種別[gsm] 2023-07-06T05:28:59Z
セクショングローバル共有メモ
日時2023-07-06T05:28:59Z
元URL(URLなし)

#AI (日本語の)ベクトル埋め込みの定番は、OpenAI の…

jrf> #AI (日本語の)ベクトル埋め込みの定番は、OpenAI の text-embedding-ada-002 のようだが、有料のため前は OpenCALM を使っていた。しかし、どうももっとよいものがあるようだ。sentence-transformers/paraphrase-multilingual-mpnet-base-v2 がそれ。

《sentence_transformer_test.ipynb》  
https://gist.github.com/JRF-2018/10ac6e6a6d862d03eab96c74a454d223