BERT で簡単に日本語の文章の特徴ベクトルを取得できるクラス作った

kaeru_nantoka_py https://blog.hatena.ne.jp/kaeru_nantoka_py/ かえるのプログラミングブログ https://kaeru-nantoka.hatenablog.com/ BERT 小ネタです。表題の通り、日本語の特徴ベクトルを5秒で作れると嬉しいなと思ってまとめてみました。成果物 https://github.com/osuossu8/Utils/blob/master/text_preprocess/bert_sentence_vectorizer.py 参考にさせていただいたページ huggingface/transformers の日本語BERTで文書分類器を作成する - Qiita コサイン類似度行列？それNumPyですぐ出せるよ - Qiita https://jp.quora.com/BERT-wo-shiyou-shi-te-bunshou-no-ru… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fkaeru-nantoka.hatenablog.com%2Fentry%2F2020%2F05%2F29%2F144745" title=" BERT で簡単に日本語の文章の特徴ベクトルを取得できるクラス作った - かえるのプログラミングブログ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2020-05-29 14:47:45 BERT で簡単に日本語の文章の特徴ベクトルを取得できるクラス作った rich https://kaeru-nantoka.hatenablog.com/entry/2020/05/29/144745 1.0 100%