Term-score

y_uti https://blog.hatena.ne.jp/y_uti/ y_uti のブログ https://y-uti.hatenablog.jp/ 前回に続き LDA の話題です。前回は、コーパスからトピックモデルを学習し、コーパスに含まれる記事が分野ごとにトピックに分かれる様子を見てみました。今度は、それぞれのトピックからどのような単語が生成されやすいかを調べてみたいと思います。トピックごとの単語生起確率も、文書‐トピック分布と同様に計算します。すなわち、あるトピックからの単語生起確率は、各単語の生成回数にパラメータ beta を足した数の比として推定できます。これは plda のモデルファイルから計算できるのですが、モデルファイルは行方向に単語、列方向にトピックの形式になっているため、次のように 2 パスで計算するコードを書いてみまし… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fy-uti.hatenablog.jp%2Fentry%2F2013%2F05%2F10%2F224207" title="Term-score - y_uti のブログ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2013-05-10 22:42:07 Term-score rich https://y-uti.hatenablog.jp/entry/2013/05/10/224207 1.0 100%