47の心得シリーズをトピックモデルで分類する。

MikuHatsune https://blog.hatena.ne.jp/MikuHatsune/ 驚異のアニヲタ社会復帰の予備 https://mikuhatsune.hatenadiary.com/ R Python 統計機械学習数理モデル Rを使いこなす医学「本当に」医者に殺されない47の心得というシリーズ物があって、これをトピックモデルで解析する。ざっと読んだ感じ、臨床検査と薬剤の使い方について言及しているものが多いので、こんな感じでトピックが抽出できたらいいと思う。本当は30くらい溜まった時点で次に筆者がどんなことについて言及するのかを機械学習で予測しようとしたけど執筆スピードが速すぎたので結局こんなんに落ち着いてしまった。結果はこんな感じ。上位頻出20単語から、それっぽいトピックを人力で名付けた。パッと見は悪くなさそうなんだが、トピック1に胃ろうの話がきていたりトピック8がタバコに引きずられたけどタイトルをよくよく見たら結局薬のこと… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fmikuhatsune.hatenadiary.com%2Fentry%2F20130805%2F1375698042" title="47の心得シリーズをトピックモデルで分類する。 - 驚異のアニヲタ社会復帰の予備" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.d.st-hatena.com/diary/MikuHatsune/2013-08-05.png Hatena Blog https://hatena.blog 2013-08-05 19:20:42 47の心得シリーズをトピックモデルで分類する。 rich https://mikuhatsune.hatenadiary.com/entry/20130805/1375698042 1.0 100%