自然言語解析 in MONMO（後編）

hiroppon https://blog.hatena.ne.jp/hiroppon/ 中年engineerの独り言 - crumbjp https://crumbjp.hateblo.jp/ mongodb 一連の自然言語処理をMONMOちゃん上で実現する試みの第３弾前回はベクタライズまで行った。今回は、形態素解析結果から、そのドキュメントの特徴を表す『ベクトル』を算出する、ベクタライズを行う。 monmo-NLProcessing github https://github.com/monmo/monmo-NLProcessing k-means 非階層型のクラスタリング手法。シンプルで軽量。ある程度の分散処理も可能。概要初期値として、仮重心を複数与え、各ベクトルは一番近い重心に所属するものとし、それらの平均値を新たな重心とする。これを繰り返す事で、仮重心は移動して行き、最終的に動か… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fcrumbjp.hateblo.jp%2Fentry%2F20130903%2F1378180060" title="自然言語解析 in MONMO（後編） - 中年engineerの独り言 - crumbjp" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/h/hiroppon/20130903/20130903121140.png Hatena Blog https://hatena.blog 2013-09-03 12:47:40 自然言語解析 in MONMO（後編） rich https://crumbjp.hateblo.jp/entry/20130903/1378180060 1.0 100%