ATOK も統計的言語処理へ

NyaRuRu https://blog.hatena.ne.jp/NyaRuRu/ NyaRuRuが地球にいたころ https://nyaruru.hatenablog.com/ MS-IME 2007 に遅れること 1 年，ATOK も統計的言語処理へ．これでだいたい役者は揃った感じですかね． ATOKは従来、最も長く取れる2文節を優先的に選択する「n文節最長一致法」を採用していたが、近年この手法による誤変換の発生が稀ではなくなってきた。そこで、出現頻度や言語的性質などを数学理論によって1つの評価軸の上に積算する統計的言語処理手法を採り入れた。また、機械処理に頼らず、人手による検証と微調整を重ねることで、体感的な変換精度を向上させたという。具体的にはATOK 2007と2008で下記のような差が出る。 2007:請求書の/市は/来日時/ 2008:請求書の/支払い/日… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fnyaruru.hatenablog.com%2Fentry%2F20071211%2Fp4" title="ATOK も統計的言語処理へ - NyaRuRuが地球にいたころ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2007-12-11 00:00:03 ATOK も統計的言語処理へ rich https://nyaruru.hatenablog.com/entry/20071211/p4 1.0 100%