<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>NyaRuRu</author_name>
  <author_url>https://blog.hatena.ne.jp/NyaRuRu/</author_url>
  <blog_title>NyaRuRuが地球にいたころ</blog_title>
  <blog_url>https://nyaruru.hatenablog.com/</blog_url>
  <categories>
  </categories>
  <description>MS-IME 2007 に遅れること 1 年，ATOK も統計的言語処理へ．これでだいたい役者は揃った感じですかね． ATOKは従来、最も長く取れる2文節を優先的に選択する「n文節最長一致法」を採用していたが、近年この手法による誤変換の発生が稀ではなくなってきた。そこで、出現頻度や言語的性質などを数学理論によって1つの評価軸の上に積算する統計的言語処理手法を採り入れた。また、機械処理に頼らず、人手による検証と微調整を重ねることで、体感的な変換精度を向上させたという。具体的にはATOK 2007と2008で下記のような差が出る。 2007:請求書の/市は/来日時/ 2008:請求書の/支払い/日…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fnyaruru.hatenablog.com%2Fentry%2F20071211%2Fp4&quot; title=&quot;ATOK も統計的言語処理へ - NyaRuRuが地球にいたころ&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url></image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2007-12-11 00:00:03</published>
  <title>ATOK も統計的言語処理へ</title>
  <type>rich</type>
  <url>https://nyaruru.hatenablog.com/entry/20071211/p4</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
