<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>laco0416</author_name>
  <author_url>https://blog.hatena.ne.jp/laco0416/</author_url>
  <blog_title>らこらこブログ</blog_title>
  <blog_url>https://laco0416.hatenablog.com/</blog_url>
  <categories>
    <anon>自然言語処理</anon>
  </categories>
  <description>PCFGを使って形態素解析器の学習データを作る計画 ツイッターとかネット上のテキストとか、とてもじゃないけど手動でいちいち辞書追加してたら新しい単語についていけないので自動で学習させたい。品詞も自動で与えたい kuromoji.jsで「艦これって何」の形態素解析の結果 品詞列で言うと[&quot;名詞&quot;, &quot;名詞&quot;, &quot;助詞&quot;, &quot;名詞&quot;]になってる。CFGの文法はすでに完成してるという前提で、この場合適用すべき文法は NP =&gt; N P S =&gt; NP N の2つだけであるべきで、上の文章を無理やり受理しようとすると N =&gt; N N の再帰的な文法が必要になる。構文解析の前処理として名詞の結合とかや…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Flaco0416.hatenablog.com%2Fentry%2F2015%2F01%2F08%2F221635&quot; title=&quot;最後まで書いた後でとても実装する気が起きなくなった - らこらこブログ&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>http://cdn-ak.f.st-hatena.com/images/fotolife/l/laco0416/20150108/20150108211631.png</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2015-01-08 22:16:35</published>
  <title>最後まで書いた後でとても実装する気が起きなくなった</title>
  <type>rich</type>
  <url>https://laco0416.hatenablog.com/entry/2015/01/08/221635</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
