コーパスと実用のサイクル (2)

takeda25 https://blog.hatena.ne.jp/takeda25/ アスペ日記 https://takeda25.hatenablog.jp/ 昨日のエントリ（コーパスと実用のサイクル - アスペ日記）の続き。「コーパスを使って漢字かな・かな漢字変換を作り、その間違いをコーパスに反映する」というのを具体的にどうするか。自分としては、せっかく現代日本語書き言葉均衡コーパス (BCCWJ)ができたこともあるので、これの形態素解析結果を使いたいと思っている。コーパスの間違いをどう反映していくか。自分としては、BCCWJ からの差分をGitHub等に置いて、NLP 関係者が更新できるようにするのがいいんじゃないかと考えている。（差分の形式は diff 以外がいいのではないかと思っている。diff を使うことには様々なメリットがあるのだが… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftakeda25.hatenablog.jp%2Fentry%2F20110818%2F1313674169" title="コーパスと実用のサイクル (2) - アスペ日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2011-08-18 22:29:29 コーパスと実用のサイクル (2) rich https://takeda25.hatenablog.jp/entry/20110818/1313674169 1.0 100%