名寄せの仕組み

astamuse https://blog.hatena.ne.jp/astamuse/ astamuse Lab https://lab.astamuse.co.jp/ データクレンジングデータ可視化自然言語処理この記事は自然言語処理 Advent Calendar 2020 の25日目の記事です。こんにちは、rinoguchi です。今年の4月にこちらの記事を書いて以来、半年ぶりの投稿になります。当社では、特許・研究課題・論文など多くの知的財産データを保持しています。これらのデータを活用するには、データに含まれる同一組織・同一人物に対して同一IDを付与してデータをグルーピングすることが必要であり、この作業のことを名寄せと呼んでいます。今回はこの名寄せの仕組みについて紹介したいと思います。大まかな処理フロー当社では名寄せ処理を、まずそれぞれのデータソース（例えば特許や論文など）の中で実… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Flab.astamuse.co.jp%2Fentry%2F2020%2F12%2F26%2F212850" title="名寄せの仕組み - astamuse Lab" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/a/astamuse/20201222/20201222215021.png Hatena Blog https://hatena.blog 2020-12-26 21:28:50 名寄せの仕組み rich https://lab.astamuse.co.jp/entry/2020/12/26/212850 1.0 100%