言語処理学会の年次大会が始まるのでトレンドを時系列で分析してみた

Hironsan https://blog.hatena.ne.jp/Hironsan/ Ahogrammer https://hironsan.hatenablog.com/ 自然言語処理 2025年3月10日から言語処理学会の年次大会が開催されるため、聴講や予稿を読むのを楽しみにしています（毎年）。せっかくなので、自分でも何か手を動かして取り組んでみたいと思い、過去10年分の論文タイトルを取得し、クラスタリングとキーワード抽出をして時系列で可視化してみました。今回は、その手法と結果について紹介します。大まかな流れとしては、以下の順番で説明します。データセットの準備タイトルの収集タイトルの前処理形態素解析辞書の作成トレンドの可視化タイトルの埋め込み埋め込みの次元削減クラスタリングキーワード抽出時系列での可視化 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fhironsan.hatenablog.com%2Fentry%2Fanlp-paper-clustering" title="言語処理学会の年次大会が始まるのでトレンドを時系列で分析してみた - Ahogrammer" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/H/Hironsan/20250309/20250309195249.jpg Hatena Blog https://hatena.blog 2025-03-10 08:00:00 言語処理学会の年次大会が始まるのでトレンドを時系列で分析してみた rich https://hironsan.hatenablog.com/entry/anlp-paper-clustering 1.0 100%