言語処理100本ノック 2020「35. 単語の出現頻度」

upura https://blog.hatena.ne.jp/upura/ u++の備忘録 https://upura.hatenablog.com/ 自然言語処理 python 問題文 nlp100.github.io 問題の概要「30. 形態素解析結果の読み込み」で作成したデータ構造から、全ての単語を取り出し、出現頻度を計算します。全ての単語を前から確認していき（単語, 出現回数）のペアの辞書を作り上げました。普通のdictではなく「defaultdict」*1が便利です。 from collections import defaultdict def parse_mecab(block): res = [] for line in block.split('\n'): if line == '': return res (surface, attr) = li… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fupura.hatenablog.com%2Fentry%2F2020%2F04%2F20%2F121729" title="言語処理100本ノック 2020「35. 単語の出現頻度」 - u++の備忘録" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2020-04-20 12:17:29 言語処理100本ノック 2020「35. 単語の出現頻度」 rich https://upura.hatenablog.com/entry/2020/04/20/121729 1.0 100%