r0706あたりの雑記

owiewowe https://blog.hatena.ne.jp/owiewowe/ 19日に更新してた https://owiewowe.hatenablog.com/ PDIC の unicode 版で学辞郎の SIL、SVL を csv に抽出してみたら、抽出ファイルが python utf8 で読み込めなくて、エディタでファイル開いて確認してみたら utf16 なのね。 pdic.la.coocan.jp 学辞朗の抽出をレベルごとにするのが面倒な時は書き出した CSV 内に level が入っているから後からなんとかするも良しな感じ。正規表現は ChatGPT に任せるのが楽で早い感じなので、SIL、SVL の例文抽出は例文突っ込んで任せたほうがいいと思っていたけれど、どうしても引っかかる文字があったりして、結局自分で細かい修正入れないといけなかった。… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fowiewowe.hatenablog.com%2Fentry%2F2025%2F06%2F19%2F000000" title="r0706あたりの雑記 - 19日に更新してた" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2025-06-19 00:00:00 r0706あたりの雑記 rich https://owiewowe.hatenablog.com/entry/2025/06/19/000000 1.0 100%