scikit-learnを使ってテキストから素性ベクトルを取得する

redhornet96 https://blog.hatena.ne.jp/redhornet96/ もふもふ技術部 https://www.mof-mof.co.jp/tech-blog/ machine learning scikit-learn python 機械学習をやっていると、実際に何か使えるものをサクっと作りたくなってくるんですが、膨大なデータが必要だったり、実装ボリュームが大きくなりすぎたりするんですが、テキスト解析ならちょうど良いノリで出来そう。そこで、TwitterのツイートをSVMにかけてネガポジ判定するコードを書いてみたいと思います。今回はひとまず、ツイートをinputとして素性抽出してベクトル化するところまでやってみます。こちらの記事に大変お世話になった。コードはかなりコピペさせていただいた。 https://datumstudio.jp/backstage/662 素性抽出とは実装素性抽出とは実装に入る前に「素性抽出… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fwww.mof-mof.co.jp%2Ftech-blog%2Fscikit-learn" title="scikit-learnを使ってテキストから素性ベクトルを取得する - もふもふ技術部" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2016-04-27 00:00:00 scikit-learnを使ってテキストから素性ベクトルを取得する rich https://www.mof-mof.co.jp/tech-blog/scikit-learn 1.0 100%