ロジスティック回帰で特徴語を抽出する

hayataka2049 https://blog.hatena.ne.jp/hayataka2049/ 静かなる名辞 https://hayataka2049.hatenablog.jp/ python sklearn 自然言語処理 Tips 20newsgroups CountVectorizer 機械学習ロジスティック回帰はじめに線形判別分析など、線形の判別モデルは係数を使って各クラスに重要な特徴を取り出すことができます。今回はロジスティック回帰を使って、20newsgroupsのデータセットから各クラスの特徴語を取り出してみます。実験以下のようなコードを走らせます。 import textwrap import numpy as np from sklearn.datasets import fetch_20newsgroups from sklearn.feature_extraction.text import CountVectorizer from sklearn.preprocessing … 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fhayataka2049.hatenablog.jp%2Fentry%2F2019%2F07%2F02%2F224158" title="ロジスティック回帰で特徴語を抽出する - 静かなる名辞" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2019-07-02 22:41:58 ロジスティック回帰で特徴語を抽出する rich https://hayataka2049.hatenablog.jp/entry/2019/07/02/224158 1.0 100%