エイエイレトリック

なぐりがき

2021-03-02から1日間の記事一覧

scikit-learnにmecab日本語分かち書きを組み込む方法

nlp

pythonで (深層学習ではない) 機械学習をするとなるとまず使うのがscikit-learn、さらに扱うデータがテキストとなると大体の場合 CountVectorizerや TfIdfVectorizer といった特徴量抽出 feature_extraction.text で前処理を行うことが定番だと思います。 し…