エイエイレトリック

なぐりがき

2021-03-01から1ヶ月間の記事一覧

アルファベットをカタカナに変換するpythonパッケージalphabet2kanaを公開しました

TL;DR 機能 経緯 関連パッケージ python-romkan alkana.py poetryを使ってpypiに登録する TL;DR ありそうでなかった、アルファベットをカタカナに変換するや〜つを作りました。*1 github.com ABC を エービーシー に変換します。 読みの付与に使うことを目的…

scikit-learnにmecab日本語分かち書きを組み込む方法

nlp

pythonで (深層学習ではない) 機械学習をするとなるとまず使うのがscikit-learn、さらに扱うデータがテキストとなると大体の場合 CountVectorizerや TfIdfVectorizer といった特徴量抽出 feature_extraction.text で前処理を行うことが定番だと思います。 し…