エイエイレトリック

なぐりがき

2021-06-01から1ヶ月間の記事一覧

気軽に使えるngramデータ「日本語ウェブコーパス 2010」を使ってみる

nlp

自然言語処理向けの日本語のデータって思ったよりも少ない気がします。 特に研究用途でのみ許可されているコーパスが多く、趣味で試したい時にどのデータを使うかで結構時間を使ってしまいます。 「日本語ウェブコーパス 2010 」はテキストデータに関しては…