エイエイレトリック

なぐりがき

2020-05-01から1ヶ月間の記事一覧

NLTKを使った英語テキストのtokenize

nlp

英語のtokenizeは日本語の分かち書きに比べたら楽なようにみえるが、注意すべき点があるよという紹介をします。 そのために、今回は NLTK (Natural Language Toolkit) を使ってtokenizeします。 (NLTK のVersion 3.5、Python 3.7.4で動作確認しています。) …

言語処理学会 (NLP2020) 読んだ論文メモ3

前々回、前回 に引き続き、今年の言語処理学会年次大会のなかで、読んだ論文を紹介します。 最終日3/19分の論文 (day3)です。 なんとか完走です。 ちなみに今年受賞した論文などの情報は下記の通りです。 年次大会優秀賞・若手奨励賞一覧 https://www.anlp.j…

言語処理学会 (NLP2020) 読んだ論文メモ2

前回に引き続き、今年の言語処理学会年次大会のなかで、読んだ論文を紹介します。 今回は3/18分の論文 (day2)です。 ちょっとだけ紹介本数減ってますが、お察しください。 紹介している論文の分野の偏りが激しいので、余裕のある方は予稿集 から読んでみてく…