エイエイレトリック

なぐりがき

言語処理学会 (NLP2020) 読んだ論文メモ2

前回に引き続き、今年の言語処理学会年次大会のなかで、読んだ論文を紹介します。 今回は3/18分の論文 (day2)です。 ちょっとだけ紹介本数減ってますが、お察しください。 紹介している論文の分野の偏りが激しいので、余裕のある方は予稿集 から読んでみてく…

言語処理学会 (NLP2020) 読んだ論文メモ1

本日、言語処理学会のサイトにて、今年の年次大会(#NLP2020)の発表論文集を一般公開しました。https://t.co/36l2juMAMO— NLP2020 (@NLP_2020) 2020年4月8日 今年の言語処理学会年次大会の予稿集が公開されていたので、読んでいました。 読んだ論文について…

Pythonでヒストグラムを描く方法まとめ

文字数などの数値の分布をみたいときにヒストグラムをよく使うのですが、 Matplotlib・Seaborn・Plotlyの関数名・引数の互換性がないため *1 何度もググってしまい時間を浪費しがちでした。 そこでpythonの可視化モジュールでのヒストグラムを描き方を調べて…

pythonのsliceにおける、s[i:j:k]の挙動が複雑だったのでまとめる

pythonのスライス、特にstepについて、個人的にわかりにくいと思ったのでまとめます。 TL;DR s[i:j:k] で無理やり書こうとすると可読性があまりよろしくない時があるので、 無理やり書かない のが一番。 以降のまとめはpython 3.8についてのドキュメント、実…

Mecab辞書、ipadicとneologdについてのメモ

nlp

主にMecabを使う時によくみるリンクとメモ。 ほぼ自分用のメモです。よって、Mac OSのことしか考慮していません。 パス 品詞 品詞ID 品詞体系についてまとめたページ ipadic / IPA辞書 マニュアル 品詞体系 辞書引き mecab-ipadic-NEologd 品詞体系 辞書引き…

10年前 (2009年) のACL論文を紹介する

nlp

本記事は 自然言語処理 #2 Advent Calendar 2019 の17日目の記事です。 2010年代も終わりということで、2000年代最後の年である 2009年 のACL論文を紹介します。 念押しすると、2019年 ではない です。字面が似ていますが全く異なる年です。 2009年のBest pa…

NLPにおけるQuestion Answeringについて、ざっくりまとめ

NLP

Kaggleで NLP のコンペ、TensorFlow 2.0 Question Answering がはじまりました。 Question Answering (質問応答) といえば、 IBMの開発したWatsonや、Siri・AlexaといったAIアシスタントなどで、みなさんにも馴染み深いタスクですね。 KaggleでQAが盛り上が…

BeautifulsoupでXMLからテキスト取得

前回記事 国立国会図書館サーチの検索API(SRU)を使うの続き。 PythonのBeautifulsoupを使って、国立国会図書館APIから取得したXMLからタイトル情報を取得する。 バージョン情報 Python 3.7.3 beautifulsoup4 4.8.0 lxml 4.4.1 requests 2.22.0 Pythonでapiの…

国立国会図書館サーチの検索API(SRU)を使う

api

国立国会図書館のAPIに触った時のメモ。 短編集の収録作品タイトル一覧を取得するために検索APIを使う。 国立国会図書館サーチ 唐突だが、本のタイトルを思い出せない時、特に短編のタイトルが思い出せない時、ググっても全然出てこないという苦しみを味わっ…