エイエイレトリック

なぐりがき

2020-01-01から1年間の記事一覧

Python「ytmusicapi 」で音楽をYoutube Musicにアップロードする

前置き 〜Google Play Musicのエクスポート〜 Google Play Music のサービスの年内終了が決まり*1、今月になって自分のアカウントも音楽を利用できなくなってしまいました。 長年音楽プレイヤーとして愛用していただけに残念です。 実は普段使っているGoogle…

再訪Pythonチュートリアル

ある程度、他の言語を経験したことがある場合、新しい言語のチュートリアルは流し読みしても問題ないことが多いです。 かくいう自分もPythonチュートリアルをちゃんと読んでこなかったので、改めて精読してみました。 実際に読んでみると、結構気づきがあっ…

機械翻訳が発展した時代で人間側ができる工夫方法あれこれ

機械翻訳で翻訳できないこととそれに対する(人間側の)解決策について書きます。 工夫方法とタイトルに書いていますが、半分感想文です。 If they give you ruled paper, write the other way. JUAN RAMÓN JIMÉNEZ Fahrenheit 451 by Ray Bradbury. 先日、…

NLTKを使った英語テキストのtokenize

nlp

英語のtokenizeは日本語の分かち書きに比べたら楽なようにみえるが、注意すべき点があるよという紹介をします。 そのために、今回は NLTK (Natural Language Toolkit) を使ってtokenizeします。 (NLTK のVersion 3.5、Python 3.7.4で動作確認しています。) …

言語処理学会 (NLP2020) 読んだ論文メモ3

前々回、前回 に引き続き、今年の言語処理学会年次大会のなかで、読んだ論文を紹介します。 最終日3/19分の論文 (day3)です。 なんとか完走です。 ちなみに今年受賞した論文などの情報は下記の通りです。 年次大会優秀賞・若手奨励賞一覧 https://www.anlp.j…

言語処理学会 (NLP2020) 読んだ論文メモ2

前回に引き続き、今年の言語処理学会年次大会のなかで、読んだ論文を紹介します。 今回は3/18分の論文 (day2)です。 ちょっとだけ紹介本数減ってますが、お察しください。 紹介している論文の分野の偏りが激しいので、余裕のある方は予稿集 から読んでみてく…

言語処理学会 (NLP2020) 読んだ論文メモ1

本日、言語処理学会のサイトにて、今年の年次大会(#NLP2020)の発表論文集を一般公開しました。https://t.co/36l2juMAMO— NLP2020 (@NLP_2020) 2020年4月8日 今年の言語処理学会年次大会の予稿集が公開されていたので、読んでいました。 読んだ論文について…

Pythonでヒストグラムを描く方法まとめ

文字数などの数値の分布をみたいときにヒストグラムをよく使うのですが、 Matplotlib・Seaborn・Plotlyの関数名・引数の互換性がないため *1 何度もググってしまい時間を浪費しがちでした。 そこでpythonの可視化モジュールでのヒストグラムを描き方を調べて…

pythonのsliceにおける、s[i:j:k]の挙動が複雑だったのでまとめる

pythonのスライス、特にstepについて、個人的にわかりにくいと思ったのでまとめます。 TL;DR s[i:j:k] で無理やり書こうとすると可読性があまりよろしくない時があるので、 無理やり書かない のが一番。 以降のまとめはpython 3.8についてのドキュメント、実…

Mecab辞書、ipadicとneologdについてのメモ

nlp

主にMecabを使う時によくみるリンクとメモ。 ほぼ自分用のメモです。よって、Mac OSのことしか考慮していません。 パス 品詞 品詞ID 品詞体系についてまとめたページ ipadic / IPA辞書 マニュアル 品詞体系 辞書引き mecab-ipadic-NEologd 品詞体系 辞書引き…