エイエイレトリック

なぐりがき

都道府県・市区町村をgeopandasで可視化

市区町村の読みって意外と曖昧性があるなと気づき、調べてみることにしました。

市区町村の位置を可視化するにあたり、geopandas を使ってみたのでメモします。

詳細については一番下にgistで埋め込んでます。

要点

geopandas で日本地図を扱うには。

都道府県だけであれば japanmap のポリゴンデータをつかう

市区町村は 国土数値情報 | 行政区域データシェープファイルを使う

課題 (未解決)

geopandasで試行錯誤した部分について

cmap でカテゴリ色づけが順序通りされない

島を含むと画像が縦長・横長になってしまう

  • 沖縄県・鹿児島県の奄美・東京都の島しょ部が外れ値のように存在しているのが原因
  • 日本列島をメインに出力する場合は除外する必要がある

可視化結果

上記点を踏まえて可視化しました。

都道府県の可視化

市区町村の数

「町」の割合、「町」の読みは「まち」か「ちょう」か

「町」の可視化

「町」の割合が高い都道府県 TOP5

都道府県
鳥取県     0.736842
北海道     0.697297
和歌山県    0.666667
徳島県     0.625000
宮城県     0.571429

「町」の読み方は西日本・東日本で分かれている印象。 九州は混在している。

市区町村の可視化

「町」率が高い鳥取県の読み方を可視化。全部読みは「ちょう」。

鳥取県の「町」の読み方

「まち」「ちょう」の読みが混在している九州を可視化

九州地方の「町」の読み方

福岡県・大分県あたりは「ちょう」が集中していて、それ以外は「まち」になっている。

gist

可視化の出力に使ったコードは以下。

japan_map_geopandas_都道府県_市区町村.ipynb · GitHub

もう少し深掘りできそう。