国立国会図書館サーチの検索API(SRU)を使う

operation (必須)
- "searchRetrieve" を指定する
query=....
- 検索条件(必須)
  - title, creator, until, from など検索したい条件とキーワードを渡す
- 仕様はCQL ( https://ja.wikipedia.org/wiki/Apache_Cassandra )
- 部分一致は = を使う e.g. title="桜" and from="2008" AND until="2008"
- 完全一致の場合は exact を使う e.g. creator exact "夏目漱石"
- utf-8 でエンコードする必要がある
recordSchema
- 返ってくるデータスキーマの指定。dc , dcndl , dcndl_simple から選択する
- デフォルトはdc。最低限の情報のみ。
- dcndl を指定すると詳細情報(部分タイトルなど)が返ってくる
- 返ってくる情報の形式はメタデータ « 国立国会図書館サーチについてを参考に
onlyBib
- true を指定すると、書誌情報のみ帰ってくる
- recordSchema=dcndl にすると、所蔵情報も返ってきて煩雑になるので、指定することでそれを防ぐことができる
maximumRecords
- データの最大取得件数
- デフォルトが 200 なので指定しないと200件分のデータが返ってきて重い
- 最初は10~20などを指定すると無難

実際の結果

スキャナーに生きがいはない がタイトルの本を検索する。

引数を以下のように指定する。

http://iss.ndl.go.jp/api/sru?
operation=searchRetrieve
&recordSchema=dcndl # スキーマの設定
&onlyBib=true # 書誌情報のみ
&maximumRecords=10 # 10件取得
&query=title%20exact%20%22%E3%82%B9%E3%82%AD%E3%83%A3%E3%83%8A%E3%83%BC%E3%81%AB%E7%94%9F%E3%81%8D%E3%81%8C%E3%81%84%E3%81%AF%E3%81%AA%E3%81%84%22 # エンコードしたクエリ

結果は以下のURL。

http://iss.ndl.go.jp/api/sru?operation=searchRetrieve&recordSchema=dcndl&onlyBib=true&maximumRecords=10&query=title%20exact%20%22%E3%82%B9%E3%82%AD%E3%83%A3%E3%83%8A%E3%83%BC%E3%81%AB%E7%94%9F%E3%81%8D%E3%81%8C%E3%81%84%E3%81%AF%E3%81%AA%E3%81%84%22

<records> → <record> → <recordData> に検索結果の情報が格納されている。

この情報をいい感じに抽出すれば、収録作品が獲得できそうだ。

今回はとりあえずここまで。