note:2025‐05‐29 - ddbj/rdf GitHub Wiki
ゴール
BioSample resourceSyncデータを全件規模にスケールさせる
やったこと
- DDBJ SearchでJSON-LDファイルを取得できるようにする [Done]
- resourcelistのurlset/urlを静的ファイルからDDBJ SearchのURLに変更する [Done]
残作業
- resource list の
lastmod
の値をdateModified
の値に置き換える - 複数の Resource List に分割した、全件データを作成し、Resource List Indexでまとめる - 現在、BioSampleは、約4500万レコード。10000 件ごと x 4500 xml
議論
- 上記の作業方針でよいか?
- Resource DumpやChange Dump などの良い運用事例はあるのか?