日本語

キュレーション機能について

2025.04.11

みなさまこんにちは。2025年3月までRCOSに在籍しておりました南山と申します。2019年9月の入所からあっという間に約5年半が過ぎ、縁あって別の組織へ移ることになりました。異動にあたり記事執筆の機会をいただけましたので、私がRCOSで開発を担当してきたキュレーション機能について簡単に書き留めておこうと思います。

20250411-1.jpg
RCOSメンバー撮影の桜

「キュレーション」という用語はどこかで聞かれたことのある方々が多いのではないでしょうか。一般的な用語としては、「キュレーションサイト」「キュレーションメディア」などの形で現れ、いずれも特定のテーマに沿った情報を収集・整理して提供する、といった意味で使われています。研究データ基盤を開発するというRCOSのミッションに照らすと、「特定のテーマに沿ったデータを収集・整理して提供する」と置き換えても収まりが良さそうです。一方で、学問分野としての「キュレーション」はやや異なる使われ方をされており、問題はそう単純ではありません。例えば、天文学、ゲノム学、生態学、経済学などデータ駆動型の手法を用いる分野では、「データキュレーション」というひとつながりの用語として「キュレーション」が登場します。これらの分野では、ジャーナルや報告書、その他のデータベースからデータを選択し、正規化し、注釈を付け、統合するプロセスを表す概念として位置づけられているようです 1 2。また、博物館学ではキュレーションを「博物館のコレクションの保存、充実化、研究、開発、管理」と定義しており 3、「データキュレーション」は「デジタル化されたコレクションの保存、充実化、研究、開発、管理」となりそうです。一般的な用法との違いは、「キュレーション」に含まれる行為がより厳密に定義されていることや、「保存」「管理」にも焦点が当てられていることが挙げられます。さらに、学問分野によっても使われ方に違いが生じている点も問題をややこしくしています。各分野の実践を詳細に見てみると、実は多くの分野で全く同一の作業、あるいは極めて近しい作業が多く含まれていたりするのですが 4、各作業は研究のライフサイクルに密接に結びついているため、RCOSが目指す汎用的な「キュレーション機能」として切り出すポイントの見極めが非常に難しいところです。

ここで、一度「キュレーション」で実現できる価値に立ち返ってみます。データを適切に収集、整理、組織化することによって、利用者は個々のデータからは見えなかった関係性を認識することができるようになります。こういった関係性は、データを説明する情報(ここではメタデータと呼びます)の一部として記述されます。一般に、メタデータの量は多ければ多いほど利用者はデータを解釈しやすく、かつ検索の際には多様な興味・関心に引っかかる可能性が高まります。私が担当した際の「キュレーション機能」ではこの点に着目し、データのライフサイクルに沿って生成されるメタデータを様々な形で引き出し、機械可読性の高い形で整備することをコンセプトに据えました 5 6。残念ながらこのコンセプトを明確な形にする前に異動の時期が来てしまったのですが、公開基盤チームの皆さまを始めとするRCOSメンバーで続きをご議論いただけることになり、大変心強く感じています。もちろん、このコンセプトがNII RDC利用者の方々に将来受け入れられるかどうかは未知数ですし、今後多くの試行や議論を経てまた違った形に変わっていくかもしれません(是非そうあって欲しいところです)。今後はNII RDCの利用者として「キュレーション機能」に関する議論に参加させていただきつつ、どう実装されていくのか陰ながら見守りたいと思っております。それではまたの機会に。

(南山 泰之)


1 Buneman, P., Chapman, A., Cheney, J., Vansummeren, S. (2006). A Provenance Model for Manually Curated Data. In: Moreau, L., Foster, I. (Eds.), Provenance and Annotation of Data. IPAW 2006. Lecture Notes in Computer Science, vol 4145. Springer, Berlin, Heidelberg. https://doi.org/10.1007/11890850_17.

2 Gray, J., A. S. Szalay, A. R. Thakar, C. Stoughton, and J. vandenBerg (2002). Online scientific data curation, publication, and archiving. In A. S. Szalay (Ed.), Virtual Observatories, Volume 4846, pp. 103-107. International Society for Optics and Photonics: SPIE. https://doi.org/10.1117/12.461524.

3 Angelika Ruge (Ed.). "Museum Professions - A European Frame of Reference". 2008. https://ictop.org/wp-content/uploads/2019/06/ICTOP-Museum-Profession_frame_of_reference_2008.pdf. 日本語訳は『博物館学・美術館学・文化遺産学基礎概念事典』より。

4 Minamiyama Y, Takeda H, Hayashi M, Asaoka M, Yamaji K (2024) A study on formalizing the knowledge of data curation activities across different fields. PLOS ONE 19(4): e0301772. https://doi.org/10.1371/journal.pone.0301772

5 込山悠介 (2024). 中核機関群活動・計画報告「研究データ基盤⾼度化」. https://rdes.rcos.nii.ac.jp/2024/1009_4-1_Komiyama.pdf

6 Minamiyama, Y., Takeda, H., Hayashi, M., Tanifuji, M., & Yamaji, K. (2025). Analyzing Functional Requirements of Data Curation Activities Support in Research Data Platforms with Domain Ontology Approach. 19th International Digital Curation Conference (IDCC25), The Hague, Netherlands. Zenodo. https://doi.org/10.5281/zenodo.14926370