第23回Research Data Alliance参加報告
2024年11月11日(月)~15日(金)に、研究データについての国際会議Research Data Alliance (RDA)の第23回会議が、コスタリカ共和国の首都、サン・ジョゼにあるコスタリカ大学で開催された。
RDAは、2013年にコミュニティ主導のイニシアチブとして立ち上げられた。研究データの自由自在な共有と再利用をビジョンとし、データ共有に必要なデータ基盤からデータ利活用にかかる技術、分野、国を超えた専門家が集まる国際組織としてアカデミア(学会等)と異なるユニークな存在である。研究データに関する政策、研究成果を公開する出版社、管理保存する図書館、データ流通にかかる企業等、セクタを超えた協働の場として12年目になる。この間、国際協働の発展として立ち上がった欧州RDA Europe、北米RDA USなどの地域主体の活動も含み、RDAのビジョンを実現するための社会的および技術的な架け橋として、特にデータ共有の障壁を減らすために必要な社会的、組織的、技術的インフラの検討や評価、実験の場としてワーキンググループ(WG)、探求的なグループ(Interest G)などの活動があり、提言書や論考の出版物を多く出力している。
RDA会議は年に2回開催され、うち1回はオンライン開催である。筆者は、第23回にパネリストおよびRDA Council理事会委員として参加した。4日間、48か国から400名弱の参加があった。開催地がアジア・パシフィック地域から遠いこともあって、参加を見送った声もあり、次々回の第25回のハイブリッド開催に期待している。(次回RDA24はオンライン開催)
Fig. 1 国別の参加数. 開催地に近い欧州と北米が多い。
Fig. 2 参加者の属性を大別すると、研究の一部としてデータ利活用に関わる研究者の参加や、そこに必要となるデータ基盤、持続性のある発展的なデータの共用、国際協調を支援するコーディネーターの役割を持つ参加者が多いことが、RDAの特徴である。
注)属性の集計は参加者の自己申告に基づいている。また国の事業やプロジェクトとしてデータ基盤を提供する組織等はコーディネーターに大別している。
以下、筆者が参加したセッションから注目点を報告する。
1. 永久識別子PIDsについて / Founders Forum
国の政策機関および研究資金機関における研究成果に対する永久識別子PIDs方針は、国としての方向性を示しつつも実際の運用やインセンティブ設計については模索中である。米NIHは論文およびデータセットに対するPID方針の検討結果を2024年10月に出版(Developing a US National PID Strategy, by ORFG PID Strategy Working Group)。豪ARDCや欧州でのPID方針は検討中の段階。研究コミュニティでのPIDs議論は盛んであるし、例えば米AGU(アメリカ地球物理学連合)がオープンに流通する地球物理データに対するPIDsの取り組みがあるものの、ドメイン横断に展開する方法や各国の目標設定には至っていない。
2. 研究データ発見FAIRの「F」/ Data Discovery Paradigms IG
2018年出版のEleven quick tips for finding research data, PLoS Computational Biology 14.4 に続き、報告書Improve Dataset Discoverabilityを発表。検索用リソースとしてインデクスする(meta)dataを評価している。
3. 国が提供するデータサービス / National Data Service (NDS) IG再開の提案
フランス高等教育研究所からの提案。国が整備、提供するデータサービスについて、前IG(2016-2019年)はGlobal Open Research Commons (GORC WG)による各国でのデータ基盤、相互運用性の実現に向けてNDSのFAIRモデルを検討。5年を過ぎて各国の整備が進み、再び相互の共有化を提案するIGを提案。
- ・ グローバル共通課題をイニシャルプロジェクトとし、相互運用のGORCレベルを定め、検索可能にした時のUI/UXを検証し、ドメインコミュニティに還元する案。例えば地球環境問題Global Environmental Issuesが提案された。類似の観点では、世界学術リポジトリ連盟COARがPaper Pledge for the Planetを開始している。
- ・ NDS Profileを記述するnational commons levelのプロファイルから再開する検討。GORC IG/WGによるGORC International Model WG V1.1 (DOI: 10.15497/RDA001119)
- ・ Founders Forum WG活動として、フランス高等教育省から地理的(EU地域)、国レベルの発展をインタラクティブに共有するナショナルレベルの提案がなされた。
4. 研究データの把握、効率的な利用、環境整備、長期維持を行う必要性、専門職として同定する必要性について / Terminologies for Data Management IG
RDA Europeから、研究データを扱うData stewardshipについて、その専門性(Research Data Management Specialist)は、データ管理(Research Data Management)、データキュレーション、図書館員の研究支援(Librarian Research Assistant)を包含する職種として重要であり、専門性を特定する語彙(terminology)を世界共通のコンセプトとする提案がなされた。
ほか、研究領域として放射光実験施設、リモートセンシングデータ(PARSCAL)の深層学習における語彙の事例紹介があった。
5. まとめ
■ RDAについて
政府と研究の間に位置し、研究データの共有を促進する関係者コミュニティに近い活動として、データベース分野CoDATA(およびData Journal)、地球科学分野WDS、オーストラリアeResearch、欧州EOSCと連携する欧米FDOなどがあり、アカデミア(学会活動)とは異なるが、日本が取り組むオープンサイエンスの促進との関係性は深く、欧米等での研究者自身の参加によって実践のユースケースも多く発表され、有効な情報が多く得られる場である。
- - 強い面:データ共有・流通にかかる多様なセクタ間で、知見や実践を共有、推奨モデルや共通スキーマの提案などを通して国際規模でのデータ共有を目指す。
- - 弱い面:グローバルコミュニティと言っても欧・米・加・豪が主流(RDA Global, RDA US)。アジアのビジビリティは小さく、多様な参加発表が望まれる。
■ 日本とRDA
政策面でNISTEP、FAでJST、基盤でNII、ほか研究機関としてNIMS、NICTから常連参加があるが、大学(研究者、図書館、基盤センター)からの参加はほぼなく、研究者でのデータ管理・データ共用・データ利活用に関する議論、所属学会のデータ駆動系やインフォマティクス関連の一部に限られている(と考えられる)。大学図書館はリポジトリ連合COAR、Open Repository、デジタルキュレーションIDCCなどに数名の派遣調査、事例発表がある。基盤とアプリケーション、研究利用が揃う場としてRDAは貴重な場である。
日本にとってRDAが有効な国際活動の機会となるためには、国内でのデータ共有・基盤の普及と需要が前提として必要であり、日本での2025年からのOA加速化実施方針によって、知見の習得や交流の関心が高まるかもしれない。
■ オープンサイエンス
技術革新によって実現するものであり、技術進展なしにOS実現は成しえない。国際動向や標準化の進展を理解し、国内での実装に活かしながら、できる範囲で国際貢献を続けることが重要であろう。
参考:
1) CMIP6Plus Whitepaper, September 17, 2024, CMIP6Plus has been initiated by the Working Group on Coupled Modelling (WGCM) Infrastructure Panel to facilitate sustained climate model intercomparison activities in advance of the Coupled Model Intercomparison Project (CMIP)'s seventh phase, CMIP7.
ここでデータ修正または取り下げをする対象データセットについてオープンデータベース化する点。論文の取り下げや修正(Errata)が増加するジャーナル論文と同様に、研究データの同様のステータスをどのように管理し、研究者が知ることが出来るかが重要で、そのケーススタディになるのではないか。
● https://errata.ipsl.fr/static/index.html
2) Definition of the terms verification, validation, evaluation and benchmarking for use in the climate model context, Hassler, Birgit / German Aerospace Center, Dingley, Beth / CMIP International Project Office, Model Benchmarking Task Team, October 24, 2024, https://zenodo.org/records/13985652 CMIP: Coupled Model Intercomparison Project, Presenter: Martina Stockhause, Data Manager, IPCC DDC Manager
● Danielle Kinkade, Director of the Biological and Chemical Oceanography Data Management Office (BCO-DMO).
FAIR、CARE、TRUSTの3つの原則を元に、Oceanographyでの実践例とRequire new infrastructureについて発表。研究利用を伴う大変に良い講演であった。
https://datascience.codata.org/articles/10.5334/dsj-2024-037
(谷藤 幹子)
- カテゴリ別
- RCOS運営
- イベント報告
- オープンサイエンスの動向
- 活動報告
- 記事一覧へ戻る