データガバナンス機能
データガバナンス機能の背景
研究データの公開範囲拡大
研究データは、個人からグループ、コミュニティと段階的に公開範囲が拡大されるものです。公開範囲を円滑に拡大していくためには、常日頃から研究データを整理し、研究データの品質が高い状態を維持することが重要となります。
研究データの品質向上
現状研究データは、研究者個人や研究プロジェクトの裁量で保存・管理されており、研究データの品質(メタデータの豊富さや再現性)が保たれていないことも少なくありません。研究データの品質を日頃から維持するために、研究データの保存構成が規格に準拠しているか、再現可能な研究記録が残っているか、などの観点で機械的検証が必要です。検証の結果を研究者にフィードバックして改善を促すことで、高品質な研究データの状態維持に繋がります。
研究プロジェクトの個別性
研究プロジェクトの個別性を表現する文書の一つとして、研究データ管理計画書(DMP:Data Management Plan)が存在します。DMPは研究費助成機関等への提出が求められており、研究費助成機関等においては管理文書として利用されていますが、研究活動には十分に活用されていません。各研究プロジェクトがDMPの内容に応じて遂行されているかを機械的に検証することで、研究活動の品質向上や効率化が見込めます。
データガバナンス機能の役割
研究プロジェクトの個別性および進捗に応じて、DMP やプロジェクト固有のデータ管理要件は変化し、それに応じて研究データ管理要件が変化します。データガバナンス機能はそれらのデータ管理要件を満たしつつ研究データ管理を行うことを支援します。具体的には下記に示す機能を提供します。
データ管理要件の設定:ガバナンスシート
データガバナンス機能はデータ管理要件をプロジェクトおよびフェーズごとに設定できる機能「ガバナンスシート」を提供します。ガバナンスシートはデータ管理要件を見える化する役割も持ちます。
研究データ品質の検証:モニタリング
「モニタリング」は、研究データの管理状態がガバナンスシートによって表現されたデータ管理要件に沿っているかどうか機械的な検証を担います。
ガバナンスシートに基づいた研究データ管理手順の提案:リサーチフロー
「リサーチフロー」は、ガバナンスシートの内容に基づき生成される実行可能な研究データ管理の手順書です。リサ ーチフローはデータ管理要件を満たす手順に沿った研究データ管理を実現します。多岐に渡る研究プロジェクトの個別性を踏まえ、研究者自身が柔軟にリサーチフローを拡張できるような方式を採用しております。それにより実際の研究活動に合わせたリサーチフローを加えることも可能な構成となっています。また、このリサーチフローを共有することでオープンサイエンスの推進に欠かせないオープンメソッドの実現にも寄与できます。
図1 データガバナンス機能の概要