日本語

SciDataCon2022 に参加しました

2022.09.02

20220902-1.png

国際会議SciDataCon2022に参加しました。
この会議は2022年6月20日から6月23日まで開催された IDW2022(International Data Week 2022, 韓国ソウル・オンライン(ハイブリッド開催))の一部として実施されたものです。このIDW2022は、「データ」に関するあらゆるテーマを取り扱う国際会議で、RCOS日誌2022.8.8で紹介されたRDA 19thもその一部となっています。もともと2021年11月に開催予定だったのですが、コロナの影響で2022年6月に延期されました。

SciDataCon2022の運営は CODATA(Committee on Data)と WDS(World Data System)の両組織が共同で実施しています。今回の会議では、全体セッション1枠、パラレルセッション7枠、更に各枠の中で複数セッションが組まれ、合計45個のセッションが実施されました。
この報告では、その中からいくつかのセッションを簡単にご紹介いたします。

Enabling reproducible computational research: Are we focusing on solutions rather than problems?

このセッションでは、研究成果についての透明性・再現性のある環境を実現するために提供されている既存のツールやソリューション、ならびにそれらを利用した活動事例についての発表がありました。
プレゼンでは、GitHubや、Notebook等の実行可能コード環境を含む、6種類のコードシェア手法について説明がなされ、ユーザアンケート結果では、それらの中でもGitHubが依然として多用されていることが示されました。
またツールとして、生物医学モデルシミュレーションの再現を可能とするためのツールである CellML、ドキュメント内のPNG画像に実行可能コードを埋め込む文書を作成するためのツールである Stencillaについて紹介されました。
さらに活動例として、Taylor & Francis社によるコードシェアに関する活動、GigaScience Press社による、Stencilla、CodeOceanを用いた実行可能コード埋め込みのジャーナル GigaByteが紹介されました。

Big Earth Data in Support of the Susteinable Development Goals

このセッションは、SGDsに絡む地球観測に関するビッグデータを用いた研究成果が4件ほど紹介されました。
1つ目は、東アフリカ(ナイル川)地域の異常気象のためのシステムAAScTCloudの紹介でした。このシステムは、元々メコン川流域向けに開発されたGOSC(Global Open Science Cloud)ツールをベースに、AASCTC(スーダンの研究組織)によってナイル川流域に適用されたもので、中国科学技術院(CAS)との共同研究開発の成果でした。
2つ目は、中国で立ち上げられたSDGs向けプラットフォーム CBASの紹介でした。このシステムの総量は14PBで、40年間の利用を想定し、人工衛星もシステムに組み込まれているとのことでした。
3つ目は、BED(Big Eeath Data)を用いた、アジアゾウの生息域全体(2001〜2018年)の生息地喪失のパターンと個体数減少進行要因の分析結果で、中国国際BD研究センターの成果でした。
4つ目は、シルクロード経済ベルト地域と北極海ルートに関連する高品質の環境情報の分析で、ヘルシンキ大学と中国科学技術院との共同研究成果でした。このセッションで紹介された事例は、いずれも中国の研究機関が絡んでおり、SDGsに関するビッグデータを用いた研究開発を契機とする、アジア・アフリカ諸国への中国の影響力拡大の傾向がみられます。

Enhancing Research Transparency and Trustworthiness by Making Dataset Quality Information Findable, Accessible, Interoperable and Reusable (FAIR)

このセッションでは、データセットの品質に影響を与える要素について、FAIR原則をもとに、データセットの品質情報を公正かつ永続的にアクセスできるようにする方法、ならびに実践された事例が紹介されました。
なお、FAIR原則というのは、Findable(検索可能性)、Accessible(アクセス可能性)、Interoperable(相互運用可能性)、Reusable(再利用可能性)の頭字語を繋げたもので、研究データの公開と共有のために定められた原則です。ここで対象となる要素は、研究データに限らず、入力、出力、補助データ、メタデータ、ソフトウェア、手順、プロセス、ワークフロー、インフラ等も含まれます。
プレゼンでは、データ品質情報をキュレートするための国際ガイドラインの活動について、地理データセットの品質に関するメタデータのISO標準化(ISO19115)の活動について、データセットの品質情報の分野固有のスキーマとガイドラインの活動について、それぞれの進捗状況の報告が行われました。
また、海洋データ品質を確保するOcean Best Practices Systemの紹介、オーストラリアの統合海洋観測システム(IMOS)におけるデータセットの品質情報に関する紹介、地球化学データの寿命、有用性、影響を保証するプロバイダEarthChemの紹介がなされました。

(下山 武司)