日本語

Center for Open Science (COS)、商業出版社との競争

「バージニア大学の二階建てのレンガ造りのビルで、数十名のコンピュータ・プログラマーが、科学の未来を決定づけるために、猛スピードで仕事をしている」。
In a plain, brick, two-story office building near the University of Virginia, several dozen computer programmers are racing to define the future of science.

2016.11.1付けChronicle of Higher Educationにおいて、"Center for Open Science (COS)"の活動を紹介する記事の巻頭言です。
COSは、オープンサイエンスの業界において主流となりつつある"Open Science Framework (OSF)"という、オープンサイエンス・プラットフォームを開発しているNPOです。各種の財団ほか、NIH、NSF、DARPAなどから支援を得ています。
[Chronicle of Higher Education] (2016.11.1) Open Data Meets a Defining Test(有料記事)


それにしてもドラマチックな書き出しですが、要は商業出版社が論文だけでなく、近年は研究データやプレプリントも囲い込みし始めているため、それを阻止するべく、研究者コミュニティにオープンな研究プラットフォームを可能な限り早く提供し、科学のあり方を正常なものに戻すために、猛スピードで仕事をしているということです。
"We feel a sense of urgency!"と、COSの創設者の一人であるBrian A. Nosekダイレクター(バージニア大学教授(心理学))は語っています。

商業出版社側は、オープンサイエンスの理念に基本的には賛同し、その方向で動いていており、COSを競争相手とは見ていないと主張していますが、各種のオープンプラットフォームの囲い込みから、これについては懐疑的な意見が多数聞かれます。
エルゼビア社は、学術論文を管理・共有するMendeley、ラボ管理ツールのHivebench、プレプリントサーバーのSSRNを買収し、トムソンロイターはWeb of Scienceを含む科学ブランドを手放し、これはClarivate Analyticsという企業となっています。ネイチャー誌のオーナー会社であるHoltzbrinck Publishing Groupは、Altmetricを含む研究ツールスイートのDigital Scienceを開発・提供しています。
COSはこうした商業出版社への対抗と同時に、NIHなどの助成機関による研究データ公開の義務化の受け皿となろうとしています。

一方、COSの理念は崇高なものであっても、肝心の研究者の心を掴むのは容易ではなく、研究機関の協力が必要と認識されています。
南カリフォルニア大学(USC)は、教員からの要望によりOSFを早い段階で導入した先駆的な大学であるものの、その利用の状況は芳しくないとHall研究担当副学長は語っています。
COSは、OSFの説明およびその重要性を説明するために大学キャラバンをしていますが、研究データを可能な限り自分の手元に置いておくというアカデミアの文化を変えるのには時間がかかる、と認識しています。

COSは"Reproducibility Project"において、2008年に心理学分野の主要な学術雑誌に掲載された研究論文100報の追証において、論文の39%しか再現できなかったという結果を発表し、注目を集めました。
[Chronicle of Higher Education] (2015.8.28)
The Results of the Reproducibility Project Are In. They're Not Good.(有料記事)

しかしこれは、オープンサイエンスの必要性を注意喚起するというCOSの短期的戦略にすぎず、COSは「全ての研究者が研究活動をする上で必要となるインフラを提供する」という長期的視野で開発を進めたいとしています。その第1フェーズの締めくくりとして来週には、社会科学、工学、心理学の分野でそれぞれSocArXiv、engrXiv、psyArXivという、SSRNと類似のプレプリントサーバーが提供開始されるそうです。
第1フェーズ終了後COSは、「急速な拡大期」である第2フェーズに乗り出します。現在でも毎週500ユーザが増え、機関参加も11機関、その他バックログとしての利用が30〜40機関あります。

最後の第3フェーズは、10年以上先のこととなるかもしれないが、COSがセンターから長期的なガバナンス構造へと変わることである、とNosekダイレクターは語ります。データ共有が学術界の常識となるのであれば、それでCOSの目的は果たされたことになるため、この暁においてCOSはその役割を終え、なくなるかもしれないとのことです。


なるほど!とようやく腑に落ちました。
学術論文を対象としたオープンアクセス運動は、学術雑誌の高騰への対抗として始まり、目指すところが明確でした。研究者の共有財産である学術論文が出版社の閉鎖された壁のなかに囲い込まれ、読めなくなるのはアカデミアにとっての損失である。これは誰にでも分かる理屈で、この運動はアカデミアも含め急速に拡大しました。

一方、その次に出てきた助成機関による「研究データの公開義務化」の動きは、そのような明確な目的意識が見当たらず、公的資金を得た研究成果はオープンにされるべき、あるいは研究は追証可能でなければいけない、といった、「説明責任」や「税金の効率的利用」の観点から始まっているように見え、あまりにも夢のない話ですし、助成機関が何かやっているふりをしなくてはいけなくて、始めたのかしら・・・、という印象がありました。それでも、公的資金をもって得た研究成果は共有されなければいけない、という理屈は反論不能で、従わざるを得ませんでした。

更に近年でてきた「オープンサイエンス」に至っては、「研究者が研究データをオープンに共有し、ネット上のプラットフォームで研究者が協働することで、研究が飛躍的に進展し、イノベーションが生まれる」という、夢物語のような世界を掲げ(おそらく研究データのオープン化があまりにも夢がなかったので、夢を無理矢理つけてみたということなのでしょうが)、一体何を目的として、何を開発すれば良いのか、よく分からない、極めて曖昧なコンセプトでした。しかも、「研究データの共有」がコンセプトの中核にあるため、その前に出てきた「研究データの公開義務化」との区別が明確でなく、何をすればよいのかよく分かりませんでした(少なくとも私は!)。

しかしここでは明確に、論文や研究データ、プレプリントなどの「学術界の共有財産」を商業出版社の囲い込みから守るためと、オープンサイエンスの目的を定義しています。
また実際、この記事で指摘されているように、気がついてみれば研究データやプレプリントなども、商業出版社により囲い込みされつつあります。先日WILEYの研究データ共有に関するアンケート調査結果を皆さんにお送りしましたが、そこでも「研究データ共有の方法」で第一に挙がるのは「学術雑誌のサプルメント(67%)」で、2位の「ウェブページ(37%)」は大きく引き離されています。WILEYはこの記事で、研究データがほぼ「学術雑誌のサプルメント」として、出版社のサーバーを介して共有されているという事実から、より研究活動に寄り添った使いやすいデータサーバーとしなくてはいけないと主張していますが、研究データはそれだけ「実態として」出版社の元にあるということを我々は認識する必要があります。

このような研究データやプレプリントも含めた商業出版社の囲い込みの現実を踏まえると、(世界でその認識に至っている人は未だ少ないとは思いますが)オープンサイエンスは、初期のオープンアクセス運動と同じ次元に、ロジックが移行しつつあるのかもしれません。
そうなると、オープンサイエンスの目的も明確となるので、もう少しやるべきことが明確になってくる予感がします。

しかし「商業出版社からの学術リソースの奪取」という点に引きずられすぎるのではなく、デジタル時代の研究活動を円滑かつダイナミックなものとする、e-ScienceやScience 2.0、データ駆動型サイエンスの流れも忘れないようにする必要はあると思います。単なるデータリポジトリや連絡掲示板としてのプラットフォームを構築するのではなく、大量のデータをその場で可視化したり、解析したりすることが容易にできるツールを提供することは、これからのアカデミアの国際競争力に大きく効いてくるように思います。


それにしても過去5〜6年、Chronicle of Higher EducationとInside Higher Edの見出しはつぶさに追っていますが、ほとんどが教育関連が大学運営関連のニュースで、研究面のニュースはほとんど出てこなかったのに、最近になって学術情報流通関連のニュースがチラホラと登場します。この記事も毎日のメールニュースのトップ記事でした。それだけ機が熟してきているということなのでしょうか。

船守美穂