日本語

VoRからRoVへ

■ 学術論文のバージョン

学術研究の過程で、さまざまなバージョンの学術論文が生まれ、さまざまな場所で公開されていますが、これら複数のバージョンを示す標準用語や、バージョンを区別するための基準は長らく存在しませんでした。この問題に対処するために、米国情報標準化機構(NISO)と学会・専門協会出版協会(ALPSP)は合同でジャーナル論文バージョン作業部会を立ち上げ、2008年4月に、ジャーナル論文バージョンの分類と定義に関する勧告レポートを公表しました。

この勧告は、論文の執筆、編集、流通、出版、検索、利用などにおける一連の電子化に伴い、論文が複数のバージョンを持つことや、それらバージョン情報の詳細や関連性が不明瞭であることなどを指摘したうえで、以下のとおり、7つのバージョンを設定し、それぞれを定義しています。

  1. AO=Author's Original:著者のオリジナル原稿。
  2. SMUR=Submitted Manuscript Under Review:査読中の投稿原稿。何らかのジャーナルに投稿され、現在査読を受けている最中のバージョン。
  3. AM=Accepted Manuscript:受理された原稿。査読を通った段階の原稿。著者最終稿と呼ばれることもある。機関リポジトリに登録することができるのは、主にこのバージョンとなる。
  4. P=Proof:出版に向けて校正中の原稿。
  5. VoR=Version of Record:記録のバージョン。正式に出版された論文。
  6. CVoR=Corrected Version of Record:修正された記録のバージョン。
  7. EVoR=Enhanced Version of Record:改良された記録のバージョン。

このうち、AOからSMURまでは査読前の論文であり、一般に「プレプリント」と呼ばれています。それに対して、AM以降の論文は、一括して「ポストプリント」と呼ばれることもあります。

以上の7つのバージョンの中で、これまで最も重要なバージョンとみなされてきたのは、VoRです。VoRは、NISO/ALPSP合同作業部会による報告書の定義によれば、「ジャーナル論文の確定版であり、出版者が、正式かつ独占的に「出版された」と宣言することで利用可能となったもの」です。今日に至るまで、VoRは学術研究の公式かつ唯一の記録としてのバージョンと見なされてきました。そして、学術雑誌や出版者にとっての価値の源泉となってきたのです。

■ VoRをめぐる争い

さて、このVoRをめぐって、VoRの権威を守ろうとする出版者グループと、それに異を唱える図書館、リポジトリ関係者、研究者等の学術コミュニティとの間に激しい論争が起こりました。

その直接のきっかけとなったのは、cOAlition Sが2020年の7月に発表した「権利保持戦略」というものです。皆さん既にご存知のように、ヨーロッパの主な研究助成機関がcOAlition Sという連合を作り、完全にして即時のオープンアクセスをめざして、Plan Sと呼ばれるガイドラインを発表しました。その中で、オープンアクセスを実現するためのルートとして、こういった三つのルートを設定しています。

  1. OA出版:著者は、オープンアクセスジャーナルまたはオープンアクセスプラットフォームで出版する。
  2. 購読誌(リポジトリ):著者は、購読誌に論文を発表し、VoRまたはAMのいずれかをリポジトリでオープンに公開する。
  3. 購読誌の転換(転換契約):著者は、転換契約の下で、購読誌でOA論文を出版する。

「権利保持戦略」というのは、この二つ目のリポジトリルートに関連する戦略でありまして、細かな説明は省きますが、要するに「ゼロ・エンバーゴでグリーンOAを可能とするための戦略」ということになります。グリーンOAというのは、著者がAMまたはVoRをリポジトリ等に登録してOAにする方式のことですが、大半の出版者は、いわゆるエンバーゴ期間というものを設けて、出版後半年後とか1年後でないと、リポジトリでの公開を認めないという制約を課しています。「権利保持戦略」は、cOAlition Sに加盟する研究助成機関から研究費をもらった研究者が、エンバーゴ期間なしに、出版後直ちに、AM、または出版者が許可すればVoRをリポジトリからOAにするための戦略です。

■ 出版者の反発

当然のことながら、この戦略に対して、出版者サイドは強く反発します。

[2020.12.4]
Open post: The rise of immediate green OA undermines progress(11の出版者の連名)
「即時グリーンOAは進歩を阻害する」

[2021.1.12]
Case for Gold Open Access(Springer Nature社のCEO)
「ゴールドOA擁護論」

[2021.2.3]
Signatories publish statement on Rights Retention Strategy (STM)
「権利保持戦略に対する声明」

出版者の主張を整理してみますと、概ね次のようになります。

  • ・ 真のフルオープンリサーチに移行するためには、ゴールドOAを通じて、研究者や読者が品質保証された付加価値のあるVoRに出版後即時にアクセスできるようにする必要がある。
  • ・ エンバーゴなしの即時グリーンOAは、AMという劣悪なバージョンの原稿で学術的記録を混乱させ、オープンサイエンスの実現を遅らせる。
  • ・ 無料の代替物の提供が購読料やAPCによる収入を脅かし、オープンアクセスジャーナルの財政的な持続可能性を損なう。

要するに、ゼロ・エンバーゴのグリーンOAによりVoRの価値が下がり、その結果自らのジャーナルポートフォリオの価値も下がり、購読料やAPCといったジャーナルからの収入が減少することをおそれているわけです。

■ 学術コミュニティからの反論

こうした出版者の意見に対して、学術コミュニティは相次いで反論します。

[2020.12.11]
Correcting the Record: The Critical Role of OA Repositories in Open Access and Open Science(COAR)
「オープンアクセスとオープンサイエンスにおけるOAリポジトリの重要な役割」

[2021.2.18]
Persistent Identifiers Connect a Scholarly Record with Many Versions(ARL)
「永続的識別子は多くのバージョンを持つ学術の記録を結びつける」

[2021.2.3]
cOAlition S response to the STM statement: the Rights Retention Strategy restores long-standing academic freedoms (cOAlition S)
「権利保持戦略は学問の自由を取り戻す」

これらの学術コミュニティサイドからの反論をまとめてみますと、

  • ・ AMは劣ったバージョンではなく、きちんとした査読を通っているので、VoRと同等の内容を持つ。
  • ・ VoRは印刷物の時代の産物である。
  • ・ VoRの価値を生み出す査読は、学術コミュニティが自発的に行っている。
  • ・ VoRに対する出版者の関心は、その学術的な価値ではなく、ビジネス上の利益を反映したものである。

ということになります。

■ 論争は続く

さらに、2021年8月に英国研究・イノベーション機構(UKRI)が発表した新OAポリシーのなかに、Plan Sに準拠した即時グリーンOAの条件が含まれたことを契機として、またしてもVoRをめぐる争いが再燃しました。英国研究図書館コンソーシアムRLUKは歓迎の意を表しましたが、国際STM出版者協会(STM)やALPSPなどの出版者グループからは、ゼロ・エンバーゴのグリーンOA方針に対する懸念の声が上がりました。

■ VoRとプレプリントの比較

ここで、この論争に密接に関連する、非常に興味深い研究があるので、それを紹介したいと思います。「科学雑誌に掲載された論文とそのプレプリント版の比較」という論文です。

Klein, M., Broadwell, P., Farb, S.E. et al. Comparing published scientific journal articles to their pre-print versions. International Journal on Digital Libraries. 20, 335-350 (2019).

この研究の手法は、まず、arXiv.orgとbioRxivという代表的なプレプリントサービスに掲載されたプレプリントとその最終出版版(すなわちVoR)を抽出して、約12,000本の論文のコーパスを作ります。そして、抽出された論文のプレプリントと最終出版版のタイトル、抄録、本文の類似性を次のような5つの指標を用いて測定しています。

  1. レーベンシュタイン距離(文字の挿入、削除、置換などの編集上の介入の量)
  2. レングス(論文の長さの比較)
  3. ジャッカード係数(文字列の類似性)
  4. セーレンセン係数(文字列の類似性)
  5. ペアワイズコサイン類似度(意味的な類似性)

測定によると、まず、arXivですが、タイトルについては、プレプリントと最終的な出版物の間で目立った変化がない。抄録についても、非常に高い類似度を示した。また、本文の95%は、高い類似度を示した、という結果が得られた。bioRxivも、タイトルでは、プレプリントと最終出版版の間に顕著な変化は見られない。抄録の類似度も高いスコアを示す。そして、本文も編集レベルでもセマンティックレベルでも差別化された特徴をほとんど示さない、という結果となっています。

以上に基づき、この論文の著者たちは、「人文社会科学系の論文が比較対象に含まれていないという限界はあるものの、今回使用した論文集合体の範囲内では、プレプリントとそれに対応する最終出版版の論文の間には大きな違いがない」と結論づけています。出版者は、編集や査読のプロセスを通して、自らが論文に加えた付加価値を強調しますが、その付加価値は実はそれほど大きなものではないのかもしれません。(蛇足ですが、この論文が掲載されているInternational Journal on Digital Librariesはシュプリンガー・ネイチャー(Springer Nature)社が出版しているジャーナルです。大手の出版者の度量の広さを感じます。)

■ 学術の記録はVoRからRoVへ

さて、こうした一連の論争の中から、RoVという考え方が生まれました。つまり、紙の時代には、学術の唯一の記録というものは、ジャーナルで出版されたVoRだった。しかし、デジタルの時代になると、研究のプロセスの中で生まれたさまざまなバージョンの論文を記録することが可能となった。さらに、オープンサイエンスの潮流の中で、論文に留まらず、研究データ、ソースコード、プロトコルなども含めて、多様な学術の成果を記録するRoV、Record of Versionsという考え方が提唱されるようになったわけです。

例えば、"Open Access in theory and practice" という本の中には、「21世紀初頭の学術コミュニケーションの中心的な手段であるジャーナルに掲載された論文は、紙の世界から派生したコミュニケーションの様式です。その固定性と平面性は、かなり時代遅れのように見えます。今や学術コミュニケーションは、成熟度の異なるアウトプットを共有し、継続的に更新されるデータ、シミュレーション、ビジュアライゼーション、そしてコメントや解釈を組み合わせた、よりフローに近いものになる可能性を秘めています」といったことが書いてあります。

また、オープンアクセスリポジトリ連合(COAR)は、「VoRは、研究者がプレプリントを素早く共有し、同僚研究者同士がオープンにレビューやコメントを交換し、論文が継続的に更新、修正、拡張されるウェブ対応のダイナミックな環境では、無用の長物となっています。印刷物の時代に培われた、Version of Record(記録のバージョン)という時代遅れの概念から脱却する時が来ているのです」と述べています。

さらに、北米研究図書館協会(ARL)は、「かつては出版され、印刷された研究論文が研究の権威ある情報源であったのに対し、新しい出版方法や他の研究成果物(プロトコル、データ、コードなど)の出版により、「記録のバージョン(Version of Record)」という用語は全く無意味なものになってしまいました。学術コミュニケーションの世界は「複数のバージョンの記録(Record of Versions)」と呼ばれるものに移行しています」というコメントを発表しています。

こうしたさまざまな動きに対応すべく、NISOも2008年の勧告の改訂に向けた活動を始めています。「最初の勧告の公表以来、出版の実践は急速に変化している。例えば、プレプリントは多くの分野で出版形態としての重要性を増しており、出版者も研究の継続性を保つための新しい方法を模索するようになっている。論文のすべてのバージョンは重要であり、引用可能となっているため、単一の「記録のバージョン、VoR」という概念はあまり意味を持たなくなっている」ということで、2020年11月に新たなワーキンググループの立ち上げが承認され、あらたな勧告を出すべく、作業を進めているようです。

こうしたRoVという考え方は今後広まっていき、VoRはその価値を失うことになるのか、それともVoRは依然として学術の公式な記録のバージョンとしての地位を保ち続けるのか、今後の動向から目が離せないところであります。

■ 大手出版者とRoV

既に述べたように、出版者サイドは、VoRの優位性を主張しつつ、他のバージョンが世の中に流通することを警戒していますが、実は、裏では、出版前のバージョンから論文を管理していくための取り組みに着手しているようです。

例えば、シュプリンガー・ネイチャー社は、リサーチ・スクエア(Research Square)というプレプリントサーバと、エリーズ(Aries)という出版ワークフローシステム(論文の投稿受付、編集・査読から出版までのフローを管理するシステム)を連携させて、イン・レビュー(In Review)とよばれるサービスを始めています。シュプリンガー・ネイチャーのジャーナルに論文を投稿する著者は、プレプリントをリサーチ・スクエアから公開するかどうかを選択できます。公開を選択すると、プレプリントが公開され、査読タイムラインを通じて、原稿のステイタス、査読の進み具合などをトレースすることもできます。

シュプリンガー・ネイチャーだけでなく、エルゼビア(Elsevier)社とワイリー(Wiley)社も同じようなシステムを開発しています。

こうした取り組みのねらいは明らかでありまして、プレプリントサーバと出版ワークフローシステムを連携させて、論文を早期のバージョン、つまりプレプリントの段階から自らの出版システムに取り込んで、管理していこうとしているのではないかと考えられるわけです。

ということで、出版者、特に大手の商業出版社は、VoRの優位性を主張しつつも、RoVに備えた準備を着々と進めていることは明らかです。仮に、「学術の記録」がVoRからRoVへと移行したとしても、このままでは、主導権を握るのはまたしても大手の商業出版社なのではないかと危惧しています。

学術コミュニティサイドの対応としては、COARが、RoVを意識したPubfairのようなシステムの提案を行っていますが、スピード、スケール、サステナビリティなどの観点から商業出版社に対抗できるでしょうか。私としては、NII研究データ基盤(NII Research Data Cloud:NII RDC)がRoVのための基盤の役割を果たしてくれることを密かに期待しているのですが......

■ おわりに

最後に、私事ではありますが、この3月末日をもってNIIを退職いたします。RCOSの皆様、その他のNIIの皆様には大変お世話になりました。また、RCOSおよびNIIの活動を外から支えていただいている学術コミュニティの皆様方には、これからも厳しい目でNIIの取り組みを検証していただくようお願いいたします。でも、時にはやさしく見守ってあげてくださいね。では、さようなら。

(尾城 孝一)