日本語

Taylor & Francis社、自社学術雑誌をAI活用のため外部提供―アカデミアから不満の声

学術出版社Taylor & Francis社(以下、TF社)が同社の学術雑誌へのアクセス権を提供する契約をマイクロソフト社と締結したことが判明し、欧米のアカデミアを中心に驚きと批判の声があがっています。

■ TF社とマイクロソフト社とのAIパートナーシップ契約

この契約は、TFとマイクロソフト社とのAIパートナーシップの一環として結ばれたもので、学術雑誌の初期利用経費として1000万ドル、これに加え向こう3年間、継続利用経費(金額は非公表)がマイクロソフト社からTF社へ支払われます。このパートナーシップにより、研究生産性や、自動引用機能のスピードや正確性等の向上、研究者や図書館員の知の生成・共有支援、AIシステムのパフォーマンス向上が図られる予定です。

TF社は、700以上の学会をパートナーとして有し、2700超の学術雑誌を出版しています。人文社会科学分野でリーディングなRoutledge出版や、医学・科学技術系のCRC Pressを有しており、多くのアカデミアが同社を通じて、論文や著書(以下、著作)を出版しています。

[informa PLC: Press Release] (2024.5.8)
Market update: AI Development and Deployment

[informa PLC: 2024 Half-Year Results] (2024.7.24)
Operating Performance, Expansion and Balance Sheet Strength

■ 蚊帳の外にあった著者ら

マイクロソフト社とのAIパートナーシップおよびデータアクセス契約については、TF社の親会社であるInforma社のマーケット情報により、2024年5月8日にすでにプレスリリースされていましたが、この事実がアカデミアに知られることになったのは、英国で現代英文学講師を務めるDr Ruth Alison Clemens氏が7月17日にこの事実をツイートし、多くのアカデミアがこれに反応してからでした。

[Dr Ruth Alison Clemens on X] (2024.7.17)

[Books+Publishing] (2024.7.23)
Academic authors 'shocked' at Microsoft AI agreement

Clemens氏は、TF社のRoutledgeから著書を出版しており、著者としてこの件について知らされていなかったこと、また、何の対価を得る可能性もないことについて不満を示しています。論文データのAIや大規模言語モデル(LLM)利用は、今日のアカデミアにおけるホットイシューとなっており、このような動きは出版社から著者により明確に情報共有されるべきであったとしています。

このニュースを報じたThe Bookseller誌からの取材に対してTF社は、「AIシステムのパフォーマンス等の改善のために、同社が先進的学習データへのアクセス権をマイクロソフト社に対して独占的に提供すること」、「著者の論文の完全性(integrity)を守るため、テキストの文字情報(verbatim text reproduction)にアクセスを限定すること」、「著者は、同社との出版契約の内容に応じ、ロイヤリティーを得る権利を有すること」としています。

Clemens氏は、「著者として、このような事態からオプトアウト可能であるかどうか」について特に、問題視しています。今回は、TF社から論文著者らに何の連絡もなかったため、同社の本件に関する考え方を知ることや、著者によるオプトアウトは不可能でした。The Bookseller誌が本件についてTF社およびマイクロソフト社に質問しましたが、両社ともノーコメントでした。

[The Bookseller] (2024.7.19)
Academic authors 'shocked' after Taylor & Francis sells access to their research to Microsoft AI

■ アカデミアの反応

TF社が著者への断りなく、論文等著作データへのアクセス権をマイクロソフト社に提供したことに対して、欧米の研究者の多くが「驚いた」「不意を突かれた」とコメントしています。

ジョージア工科大学のLauren Barbeau教育・学習ディレクター補佐は、「AIの進展とともに、論文データがAIの学習データとして近い将来のうちに利用されることは見通していた。しかし、その利用はネット上に転がっている(非合法を含む)コンテンツを通じてと思っており、まさか、自分が論文出版した出版社がこれを売り渡すとは思っていなかった」と驚きの内容を的確に表現しています。

論文データが活用されることによるAIツールの正確性向上に期待する声も一部見られますが、一方では、研究者の研究評価の指標でもある論文引用への影響も懸念されています。高等教育コンサルタントで、生成AIの専門家であるLance Eaton氏は、「AIツールは一般に、正確な引用を不得手としており、その導入により、論文の引用情報が不正確になる危険性がある。一方で、論文の引用情報は、研究者のアカデミックキャリアに大きな影響を有しており、これへの影響が懸念される」と指摘しています。

Clemens氏は、今回の事件を「データ・キャピタリズム」の一環として捉え、学術研究に暗い影を落とす危険性を指摘しています。実際、学術出版社は、これまでもアカデミアが生み出した論文で購読ビジネスやOA出版ビジネスを展開して大きな利益を得ており、AI活用のための論文データ提供は次なる収入源の確保であると指摘する声も複数見られます。

[how to be] (2024.7.22)
Academic authors alarmed over Taylor & Francis and Microsoft AI deal

[Inside Higher Ed] (2024.7.29)
Taylor & Francis AI Deal Sets 'Worrying Precedent' for Academic Publishing

■ 著者の利益確保や対抗措置の可能性

出版社による著作データのAI提供について、著者がロイヤリティーを得る可能性が指摘されていますが、世界のOA運動に対してシニカルな見方をいつも提示するGeyser誌は簡単な試算をもって、今回のTF社とマイクロソフト社の初期契約額1000万ドルを論文一本当たりに置き直すと0.15ドルのみであり、仮に契約額の10%が著者にロイヤリティーとして支払われるとしても、論文一本当たり数ペニーにしかならないことを指摘しています。

[The Geyser] (2024.7.31) The CC-BUT-WAIT License

また、ノンフィクション作家を中心に、OpenAIとマイクロソフト社に対して訴訟を起こす動きがでていますが、アカデミアの場合、出版社と著者との間の出版契約において、著作に対する出版社の独占的利用を約束する著作権譲渡の条項が一般的には含まれているため、「訴訟に持ち込むことはほぼ不可能」とコーネル大学ロースクールでデジタル・情報法が専門のJames Grimmelmann教授は指摘しています。

[how to be] (2024.1.7)
Authors launch new lawsuit against Microsoft and OpenAI

[Inside Higher Ed] (2024.7.29)
Taylor & Francis AI Deal Sets 'Worrying Precedent' for Academic Publishing

■ 新たなAI利用ライセンス導入の可能性

著者協会(Society of Authors, SoA)は、「出版社が著者等への断りなく、テックカンパニーと契約を締結することを憂慮している」と述べています。「著作権、人格権(moral rights)、データ保護などに加えて、テックカンパニーとの契約内容(契約額から、データ利用条件等までを含む)の透明性や妥当性など検討すべき観点が複数あります。また、これらが、従来からの「著者の著作の出版・販売」や、これからの「著者の専門職としての未来」に、どのようなインパクトを与えるかが評価される必要があります。クリエイター(著者)は、世界をクリエイティブ産業の要であり、クリエイターを保護する必要性は強調しても強調しすぎることはありません」としています。

SoAは現在、自分の知らないうちに、自分の著作が利用されてしまった著者に対して、著者ライセンス・集金協会(Authors' Licensing and Collecting Society, ALCS)の実施するアンケート調査に参加するよう、呼びかけています。

ALCSは、著作のAI利用を防止あるいは取りやめにすることは不可能と考え、著作データの 1)AIの指示文としての利用ライセンス(Prompt License)、あるいは、2)AIの学習データとしての利用ライセンス(License to Train)の2つを用意することを想定しています。著者が「自身の著作をコントロールする権利」を確立することを通じて、正当な経済的対価を獲得できるようにしたい考えです。アンケートは、この2つのライセンスについて、著者に意見を聞いています。

Authors' Licensing and Collecting Society, Take our survey on AI

なお、Copyright Clearance Centre(CCC)は2024年7月、同社の著作権年間ライセンスにおいて「AIリユース権(AI re-use rights)」を含めることが可能となったことを発表しました。「機関内部利用時に限定して、購読対象著作へのAI利用を可能とする、世界初の共同ライセンス・ソリューション」であるとしています。このライセンス・ソリューションにより、著者は著作物の新たな利用に対して権利と報酬を得ることができます。

Copyright Clearance Centre, Annual Copyright License

(所感)

学術出版社が、論文データを著者に断りなく、AI利用等のために第三者に提供し、利益を得ていることが問題視されています。問題のポイントは主に、1)著者が自身の著作に対して権限を及ぼすことのできる範囲と、2)学術出版社が、無償で執筆されている論文から再び、多額の利益を得ている点にあります

前者については、論文が、「人により執筆され、出版社により印刷・流通され、人により紙媒体で読まれる」という原始的なモデルから、「人によりボーンデジタルに執筆され、学術出版プラットフォーム上で査読・流通し、プラットフォームへのアクセス権により購読可能となる」というデジタル時代のモデル、そして更には、「論文データが集合体として解析され、要約や新たな論文の生成など、新たな付加価値が生み出される」という生成AI時代のモデルへと変遷する過程で、著者や出版社、読者、その他のユーザなどの論文に対する権利関係についても都度、整理されるべきが、デジタル化の動きが速く、状況が混沌としているままに、グーテンベルグの印刷機時代の論文著者から出版社への著作権譲渡の伝統のまま、今に至っているというところに問題があるように思います。動きが速く、アカデミアの考え方が十分にまとまらないことを出版社がうまく逆手に取っているとも言えます。

本年6月に開催されたJapan Open Science Summitの「B3 オープンサイエンス時代の権利保持を考える(1) ― 即時OA下の論文の権利に着目して」というセッションでも指摘しましたが、オープンサイエンス時代あるいはDX時代になり、コンテンツ流通や利用の方式が多様化し、これに伴い、学術情報の生成・加工・流通・利用等に関わるステークホルダーやその関わり方も複雑化するなか、新たな権利分配の方式が検討される必要が生じています。

後者の、学術出版社がアカデミアの生み出す論文等コンテンツをもって、膨大な収益を得ていることについては、長年、世界で問題視されています。AI活用のための論文データ提供は出版社にとっての次なる金脈で、批判の対象となっているわけですが、Geyser誌も指摘するように、これは単なる貧乏人の金持ちに対するやっかみであり、AI時代の本質的な論点ではありません。

[The Geyser] (2024.7.31) The CC-BUT-WAIT License

むしろ、個人的に問題として指摘したいのは、今回のTF社とマイクロソフト社間のAIパートナーシップ契約に関連して、日本人が何の反応もしていないことです。GoogleおよびX上で検索をしましたが、日本語の記事は、AIが勝手に翻訳・生成した読みづらい記事が一本のみ、X上のツイートも一件のみでした。探し方が悪いのかもしれませんが、この件について騒いでいる日本人はごく少数と言えます。

AIに関わる問題は、これから益々大きくなってくることが予想されますが、問題として認識すらされていなかったら、問題の解決や緩和に向けてアクションがなされようがありません。日本はAIについても、LLMについても、世界の中で技術力を有するリーディングな国と思いますが、こうした法制度や権利関係について脇を締めていかないと、せっかくの技術力があっても、それによる旨味を得ることができないように思います。

7月初旬に、Data for Policy 2024(2024/7/9-11、英・Imperial College London)という国際会議に参加しました。Data&Policy、ケンブリッジ大学出版、インペリアル・カレッジ、ゲイツ財団、マイクロソフト社、Smart Data Research UK、アラン・チューリング研究所による共催で、テーマは「未来を読み解く:AIを用いた信頼できるガバナンスは構築可能か?(Decoding the Future: Trustworthy Governance with AI?)」でした。

政治家や政策立案者、産業界からも多数の参加と講演があり、また、アカデミアとのパネルディスカッションも数多く企画され、これからのAI時代における社会のあり方や課題、必要な制度枠組み、ツールなどが幅広く議論されていました。

たとえば、初日冒頭のパネルディスカッションでは、カナダ研究助成機関のデジタル研究主任、マドリッド工科大学AI4Gov長、OECDデジタル政府とデータユニット長、インペリアル・カレッジのAI・イノベーション教授、トニーブレア研究所政府イノベーション政策シニアアドバイザーなどが、Data for Policy 国際会議事務局長の司会で、「AIと信頼性によるガバナンスの転換(Transforming Governance with AI & Trustworthiness)」について議論していました。

複数あった基調講演において、英国統計局の長で、Aberdeen大学の学長でもあったSir Ian Diamond氏は、統計から読み取れる人口動態と、その分析に基づく社会福祉政策を説明し、AIの導入により、データ分析手法上の新たな可能性が生まれるものの、統計情報や統計解析がAIにより置き換わることはないと主張していました。

英国貴族院のLord Holmes of Richmond氏は、自身が手がけたAI法案について、AIを規制する方向と、自由に利用させる方向とがあり、どのような考え方で英国のAI法案を起草したか等について、ウィットやユーモアを交え、会場を沸かせながら、自分の言葉で30分も講演していました。この法案は、労働党への政権交代により残念ながら流れてしまったそうですが、日本の議員で、このような講演をできる者はいるのでしょうか?

この国際会議は来年、アジア太平洋での開催が期待されており、同会議に参加していた日本人3-4名で、日本への誘致可能性を議論しました。しかし、日本の高等教育機関で「AIと法、倫理」などのテーマで、これだけの企画のできるセンター等が思い当たらず、また、2024年と同様の人選で人を無理に集めたとしても、これだけの水準で、未来に向けた議論をできるとも思えず、日本での開催は難しいという判断になりました。

もし、誰かできるという方がいるようでしたら、ご連絡下さい。このような会議の誘致は、日本における議論喚起のためにもなるはずです。

船守美穂