PLOSのRichなCitations

お疲れ様です。プロジェクトマネージャの浜野です。

今日はオープンアクセスの学術雑誌を発行しているPLOSが開始した論文間の引用関係を詳細に表すデータの構築プロジェクト「Rich Citations」を紹介します。

このプロジェクトは、引用文献の見せ方や探し方だけでなく、雑誌や文献の評価指標をも変えてしまう可能性があります。

なぜ従来の引用文献ではダメなのか

引用文献は論文の最後に区別することなく並べて表記されています。しかし、論文の「はじめに」で1回引用される文献もあれば、「解析方法」や「結果」のセクションで8回引用される文献もあり、文献が引用されるセクションや回数によって、その論文における引用文献の意味や重要度がそれぞれ異なるのではないか、というのがこの「Rich Citations」プロジェクトの出発点になっています。

どのような引用情報を保持するのか

PLOSでは、引用元の論文Aと引用先の論文Bの書誌情報にあわせて、PLOSに登載される全ての論文から以下の引用文献に関する情報をボットを使って自動収集しています。

  • 論文Bが論文Aにおいて引用されるセクション
  • 論文Bが引用される際のライセンス
  • 論文BのCrossMarkにおける状態
  • 論文Bは論文Aの論文内で何回引用されているか、引用される際のコンテキスト
  • 論文Aと論文Bの著者が同じかどうか(自己引用か)
  • 論文Aで論文Bと同じ箇所で引用されているほかの記事
  • 論文Aと論文Bのデータ種別(論文、書籍、コードなど)

Rich Citationsで何ができるか

これらのデータを使って、多面的な引用文献情報を表示することで、文献を探す人が有意義な文献であるか判断できる情報をより多く提供できるようになっています。

「Rich Citations」を使った新しい引用文献表示をアルファサイトで確認することができます。例えばこちらの論文にある最初の引用文献は自己引用であり、この論文内で7回引用されていることから、この論文と非常に関連性が高いことがわかります。

引用文献はソートできるようになっており、論文内での引用回数順で並べて関連性の高い文献を探したり、セクション順に並べて重要なセクションで引用されている文献を探したりすることが簡単にできるようになっています。

Rich Citationsの今後

PLOSの最終的な目標は、全ての科学論文の「Rich Citations」を収集し、オープンデータとして提供することを目指しています。それが実現した暁には、被引用情報としても多面的な要素を持つことができるため、インパクトファクターやh指標が従来の被引用を基にした指標から被引用の重み付けを加味した指標へと進化していく可能性があります。

このプロジェクトはまだ始まったばかりですが、学術界に大きな影響のある話題なので、アトラスでも今後の動向を見守っていきます。

[参考サイト]

PLOS Labs Rich Citations

Rich Citations アルファサイト