Natureグループによる新オープンアクセスジャーナル"Scientific Data"と科学の未来

天下のNature Publishing Groupが来春に新ジャーナル"Scientific Data"を創刊することを発表しました。
Announcement: Launch of an online data journal | Nature

発表によるとScientific Dataは完全オンラインということで、2010年に創刊されたNature Communications誌に続く流れに乗っているようですが、Scientific Dataはさらに流行に乗ってオープンアクセスとのこと。面白そうなことになってきましたね。


Scientific Dataはその名の通りデータ、特にバイオメディカルと環境科学分野の実験データの掲載に特化するそうです。この分野はいわゆるビッグデータ化が顕著な領域で、実験から生み出される膨大なデータをどのように解析するのかという問題が近年、再現性の観点から非常に重大になってきています。

また適切な共有方法やフォーマットが整備されてこなかったため、自分の研究にほかの研究者の実験の生データを使いたくても使えない状況が続いています。

Natureは発表で以下のように述べています。

Data Descriptor articles*1 are fully fledged, peer-reviewed scientific publications, and will be listed in major indexing services, thereby giving authors the credit they deserve for sharing their data and making it usable by others. All Data Descriptors will be released under a Creative Commons licence that allows researchers to reuse, re­distribute and remix the articles’ content.

提出されたデータは査読され、さらに掲載される際にはクリエイティブ・コモンズによってデータの利用を簡便化するということで、先述したデータの品質管理と再利用可能性の問題を一挙に解決しようという意気込みが見えます。オープンアクセス誌のずさんな査読状況を糾弾した2013年版ソーカル事件がこのまえ起こったばかりですし、今回の発表はかなりタイムリーですね。

データの再利用を行う際に混乱を避ける目的で、Data Descriptor articlesにはデータの品質について記述するTechnical Validationと取扱説明書のような役割のUsage Notesというセクションがそれぞれ設けられるそうです。どの程度詳細に書いてくれるかにもよりますが、これは助かりますね。またデータマイニングのために"Experimental Metadata"が付与され、検索性を向上させるとのこと。

NatureによるとScientific Dataは実験データのレポジトリ化を目指すものではないとしていて、既存のレポジトリであるfigshareDryadと連携してデータを共有していくらしいです。Scientific DataにData Descriptorを提出すると同時にfigshareにもデータが送られる仕組みが整備されているとのこと。

個人的に面白いと思ったのが、Scientific Data誌には未発表データはもちろんのこと、他誌で発表済みのデータでも、より詳述する必要が認められれば掲載ができるというシステム。このあたりの著作権問題はどうなってるのかわかりませんが、順調にデータセットが増えれば「関連データがほしかったらまずScientific Dataを見ればいい」とデータ版PubMedのような存在になるのかもしれませんね。

丁寧に取説が用意された高品質な実験データがオンラインで誰にでも使えるようになれば、莫大な予算が必要な分子生物学実験設備が使えない環境にいる研究者(高校生なども)がバシバシ研究を進めていけるようになる「科学の春」が訪れる……といいなァと思います。
僕もData Drivenなシステムバイオロジー研究に若干触れているので、かなりわくわくしています。

*1:SD誌独自の新データ共有フォーマットに基づく記事

Related Posts Plugin for WordPress, Blogger...