subscribe to the RSS Feed

Monday, May 21, 2012

科学におけるオープンデータのためのPanton原則 とは?

Posted by admin on 2010/03/01

イギリスのNPO団体であるOpen Knowledge Foundationは、2010年の2月19日付のブログで、「科学におけるオープンデータのためのPanton原則」を公開したと発表しました。Open Knowledge Foundationはデジタル時代に則した形で、自由に利用再利用や再配布ができる情報をよりもっと増やし、人類全体の知識をより高めて行こうというOpen Knowledge運動を推進する団体です。メンバーにはクリエイティブ・コモンズやサイエンス・コモンズの人々も多く参加しています。

この団体の取り組むプロジェクトの一例としてオープンシェイクスピアプロジェクトというものがあります。すでに世界遺産ともいえるような古いものなのに、出版などの過程において様々な権利で自由に利用できなくなっている文章を、オープンに、しかも完全版として、公開しようというプロジェクトです。

公開済み、もしくは公開を望まれている科学のデータが、どうして上手く利用されないのかについて、統合データベースプロジェクトではシンポジウムなどを開いて現状の理解と、解決策の議論を進めてきました(シンポジウム)。また実際に、統合データベースプロジェクトに寄託されたデータには、クリエイティブコモンズライセンスを付けて公開し、法的にも認められた形で第三者が安心してデータが利用できるよう工夫しています(データベースアーカイブ)。

今日ここで取り上げるPanton原則は、Open Knowledge FoundationのOpen Data in Scienceワーキンググループが中心となって作った、主に科学データに関するものです。この原則の中では、科学データに適したライセンスとして、「クリエイティブコモンズのライセンス(CCZeroは別)、GFDL、GPL、BSDなどはデータに適しておらず、それらを使用することには強く反対します。」とあります。そして、「パブリックドメイン寄贈ライセンス(PPDL:Public Domain Dedication and Licence)またはクリエイティブ・コモンズCC0著作権放棄」を使いましょうとしています。そしてこの原則への賛同をつのっています。

賛同するということであれば、統合データベースプロジェクトにおいて、データベース公開の際のライセンスとしてクリエイティブコモンズライセンスを普及させようとする道筋を世界と歩調をあわせ少し修正しなければならないかもしれません。そこでまずは、このPanton原則を、私なりに翻訳してみましたのでご一読下さい。ただし、翻訳は本記事を記入時、他の人の校閲を受けておりませんので間違っている部分があるかもしれません。必ず原文もあわせてお読み下さい。

Panton Principles (原文)

———————翻訳はここから———————

パントン原則

科学におけるオープンデータのための原則

出版された科学知識を再利用し、自由に批判することは科学の基礎であり、科学はその上に構築されています。

科学が効果的に機能するために、また、社会が科学から十分に利益を得るために大切なことは科学データがオープンであることです。

私たちが言う科学におけるオープンデータとは、インターネットから誰もが自由にデータにアクセスし利用できるということを意味しています。ダウンロードや複製、解析、再構築、ソフトウェアで利用すること、その他いかなる目的であれ、自由な利用が許可されます。そこにはインターネットが使えるかどうかということ以外、金銭や法律、技術的な障壁はありません。この目的を果たすため、出版済みの科学に関連するデータは明示的にパブリックドメインに置かれるべきです。

そこで私たちは正式に、以下の原則にのっとって行動することを提言します。

1. データやデータのコレクションががどのようなところで出版されるかは非常に重要な問題です。個々のデータ要素、全データコレクション、そしてコレクションのサブセット、のいずれをも、再利用したり別目的に利用されることを尊重しているという出版者の希望や期待が、明確かつ明示的に述べられていることが重要です。この声明は、正確かつ変更不能で、権利放棄(waiver)もしくは許諾(license)といった形式の法的に適切で認められたものでなければなりません。

データを出版するときにはあなたの意思を明示的かつしっかりと公表しましょう。

2. 広く知られている既存のライセンスは、データやデータのコレクションのために意図されたもので無く適当ではありません。データの取り扱いのため適するようにデザインされた様々な権利放棄や許諾は、こちらのサイトに説明があります。クリエイティブコモンズのライセンス(CCZeroは別)、GFDL、GPL、BSDなどはデータに適しておらず、それらを使用することには強く反対します。

データに適したもので認められている権利放棄や許諾を使いましょう

3. 商用の再利用を制限するライセンスや、派生著作物の制作を特定の目的、特定の個人や団体に制限するライセンスの使用は強く認められません。そのようなライセンスは、データセットの効果的な統合や、再目的化を不可能にするばかりでなく、データの保存をサポートすることに使われるような商業活動までをも妨げることになります。

もしあなたのデータが他の人によって有効に利用され追加されることを望むなら、データは”Open Knowledge / Data Definition” の規定に従って公開するべきです。その際、非営利その他の制限は使うべきではありません。

4. さらに、科学の中でも、特に公的資金により作られたデータは、パブリックドメイン寄贈ライセンス(PPDL:Public Domain Dedication and Licence)またはクリエイティブ・コモンズCC0著作権放棄を使用して、明示的にパブリックドメインに置くことを強く推奨します。このことは、公的資金で維持されている多くの科学研究に対するものですが、共有や再利用についての科学コミュニティーにおける一般的な価値観とも一致します。

出版済みの科学が保持するデータをPPDLやCCZeroを使って明示的にパブリックドメインに提供することは強く推奨されることであり、サイエンスコモンズの”Protocol for Implementing Open Access Data“と”Open Knowledge/Data Definition”がコンプライアンスを保障します。

著者:

Peter Murray-Rust、 ケンブリッジ大学(英国)
Cameron Neylon、STFC(英国)
Rufus Pollock、Open Knowledge財団とケンブリッジ大学(英国)
John Wilbanks 、サイエンスコモンズ(米国)

Open Knowledge財団の Open Data in Scienceワーキンググループメンバーの助けにより

———————翻訳ここまで———————

翻訳は以上ですが、この内容を理解しようとするためには、さらに文中に何度も現れるOpen Knowledge/Data Definitionを理解する必要があります。ところでパントンは、この原則がイギリスのケンブリッジのパントン通りにある、PANTON ARMS というパブで草案が練られたことにちなんでいるそうです。(つづく)

(文章・翻訳)ライフサイエンス統合データベースセンター 川本祥子