ベンチメソッドオントロジー
| (背景) ライフサイエンス研究の中心は日々のベンチワークです。そこから生み出されるデータや知見は、論文とともにデータベースにも蓄積されるようになり、インターネットを通じて誰もが利用できる環境が整いつつあります。 | |
実施内容(本年度成果と課題)
![]() | (1)プロトコール辞書の作製 実験という名目でデータベースや論文を索引付けするためには、まず実際に利用されている実験の名前を集めて辞書を作成する必要があります。一つの実験には沢山の表現(同義語、類義語)が存在しますので、できるだけ多くの表現を集めることが必要になります。今年度は実験名収集のためのリソースの調査を行いました。日本語の検索にも利用可能な和英辞書として公開を行います。この課題では、本やインターネットから実験名を抽出しますが、ある程度手作業によることになってしまいます。またその辞書を利用した索引づけも、アノテータなどの力によるものになると考えられます。次年度からは他の技術開発項目と連携を図り、作業の効率化を進めます。 (2)ベンチメソッドオントロジーの構築 実験名がタグ付けされたデータベースや論文を、意味の近さでまとめるためには、それぞれの実験が他のどのような実験の要素と関係があるのかについて関連付けなければなりません。ある実験名称がどのような材料を利用して、どのような内容の操作を行うのかについて、オントロジーを構築し整理する必要があります。そこで今年度はメソッドオントロジーのプロトタイプを作成(図3)、核酸の基本メソッドについて応用しました。現在は人の理解を助けるためのオントロジーですが、実際に機械が理解し解析サービスのもとになるオントロジーとする必要があります。特に一連の実験フローの中では、バイオインフォマティクスのメソッドが用いられることも多く、将来的にはドライメソッドとその材料とも言うべきデータベースのオントロジーとの連携について検討する予定です。 (3)論文からの目的と実験手法の抽出(課題)例えば一般的なマイクロアレイ実験の目的は遺伝子発現をプロファイルするものと言ってしまうと、どのデータも同じ性質のものとなってしまいますが、実際にはそれぞれの実験においてより具体的な目的があるはずです。データを真に理解するためには、実験者が何のためにその実験を計画し、どのような手順で行ったかという情報が必要です。本課題では、辞書やオントロジーで実験名の整理を行うとともに、論文から目的と手法のセットを抽出を進め(図4)、データベース検索を高度化し、ライフサイエンスの方法というものについて、分析と記述を進める予定です。 |
図2 それぞれの領域を結ぶための基盤構築 | |
![]() | |
図3 ベンチメソッドオントロジーの設計 | |
![]() | |
図4 DB論文の目的と実験手法データベース |


