Personal tools
You are here: Home II. 統合技術開発・提供 II-1. 辞書シソーラス 遺伝子名称シソーラス
Document Actions

遺伝子名称シソーラス

by Member last modified 2007-03-22 16:38

辞書内容と作成方法の説明をしています。 ここから辞書のダウンロードをしていただけます。

1. ダウンロード


dictionary.zip


タブ区切りテキストで、各カラムの意味は以下の通りです。

第1カラム     SWISS-PROTのID
第2カラム EntrezGeneのID
第3カラム 上記以外のDBのID
第4カラム以降 遺伝子名
ファイルの内容:
gene_dict.jpg







2. 登録されているデータ

9種類の生物(ヒト、マウス、ラット、ゼブラフィッシュ、ショウジョウバエ、線虫、出芽酵母、分裂酵母、枯草菌)を対象に遺伝子名、遺伝子ファミリ名を集め並列関係【同義】および上下関係【ファミリ名】で関係付けました。頭文字表記や代表的な遺伝子・ゲノムデータベースID情報も名称と扱います。現在ダウンロード可能な辞書のデータ数は下のとおりです(2007年2月9現在)。


遺伝子数 名称数
遺伝子ファミリ 12,110 27,923
ヒト 27,959 145,623
マウス 48,545 173,375
ラット 17,319 61,801
ゼブラフィッシュ 24,230 60,270
ショウジョウバエ 30,708 96,934
線虫 25,304 96,220
出芽酵母 7,359 29,533
分裂酵母 7,943 15,431
枯草菌 4,206 14,816

3. 作成方法

  1. さまざまな遺伝子・ゲノムデータベースのエリアス(同義語)情報から遺伝子名を網羅的に収集する。

  2. 生物学の知識を持つキュレータにより名称が指す遺伝子の同一関係を確認しグループ化、対応関係に混乱を生じる不適切名称(多義語 異なる遺伝子のアクロニムなど)を削除。
  3. 文献データベースMEDLINE抄録から遺伝子を指す用語を拾い未登録の名称を収集する。
  4. 辞書の遺伝子名検出性能を評価する。
  5. 検出できなかった用語を辞書に付加し、別の文献セットで4-5を繰り返す。

4. 検索ツール

    シソーラス内の遺伝子名を検索できるツールも用意してあります。


Powered by Plone CMS, the Open Source Content Management System

This site conforms to the following standards: