遺伝子名称シソーラス
辞書内容と作成方法の説明をしています。 ここから辞書のダウンロードをしていただけます。
1. ダウンロード
dictionary.zip
タブ区切りテキストで、各カラムの意味は以下の通りです。
第1カラム SWISS-PROTのIDファイルの内容:
第2カラム EntrezGeneのID
第3カラム 上記以外のDBのID
第4カラム以降 遺伝子名

2. 登録されているデータ
9種類の生物(ヒト、マウス、ラット、ゼブラフィッシュ、ショウジョウバエ、線虫、出芽酵母、分裂酵母、枯草菌)を対象に遺伝子名、遺伝子ファミリ名を集め並列関係【同義】および上下関係【ファミリ名】で関係付けました。頭文字表記や代表的な遺伝子・ゲノムデータベースID情報も名称と扱います。現在ダウンロード可能な辞書のデータ数は下のとおりです(2007年2月9現在)。| 遺伝子数 | 名称数 | |
|---|---|---|
| 遺伝子ファミリ | 12,110 | 27,923 |
| ヒト | 27,959 | 145,623 |
| マウス | 48,545 | 173,375 |
| ラット | 17,319 | 61,801 |
| ゼブラフィッシュ | 24,230 | 60,270 |
| ショウジョウバエ | 30,708 | 96,934 |
| 線虫 | 25,304 | 96,220 |
| 出芽酵母 | 7,359 | 29,533 |
| 分裂酵母 | 7,943 | 15,431 |
| 枯草菌 | 4,206 | 14,816 |
3. 作成方法
さまざまな遺伝子・ゲノムデータベースのエリアス(同義語)情報から遺伝子名を網羅的に収集する。
- 生物学の知識を持つキュレータにより名称が指す遺伝子の同一関係を確認しグループ化、対応関係に混乱を生じる不適切名称(多義語 異なる遺伝子のアクロニムなど)を削除。
- 文献データベースMEDLINE抄録から遺伝子を指す用語を拾い未登録の名称を収集する。
- 辞書の遺伝子名検出性能を評価する。
- 検出できなかった用語を辞書に付加し、別の文献セットで4-5を繰り返す。
4. 検索ツール
シソーラス内の遺伝子名を検索できるツールも用意してあります。