外部機関のデータとの対応
外部機関(Species2000, NCBI Taxonomy, MeSH)のデータと生物学名辞書の対応
学名(ラテン語)を基に外部機関のデータとの対応付けを行いました。
学名は正式なものかシノニムであるかは問わず、全てを使いました。(書籍に記載されている学名は、出版時点で正式であっても、現時点でシノニムになっている可能性があるため。)
生物名辞書では、オリジナルの学名表記とは別に、二名法の表現に変換して保存しているカラムがあるので、それを使用した。
Species2000
- 生物名辞書の主要な収集作業が2008-2009年に行われているため、それに合わせて2009年度版を使用。
- 学名がgenus, species, infraspeciesなど、細かく分けて保存されているので、これらを連結し、二名法の表現を作成。これと生物名辞書の二名法の表現と比較し、厳密に一致するものをマッチしたとみなした。
- Species2000から作成した二名法の表現をクエリとして使用し、生物名辞書のRDBを検索した。
- 学名数においてはSpecies2000のほうが32倍多い。( 55,759 vs 1,809,400 )
- Species2000が持っている学名のうち、生物名辞書の学名と一致するものは 33,415件
- Species2000の学名の分布はAnimaliaが67.70%, Plantaeが23.83%, Fungiが6.49% 残りはBacteria, Chromista, Protozoa, Viruses, Archaea
- Species2000における一致率は 1.85 % ( 33,415 / 1,809,400 )
AnimaliaのClass TOP10のカバー率
| Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|
| Animalia | Arthropoda | Insecta | 4,389 | 881,419 | 0.50 | 4,236 | 696,263 | 0.61 | 昆虫綱 |
| Animalia | Chordata | Actinopterygii | 4,221 | 77,284 | 5.46 | 3,486 | 30,018 | 11.61 | 条鰭綱(魚) |
| Animalia | Arthropoda | Arachnida | 120 | 60,410 | 0.20 | 117 | 57,378 | 0.20 | クモ綱 |
| Animalia | Chordata | Reptilia | 140 | 33,092 | 0.42 | 105 | 13,132 | 0.80 | 爬虫綱 |
| Animalia | Chordata | Aves | 8,072 | 22,768 | 35.45 | 7,676 | 21,397 | 35.87 | 鳥綱 |
| Animalia | Arthropoda | Malacostraca | 313 | 22,116 | 1.42 | 286 | 20,141 | 1.42 | 軟甲綱(エビ) |
| Animalia | Arthropoda | Diplopoda | 21 | 15,295 | 0.14 | 17 | 10,584 | 0.16 | ヤスデ綱 |
| Animalia | Porifera | Demospongiae | 49 | 13,169 | 0.37 | 36 | 7,104 | 0.51 | 普通海綿綱 |
| Animalia | Mollusca | Gastropoda | 226 | 9,917 | 2.28 | 225 | 8,902 | 2.53 | 腹足綱(軟体動物) |
| Animalia | Chordata | Mammalia | 3,646 | 7,974 | 45.72 | 3,523 | 7,244 | 48.63 | 哺乳綱 |
PlantaeのClass TOP5のカバー率
| Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|
| Plantae | Magnoliophyta | Magnoliopsida | 1,269 | 187,000 | 0.68 | 1,122 | 100,221 | 1.12 | 双子葉植物綱 |
| Plantae | Magnoliophyta | Liliopsida | 910 | 164,037 | 0.55 | 715 | 65,380 | 1.09 | 単子葉植物綱 |
| Plantae | Rhodophyta | Florideophyceae | 94 | 13,504 | 0.70 | 66 | 6,840 | 0.96 | 真正紅藻綱 |
| Plantae | Bryophyta | Bryopsida | 58 | 12,904 | 0.45 | 58 | 12,904 | 0.45 | 蘚綱 |
| Plantae | Pinophyta | Pinopsida | 46 | 3,993 | 1.15 | 40 | 933 | 4.29 | マツ綱 |
- 生物名辞書における一致率は 59.93 % ( 33,415 / 55,759 )
- Species2000にも日本語名が(読みがローマ字表記で)収録されているが 4,640件しかない。
- 生物名辞書に収録されている日本語名は 57,929件
- Species2000の学名のうち、日本語名との対応がとれるものは 18,324 件で、 98%以上が魚類(条鰭綱:16,747件、板鰓亜綱:1,249件)で占められている。
(実際の日本語収録数4,640件と比べて大幅に増えているのは、日本語が種に対する名称ではなく、 グループに対する名称のものを含んでいるため。) - 生物名辞書の学名のうち、日本語名との対応がとれるものは 55,245 件
- Species2000で、学名対する日本語が存在しているが、 その学名が生物名辞書には無いものの日本語の数は 1,266件 その分布は96%以上が魚類(条鰭綱:1,111件、板鰓亜綱:114件)で占められている。
NCBI Taxonomy
- 生物名辞書の二名法の表現をクエリとして使用し、NCBI Taxonomyのダンプファイルから作成したRDBを検索した。
- NCBI Taxonomyのダンプファイルは2010/05/27にダウンロードしたものを使用。
- names.dmpで、"name class" が "scientific name" または "synonym" となっているものを採用。
- 学名の表現の揺らぎが大きいため、厳密に一致が取れないものについては、SQLのLIKEで"%[genus]%[spieces](%[subspieces])%"といった条件で1件に限定できる場合のみマッチしたとみなした。
- 学名数においてはNCBI Taxonomyのほうが13倍多い。( 55,759 vs 734,020 )
- NCBI Taxonomyが持っている学名のうち、生物名辞書の学名と一致するものは 25,641件
- NCBI Taxonomyの学名の分布はEukaryota/Metazoaが29.20%, Bacteriaが24.76%, Eukaryota/Viridiplantaeが22.87%, Eukaryota/Fungiが8.57% 残りはEukaryota, Archaea, どこにも属していないもの
- NCBI Taxonomyにおける一致率は 3.49 % ( 25,641 / 734,020 )
Eukaryota/MetazoaのClass TOP7のカバー率
| Superkingdom | Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|---|
| Eukaryota | Metazoa | Arthropoda | Insecta | 1,845 | 90,252 | 2.04 | 1,794 | 71,060 | 2.52 | 昆虫綱 |
| Eukaryota | Metazoa | Chordata | Actinopterygii | 1,979 | 25,816 | 7.67 | 1,834 | 16,421 | 11.17 | 条鰭綱(魚) |
| Eukaryota | Metazoa | Chordata | Aves | 5,569 | 12,313 | 45.23 | 5,337 | 11,317 | 47.16 | 鳥綱 |
| Eukaryota | Metazoa | Chordata | Amphibia | 69 | 10,315 | 0.67 | 60 | 5,281 | 1.14 | 両生綱 |
| Eukaryota | Metazoa | Mollusca | Gastropoda | 650 | 9,391 | 6.92 | 628 | 8,555 | 7.34 | 腹足綱(軟体動物) |
| Eukaryota | Metazoa | Arthropoda | Arachnida | 76 | 8,734 | 0.87 | 68 | 6,768 | 1.00 | クモ綱 |
| Eukaryota | Metazoa | Chordata | Mammalia | 2,848 | 8,521 | 33.42 | 2,621 | 7,322 | 35.80 | 哺乳綱 |
BacteriaのClass TOP5のカバー率
| Superkingdom | Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|---|
| Bacteria | Proteobacteria | Gammaproteobacteria | 1,060 | 42,393 | 2.50 | 1,008 | 38,532 | 2.62 | ||
| Bacteria | Actinobacteria | Actinobacteria (class) | 1,734 | 31,257 | 5.55 | 1,644 | 26,162 | 6.28 | ||
| Bacteria | Proteobacteria | Alphaproteobacteria | 632 | 21,953 | 2.88 | 589 | 19,710 | 2.99 | ||
| Bacteria | Firmicutes | Bacilli | 773 | 21,294 | 3.63 | 726 | 19,303 | 3.76 | ||
| Bacteria | Proteobacteria | Betaproteobacteria | 318 | 10,538 | 3.02 | 307 | 9,280 | 3.31 |
Eukaryota/ViridiplantaeのClass TOP5のカバー率
| Superkingdom | Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|---|
| Eukaryota | Viridiplantae | Streptophyta | 2,102 | 113,105 | 1.86 | 1,896 | 73,677 | 2.57 | ||
| Eukaryota | Viridiplantae | Streptophyta | Liliopsida | 686 | 33,446 | 2.05 | 640 | 21,259 | 3.01 | 単子葉植物綱 |
| Eukaryota | Viridiplantae | Streptophyta | Polypodiopsida | 424 | 5,539 | 7.65 | 373 | 3,156 | 11.82 | シダ綱 |
| Eukaryota | Viridiplantae | Streptophyta | Bryopsida | 41 | 4,773 | 0.86 | 38 | 3,427 | 1.11 | 蘚綱 |
| Eukaryota | Viridiplantae | Streptophyta | Jungermanniopsida | 5 | 2,326 | 0.21 | 5 | 1,473 | 0.34 | ウロコゴケ綱 |
Eukaryota/FungiのClass TOP3のカバー率
| Superkingdom | Kingdom | Phylum | Class | 一致数 (シノニムを含む) |
全件数 (シノニムを含む) |
カバー率(%) (シノニムを含む) |
一致数 (シノニムを除く) |
全件数 (シノニムを除く) |
カバー率(%) (シノニムを除く) |
備考 |
|---|---|---|---|---|---|---|---|---|---|---|
| Eukaryota | Fungi | Basidiomycota | Agaricomycetes | 72 | 14,149 | 0.51 | 65 | 13,169 | 0.49 | |
| Eukaryota | Fungi | Ascomycota | Sordariomycetes | 16 | 11,866 | 0.13 | 11 | 11,059 | 0.10 | |
| Eukaryota | Fungi | Ascomycota | Dothideomycetes | 6 | 5,994 | 0.10 | 6 | 5,381 | 0.11 |
- 生物名辞書における一致率は 45.99 % ( 25,641 / 55,759 )
MeSH
- 構造の概略
- DescriptorRecord
- DescriptorName
- Concept
- ConceptName
- SemanticType
- Term
- SemanticTypeが生物関係、具体的には
- Alga
- Amphibian
- Archaeon
- Bacterium
- Fish
- Fungus
- Invertebrate
- Mammal
- Plant
- Rickettsia or Chlamydia
- Virus
- 学名以外の一般名称も同じ場所にあるため、結果には除去しきれなかった学名以外も混入している。
- 学名と一般名称を区別するために使用した正規表現は、"^[A-Z][a-z]*( \\([A-Z][a-z]*\\))? [a-z\\-]+( (subsp\\. )?[a-z\\-]+)?( .*)?$"
- ウィルスの学名は、上記の正規表現とは異なるため、SemanticTypeがVirusで、以下のフレーズを含む場合、無条件で学名とみなしている。
- virus
- viroid
- phage
| SemanticType | 一致数 | 全件数 | カバー率(%) | 学名の分布 | 備考 |
|---|---|---|---|---|---|
| All | 677 | 2,600 | 26.04 | ||
| Alga | 1 | 18 | 5.56 | 0.69 | 藻類 |
| Alga, Invertebrate | 0 | 2 | 0.00 | 0.08 | 藻類, 無脊椎 |
| Amphibian | 2 | 16 | 12.50 | 0.62 | 両生類 |
| Archaeon | 10 | 12 | 83.33 | 0.46 | 古細菌 |
| Bacterium | 337 | 463 | 72.79 | 17.81 | バクテリア |
| Fish | 6 | 44 | 13.64 | 1.69 | 魚類 |
| Fungus | 23 | 56 | 41.07 | 2.15 | 真菌 |
| Invertebrate | 75 | 195 | 38.46 | 7.50 | 無脊椎 |
| Mammal | 40 | 242 | 16.53 | 9.31 | 哺乳類 |
| Plant | 158 | 650 | 24.31 | 25.00 | 植物 |
| Rickettsia or Chlamydia | 23 | 23 | 100.00 | 0.88 | リケッチア・クラミジア |
| Virus | 2 | 879 | 0.23 | 33.81 | ウィルス |
- Species2000, NCBI Taxonomyと違って、微生物の比率が多い。
- ウィルスの学名は表現が多様なため、一致数が少ない。
Species2000 vs NCBI Taxonomy
Species2000, NCBI Taxonomy, 生物名辞書の重なり合いのベン図を完成させるために調査した。
- Species2000から作成した二名法の表現をクエリとして使用し、NCBI Taxonomyのダンプファイルから作成したRDBを検索した。
- Species2000における一致率は 7.97 % ( 144,196 / 1,809,400 )
- NCBI Taxonomyにおける一致率は 19.64 % ( 144,196 / 734,020 )
この一致率の低さはなぜだろう?
重なり合い
| シノニムを含む全ての学名 | 生物種ごと |
|---|---|
![]() |
![]() |
下線の付いていない数字は、結果の数字から算出したもの。
Speices2000に一致した生物名辞書の学名のうち、NCBI Taxonomyにも一致したもの
| Kingdom | 一致数 | 全件数 | 一致数率(%) |
|---|---|---|---|
| Animalia | 12,281 | 23,097 | 53.17 |
| Archaea | 257 | 261 | 98.47 |
| Bacteria | 6,099 | 6,356 | 95.96 |
| Chromista | 57 | 65 | 87.69 |
| Fungi | 448 | 664 | 67.47 |
| Plantae | 1,993 | 2,779 | 71.72 |
| Protozoa | 103 | 188 | 54.79 |
| All | 21,238 | 33,410 | 63.57 |
NCBI Taxonomyに一致した生物名辞書の学名のうち、Speices2000にも一致したもの
| Superkingdom | Kingdom | 一致数 | 全件数 | 一致数率(%) |
|---|---|---|---|---|
| Archaea | 257 | 259 | 99.23 | |
| Bacteria | 6,117 | 6,157 | 99.35 | |
| Eukaryota | Fungi | 448 | 586 | 76.45 |
| Eukaryota | Metazoa | 12,256 | 14,812 | 82.74 |
| Eukaryota | Viridiplantae | 1,931 | 3,446 | 56.04 |
| Eukaryota | 225 | 370 | 60.81 | |
| 4 | 4 | 100.00 | ||
| All | 21,238 | 25,634 | 82.85 |
Species2000, NCBI Taxonomyのどちらにも含まれないものの内訳 注)荒い調査です
| title | distributor | ミスヒット数 | 情報源の学名数 | ミスヒット率(%) | 出版年 | 原版出版年 |
|---|---|---|---|---|---|---|
| 日本産魚類の追加種リスト | 日本魚類学会 | 22 | 209 | 10.53 | 2009 | 2009 |
| 新牧野日本植物圖鑑 | 北隆館 | 2,294 | 6,636 | 34.57 | 2008 | 1940 |
| 新訂 原色昆虫大圖鑑 第 III 巻 (トンボ目・カワゲラ目・バッタ目・カメムシ目・ハエ目 他) | 北隆館 | 1,318 | 3,783 | 34.84 | 2008 | 1965 |
| 暫定新寄生虫和名表 | 日本寄生虫学会 | 130 | 980 | 13.27 | 2008 | 1994 |
| 日本産爬虫両生類標準和名 | 日本爬虫両棲類学会 | 16 | 296 | 5.41 | 2008 | 2002 |
| シノニム・学名の変更 | 日本魚類学会 | 13 | 104 | 12.50 | 2008 | 2008 |
| 新訂 原色昆虫大圖鑑 第 II 巻 (甲虫 篇) | 北隆館 | 2,935 | 4,473 | 65.62 | 2007 | 1963 |
| 新訂 原色昆虫大圖鑑 第 I 巻 (蝶・蛾 篇) | 北隆館 | 924 | 2,888 | 31.99 | 2007 | 1959 |
| 微生物学用語集 英和・和英, III. 動物ウイルス名 | 南山堂 | 128 | 128 | 100.00 ※1 | 2007 | 1973 |
| 日本産魚類の差別的標準和名の改名最終勧告 | 日本魚類学会 | 19 | 86 | 22.09 | 2007 | 2007 |
| 微生物学用語集 英和・和英, II. 真菌名 | 南山堂 | 8 | 30 | 26.67 | 2007 | 1973 |
| 微生物学用語集 英和・和英, I. 細菌名 | 南山堂 | 7 | 6,790 | 0.10 | 2007 | 1973 |
| 日本の野生植物 シダ | 平凡社 | 980 | 1,896 | 51.69 | 2006 | 1992 |
| 世界哺乳類和名辞典 (オンデマンド版) | 平凡社 | 766 | 5,790 | 13.23 | 2005 | 1998 |
| チェックリスト (和名順) | 日本地衣学会 | 361 | 1,401 | 25.77 | 2005 | 2004 |
| New Taxa Proposed in VENUS Volume 64 (2005) | 日本貝類学会 | 8 | 9 | 88.89 | 2005 | 2005 |
| 復刻版 新日本動物圖鑑〔中〕 | 北隆館 | 1,305 | 2,687 | 48.57 | 2004 | 1965 |
| 復刻版 新日本動物圖鑑〔上〕 | 北隆館 | 1,083 | 2,272 | 47.67 | 2004 | 1965 |
| 復刻版 新日本動物圖鑑〔下〕 | 北隆館 | 476 | 2,639 | 18.04 | 2004 | 1965 |
| 植物寄生線虫の和名の改訂 | 日本線虫学会 | 20 | 33 | 60.61 | 2004 | 2004 |
| 日本近海産貝類図鑑 | 東海大学出版会 | 3,740 | 5,142 | 72.73 | 2000 | 2000 |
| 日本産 魚類検索 全種の同定 第二版 | 東海大学出版会 | 71 | 4,451 | 1.60 | 2000 | 1993 |
| 世界鳥類和名辞典 | 大学書林 | 799 | 11,228 | 7.12 | 1993 | 1986 |
| 相模湾産海胆類 | 丸善 | 44 | 201 | 21.89 | 1986 | 1986 |
| 計 | 17,467 | 64,152 | 27.23 |
※1:対応付けプログラム内でのウィルス名の取り扱いを誤ったため、全てがミスヒットになっています。
生物名辞書の弱い分野
Species2000とNCBI Taxonomyの両方に存在している学名が「知名度の高い学名」だと考え、生物名辞書とSpecies2000の対応付けの結果から、「知名度の高い学名」の不足具合を推測してみました。
不足数の多い 20 Class
| Kingdom | Phylum | Class | Spieces2000と NCBI Taxonomyの 両方に存在 ① |
Spieces2000 での全件数 ② |
Spieces2000 における①の比率(%) ③ |
生物名辞書のうち、 Spieces2000と NCBI Taxonomyの 両方に一致した数 ④ |
不足数 ① - ④ |
カバー率(%) | 備考 |
|---|---|---|---|---|---|---|---|---|---|
| Plantae | Magnoliophyta | Magnoliopsida | 23,752 | 187,000 | 12.7 | 993 | 22,759 | 4.18 | 双子葉植物綱 |
| Animalia | Arthropoda | Insecta | 23,770 | 881,419 | 2.7 | 1,091 | 22,679 | 4.59 | 昆虫綱 |
| Plantae | Magnoliophyta | Liliopsida | 14,800 | 164,037 | 9.02 | 567 | 14,233 | 3.83 | 単子葉植物綱 |
| Animalia | Chordata | Actinopterygii | 13,972 | 77,284 | 18.08 | 1,966 | 12,006 | 14.07 | 条鰭綱(魚) |
| Animalia | Chordata | Reptilia | 5,776 | 33,092 | 17.45 | 78 | 5,698 | 1.35 | 爬虫綱 |
| Fungi | Basidiomycota | Agaricomycetes | 4,595 | 36,412 | 12.62 | 63 | 4,532 | 1.37 | |
| Animalia | Chordata | Amphibia | 3,081 | 6,424 | 47.96 | 53 | 3,028 | 1.72 | 両生綱 |
| Fungi | Ascomycota | Sordariomycetes | 2,709 | 16,339 | 16.58 | 15 | 2,694 | 0.55 | |
| Animalia | Chordata | Aves | 7,488 | 22,768 | 32.89 | 5,404 | 2,084 | 72.17 | 鳥綱 |
| Plantae | Bryophyta | Bryopsida | 2,121 | 12,904 | 16.44 | 47 | 2,074 | 2.22 | 蘚綱 |
| Animalia | Arthropoda | Arachnida | 1,975 | 60,410 | 3.27 | 40 | 1,935 | 2.03 | クモ綱 |
| Fungi | Ascomycota | Dothideomycetes | 1,814 | 15,725 | 11.54 | 4 | 1,810 | 0.22 | |
| Animalia | Arthropoda | Malacostraca | 1,843 | 22,116 | 8.33 | 143 | 1,700 | 7.76 | 軟甲綱(エビ) |
| Plantae | Rhodophyta | Florideophyceae | 1,585 | 13,504 | 11.74 | 56 | 1,529 | 3.53 | 真正紅藻綱 |
| Fungi | Ascomycota | Lecanoromycetes | 1,649 | 16,717 | 9.86 | 285 | 1,364 | 17.28 | |
| Fungi | Ascomycota | Eurotiomycetes | 1,137 | 4,103 | 27.71 | 47 | 1,090 | 4.13 | |
| Animalia | Chordata | Mammalia | 3,555 | 7,974 | 44.58 | 2,581 | 974 | 72.60 | 哺乳綱 |
| Animalia | Mollusca | Gastropoda | 948 | 9,917 | 9.56 | 69 | 879 | 7.28 | 腹足綱(軟体動物) |
| Animalia | Cnidaria | Anthozoa | 869 | 7,528 | 11.54 | 52 | 817 | 5.98 | 花虫綱(イソギンチャク・サンゴ) |
| Fungi | Ascomycota | Leotiomycetes | 744 | 8,797 | 8.46 | 2 | 742 | 0.27 |
両方に一致した数が多い 10 Class
| Kingdom | Phylum | Class | Spieces2000と NCBI Taxonomyの 両方に存在 ① |
Spieces2000 での全件数 ② |
Spieces2000 における①の比率(%) ③ |
生物名辞書のうち、 Spieces2000と NCBI Taxonomyの 両方に一致した数 ④ |
不足数 ① - ④ |
カバー率(%) | 備考 |
|---|---|---|---|---|---|---|---|---|---|
| Animalia | Chordata | Aves | 7,488 | 22,768 | 32.89 | 5,404 | 2,084 | 72.17 | 鳥綱 |
| Animalia | Chordata | Mammalia | 3,555 | 7,974 | 44.58 | 2,581 | 974 | 72.60 | 哺乳綱 |
| Animalia | Chordata | Actinopterygii | 13,972 | 77,284 | 18.08 | 1,966 | 12,006 | 14.07 | 条鰭綱(魚) |
| Bacteria | Actinobacteria | Actinobacteria | 2,142 | 2,197 | 97.5 | 1,736 | 406 | 81.05 | 放線菌綱 |
| Animalia | Arthropoda | Insecta | 23,770 | 881,419 | 2.7 | 1,091 | 22,679 | 4.59 | 昆虫綱 |
| Bacteria | Proteobacteria | Gammaproteobacteria | 1,320 | 1,393 | 94.76 | 1,051 | 269 | 79.62 | |
| Plantae | Magnoliophyta | Magnoliopsida | 23,752 | 187,000 | 12.7 | 993 | 22,759 | 4.18 | 双子葉植物綱 |
| Bacteria | Firmicutes | Bacilli | 964 | 1,000 | 96.4 | 780 | 184 | 80.91 | |
| Bacteria | Proteobacteria | Alphaproteobacteria | 761 | 807 | 94.3 | 590 | 171 | 77.53 | |
| Plantae | Magnoliophyta | Liliopsida | 14,800 | 164,037 | 9.02 | 567 | 14,233 | 3.83 | 単子葉植物綱 |
学名不一致の原因
Spieces2000とNCBI Taxonomyのどちらにも一致しなかった学名について、その原因を探ってみました。
予想していた原因と理由は以下のとおりです。
- スペル誤り
- ラテン語の語尾活用違い
- 古すぎて流通していないシノニム
書籍に誤字があることもありますが、書籍に記載されている学名をデジタル化する際に、膨大な人手が掛かっており、作業ミスを全てを修正することが困難なため、それが残ってしまっている可能性があります。
ラテン語は、単語の性別により、語尾が変化します。学名をつける際に、ラテン語ではない単語をラテン語化したときに付与した語尾の性別の違いによって完全一致しないことがあります。
書籍の記載内容は、執筆の時点で最新であったとしても、時間の経過とともに内容が古くなってしまいます。執筆の時点でさえ古い名称は、現在の名称との対応付けができないため、不一致となります。
哺乳類については、「Classification of Mammals Notions of taxonomy Mammals'Planet」(http://planet-mammiferes.org/drupal/en/node/37?taxon=1)の「List of synonym taxa」に、シノニムと現在の名称の対応表がありました。
この対応表がどれだけ信用できるものなのかはわかりませんが、他にシノニムと現在の名称を簡単に結びつけることができる表が見当たらなかったので、この対応表を使ってみることにしました。
不一致になっていた哺乳類の学名を調べると 363 / 646 件(56.19%)が現在の学名ではなく、シノニムであることがわかりました。
Spieces2000およびNCBI Taxonomyにもシノニムの名称が登録されており、対応付け作業でもシノニムを考慮していましたが、シノニムが全て登録されているわけでは無いようです。
サイエンスミュージアムネット(S-Net)
生物名辞書は、日英対訳に主眼を置いて収集されているので、国内に生息する生物の名称が主体になっている。
そのため、世界中の生物名称を収集している機関のデータとの対応付けでは、一致率が低くなってしまうのは当然である。
そこで、生物名辞書と同様に、日本に生息する生物名が集まっている機関として、国内の科学系博物館の情報や、自然史系の標本に関する情報を検索できるポータルサイト「サイエンスミュージアムネット」(http://science-net.kahaku.go.jp/)に注目し、生物標本の詳細情報から、生物名を集めました。
- 収集したデータは、1,751,638件(2010/08/24時点)、分類に関する情報のみで重複を排除すると、602,410件、種の学名のみで重複を排除すると、74,182件。
- 界より下の分類は付いていないものが多いため、界ごとに集計した。
- 分類の付いているデータも、複数の分類体系が存在している。
- どちらも学名がシノニムであるかどうかは不明なため、シノニムを除外した集計は行えない。
- 亜種以下のタクソンは表記の揺らぎが大きいため、種レベルに切り上げて比較する。
| Kingdom | 一致数 | 全件数 | カバー率(%) |
|---|---|---|---|
| Animalia | 16,687 | 46,179 | 36.14 |
| Chromista | 30 | 404 | 7.43 |
| Fungi | 234 | 5,307 | 4.41 |
| Plantae | 4,847 | 21,925 | 22.11 |
| Protozoa | 0 | 367 | 0.00 |
| All | 21,798 | 74,182 | 29.38 |
結果を部分的に見ると、Aves 84.40% ( 1,921 / 2,276 ), Mammalia 78.20% ( 104 / 133 ), Insecta 33.24% ( 3,505 / 10,534 ) と、高めのカバー率にはなっているが、分類の付いていないデータでのカバー率が低い。
同じ「日本」に偏重している生物名の集合同士で、このカバー率は低すぎる。
Species2000 vs S-Net
Species2000とS-Netの学名の対応付けを行うことにより、S-NetのデータをSpecies2000の分類で集計を行ってみました。
- 亜種以下のタクソンは、種レベルに切り上げています。
- シノニムも除外しています。
Species2000と生物名辞書についても、同じ条件で再度、対応付けを行ってみました。
絶対数の多い 30 Class
| Kingdom | Phylum | Class | 全件数 | S-Net | 生物名辞書 |
差 (① - ②) |
||
|---|---|---|---|---|---|---|---|---|
| 一致数① | カバー率(%) | 一致数② | カバー率(%) | |||||
| Animalia | Arthropoda | Insecta | 678,622 | 8,167 | 1.20 | 4,208 | 0.62 | 3,959 |
| Plantae | Magnoliophyta | Magnoliopsida | 85,188 | 3,041 | 3.57 | 1,104 | 1.30 | 1,937 |
| Plantae | Magnoliophyta | Liliopsida | 59,173 | 1,387 | 2.34 | 702 | 1.19 | 685 |
| Animalia | Arthropoda | Arachnida | 55,689 | 357 | 0.64 | 116 | 0.21 | 241 |
| Animalia | Chordata | Actinopterygii | 29,549 | 6,199 | 20.98 | 3,445 | 11.66 | 2,754 |
| Animalia | Arthropoda | Malacostraca | 19,354 | 762 | 3.94 | 284 | 1.47 | 478 |
| Plantae | Bryophyta | Bryopsida | 12,899 | 1,241 | 9.62 | 58 | 0.45 | 1,183 |
| Fungi | Basidiomycota | Agaricomycetes | 10,357 | 783 | 7.56 | 58 | 0.56 | 725 |
| Animalia | Chordata | Aves | 9,913 | 2,063 | 20.81 | 7,676 | 77.43 | -5,613 |
| Animalia | Arthropoda | Diplopoda | 9,810 | 12 | 0.12 | 17 | 0.17 | -5 |
| Animalia | Chordata | Reptilia | 8,761 | 109 | 1.24 | 83 | 0.95 | 26 |
| Animalia | Mollusca | Gastropoda | 8,363 | 287 | 3.43 | 221 | 2.64 | 66 |
| Fungi | Ascomycota | Dothideomycetes | 7,196 | 63 | 0.88 | 6 | 0.08 | 57 |
| Animalia | Porifera | Demospongiae | 6,890 | 7 | 0.10 | 37 | 0.54 | -30 |
| Fungi | Ascomycota | Sordariomycetes | 6,852 | 109 | 1.59 | 14 | 0.20 | 95 |
| Plantae | Rhodophyta | Florideophyceae | 6,345 | 642 | 10.12 | 68 | 1.07 | 574 |
| Plantae | Bacillariophyta | Bacillariophyceae | 6,213 | 0 | 0.00 | 0 | 0.00 | 0 |
| Animalia | Cnidaria | Anthozoa | 5,924 | 105 | 1.77 | 133 | 2.25 | -28 |
| Animalia | Chordata | Amphibia | 5,752 | 67 | 1.16 | 59 | 1.03 | 8 |
| Animalia | Arthropoda | Maxillopoda | 4,963 | 19 | 0.38 | 134 | 2.70 | -115 |
| Fungi | Ascomycota | Lecanoromycetes | 4,898 | 652 | 13.31 | 379 | 7.74 | 273 |
| Animalia | Chordata | Mammalia | 4,835 | 277 | 5.73 | 3,454 | 71.44 | -3,177 |
| Animalia | Cnidaria | Hydrozoa | 3,694 | 12 | 0.32 | 122 | 3.30 | -110 |
| Fungi | Ascomycota | Leotiomycetes | 3,203 | 105 | 3.28 | 3 | 0.09 | 102 |
| Animalia | Arthropoda | Chilopoda | 3,142 | 12 | 0.38 | 13 | 0.41 | -1 |
| Animalia | Annelida | Polychaeta | 2,987 | 70 | 2.34 | 98 | 3.28 | -28 |
| Animalia | Arthropoda | Entognatha | 2,666 | 54 | 2.03 | 6 | 0.23 | 48 |
| Animalia | Nemata | Adenophorea | 2,637 | 0 | 0.00 | 1 | 0.04 | -1 |
| Bacteria | Cyanobacteria | Notassigned | 2,626 | 1 | 0.04 | 4 | 0.15 | -3 |
| Fungi | Ascomycota | Notassigned | 2,257 | 7 | 0.31 | 1 | 0.04 | 6 |
| All | 1,140,551 | 29,203 | 2.56 | 30,371 | 2.66 | -1,168 | ||
S-NetのMammaliaは、妙に一致数が少ない気がする。
上述の「知名度の高い学名」が不足していると推測していたとおり、Insecta, Actinopterygii, Magnoliopsidaで1,000件を超える不足があるようです。
Species2000との一致数が近いことから、既存の生物名辞書の収録量は十分であると考えることもできる。
しかし、S-Netに対する生物名辞書のカバー率はかなり低いので、国内で流通している生物名の多くが、最新の名称で呼ばれていないのかもしれない。



