データベース調査②: メタボロームデータ (HMDB, Metabolomics Workbench, MetaboLights etc)
代謝産物のデータベース
GC-MSやLC-MSなどでヒト資料から取得したメタボロームデータのUntargeted解析*1を実施すると、全ピークのうち既知の物質へ帰属できるものは僅か1.8%しかないという報告がある*2。(素人目に見ても)ある意味宝の山とも言えるメタボロームのデータはどのように整備されているのだろうか。
HMDB
Human Metabolome Database (HMDB)は2007年に公開された代謝物データベースである。名前の通りヒト由来の代謝物に特化したデータベースであり以下の情報を含む。
- バイオロジーとの関連 *3
- 関連疾患
- 代謝物の量に影響する遺伝因子(eQTL)
- 代謝物の量に影響する薬剤
- 存在するBiosampleの種類(e.g. 血液、唾液)
- 産生するバクテリア
- 上記の関連を示す文献情報
- リファレンススペクトル (MS/MS, GC-MS, NMR)
- 物性情報 (実測データ・予測データ両方)
- パスウェイとの対応 (パスウェイ情報としてSMPDBを使用)
- 他の代謝物DBとのIDの対応表 (KEGG, InChI, PubChem, ChemSpider等)
MetaboLights, Metabolomics Workbench
MetaboLightsはEMBL-EBIによって開発されたメタボロームデータベースである。Metabolomics WorkbenchはUCSDとNIHが開発したメタボロームデータ。メタボロームデータ(1次データ、2次データ)のレポジトリとして多くの研究者に利用されている。代謝物のアノテーションデータも整理されているが、情報量はHMDBの方が充実している印象を受ける。Metabolomics Workbenchでは公開されているデータを簡単に解析することも可能*4。
参考資料
理研・津川 裕司先生の講演が統合TVにアップされていて非常に参考になりました。