Aurora blog

バイオインフォ・バイオテクノロジーにまつわる情報

データベース調査②: メタボロームデータ (HMDB, Metabolomics Workbench, MetaboLights etc)

代謝産物のデータベース

GC-MSやLC-MSなどでヒト資料から取得したメタボロームデータのUntargeted解析*1を実施すると、全ピークのうち既知の物質へ帰属できるものは僅か1.8%しかないという報告がある*2。(素人目に見ても)ある意味宝の山とも言えるメタボロームのデータはどのように整備されているのだろうか。

HMDB

Human Metabolome Database (HMDB)は2007年に公開された代謝物データベースである。名前の通りヒト由来の代謝物に特化したデータベースであり以下の情報を含む。

例: Butyric acid in HMDB

academic.oup.com

MetaboLights, Metabolomics Workbench

MetaboLightsはEMBL-EBIによって開発されたメタボロームデータベースである。Metabolomics WorkbenchはUCSDとNIHが開発したメタボロームデータ。メタボロームデータ(1次データ、2次データ)のレポジトリとして多くの研究者に利用されている。代謝物のアノテーションデータも整理されているが、情報量はHMDBの方が充実している印象を受ける。Metabolomics Workbenchでは公開されているデータを簡単に解析することも可能*4

academic.oup.com

academic.oup.com

参考資料

理研・津川 裕司先生の講演が統合TVにアップされていて非常に参考になりました。

togotv.dbcls.jp

*1:解析者が対象となる代謝物の情報を与えずにスペクトルを帰属、代謝物を同定する方法

*2:https://www.pnas.org/content/112/41/12549.long

*3:HMDB独自のオントロジーが使われている

*4:触ってみたが、使いこなすのが難しい印象