Aurora blog

バイオインフォ・バイオテクノロジーにまつわる情報

Bioinfo

シングルセル解析⑧: 細胞の運命を確率的に推定する (Plantir, CellRank)

問題設計 CellRankは、Fabian TheisとDana Pe'erのグループから最近報告された、シングルセルデータから細胞が将来的に辿る状態遷移の可能性を確率的に求める手法。「細胞Aは細胞Bよりも細胞Cへと辿り着く可能性が高い」といった推定ができる。 www.nature.c…

Context-specific metabolic modelingについて

Context-specific metabolic modeling Context-specific metabolic modelingとは、トランスクリプトーム・プロテオーム等の発現情報を用いて、Recon3DやHuman1等の全代謝反応を含むGenome-scale metabolic model (GEMs)から、解析対象 (e.g. 特定の細胞、組…

マイクロバイオーム解析④:COBRApyで細菌の代謝をモデリングする(2)

2細菌が同じ環境にいるときの代謝を推定する 前回の記事の続き。2種類の細菌が同じ環境にいるときに、Cooperative/Competitiveな関係になるのか、どのように代謝物を交換するのか、といった細菌間相互作用をCOBRApyを使ったFBA (Flux Balance Analysis)で推…

マイクロバイオーム解析④:COBRApyで細菌の代謝をモデリングする

COBRApy 以前の記事で触れたFlux balance analysis (FBA) にはMATLAB用のパッケージCOBRAが使われている論文が多い。筆者の解析環境にはMATLABはインストールされていないので*1、COBRAの機能をPythonで使えるようにしたパッケージCOBRApyを使おうと思うが、…

マイクロバイオーム解析③:bioBakery, Kraken/Bracken

bioBakery bioBakeryはHarvardのCurtis Huttenhowerのグループが開発したマイクロバイオーム解析のツール群である。マイクロバイオーム関連の研究を見ているとよく名前が出てくるツールが多数含まれているので、改めてどのようなツールが提供されているのか…

シングルセル解析⑦:RNA velocity

はじめに Trajectory inferenceはscRNA-seqデータから細胞状態の遷移パターンを推定する解析手法である。一般的にはこれらの手法は、細胞の遺伝子発現データの分布から、どの細胞種(細胞サブセット)が連続的な関係にあるかを推定することができるが、「ど…

シングルセル解析⑥: Ambient RNA contamination除去

はじめに 10X ChromiumをはじめとするDroplet-basedのシングルセル解析を行う場合にAmbient RNA contaminationが問題になることがある。Ambient RNAは細胞に由来しないRNAであり、処理中に壊れた細胞から溶出したRNAや、コンタミネーションなどが由来となる…

シングルセル解析⑤:ディープラーニングはシングルセル解析に有用なのか

はじめに シングルセル解析にディープラーニングを利用して、データのノイズ除去(≒インピューテーション)、細胞種の推定、バッチ補正などを行う事例が出てきている。本当に有用であるか些か疑問に感じていたので*1、まとめたいと思う。 研究事例 scVI 2018年…

マイクロバイオーム解析②: 16Sデータの前処理について

はじめに 16Sアンプリコンシーケンスデータの前処理・一次解析のプロセスを自動化しようとしたら、色々とわかりにくいポイントがあったので以下にまとめる。 シーケンシングまでの過程 データ前処理のプロセスを最適化するには、アンプリコンシーケンスの実…

シングルセル解析④: Compass: Flux balance analysisを使った代謝活性予測

シングルセルデータを使った代謝活性予測 先週のCellに以下の興味深い論文が出ていたので手法を読み解いていく。この論文では、Flux balance analysisをscRNA-seqデータへ応用することで各細胞の代謝状態を推定するCompassというツールを開発し、Th17のサブ…

データベース調査③: シングルセルデータベース

HCA Data Portal Human Cell Atlasで開発されたデータベース。2021年6月時点では55種類のヒト組織に由来する92プロジェクトのシングルセルデータが登録されている。 data.humancellatlas.org HCA Data Portalには基本的にユーザーにより登録されたデータが公…

データベース調査②: メタボロームデータ (HMDB, Metabolomics Workbench, MetaboLights etc)

代謝産物のデータベース GC-MSやLC-MSなどでヒト資料から取得したメタボロームデータのUntargeted解析*1を実施すると、全ピークのうち既知の物質へ帰属できるものは僅か1.8%しかないという報告がある*2。(素人目に見ても)ある意味宝の山とも言えるメタボロー…

データベース調査①: cBioPortal

cBioPortalとは がんに由来する大規模・多種類オミクスデータを整理し、誰もが探索的なデータ利用をできるようにしたプラットフォーム。解析に明るく無くてもGUIで簡単に可視化ができる環境が用意されている。 上記の文献が発表された2013年当時は"TCGA + 10…

マイクロバイオーム解析①:QIIME2を使ったメタ16S解析

QIIME2とは マイクロバイオーム界隈のバイオインフォマティシャンが共同で開発するメタ16S解析用のツールキット((ちなみにチャイムと読む))。自分が学生の頃は旧バージョンのQIIMEしか存在していなかったように思うが、2019年頃に公開されたらしい。 基本的…

空間オミクス解析③:Scanpy/Squidpyを使ってPythonで空間オミクスデータを扱う

Squidpyとは Squidpyは、シングルセルオミクスデータの探索的データ解析(EDA)に使われるScanpyを開発したFabian Theisのグループがつい最近公開した空間オミクス解析のためのPythonモジュール。 squidpy.readthedocs.io www.biorxiv.org 以前のエントリで空…

R:オミクスデータのためのクラス (SummarizedExperiment, MultiAssayExperiment)

はじめに 最近一つの実験で複数種類の高次元データを取得する機会や、ATAC-seqやChIP-seqなどのパラメータがゲノム領域に対応するデータ*1を扱う機会が増えてきた。これまで単一のデータをRで解析する際にはdata.frameクラスやmatrixクラスでデータを扱って…

空間オミクス解析②:解析用ライブラリについて

空間オミクス解析のライブラリ シングルセル解析が普及した背景はChromiumの様な商用の解析装置がリリースされたことに加えて、SeuratやScanpyなどの解析用ライブラリが整備されたことが大きい。これらのライブラリに付属するマニュアルを追いかけさえすれば…

空間オミクス解析①:テクノロジーの概要と現状

空間オミクスとは 組織中の場所と対応づいたオミクスデータを取得する手法。古くはレーザーマイクロダイセクションで組織断片をくり抜き、そこからオミクスデータを取得するような手間のかかる方法が一般的であったが、最近はより短時間で多くの領域からデー…

シングルセル解析③:ダブレット推定手法について

ダブレットとは シングルセル解析で現在主流になりつつあるのは10x Genomics Chromiumのようなドロップレットベースの方法である。この方法はドロップレットの中で磁気ビーズと細胞を封入し、mRNAの逆転写・増幅を行う (下図b)。ビーズにはポリT領域と、ビー…

シングルセル解析②:CITEseqデータの正規化手法について

CITEseqとは シングルセルトランスクリプトームと表面タンパク質発現量*1を同一細胞から計測する技術*2。概要としては以下のような手法である。 オリゴDNAを付与した抗体を使って細胞を標識。このオリゴDNAにはポリA配列*3、標的タンパク毎にに異なるバーコ…

シングルセル解析①: reticulateでRとPythonを両方使う

RとPythonどちらを使う? 10x GenomicsのChromiumが販売され始めてからシングルセル解析は身近なツールになり多くの研究者に使われるようになっています*1。 それに伴い解析のためのツールも続々と開発されており、誰でもデータを利用しようと思えばできる環…

Common Workflow Language (CWL)で解析の再現性を高める

Common Workflow Language (CWL) とは バイオインフォマティクスでは複数のツールを組み合わせたパイプラインを構築してデータを処理することが多いと思います。例えばRNA-seq解析であれば以下のような流れが考えられます。 FASTQファイルの準備 (bcl2fastq)…