2021-01-01から1年間の記事一覧
bioBakery bioBakeryはHarvardのCurtis Huttenhowerのグループが開発したマイクロバイオーム解析のツール群である。マイクロバイオーム関連の研究を見ているとよく名前が出てくるツールが多数含まれているので、改めてどのようなツールが提供されているのか…
はじめに Trajectory inferenceはscRNA-seqデータから細胞状態の遷移パターンを推定する解析手法である。一般的にはこれらの手法は、細胞の遺伝子発現データの分布から、どの細胞種(細胞サブセット)が連続的な関係にあるかを推定することができるが、「ど…
はじめに 10X ChromiumをはじめとするDroplet-basedのシングルセル解析を行う場合にAmbient RNA contaminationが問題になることがある。Ambient RNAは細胞に由来しないRNAであり、処理中に壊れた細胞から溶出したRNAや、コンタミネーションなどが由来となる…
はじめに シングルセル解析にディープラーニングを利用して、データのノイズ除去(≒インピューテーション)、細胞種の推定、バッチ補正などを行う事例が出てきている。本当に有用であるか些か疑問に感じていたので*1、まとめたいと思う。 研究事例 scVI 2018年…
はじめに 16Sアンプリコンシーケンスデータの前処理・一次解析のプロセスを自動化しようとしたら、色々とわかりにくいポイントがあったので以下にまとめる。 シーケンシングまでの過程 データ前処理のプロセスを最適化するには、アンプリコンシーケンスの実…
シングルセルデータを使った代謝活性予測 先週のCellに以下の興味深い論文が出ていたので手法を読み解いていく。この論文では、Flux balance analysisをscRNA-seqデータへ応用することで各細胞の代謝状態を推定するCompassというツールを開発し、Th17のサブ…
HCA Data Portal Human Cell Atlasで開発されたデータベース。2021年6月時点では55種類のヒト組織に由来する92プロジェクトのシングルセルデータが登録されている。 data.humancellatlas.org HCA Data Portalには基本的にユーザーにより登録されたデータが公…
代謝産物のデータベース GC-MSやLC-MSなどでヒト資料から取得したメタボロームデータのUntargeted解析*1を実施すると、全ピークのうち既知の物質へ帰属できるものは僅か1.8%しかないという報告がある*2。(素人目に見ても)ある意味宝の山とも言えるメタボロー…
cBioPortalとは がんに由来する大規模・多種類オミクスデータを整理し、誰もが探索的なデータ利用をできるようにしたプラットフォーム。解析に明るく無くてもGUIで簡単に可視化ができる環境が用意されている。 上記の文献が発表された2013年当時は"TCGA + 10…
QIIME2とは マイクロバイオーム界隈のバイオインフォマティシャンが共同で開発するメタ16S解析用のツールキット((ちなみにチャイムと読む))。自分が学生の頃は旧バージョンのQIIMEしか存在していなかったように思うが、2019年頃に公開されたらしい。 基本的…
CWLを学ぶ part 2 以前のエントリでCWL (Common Workflow Language) について簡単にまとめたが、マニュアルやgithubを見ていると、いくつか知らない機能があることがわかったので、改めてメモを残しておこうと思う。 auroratummy.hatenablog.com github.com …
R Markdown RではR Markdownでコードを記述することで、データ解析の結果、データ解析に使われたプログラム、解析プロセスの説明等をHTMLやPDFなどのフォーマットでレポート化することできる。他人に解析結果と解析方法を共有する場合に大変便利な機能だが、…
Squidpyとは Squidpyは、シングルセルオミクスデータの探索的データ解析(EDA)に使われるScanpyを開発したFabian Theisのグループがつい最近公開した空間オミクス解析のためのPythonモジュール。 squidpy.readthedocs.io www.biorxiv.org 以前のエントリで空…
はじめに 最近一つの実験で複数種類の高次元データを取得する機会や、ATAC-seqやChIP-seqなどのパラメータがゲノム領域に対応するデータ*1を扱う機会が増えてきた。これまで単一のデータをRで解析する際にはdata.frameクラスやmatrixクラスでデータを扱って…