Aurora blog

バイオインフォ・バイオテクノロジーにまつわる情報

2021-01-01から1年間の記事一覧

マイクロバイオーム解析③:bioBakery, Kraken/Bracken

bioBakery bioBakeryはHarvardのCurtis Huttenhowerのグループが開発したマイクロバイオーム解析のツール群である。マイクロバイオーム関連の研究を見ているとよく名前が出てくるツールが多数含まれているので、改めてどのようなツールが提供されているのか…

シングルセル解析⑦:RNA velocity

はじめに Trajectory inferenceはscRNA-seqデータから細胞状態の遷移パターンを推定する解析手法である。一般的にはこれらの手法は、細胞の遺伝子発現データの分布から、どの細胞種(細胞サブセット)が連続的な関係にあるかを推定することができるが、「ど…

シングルセル解析⑥: Ambient RNA contamination除去

はじめに 10X ChromiumをはじめとするDroplet-basedのシングルセル解析を行う場合にAmbient RNA contaminationが問題になることがある。Ambient RNAは細胞に由来しないRNAであり、処理中に壊れた細胞から溶出したRNAや、コンタミネーションなどが由来となる…

シングルセル解析⑤:ディープラーニングはシングルセル解析に有用なのか

はじめに シングルセル解析にディープラーニングを利用して、データのノイズ除去(≒インピューテーション)、細胞種の推定、バッチ補正などを行う事例が出てきている。本当に有用であるか些か疑問に感じていたので*1、まとめたいと思う。 研究事例 scVI 2018年…

マイクロバイオーム解析②: 16Sデータの前処理について

はじめに 16Sアンプリコンシーケンスデータの前処理・一次解析のプロセスを自動化しようとしたら、色々とわかりにくいポイントがあったので以下にまとめる。 シーケンシングまでの過程 データ前処理のプロセスを最適化するには、アンプリコンシーケンスの実…

シングルセル解析④: Compass: Flux balance analysisを使った代謝活性予測

シングルセルデータを使った代謝活性予測 先週のCellに以下の興味深い論文が出ていたので手法を読み解いていく。この論文では、Flux balance analysisをscRNA-seqデータへ応用することで各細胞の代謝状態を推定するCompassというツールを開発し、Th17のサブ…

データベース調査③: シングルセルデータベース

HCA Data Portal Human Cell Atlasで開発されたデータベース。2021年6月時点では55種類のヒト組織に由来する92プロジェクトのシングルセルデータが登録されている。 data.humancellatlas.org HCA Data Portalには基本的にユーザーにより登録されたデータが公…

データベース調査②: メタボロームデータ (HMDB, Metabolomics Workbench, MetaboLights etc)

代謝産物のデータベース GC-MSやLC-MSなどでヒト資料から取得したメタボロームデータのUntargeted解析*1を実施すると、全ピークのうち既知の物質へ帰属できるものは僅か1.8%しかないという報告がある*2。(素人目に見ても)ある意味宝の山とも言えるメタボロー…

データベース調査①: cBioPortal

cBioPortalとは がんに由来する大規模・多種類オミクスデータを整理し、誰もが探索的なデータ利用をできるようにしたプラットフォーム。解析に明るく無くてもGUIで簡単に可視化ができる環境が用意されている。 上記の文献が発表された2013年当時は"TCGA + 10…

マイクロバイオーム解析①:QIIME2を使ったメタ16S解析

QIIME2とは マイクロバイオーム界隈のバイオインフォマティシャンが共同で開発するメタ16S解析用のツールキット((ちなみにチャイムと読む))。自分が学生の頃は旧バージョンのQIIMEしか存在していなかったように思うが、2019年頃に公開されたらしい。 基本的…

CWL②:BioContainer / scatter / when

CWL

CWLを学ぶ part 2 以前のエントリでCWL (Common Workflow Language) について簡単にまとめたが、マニュアルやgithubを見ていると、いくつか知らない機能があることがわかったので、改めてメモを残しておこうと思う。 auroratummy.hatenablog.com github.com …

R Markdownで美しいレポートを作成するためのTips

R

R Markdown RではR Markdownでコードを記述することで、データ解析の結果、データ解析に使われたプログラム、解析プロセスの説明等をHTMLやPDFなどのフォーマットでレポート化することできる。他人に解析結果と解析方法を共有する場合に大変便利な機能だが、…

空間オミクス解析③:Scanpy/Squidpyを使ってPythonで空間オミクスデータを扱う

Squidpyとは Squidpyは、シングルセルオミクスデータの探索的データ解析(EDA)に使われるScanpyを開発したFabian Theisのグループがつい最近公開した空間オミクス解析のためのPythonモジュール。 squidpy.readthedocs.io www.biorxiv.org 以前のエントリで空…

R:オミクスデータのためのクラス (SummarizedExperiment, MultiAssayExperiment)

はじめに 最近一つの実験で複数種類の高次元データを取得する機会や、ATAC-seqやChIP-seqなどのパラメータがゲノム領域に対応するデータ*1を扱う機会が増えてきた。これまで単一のデータをRで解析する際にはdata.frameクラスやmatrixクラスでデータを扱って…