A unified catalog of 204,938 reference genomes from the human gut microbiome

スポンサーリンク

Almeida A, Nayfach S, Boland M, Strozzi F, Beracochea M, Shi ZJ, Pollard KS, Sakharova E, Parks DH, Hugenholtz P, Segata N, Kyrpides NC, Finn RD.

Nat Biotechnol. 2020 Jul 20.

doi: 10.1038/s41587-020-0603-3. Epub ahead of print. PMID: 32690973.

A unified catalog of 204,938 reference genomes from the human gut microbiome - Nature Biotechnology
More than 200,000 gut prokaryotic reference genomes and the proteins they encode are collated, providing comprehensive resources for microbiome researchers.

 ヒト腸内マイクロバイオームは、健康や疾患に関連する重要な表現型に関与している。しかし、多様性を欠いた不完全な参照データが、個々の微生物の役割やその機能、相互作用の理解を妨げている。したがって、微生物リファレンスゲノムと遺伝子の包括的なコレクションを確立することは、腸内微生物生態系の分類学的および機能的レパートリーの正確な特徴づけのための重要なステップである。

 Human Microbiome Project (HMP)は、ヒトの微生物叢の多様性に関する知識を蓄積する先駆的な取り組みである。このプロジェクトより、数百の新規細菌種のゲノムが得られ、参照ベースのメタゲノム研究に利用できるようになった。その後、HMPとMetagenomics of the Human Intestinal Tract (MetaHIT) コンソーシアムから得られた配列データを組み合わせて、Integrated Gene Catalog (IGC) が作成された。この遺伝子カタログは、様々な臨床現場でのマイクロバイオーム研究に応用されており、2型糖尿病、肥満、その他の疾患に関連する微生物の特徴を明らかにしている。しかし、IGCはその起源となるゲノムとの直接的な関連性を持たない遺伝子で構成されているため、高分解能の分類、遺伝的関連性の確立、完全な機能的経路などを推論するための文脈データが不足している。

 培養を伴う研究は、ヒト腸内細菌群集に関する知見を明らかにし続けており、バイオテクノロジーへの応用に不可欠なものとなっている。しかし、ハイスループットシーケンシングや新しいメタゲノム解析法(ゲノムアセンブリーやビニングなど)の出現により、マイクロバイオームの構成に関する理解が一変した。メタゲノム解析は、バイアスは存在するものの、培養を必要とせずにサンプル中の遺伝子を直接分析することで、培養では容易にアクセスできない実質的な微生物の多様性を捉えることができる。これは、de novo アセンブルされたコンティグを、metagenome-assembled genome(MAG)と呼ばれる推定ゲノムにビニングさせることによって達成される。しかし、誤ってビニングされたコンティグが発生する可能性があり、これがさらなる分類学的および機能的な推定に大きな影響を与える。そのため、MAGの使用には慎重な検討が必要であるが、単離ゲノムがない場合の未培養微生物の多様性についての重要な洞察を提供する。

 最近の研究は、既知のヒト腸内細菌のレパートリーを大幅に拡大し、これまでにない数の新しい培養および未培養ゲノムが利用できるようになった。2つの培養研究では、それぞれ500以上のヒト腸内細菌ゲノムが単離・配列決定された。3つの独立した研究は、公開されているヒトマイクロバイオームデータから60,000~150,000のMAGを再構築しており、そのほとんどが新規の種に属するものであった。これら個々の努力を結集し、ヒト腸内ゲノムの統一された非冗長なデータセットを確立することは、将来のマイクロバイオーム研究を推進するために不可欠である。

 これを達成するために、我々は4,644の腸内原核生物から得られた204,938の非冗長ゲノムと170,602,708の遺伝子をコンパイルして解析した。これらのゲノムは1億7000万以上のタンパク質配列をコードしていた。このデータを用いて、これまでに確立されたヒト腸内マイクロバイオームの最も包括的な配列資源であるUnified Human Gastrointestinal Genome (UHGG) and Protein (UHGP) catalogsを生成した。UHGPは、IGCに掲載されているものと比較して、腸内タンパク質の情報を2倍以上に増やすことができる。UHGGの70%以上の種は未培養であり、UHGPの40%には機能的アノテーションがない。種間ゲノム変異解析の結果、ヒト個体群に特異的な付属的遺伝子や一塩基変異体が多数存在することが明らかになった。UHGGとUHGPのコレクションは、ヒト腸内マイクロバイオームの遺伝子型と表現型を結びつける研究を可能にするだろう。

コメント

タイトルとURLをコピーしました