最近小编不小心了解到了这么个数据库,给大家分享一下!

MiCoDa是一个可搜索数据库,拥有超过35,000个来自水生、宿主相关和矿物环境的处理过16S rRNA基因扩增子序列样本,遍布全球。为提升交叉研究的可比性,MiCoDa中的所有样本均在16S rRNA基因的同一区域(碱基对515和806之间)测序。MiCoDa还承载着地球微生物组项目的样本,这些样本的处理方式相同。MiCoDa目前是目前最大的公共微生物组数据库。其目标是鼓励生命科学领域对现有序列数据的再利用。MiCoDa的起源是基于这样一个观察:生物多样性的再利用非常困难,尤其是微生物组序列数据的复杂性。除了大量数据和元数据收集外,微生物组数据的再利用还需要丰富的生物信息学知识和足够的序列处理计算能力。另一方面,微生物组数据会定期被归档。我们创建MiCoDa是为了利用现有数据,促进微生物组数据的再利用和综合,无论是专家还是非专业人士。为此,研究人员手动整理了包含的数据和元数据,对序列数据进行了预处理以最大化可比性,并创建了一个可搜索的数据门户。

序列可用性占比图
MiCoDa 的输出文件设计得与 R 的 phyloseq 包无缝集成。MiCoDa输出分析的详细示例可在 https://github.com/drcarrot/MiCoDa 中提供。在样本选择后,用户下载一个压缩文件夹,包含三个文件:


AI时代,我们每个人的分析能力都得到极大提升,不管是能力还是效率,期待微生物领域也能获得更给力的成果。