APP下载

AWS开源云端基因组分析工作流程部署工具Amazon Genomics CLI

消息来源:baojiabao.com 作者: 发布时间:2024-10-02

报价宝综合消息AWS开源云端基因组分析工作流程部署工具Amazon Genomics CLI

AWS现在开源能够处理PB级基因组资料的工具Amazon Genomics CLI,用户可以将这个工具与目前公开可用的工作流程工具一起使用,并在这些基础上执行基因分析。

DNA双股螺旋结构由一串碱基对组成,完整的碱基对序列可能很长,像是人类基因组就由超过30亿个碱基对组成,基因组资料可被用来追踪传染病、病原体,或是改进疾病诊断。要存取基因组资料,必须先进行基因组定序,由于技术的发展,科学家开始可以对大量个体进行测序,速度和成本效益都比过去更高。

而要分析这些基因组资料,需要使用各种工具,这些工具会被安排为特定步骤或是工作流程,科学家为了促进工作流程的开发、共享和执行,因此生物资讯社群开发了专门的工作流程定义语言,像是WDL、Nextflow、CWL和Snakemake。

而这个过程会产生PB级的原始基因组资料,要快速处理资料并获得答案,便需要配置运算、储存和网络等云端资源,和分析工具一同运作,因此科学家也就必需要花费额外的时间部署基础设施,并且修改开源基因分析工具。

Amazon Genomics CLI供科学家能在AWS上处理PB级的基因资料,而且透过开源,用户也就能更方便地与其他公共工作流程工具一并使用。

Amazon Genomics CLI借由简化和自动化云端基础设施部署,让用户可以使用命令列界面,在AWS上快速配置和运作基因组学工作流程,该命令列工具改进基因组学工作流程引擎,使其能够更简单地和AWS整合,消除手动修改开源工具,和调校以供大规模运作,所带来的额外工作。

而且该工具能够减少像是储存、运算容量、部署基因组学工作流程引擎,以及工作流程丛集的耗时配置工作,同时,也能与ECS、EFS或S3等服务无缝整合,并最佳化资源使用成本。

Amazon Genomics CLI现在是一个开源工具,用户可以在所有AWS地区使用,除了美国AWS GovCloud和中国地区除外。

2021-09-28 16:55:00

相关文章