新的文件格式帮助研究人员缩短DNA分析时间



新的文件格式帮助研究人员缩短DNA分析时间


文章图片

【新的文件格式帮助研究人员缩短DNA分析时间】

新的文件格式帮助研究人员缩短DNA分析时间


处理DNA纳米孔测序产生的数据现在需要半天时间 , 而不是两周 。新南威尔士大学和Garvan医学研究所开发了一种新的计算机文件格式 , 以加快纳米孔测序分析并改善癌症和其他疾病患者的专业治疗 。

该研究发表在《自然生物技术》杂志上 , 该研究称 , 新开发的SLOW5格式可以处理复杂的DNA纳米孔测序 , \"速度快30倍以上\" , 具有讽刺意味的是 , FAST5以前称为FAST5的文件格式 。纳米孔测序用于识别一系列疾病 , 并帮助医疗专业人员详细分析DNA样本 , 以便为癌症患者提供量身定制的治疗方法 。
该过程产生的数据通常以FAST5文件格式记录 , 该格式产生约1.3 TB的大型文件 , 相当于大约650小时的高清视频 。 研究人员说 , 由于其大尺寸 , 计算机需要两周时间才能处理FAST5文件 。
然而 , 主要作者和Garvan研究所基因组学计算系统工程师Hasindu Gamaarachchi表示 , 使用SLOW5处理人类基因组数据的时间减少到半天 。

他解释说 , 与FAST5不同 , SLOW5格式支持并行计算 , 其中多个处理器可以同时执行从较大 , 复杂和完整的数据集中分解的多个较小的分析 。\"你可以把这想象成试图和10个人一起挖一个非常大的洞 , 但他们只需要共用一把铲子 。 这就是FAST5过去的样子 , \"他说 。
\"但是使用SLOW5 , 每个人都有自己的铲子 , 他们都可以同时挖掘并更快地完成工作 。

\"FAST5 格式很慢 , 因为无法并行访问数据 。 它基于分层数据格式 , 该格式是在20世纪90年代设计的 , 用于在当时只有一个处理器的机器上工作 , 而不是在包含多个处理器的现代机器上工作 。\"Hierachical Data Format也是通用的 , 而SLOW5是专门构建的 。 因此 , 就挖掘类比而言 , 就像我们还提供了一把专门为土壤类型设计的铲子 。 而且由于新的SLOW5可以由多个处理器同时并行访问 , 因此处理时间减少了30倍 。

    推荐阅读