生物医学数据大爆炸,大数据“挖掘机”哪家强?( 三 )

由国际生物数据中心的运营可以看出,生物医学数据呈现种类繁多、内部结构高维复杂、内涵丰富、数据相对分散、难以高维度多层次交汇共享等特点,例如NCBI的Gene服务是一个可搜索的基因数据库,专注于已经完全测序的基因组,基因信息是包括命名法、染色体定位、基因产物及其属性、相关标记、表型、相互作用、引文链接、序列、突变详情、图谱、表达报告、同源物、蛋白结构域内容和外部数据库链接等在内的高维数据。

中科院专家在2018年发表的《生物医学大数据发展的新挑战与趋势》一文中指出,随着数据规模的增加,如何更加有效地利用生物医学数据成为了挑战。传统的数据模型和数据组织方式,无法满足海量数据的结构、数量快速增长以及数据结构不断变化的管理需求,难以按照实际情况动态调整。因此,必须要突破传统的一类数据建设一个数据库的模式,而采用新类数据基础设施,在底层数据结构上以整合为导向,支持数据结构动态调整,为后期数据集成与整合工作奠定基础。

生物医学进入新时代,大数据带来新改变

生物医学数据大爆炸,大数据“挖掘机”哪家强?

推荐阅读