生物医学数据大爆炸,大数据“挖掘机”哪家强?( 四 )
要把基于海量的基因数据和难以复制的“人工经验”,变成可积累、易复制的“数据智能”,就必须要解决数据的存、算、用的问题,华为与中科院一起探索建设符合生物医学研究特点的大数据基础设施。
首先要解决海量数据汇集的问题。生物医学数据本身具备多样性,数据来自不同区域、机构、个体,有结构化数据也有图像、视频、文本等非结构化数据,新的生物大数据基础设施要支持EB级多样性数据的高效存储,并且可以通过文件、大数据等多协议共享访问,减少不必要的数据迁移,实现存储即分析。
其次是海量数据的高效处理。基于CPU和GPU的高性能协同计算,得益于其强大的并行处理能力,成为海量生物医学数据处理的研究热点。而生物医学的实时分析和临床处理,还需要用到大数据和AI技术快速准确进行影像处理、数据降维、数据取样和知识发现,因此新的生物大数据基础设施也在积极引入NPU/ARM/FPGA等硬件技术,打造多样性的数据分析平台,让数据分析更高效。
最后,数据只有共享了,才能发挥出它的最大价值,通过建设数据使能平台,可以实现数据的共享、标准化、可视化、服务化,让数据更好地服务于不同的对象,造福全人类。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |S11淘汰赛数据盘点:场均时长为33分 55个不同英雄登场
- 中单|2021年英雄联盟世界赛终于落下帷幕!!大数据统计二!!
- 灵饰|梦幻西游:109级法系前排灵饰选择方法,用数据告诉你怎么做
- 卡牌|S11淘汰赛数据出炉,卡牌24场全被ban,压刀最多竟是辅助
- edg战队|堡垒之夜国服将清除数据,EDG创造队史晋级S11世界赛决赛
- 原神|原神:流水预测数据还在变化,日本的预估流水,倒是有了小状况