【工经之声】大数据技术及其行业应用:基于铁路领域的概念框架研究(18)

2.从铁路数据获取层、平台层和应用层提出了铁路大数据的平台架构。首先,铁路大数据的获取层主要包括数据的采集及初步分析,通过采集各类铁路信息系统、传感器、生产报表等类型的数据,实现铁路海量数据的集成。其次,平台层主要包括铁路大数据的处理及初步应用,通过批量计算、内存计算等多种计算方式,满足铁路不同业务类型数据的计算需求。最后,应用层主要包括铁路大数据的深度应用,针对各个业务领域的数据分析和决策支持的需求,能够实现多业务的数据系统,支撑面向多层次多用户的分析应用,包括战略决策、经营管理、现场管理等。铁路大数据的三层平台架构为建设铁路数据服务平台奠定了基础,涵盖了铁路基础数据管理、数据集成、数据共享、大数据存储与分析等功能,保障了铁路数据的准确性及共享性,可有效提升大数据分析的数据质量,便于建立对不同业务实体的数据关联,以实现多实体关联分析。

3.从铁路数据获取、处理、管理、建模和应用等方面提出了铁路大数据处理的流程。在数据获取阶段,主要是各种硬件设备(传感器、应答器、摄像仪等)对数据的采集和信息系统的数据交换;在数据处理阶段,针对具体的应用场景需要不同的处理平台或技术支撑,比如分布式处理等,在此阶段,针对数据自身特点,需要提前进行预处理分析,主要包括数据筛选、数据清洗、数据标准化等工作;数据分析阶段(包括管理、建模和应用等)是与应用或需求息息相关的,通过设计不同的模型可以获得不同的分析结果。铁路大数据处理流程的确立可利用当前较为成熟的大数据采集、分析、应用等相关技术,解决当前铁路面临的数据共享、数据治理、数据分析等方面的挑战,使大数据技术在铁路领域的广泛应用成为可能。

推荐阅读