【工经之声】大数据技术及其行业应用:基于铁路领域的概念框架研究(16)

3

铁路大数据管理

大数据管理是指利用数据库技术、分布式文件系统技术等实现对各种数据的有效组织,达到快速索引、高效查询等目的。传统的数据库技术以关系型数据管理为主,数据量级相对小,在面对半结构化、非结构化数据洪流时,其扩展性存在障碍,难以满足需要。面对类型多样、形态各异、数量庞大的铁路大数据,需要根据具体需求选择合适的数据库。图存数据库以及文档数据库等非关系型数据库、传统关系数据库系统以及New SQL数据库等都将在铁路大数据的管理中起到重要作用。例如,对客运大数据进行管理,全路每天上千辆列车运行产生海量数据,在进行数据预处理后按照特定需求对数据进行判别,建立数据仓库,进而形成不同类别的数据库。

4

铁路大数据建模

大数据的研究最主要的功能在于利用数据分析技术获取未知潜在关联、隐藏范式、市场及社会规律和附加价值等。传统的数据分析技术,如数据挖掘中的关联、聚类、分类、预测、时序模式、偏差分析等技术将仍然可用。一些新兴的数据分析技术,也将不断涌现,并将在铁路大数据领域占据重要位置。例如,通过先进的人脸识别技术,将旅客头像与海量的治安大数据进行匹配,实现刷脸进站,简化了安检流程,也在一定程度上打击在逃人员。

推荐阅读