Data Lake Analytics + OSS数据文件格式处理大全(22)
127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700
\"GET /apache_pb.gif HTTP/1.0\" 200 2326
127.0.0.1 - - [26/May/2009:00:00:00 +0000
\"GET /someurl/?track=Blabla(Main) HTTP/1.1\" 200 5864 - \"Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US) AppleWebKit/525.19 (KHTML like Gecko) Chrome/1.0.154.65 Safari/525.19\"
每行文件可以用下面的正则表达式表示 , 列之间使用空格分隔:
([^
*) ([^
*) ([^
*) (-|\\\\[[^\\\\
*\\\\
) ([^ \\\"
*|\\\"[^\\\"
*\\\") (-|[0-9
*) (-|[0-9
*)(?: ([^ \\\"
*|\\\"[^\\\"
*\\\") ([^ \\\"
*|\\\"[^\\\"
*\\\"))?
针对上面的文件格式 , 建表语句可以表示为:
查询结果
2.10 Esri ArcGIS的地理JSON数据文件
DLA支持Esri ArcGIS的地理JSON数据文件的SerDe处理 , 关于这种地理JSON数据格式说明 , 可以参考:https://github.com/Esri/spatial-framework-for-hadoop/wiki/JSON-Formats
推荐阅读
- sccc|虎牙data2:sccc满血归来人气超越主舞台,连麦老队友解说外战
- 苹果新13英寸MacBook Pro或将搭载英特尔第十代Ice Lake芯片
- Strategy Analytics到2025年:可折叠智能手机出货量将达1亿部
- 最前线 | Trustdata:生鲜电商赛道梯队分化加剧,疫情之后谁能继续领跑
- NET开发-SqlDataReader只读流,有哪些属性和方法如何读数据
- SuperData:2019 Q4 Index出货10.3万台,Quest出货31.7万台
- Intel于去年八月份正式发布了Ice Lake系列处理器
- Strategy Analytics:2019年Apple AirPods销量达到近6000万
- 如何制作长方形的datamatrix二维码
- DataPipeline陈诚:2020年,企业将从关注商业智能转向数据应用