Data Lake Analytics + OSS数据文件格式处理大全(11)
示例:
2.4 JSON文件
DLA可以处理的JSON文件通常以纯文本的格式存储 , 数据文件的编码方式需要是UTF-8 。
在JSON文件中 , 每行必须是一个完整的JSON对象 。
例如 , 下面的文件格式是不被接受的
需要改写成:
不含嵌套的JSON数据
建表语句可以写
含有嵌套的JSON文件
使用struct和array结构定义嵌套的JSON数据 。
例如 , 用户原始数据(注意:无论是否嵌套 , 一条完整的JSON数据都只能放在一行上 , 才能被Data Lake Analytics处理):
{ \"DocId\": \"Alibaba\" \"User_1\": { \"Id\": 1234 \"Username\": \"bob1234\" \"Name\": \"Bob\" \"ShippingAddress\": { \"Address1\": \"969 Wenyi West St.\" \"Address2\": null \"City\": \"Hangzhou\" \"Province\": \"Zhejiang\" \"Orders\": [{ \"ItemId\": 6789 \"OrderDate\": \"11/11/2017\" { \"ItemId\": 4352 \"OrderDate\": \"12/12/2017\"
推荐阅读
- sccc|虎牙data2:sccc满血归来人气超越主舞台,连麦老队友解说外战
- 苹果新13英寸MacBook Pro或将搭载英特尔第十代Ice Lake芯片
- Strategy Analytics到2025年:可折叠智能手机出货量将达1亿部
- 最前线 | Trustdata:生鲜电商赛道梯队分化加剧,疫情之后谁能继续领跑
- NET开发-SqlDataReader只读流,有哪些属性和方法如何读数据
- SuperData:2019 Q4 Index出货10.3万台,Quest出货31.7万台
- Intel于去年八月份正式发布了Ice Lake系列处理器
- Strategy Analytics:2019年Apple AirPods销量达到近6000万
- 如何制作长方形的datamatrix二维码
- DataPipeline陈诚:2020年,企业将从关注商业智能转向数据应用