Data Lake Analytics + OSS数据文件格式处理大全(11)

示例:

2.4 JSON文件

DLA可以处理的JSON文件通常以纯文本的格式存储 , 数据文件的编码方式需要是UTF-8 。

在JSON文件中 , 每行必须是一个完整的JSON对象 。

例如 , 下面的文件格式是不被接受的

需要改写成:

不含嵌套的JSON数据

建表语句可以写

含有嵌套的JSON文件

使用struct和array结构定义嵌套的JSON数据 。
例如 , 用户原始数据(注意:无论是否嵌套 , 一条完整的JSON数据都只能放在一行上 , 才能被Data Lake Analytics处理):

{       \"DocId\": \"Alibaba\"         \"User_1\": {             \"Id\": 1234             \"Username\": \"bob1234\"          \"Name\": \"Bob\"          \"ShippingAddress\": {                    \"Address1\": \"969 Wenyi West St.\"                     \"Address2\": null                       \"City\": \"Hangzhou\"                      \"Province\": \"Zhejiang\"                        \"Orders\": [{                            \"ItemId\": 6789                                 \"OrderDate\": \"11/11/2017\"                                            {                               \"ItemId\": 4352                                 \"OrderDate\": \"12/12/2017\"                                    

推荐阅读