Data Lake Analytics + OSS数据文件格式处理大全(12)


     

使用在线JSON格式化工具格式化后 , 数据内容如下:

则建表语句可以写成如下(注意:LOCATION中指定的路径必须是JSON数据文件所在的目录 , 该目录下的所有JSON文件都能被识别为该表的数据):

对该表进行查询:

对于struct定义的嵌套结构 , 可以通过“.”进行层次对象引用 , 对于array定义的数组结构 , 可以通过“[数组下标
”(注意:数组下标从1开始)进行对象引用 。

使用JSON函数处理数据

例如 , 把“value_string”的嵌套JSON值作为字符串存储:

{\"data_key\":\"com.taobao.vipserver.domains.meta.biz.alibaba.com\"\"ts\":1524550275112\"value_string\":\"{\\\"appName\\\":\\\"\\\"\\\"apps\\\":[
\\\"checksum\\\":\\\"50fa0540b430904ee78dff07c7350e1c\\\"\\\"clusterMap\\\":{\\\"DEFAULT\\\":{\\\"defCkport\\\":80\\\"defIPPort\\\":80\\\"healthCheckTask\\\":null\\\"healthChecker\\\":{\\\"checkCode\\\":200\\\"curlHost\\\":\\\"\\\"\\\"curlPath\\\":\\\"/status.taobao\\\"\\\"type\\\":\\\"HTTP\\\"\\\"name\\\":\\\"DEFAULT\\\"\\\"nodegroup\\\":\\\"\\\"\\\"sitegroup\\\":\\\"\\\"\\\"submask\\\":\\\"0.0.0.0/0\\\"\\\"syncConfig\\\":{\\\"appName\\\":\\\"trade-ma\\\"\\\"nodegroup\\\":\\\"tradema\\\"\\\"pubLevel\\\":\\\"publish\\\"\\\"role\\\":\\\"\\\"\\\"site\\\":\\\"\\\"\\\"useIPPort4Check\\\":true\\\"disabledSites\\\":[

推荐阅读