Data Lake Analytics + OSS数据文件格式处理大全(20)
2.8 AVRO文件
DLA针对AVRO文件建表时 , 需要指定STORED AS AVRO , 并且定义的字段需要符合AVRO文件的schema 。
如果不确定可以通过使用Avro提供的工具 , 获得schema , 并根据schema建表 。
在Apache Avro官网下载avro-tools-.jar到本地 , 执行下面的命令获得Avro文件的schema:
建表语句如下 , 其中fields中的name对应表中的列名 , type需要参考本文档中的表格转成DLA支持的类型
大多数情况下 , Avro的类型可以直接转换成DLA中对应的类型 。 如果该类型在DLA不支持 , 则会转换成接近的类型 。 具体请参照下表: