Data Lake Analytics + OSS数据文件格式处理大全(20)

2.8 AVRO文件

DLA针对AVRO文件建表时 , 需要指定STORED AS AVRO , 并且定义的字段需要符合AVRO文件的schema 。

如果不确定可以通过使用Avro提供的工具 , 获得schema , 并根据schema建表 。
在Apache Avro官网下载avro-tools-.jar到本地 , 执行下面的命令获得Avro文件的schema:

建表语句如下 , 其中fields中的name对应表中的列名 , type需要参考本文档中的表格转成DLA支持的类型

大多数情况下 , Avro的类型可以直接转换成DLA中对应的类型 。 如果该类型在DLA不支持 , 则会转换成接近的类型 。 具体请参照下表:

推荐阅读


Avro类型对应DLA类型
nullvoid
booleanboolean
intint