Data Lake Analytics + OSS数据文件格式处理大全( 八 )

后面的部分会做进一步的讲解 。

2. 示例

2.1 CSV文件

CSV文件 , 本质上还是纯文本文件 , 可以使用STORED AS TEXTFILE 。
列与列之间以逗号分隔 , 可以通过ROW FORMAT DELIMITED FIELDS TERMINATED BY '' 表示 。

普通CSV文件

例如 , 数据文件oss://bucket-for-testing/oss/text/cities/city.csv的内容为

BeijingChina010

ShangHaiChina021

TianjinChina022

建表语句可以为

使用OpenCSVSerde__处理引号__引用的字段

OpenCSVSerde在使用时需要注意以下几点:

  1. 用户可以为行的字段指定字段分隔符、字段内容引用符号和转义字符 , 例如:WITH SERDEPROPERTIES (\"separatorChar\" = \"\" \"quoteChar\" = \"`\" \"escapeChar\" = \"\\\" );

    推荐阅读