从供给平台到创意智能,「特赞」如何开启想象力的摩尔定律?|36氪MarTech专题( 三 )

范凌解释,特赞将创意数据划分为四个维度:创意内容、创意能力、商业目的、用户触达。这四个维度分别描述了内容、生产者、应用场景以及商业效果的情况。

数据标注是智能化进程中最基础,但也是最重最累的活儿。特赞COO王喆告诉36氪,创意行业的数据标注要比传统图像识别难度更高,举个例子,每个人的语言体系不同,对同一个事物类似的感知也会用不同词汇描述,有的人称赞“可爱”,有的人则称之为“萌”,因此要对标注数据之间做相关性和等价关系的匹配。

目前特赞已经积累了20多万条标注数据,形成创意设计的基础开源数据集“DesignNET”,对设计人工智能的研发生态开放。DesignNET还与行业合作建立了垂直数据集,包括房地产、快消和食品饮料行业。基于这些垂直行业数据,机器才能理解并优化内容与应用场景之间的匹配度。

当前流量市场掌握在BATJ等大型互联网公司手中,甲方公司要自建DMP(Data Management Platform)时需要映射BATJ的数据,但是不同互联网公司的数据结构和规则不一样,此时甲方就变得非常痛苦。相较于异构的的用户数据,甲方能够精确掌握的是供给侧的情况,不同场景、不同人群的投放结果经数据回流,匹配不同内容的CTR和ROI,就可以建立创意优化的模型。

推荐阅读