2. 更广的内容识别范围
对机器来说,视频通常集图像、音频、文本等各个形态于一身,所以识别难度也比文本更高。在技术领域,通过机器学习的方法实现和理解多种形态信息的能力称为多模态学习,这其中“模态”就是指各种信息的载体,如文本、图像、声音等。因此,视频理解就是一个典型的多模态学习应用场景。通过“多模态学习”,机器能够识别出更多数据形态,对内容的理解也会更充分。
整体而言,让机器理解视频主要分为表征、融合和分类三个步骤。
“表征”的作用类似于翻译,即将文本、图像、声音等不同类型的数据转换成机器能理解的“数据语言”,即同一种结构的数据。在“融合”阶段,机器将采取不同的策略将多种模态的信息进行整合,寻找这些信息之间的关联性,形成统一的认知。最后,机器在充分理解之后再把数据按照一级、二级行业属性等规则进行归类,相似的数据归为一类,最终输出“标签”。
https://v.qq.com/x/page/y3311tlnfph.html
「多模态技术科普视频:机器是如何理解视频的?」
通俗来讲,有了多模态技术的加持,就像人类掌握了多国语言。一方面,在缺失某种模态的情况下也能凭借另一种模态理解内容;另一方面,通过对不同模态的信息进行融合,机器对内容的理解也更加准确。
通过对文本与视频的理解,机器将底层庞大的内容流“划分”成了各式各样的标签,这些标签中有相对粗粒度的类目标签,也有精细到词粒度的关键词,它们组成了庞大的商业标签库,成为满足广告主不同营销需求的底层基础。
应用层:高效满足个性化洞察需求
虽然通过内容理解技术,机器最终能够输出更精准的标签。但这些标签属于标准化产物,产出后无法再更改和调整,因此依然很难满足一些广告主的个性化需求。
例如,如果广告主只想投放对自己品牌感兴趣的人群,或仅想知道与自身产品相关的利益点分析,那么就需要重新生产出一套符合自己需求的个性化标签,这其中需要对标签进行定义、根据规则在底层数据库中进行挖掘、以及评估测试等多个流程,最后才能上线使用。
这一系列流程都是在标签平台上实现的。简单来讲,标签平台是搭建在内容理解的能力基础之上的标签生产和管理工具。通过一套标准化的流程,让不懂技术的业务同学也能够根据实际需求自定义标签规则,在平台上灵活生产标签。后来标签平台经过内测后对外开放,在巨量云图上线为“标签工厂”。
用技术同学的话说,标签平台的价值就像是将餐厅的后厨开放出来。如果菜单上没有符合客人胃口的菜,那么就可以直接去后厨,挑选合适的食材,做出想要的美食(标签)。
一言以蔽之,标签平台让精准洞察具备了“适配性”:不仅精准,且为广告主真正所需。
最终,通过内容理解和标签平台,广告主才能通过对全平台的内容指标分析,看到各种品类的市场趋势。甚至还能通过分析某一特定品类的UGC及PGC内容,得知产品卖点与用户认知是否契合、正负评论各有哪些、产品利益点表现情况等。
人群方面,广告主还能在标签平台上圈选出本品的兴趣和机会人群,以及找出与目标群众重合度高的KOL,大大降低营销决策的风险。
效率层:让商业分析唾手可得
如同古代的行军打仗,战报的送达时间密切影响着战略决策,事关战局输赢。商业分析也是如此,对广告主而言,如果数据不能被即时看见,就意味着不能尽快复盘,敏捷应对,那么其价值就会被削弱,即便洞察精准,依旧如管中窥豹。
推荐阅读
- 阿里巴巴|马云“接班人”是啥来头第一天上任,阿里巴巴损失517亿!
- 电商|俞敏洪或要“转型”?在电商平台做起直播带货,是有何打算?
- 亚马逊|告别“好评返现”,商家侧的“晒单有礼”还有意义吗
- 上门|快递上门的“蜀道难”
- 低俗词汇|B站发布“低俗词汇谐音梗”治理公告,多次违规将被封号
- 工地|“小马云”已不火,如今“工地马云”火了,网友:确定不是本人?
- 景气度|2022,七“贱”下天山
- 劳动者|这些工作将实行“职称制”!官方发通知,新的“香饽饽”行业来了
- 网易养不起“考拉”,阿里拼多多急剁手,网友丁磊全职养猪
- 阿里巴巴|曾是阿里高管,遭马云“忽视”创办410亿公司,却进腾讯口袋