文章图片
AI时代正在到来
随着音乐的应用场景越发广泛 , 用户在音频识别上的需求越来越高 。 尽管音频指纹技术应用于听歌识曲已有多年 , 但由于声纹的变化 , 歌曲的翻唱版却难以识别 。
意识到这一用户需求后 , 在2012年的算法技术基础上 , QQ音乐的听歌识曲团队在2019年对其进一步优化 , 并获得了Mirex音频指纹大赛冠军 , 同时打破了三项世界纪录;去年 , 又成功将基于DNN的翻唱识别技术引入听歌识曲场景 , 开创了革命性的第一代听歌识曲系统 。 这一技术应用 , 不仅能识别短视频、综艺里的翻唱歌曲 , 还能识别Live、直播等线下场景中的歌曲使用 , 在原始系统无法识别的歌曲中 , 识别率提升了12% , 实现了用户听翻唱歌曲的自由 。
值得一提的是 , 团队还制作了“离线系统”的小彩蛋 , 在歌曲第一次未能成功识别后 , QQ音乐会在一周之内自动向全曲库发起请求 , 直到识别成功再为用户发送反馈提醒 。 这种始终“牵挂”着待解用户需求的贴心设计 , 便是技术温度的体现 。 而类似细节需求的精准洞察 , 往往能为用户体验的提升带来四两拨千斤的效果 。
文章图片
QQ音乐听歌识曲功能
当下 , 视频APP的崛起改变了用户的观看习惯 , 为了适应这些改变 , QQ音乐等平台也在播放页添加了竖屏MV 。 在不改变音乐内核的前提下 , 利用短视频传播优势 , 尝试实现优质作品的“被记住” , 而不仅是“被听到” 。
在“天琴”的帮助下 , QQ音乐会对横屏MV进行歌手检测、注意力检测 , 并通过多目标跟踪和注意力热力图等技术 , 实现对焦点运动轨迹的优化 。 在发掘了一段横屏MV中最精彩、最具美感的片段后 , 平台会将用户关注的区域裁剪下来并输出 , 实现“音乐视频竖屏化” 。 实验显示 , QQ音乐播放页静音视频、竖屏MV将用户的听歌时长提高了5.5% 。
此外 , 最能让人明显感知到AI技术温度的 , 当属在公益项目落地中的人文关怀 。 今年8月 , QQ音乐运用天琴实验室的音频处理和合成的相关技术 , 制作了国内首张低频公益专辑《听见“听不见”的音乐》 , 让中高频听力损失的孩子们第一次听到完整的音乐 , 感受到了音乐的多种“色彩” 。
可见 , 以“让科技充满温度”为研发导向 , 在“AI技术赋能音乐”的时代新题中 , 浪漫且温暖的天琴实验室 , 交出了不一样的答卷 。
文章图片
推荐阅读
- 安全|Redline Stealer恶意软件:窃取浏览器中存储的用户凭证
- 数据|数智安防时代 东芝硬盘助力智慧安防新赛道
- 最新消息|宁德时代再投240亿元扩产宜宾基地
- 硬件|一个时代落幕 佳能:1DX3将会是旗下最后一款旗舰单反
- 转向|时代落幕,佳能:1DX3 将会是旗下最后一款旗舰单反
- 孙自法|中国科技馆“智能”展厅携多款机器人亮相 喜迎新年和人机共融时代
- 穿越|解锁听歌新姿势,这款音乐播放神器值得一试?
- 吴祖榕|上线 2 周年,用户数破 2 亿,腾讯会议和我们聊了聊背后的产品法则
- 硬件|上线两年用户破两亿,腾讯会议还能做什么?
- 全体|喜报:三星 Galaxy S21 系列全体用户现已获推 One UI 4.0 正式版