用户|AI时代，音乐科技如何触摸温度与浪漫？( 二 )_识别|音视频|团队|平台|音乐

文章图片

AI时代正在到来
随着音乐的应用场景越发广泛，用户在音频识别上的需求越来越高。尽管音频指纹技术应用于听歌识曲已有多年，但由于声纹的变化，歌曲的翻唱版却难以识别。
意识到这一用户需求后，在2012年的算法技术基础上， QQ音乐的听歌识曲团队在2019年对其进一步优化，并获得了Mirex音频指纹大赛冠军，同时打破了三项世界纪录；去年，又成功将基于DNN的翻唱识别技术引入听歌识曲场景，开创了革命性的第一代听歌识曲系统。这一技术应用，不仅能识别短视频、综艺里的翻唱歌曲，还能识别Live、直播等线下场景中的歌曲使用，在原始系统无法识别的歌曲中，识别率提升了12% ，实现了用户听翻唱歌曲的自由。
值得一提的是，团队还制作了“离线系统”的小彩蛋，在歌曲第一次未能成功识别后， QQ音乐会在一周之内自动向全曲库发起请求，直到识别成功再为用户发送反馈提醒。这种始终“牵挂”着待解用户需求的贴心设计，便是技术温度的体现。而类似细节需求的精准洞察，往往能为用户体验的提升带来四两拨千斤的效果。

文章图片

QQ音乐听歌识曲功能
当下，视频APP的崛起改变了用户的观看习惯，为了适应这些改变， QQ音乐等平台也在播放页添加了竖屏MV 。在不改变音乐内核的前提下，利用短视频传播优势，尝试实现优质作品的“被记住” ，而不仅是“被听到” 。
在“天琴”的帮助下， QQ音乐会对横屏MV进行歌手检测、注意力检测，并通过多目标跟踪和注意力热力图等技术，实现对焦点运动轨迹的优化。在发掘了一段横屏MV中最精彩、最具美感的片段后，平台会将用户关注的区域裁剪下来并输出，实现“音乐视频竖屏化” 。实验显示， QQ音乐播放页静音视频、竖屏MV将用户的听歌时长提高了5.5% 。
此外，最能让人明显感知到AI技术温度的，当属在公益项目落地中的人文关怀。今年8月， QQ音乐运用天琴实验室的音频处理和合成的相关技术，制作了国内首张低频公益专辑《听见“听不见”的音乐》，让中高频听力损失的孩子们第一次听到完整的音乐，感受到了音乐的多种“色彩” 。
可见，以“让科技充满温度”为研发导向，在“AI技术赋能音乐”的时代新题中，浪漫且温暖的天琴实验室，交出了不一样的答卷。

文章图片

用户|AI时代，音乐科技如何触摸温度与浪漫？( 二 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)