原唱都能败给评分系统?究竟是谁在KTV里偷偷给我们打分?
2023/05/30

爱唱歌的你,是否曾经怀疑过,KTV里到底是不是有一群评委蹲在某个角落,随机地给你出分。要不然为什么每次你在KTV里唱得风生水起或者声泪俱下时,却总被打分系统打击得体无完肤?一度飙高音飙到觉得自己是陈奕迅第二,结果机器评价你的声音像王祖蓝。一顿操作猛如虎,一看分数45。而你的朋友在旁边鬼哭狼嚎或者气若游丝,毫无技巧全是感情地一顿输出,但得分就是比你高不少。那一瞬间,面对占据一半屏幕的打分界面,恐怕你只觉得兴趣全消,只想切歌喝酒玩骰子。

这样的糟糕体验就连明星也不能幸免。此前,著名音乐组合凤凰传奇一起去KTV唱歌,他们一起演唱了自己的作品《自由飞翔》,没想到等二位原唱唱完,居然显示只得了50.39分,系统判定为不及格。这就堪比鲁迅做《狂人日记》的阅读理解没得分,梵高参加《星空》临摹大赛被刷下来一样讽刺。网友惊呼上当:“合着不是我五音不全唱得差,是这KTV的评分系统有bug啊”。从前决定你唱歌好不好听的是在场听众的反馈,现在似乎是屏幕上的那串分数掌握了话语权。但问题是,系统是如何听懂我们唱歌的呢?K歌和评分是怎么走到一起的?KTV打分系统的的工作原理究竟是什么?

图片来源于网络及凤凰传奇成员玲花的社交账号

事实上,KTV打分系统并不是一个人工智能,也没有评委蹲在里面,而是一个基于音频信号处理、输出客观数据统计的系统。卡拉OK八十年代开始率先在日本风靡,1982 年,日本一家公司推出首款带打分功能的家用卡拉OK机。随着卡拉OK 从日本传入亚洲各国乃至全世界,评分系统也跟着漂洋过海,满足了我们对音乐娱乐及互动反馈的进一步需求。

不过,让机器给人类的歌声评分显然没有那么容易。传统K歌评分的主要思路是比对旋律特征,当你唱歌时,系统会实时地录制你的声音,并将其转换成数字信号,将你的声音信号和原唱的音轨信号进行对比,计算出你的音准、节奏和音色的相似度。用户演唱的旋律特征和原唱越相似,在机器看来则代表着“音准越好”、“节奏越对应”,得分就会越高。做到这些需要三步走:一是KTV打分系统会预先存储好每首歌曲的音轨和歌词,以及每个音符的音高、时长和节奏,根据评分标准提取旋律特征,建立标准模板库;二是通过算法提取被评分的干音(设备采集的未经任何后期处理的人声录音)旋律特征;最后,把两者特征相似度进行量化评估,得出分数。

当然,系统所认定的“高分”演唱在人类耳中并不一定好听。有人总结过“套路”系统获得高分的技巧:录音清晰、歌声音量大、声音平稳、尾音拖长,都可能获得系统青睐。至于音色,声情并茂、气沉丹田?对不起,暂时不在考虑范围内。因此,经常可以听到灵魂吐槽:“我明明唱得很好,为什么分数这么低?!”

可以说,大部分KTV打分系统都不是完美的,存在一些局限性和缺陷,比如只能评价你的音准、节奏和音色,而不能评价你的情感、表达和技巧,对于不同的歌曲和歌手的难度和标准可能不一致,因此有些歌曲可能比较容易拿高分,有些歌曲可能比较难拿高分。总之,部分KTV打分系统可能存在一些技术上的误差和延迟,未必能真实反映你的演唱水平。不少演唱者因为分数过低,而被打击了演唱信心。

在刚度过的疫情三年里,歌唱让人欢乐、让人宣泄,让人找到社会支持,K歌软件的声音修饰也给了更多人展露歌喉的勇气。后疫情时代年轻人进一步享受在线上展示和交流自己,在线K歌更能满足他们社交+休闲的需求。当娱乐阵地逐渐从线下 KTV 转移至线上,为了真实还原线下KTV 的娱乐体验,“打分”这一互动玩法在线上同样成为提升受众参与感不可或缺的一项功能。在互联网公司技术实力的加持下,K歌评分已进入2.0时代。这导致的结果是,靠干嚎骗过机器的难度大幅提升了。那么如今这一功能有哪些提升呢?

众所周知,现在很多歌曲人声包含了和声等因素的影响,并且不同音乐的复杂性以及歌曲语料质量参差不齐,使音高线的提取工作相当困难。实时互动企业即构科技近期将自研的KTV实时打分功能集成在了在线 KTV 及实时合唱解决方案中,通过使用AI模型在尽量保证人声完整性的前提下,分离出信噪比较高、保留较完整的人声,即构的算法能从各种复杂的音乐中准确提取音高线,精确率高达99%,快速生成打分标准。

如果只是根据差异做一个线性的评分,对于不同的平台用户的体验未必是最佳的。算法也需要尽可能“读懂感情”,给出更有人情味的评价标准。如何确保唱得好的人能够通过分数获得认可,同时也让部分演唱小白能够得到积极的正反馈和激励,这是在线K歌场景避不开的需求点。因此即构的这套打分策略算法上,对大部分“青铜级”演唱者能够给出一个兼顾自信及保留进步空间的多维度弹性分数,以保护他们的演唱积极性,同时对头部的“王者级”演唱者做到凸显高分,提升其互动竞技性。目前,即构的方案中设置了 5 种演唱难度等级,供平台方在Easy模式和Hard模式中间按需切换选择。

此外,即构的在线 KTV 解决方案中还配备海量正版曲库,收纳 2000 万+首歌曲,热门点唱top 歌曲覆盖率超过 90%,并且对周杰伦等热门明星歌手和抖音等短视频平台的热门歌曲进行了覆盖,更支持动态更新热门歌曲,平台方仅通过一套 SDK 就可迅速实现音乐版权的接入。

即构科技作为音视频技术厂商,将持续以丰富的功能与玩法,不断鼓励用户进行个性化表达,守护音乐的情感价值,让用户在K歌过程中发现自我声音的独特魅力,与众多泛娱乐平台共同为整个音乐行业的繁荣发展提供源源不断的动力。

扫一扫,获取更多服务与支持
热门推荐
H.264 与 H.265 视频编解码器的区别,哪个更好?
2024/07/26
直播产品中的“六边形战士”来了!ZEGO 超低延迟直播,高质量带来新增长!
2024/07/23
什么是抖动?如何使用抖动缓冲区来减少抖动
2024/07/22
热门标签
AI 降噪
AI课堂
ExpressSDK
MSDN
RTI
SEI
webrtc
ZIM
互动白板
即构融资
在线KTV
在线K歌
屏幕共享
录屏采集
数智人
直播技术
范围语音
行业报告
语聊房
语音社交
超分
音视频
音视频开发
音视频技术
音频编码
关注我们
获得更多服务与支持了解价格与优惠 扫码关注我们
关注我们
获得更多服务与支持了解价格与优惠 扫码关注我们