智能音箱终于秀得起音质了……

图图发表于 2022-12-15 18:59:31

梦晨发自凹非寺
量子位 | 公众号 QbitAI
记得前几年智能音箱刚火的时候，挺想买一个尝尝鲜，不太贵的那种。
智能方面我还算会挑，音质方面可就不太懂了。
于是去找玩音响的朋友问问有什么推荐，哪款音质好一些？结果他的回答让我挺无语的：
音质上没什么可挑的，都是听个响，你就看哪家智能做得好吧。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/4c4e4e5a8e6c4547a354506ea0ba8d95~tplv-tt-large.image?x-expires=1986464640&x-signature=CTbiBjQbIzlKGTgIGmDBDZz0GOM%3D

如今几年过去，情况在变化。
在苹果放弃价格贼贵的HomePod之后，国产智能音箱却开始拼音质了。
华为联合音响品牌帝瓦雷推出高端产品Sound系列，音箱部分极致堆料，智能部分主推搭载鸿蒙，其中最高端型号Sound X价位来到2000+。
小米也联手哈曼卡顿推出主打音质的小体积产品Xiaomi Sound，延续性价比传统定价499，被网友戏称为“年轻人的第一台高端智能音箱”。
这么热闹，自然也少不了另一大玩家天猫精灵，最近其在高端产品上的布局终于浮出水面——

[*]与顶级声学机构波士顿声学深度合作，联合打造的高端智能声学新品Sound系列已于6月1日上市。
[*]其中，Sound Pro到手价为1299元，配备了5.25英寸的60W低频发声单元，实现了罕见的35Hz低频下潜，可以说已经能挑战同品类天花板了。
智能声学，便是天猫精灵新品身上最醒目的标签，这里可以先来分享一波Pro版的提前试用体验。
首先，这款产品外观就给人很大冲击力。一反之前型号小巧纤细的“网红感”，设计上也更接近经典造型。
主观感受上，大箱体发出的声音确实比之前的小体积型号更饱满，特别是低音表现，有很嗨的感觉了。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/ac78bf14035c4c89857f00fb8e607b2e~tplv-tt-large.image?x-expires=1986464640&x-signature=%2BAe6VEqRS%2FesuwvbOuoBlGh6vKk%3D

接下来是主打新功能之一智能EQ调音。
内置算法可以自动选择最佳音效，无需手动调整复杂参数。据说这次还特别为电子核、情绪摇滚等小众音乐类型有专门调音。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/849ac6c6ff534872819e112580bb7b62~tplv-tt-large.image?x-expires=1986464640&x-signature=I2dViJFvtwvxy6z%2BmEiQsmvay5s%3D

主打新功能之二独家“猫耳算法”，解决了大音量听歌时音箱听不见你说话的问题。
实际体验下来，即使是80%超大音量播放新晋的跳操神曲《本草纲目》，也可以用正常说话的音量和音箱交互。
极限场景下，跑到厨房里打开抽油烟机再关上门，都能成功唤醒客厅里大声播放音乐的天猫精灵。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/1ddd94efaed44c8bac540e473ec898aa~tplv-tt-large.image?x-expires=1986464640&x-signature=Sob6D6AVw8E2THJ2Fo5dKo0bDQI%3D

下面就来扒一扒这些新功能背后，都有哪些新技术在支撑。
搭载了什么新技术？

先来说说这个猫耳算法，根据猫耳朵能独立旋转180度并通过内部褶皱准确定位声音来源而得名。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/d45fa75f8c184e079e96b6802b2d2c7f~tplv-tt-large.image?x-expires=1986464640&x-signature=ZuF3D7dfGffBk%2Fgig%2FJ%2B2C40W2o%3D

要想用算法实现这一特性，要做到三个部分。
第一个是回声消除，也就是麦克风收音时需要消除掉音箱自己发出来的声音。
回声一般分为线性和非线形两部分。对于线性回声主要通过线性滤波器的传统算法来解决，对于非线性回声天猫精灵增加了深度学习算法来解决。
第二个是声源定位，增加使用了唤醒词的信息，包括唤醒词上每个频点人声的比例，综合利用声学信息和语音特征增加准确率。
第三个是降噪，也是传统算法与深度学习结合，先用噪声识别模型区分出人声与非人声，再分别用不同的算法去处理。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/30bf136c32cd48cf8edc79b7394e3cb4~tplv-tt-large.image?x-expires=1986464640&x-signature=%2Bn99Xhe9JoSWuEM3yoC7e8L85tY%3D

接下来是智能EQ，也被天猫精灵团队称为不包浆均衡器。
总体思路是通过软件算法与低失真功放芯片协同工作，在为不同音乐带来匹配的音效同时不过度渲染，尽量还原音乐本身想表达的感觉。
具体细节上共有1040段智能参数，除了4种预制模版（HiFi、古典、人声、劲爆）外，默认还可以选择智能模式根据音乐类型动态匹配。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/275d259a41814401b2cd0f5ef42b97af~tplv-tt-large.image?x-expires=1986464640&x-signature=qYZXacGiz%2BTNLlbWwgCmx%2FJMfH4%3D

硬件上的创新之处还有智能一体腔。
通过改进结构堆叠设计，将音腔容积增加了29%，无源辐射器和扬声器因此可以辐射出更多的低频效果。低频到位了，听起来就更带感。
通过优化结构堆叠及装配，改善了腔体的振音，震动以及内部驻波，使mic收音更纯净，提高智能语音交互的效果。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/de623fba9cc14cc2a91a8363c4037a6a~tplv-tt-large.image?x-expires=1986464640&x-signature=7QYlYmPHujUR6nWj0nY6dbIAWm8%3D

除了音质方面外，智能音箱本身也是内容的提供者，需要在不连接PC或手机的情况下独立工作。
天猫精灵与众多平台进行内容授权合作，把多平台内容聚合在一起。
也就是说，智能音箱反倒没有手机上听歌要切换不同App的烦恼～
除了音乐以外，有声读物、播客资源也能一网打尽。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/8640f462bd834c94983521de8c2d9d72~tplv-tt-large.image?x-expires=1986464640&x-signature=9BKZybsfLmXFIg%2BtRrzERujSpKA%3D

有了内容，接下来还要考虑分发和推荐。
考虑到音箱的家庭使用情景，天猫精灵开发了智能身份识别系统，可通过声纹来识别不同使用者的角色。
就像指纹一样，每个人的声音也有独特的声纹特征。就像给手机录入指纹一样，采集了3个不同距离下的声纹后就可以准确识别。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/bbbf062f18e841dbb66b1b67d97735da~tplv-tt-large.image?x-expires=1986464640&x-signature=SaYuZcdgAfnEkaMK5Ia7Lom1gBg%3D

不同角色的声纹采集好之后，可以选择兴趣标签，让智能音箱的内容推荐有“更懂你”的感觉。
再结合上长时间使用后学习到的使用场景，可以在需要时及时送上需要的内容。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/84830acf6b3d4342b2846cec18f8b2cc~tplv-tt-large.image?x-expires=1986464640&x-signature=tXpCErbmTHCl2GUBMGAObiokX4Y%3D

当然，整个过程都是符合信息安全认证国际标准的，包括基础的ISO 27001、扩展的ISO 27018、以及最新的ISO 29151。
在天猫精灵这次的新品上诸多智能声学技术都是第一次亮相，但其实早在4年前就已布局。
下面再来揭秘一下，背后这只独特的研发团队——
天猫精灵声学实验室

据介绍，实验室声学成员平均有13年声学设计经验，来自哈曼、楼氏、AAC、飞利浦等全球知名公司。
其中负责人汪涛更是哈曼“金耳朵”全球认证测试中0错题达到level 14难度的满分选手。
实验室有20多间声学试验场地，成立4年来已积累了数十项相关专利，形成了独特的智能声学发展路线。
成果除了前面介绍过的以外，还有虚拟多声道搭建、千人千面音质设计方案、声场自适应校准等专利技术。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/289585f8bf1f4d20bbe87e6dc090c02d~tplv-tt-large.image?x-expires=1986464640&x-signature=lD0L8DvDc2QEu58m1Pxv%2BV97qwA%3D

天猫精灵为什么要花大力气自建声学实验室呢？
从目的上，是要通过跨领域技术融合创新解决音箱产业长期以来有智能与音质难以兼容的难题。
工作方式上，也是提供了让声学团队与电子、算法和设计等内部团队通过AliGenie一体化研发平台高效协作的模式。
除了内部的协作，声学实验室也是天猫精灵这家公司与外部声学行业合作的一个连接点。
有了既懂声学又懂智能的实验室团队，天猫精灵与音响品牌波士顿声学的合作可以更加深入。
这一次双方的合作不仅限于表面的品牌背书，也不是单纯的购买发声单元等器件，而是在声学架构上进行了深度协同研发，包括算法、硬件、调音之间的协同。
前面介绍过的智能EQ调音，和智能一体腔效果，也加入了波士顿声学专家的参数建议。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/862a15cc93fd4ce6ad937b4436808840~tplv-tt-large.image?x-expires=1986464640&x-signature=rn9As2J6VKo5hOOn5zvkt%2FnOvgI%3D

像这样把传统音箱声学、AI算法、智能物联等多学科跨领域技术进行创新融合的模式，不仅产出应用在音箱产品上能给用户带来更好的体验，还产生了1+1>2的效果。
在量子位与天猫精灵人工智能部总经理姜飞俊的交流中，他表达了这样的观点。
智能音箱最重要的地方，是带来不同于动手操作的全新交互方式，技术上称为“远场语音交互”。
从这个视角看，通过智能声学沉淀出的相关技术还可以迁移到更多适合搭载语音交互的智能物联网产品，如时下爆火的扫地机器人、智能跑步机等运动器材。
进一步看，技术成果应用到多样场景，反过来也能推动技术本身迭代进化。
例如，音箱摆放在室内固定位置，面对的环境噪声也相对固定。而扫地机器人自身就在移动，也会产生变化性更大的噪声，对语音识别定位和降噪能力提出新的要求。
再例如，深度学习算法应用到扫读笔等更小型、计算能力有限的设备时，又会推动算法本身朝轻量化、易部署方向演进。
— 完 —
量子位 QbitAI · 头条号签约
关注我们，第一时间获知前沿科技动态

页: [1]

彩虹邦系统's Archiver

智能音箱终于秀得起音质了……