中科院顾亚平:家庭声场和音效的智能处理和应用

在2021 GFIC 5G全球家庭互联网大会的5G+4K/8K超高清论坛上 , 中国科学院声学研究所东海研究站二级研究员、博士生导师 顾亚平发表题为《家庭声场和音效的智能处理和应用》的精彩演讲 。
中科院顾亚平:家庭声场和音效的智能处理和应用
文章图片

文章图片
受到家庭环境的影响 , 家庭声场的布置不可能达到理想的效果 。自适应声抵消技术可有效通过“电”来改变“声场” 。在普通扬声器基础上 , 可以实现低音增强、高音增强、室内小区域声音音质改善、室内混响抵消或增强 。——顾亚平
空气声信号处理技术
顾亚平介绍 , 空气声信号处理的最新技术发展情况 。主要是:
空气声的定义和应用范围 。空气声是指声音在空气中的声传播 。包括:声波频率小于1Hz的次声 , 声波频率为20Hz-20KHz音频可听声 , 声波频率大于20KHz的超声 。
聚焦在音频声信号处理中 , 高保真音频编解码、低时延音频编解码、媒体分发网络传输中的视音频同步、虚拟3D环绕音效处理、DOA 空气声方位估计等前沿技术研发进展 。
顾亚平介绍到解决低时延音频编解码是音视频同步的首要条件:音频信号频率低、采样频率相对也低.高时延音频编解码会产生声音的混叠、分辨不清 。高时延的音频编解码会带来设备间音视频传输的不同步 。
顾亚平介绍到 , 音视频信号编解码、家庭内联网传输、设备间媒体共享需要解决音视频同步的问题:1.音视频编解码不同步 2.网络传输带来不同步 3.网络质量不好带来的丢包、抖动、延时 。而解决这些问题的关键技术点在于1.插入同步码元信息 , 2.插入时间戳 , 而设备间的互联互通协议也是其难点所在 。
顾亚平介绍到 , 3D环绕音效处理的关键技术是音效定位和回声效果 。
多通路环绕声系统需要使用多个扬声器进行声音的重放 , 同时对扬声器的质量和摆放位置也有较高的要求 。而虚拟环绕声技术可以很好的解决这一问题 。虚拟环绕声技术系统简洁、性价比较高 , 在音响、数字电视、个人多媒体产品、虚拟现实等领域得到广泛应用 。利用头部相关传递函数(HRTF)对多通路环绕声音频信号进行数字信号处理 , 通过耳机或者两个扬声器重放出来 , 让人感觉到有环绕声的效果 。
音效定位出环绕使用者身边不同位置的音源 。这种音源追踪的能力 , 就叫做定位音效 , 它使用当时的HRTF的功能来达到这种神奇的效果 。所谓HRTF的全名是Head—Related Transfer Function(头部相关位置转换) , 就是在三度立体空间中 , 人耳是如何监测和分辨出声音来源的方法 。简单的说一下 , 就是声波会以几百万分之一秒的差距先后传到你的耳朵里面 , 而我们的大脑可以分辨出那些细微的差别 , 利用这些差别来分辨声波的形态 , 然后在换算成声音在空间里的位置来源 。
在多数的3D音效的声卡上 , 都是使用HRTF的换算法来转换游戏里的声音效果 , 误导你的大脑听到声音是来自不同地方的 。支援声源定位的游戏将声音与游戏的物件、人物或是其他的声音的来源结合在一起 , 当这些声音与你在游戏中的位置改变时 , 声卡就将依据相对位置来调整声波讯号的发送 。
回声效果除了重现游戏的音效的方位之外 , 3D音效的开发者还试着利用回声与其他环境声音的效果来让游戏的声音效果变得更加立体 , 其实所谓的回声(reverb effect)基本上就是音波的反射 。3D更具说服力 。
空气声信号处理的应用
围绕家庭这个角度出发 , 顾亚平介绍了空气声信号处理的最新应用进展情况 。