题主的问题实际上是一系列的问题。大致按照声音的传递和感知过程,我逐步的来回答这个问题:
1.人脑的物理声学特性:频率响应与方向选择
或许你已经注意到,自己说话时听到的自己的声音,跟对自己的录音有很大的区别。其中一个重要的因素是人耳的耳廓-外耳道、头骨等会对声音产生一定的影响(作处理)。我们把这些影响作为一个系统,它对声音的处理有一个传递函数[1],称为Head-Related Transfer Functions(脑相关传递函数,HRTF),定义如下:
其中P_1是人耳鼓膜处的声压,P_2是在同样的条件(与音源距离,角度)下,在同样的位置使用无方向特性的麦克风测到的声压。该传递函数主要表现为两个特性:频率响应特性和方向选择特性[2]。
可以注意到
- 该系统对不同频率的声音,增益/衰减效果不一样,在2KHz-6KHz频段,表现为增益(这也解释了为什么我们对比较尖锐的声音很敏感),比之低的频段表现为衰减。在人声的80 Hz 到1100 Hz频段,频率响应曲线比较平缓,大致处在-10db.
- 不同角度传递来的声音具有不同的响应,上图中30度(垂直方向,偏上方)的音源比0度的方向(垂直方向,正前方)的音源具有更高的响应。
实际上,不仅在垂直方向上有方向性,在水平方向上,该系统也有方向性:
我们对45度方向(两侧)上的声音最敏感(“侧耳倾听”),对正前方左右20度内的声音具有最好的空间敏感特性(更易于辨别方向)[3]。
更多关于该模型的特性,可以参考引文[1-4].
2.噪声与随机共振(stochastic resonance, SR)
噪声无处不在,我们所处的环境中随时都存在在风声、谈话声、机器运转等声音,比较类似的环境模型是白噪/粉噪。对于一个信号处理系统,噪声的存在通常会影响系统的信号的处理能力,因此人们经常想要抑制系统的噪声,提高信噪比(SNR),理论上来讲,噪声是信号处理系统的敌人。但是在实际系统中,反而经常会发现,当系统中存在不可预期的随机震荡时,系统对信号的处理效果反而会增加,即随机共振现象(stochastic resonance, SR)。[5]
约瑟夫结(Josephson Junction)是一个典型的随机共振系统模型[6]:
在输入信号中的噪声水平增加时,该系统的输出信号SNR反而增加,直到输入信号中的噪声超过一定水平。其数学物理基础我在这里不做解释,请参考引文[5-8]。
Bulsara等早在1991年就提出了包含随机共振的单个神经细元模型[9]。随后,人们在人类视觉[10]、听觉[11-12]等方面观察到随机共振现象。甚至人工耳蜗使用者也有该现象[13]。简单的说,就是在环境中有一定的噪声时,我们反而(对目标声音)听得更加清楚。并且人的其他知觉也有类似的效应。
3.鸡尾酒会效应(Cocktail party effect)
人在一个很吵闹的环境,比如拥挤的公车或是鸡尾酒会上,仍然能听到朋友的谈话。该能力被称为鸡尾酒会效应(cocktail party effect)[14],也就是选择性关注(selective attention)。在周围交谈的语言都不是我们的母语时(我们不感兴趣的声音),我们可以注意到较远处以母语说出的话语。我们所注意的声源所发的音量,感觉上会是其他同音量的声源的三倍甚至更多。
人之所以能对声音选择性关注,一方面是因为我们有两个耳朵,而左右耳都还有方向选择性的(原理类似于无源相控阵雷达,使用多个小的TR单元接受信号,而不是像传统雷达一样仅使用一个较大的接收单元),可以利用双耳信号的相关性增强信号[15],我们面向音源时候,在嘈杂环境中对目标声音的感知能力会得到显著增强,模型模拟中,能得到5db左右的增益[16]:
同时,对方说话的手势、嘴唇的动作等等也都会助益我们对其的理解,这方面的因素制造了我们“听清”了的假象。另一方面,人的注意力能控制当有多个声音传到时,更注重听哪个声音[17]:
在同时听到两个声音并注意其中一个时,和只听到一个时,脑内的EEG信号略有不同。目前人们只是通过各种途径观测到人的对知觉的控制能力,并没有一个完整和透彻的神经基础来解释该控制能力[18]。
4.语音与非语音感知
人脑有特定的区域来处理听觉信号(比如出击听觉皮层)[19],对于不同类型的听觉信号,人脑中有对应不同的敏感区域:
上图中黄色部分即对语音感知能力敏感而对非语音迟钝的区域。有了该神经基础,我们更容易将语音从环境之中提取出来,并忽略其他声音。
5.噪声与休息/睡眠
或许你注意到,在屋外下着雨,偶尔有遥远雷声飘来的飘来的时候,很容易感到困意。这就是噪声(适度)的神奇功效。在给予一定白噪声刺激时,人经在放松状态下过短短几分钟,心跳频率便会显著下降,容易入眠[21]:
以上显示了两人的心律变化,在白噪声引入时虽然效果有差异,但都出现了心律的下降。关于该效果,可以前往该网站自测:Rainy Mood。当然,如果这时候传来尖锐的声音(惊雷,2-6KHz),人是很容易惊醒的(参见上文关于频率响应的内容)。
至于白噪声助眠效果基理,我们还没有透彻的了解。
总结:
基于以上的原理,我们可以通过以下方式增强对特定声音的感知能力:
- 加一点噪声
- 面向声音传来的方向
- 在音源较远,没有视觉帮助时,可以”侧耳倾听“
- 意识里选择注意对象(该能力可锻炼)
——
[1] Mehrgardt, Sünke, and V. Mellert. “Transformation characteristics of the external human ear.” The Journal of the Acoustical Society of America 61.6 (1977): 1567-1576.
[2] Ballachanda, Bopanna B. “Theoretical and applied external ear acoustics.”Journal of the American Academy of Audiology 8.6 (1997): 411-420.
[3] Wersényi, G. “Directional properties of the dummy-head in measurement techniques based on binaural evaluation.” Journal of Engineering, Computing & Architecture 1.2 (2007): 1-15.
[4] Chen, Jiashu, Barry D. Van Veen, and Kurt E. Hecox. “External ear transfer function modeling: A beamforming approach.” The Journal of the Acoustical Society of America 92.4 (1992): 1933-1944.
[5] Benzi, Roberto, Alfonso Sutera, and Angelo Vulpiani. “The mechanism of stochastic resonance.” Journal of Physics A: mathematical and general 14.11 (1981): L453.
[6] Wiesenfeld, Kurt, and Frank Moss. “Stochastic resonance and the benefits of noise: from ice ages to crayfish and SQUIDs.” Nature 373.6509 (1995): 33-36.
[7] Gammaitoni, Luca, et al. “Stochastic resonance.” Reviews of modern physics70.1 (1998): 223.
[8] McDonnell, Mark D., and Derek Abbott. “What is stochastic resonance? Definitions, misconceptions, debates, and its relevance to biology.” PLoS computational biology 5.5 (2009): e1000348.
[9] Bulsara, Adi, et al. “Stochastic resonance in a single neuron model: Theory and analog simulation.” Journal of Theoretical Biology 152.4 (1991): 531-555.
[10] Simonotto, Enrico, et al. “Visual perception of stochastic resonance.” Physical Review Letters 78.6 (1997): 1186.
[11] Balenzuela, Pablo, and Jordi García-Ojalvo. “Neural mechanism for binaural pitch perception via ghost stochastic resonance.” Chaos: An Interdisciplinary Journal of Nonlinear Science 15.2 (2005): 023903.
[12] Ward, Lawrence M., et al. “Neural synchrony in stochastic resonance, attention, and consciousness.” Canadian Journal of Experimental Psychology/Revue canadienne de psychologie expérimentale 60.4 (2006): 319.
[13] Chatterjee, Monita, and Mark E. Robert. “Noise enhances modulation sensitivity in cochlear implant listeners: Stochastic resonance in a prosthetic sensory system?.” Journal of the Association for Research in Otolaryngology 2.2 (2001): 159-171.
[14] Pollack, Irwin, and J. M. Pickett. “Cocktail party effect.” The Journal of the Acoustical Society of America 29.11 (1957): 1262-1262.
[15] Von der Malsburg, Ch, and Werner Schneider. “A neural cocktail-party processor.” Biological cybernetics 54.1 (1986): 29-40.
[16] Hawley, Monica L., Ruth Y. Litovsky, and John F. Culling. “The benefit of binaural hearing in a cocktail party: Effect of location and type of interferer.” The Journal of the Acoustical Society of America 115.2 (2004): 833-843.
[17] Kerlin, Jess R., Antoine J. Shahin, and Lee M. Miller. “Attentional gain control of ongoing cortical speech representations in a “cocktail party”.” The Journal of Neuroscience 30.2 (2010): 620-628.
[18] Miller, Lee M. “Shaken, Not Stirred: Emergence of Neural Selectivity in a “Cocktail Party”.” Neuron 77.5 (2013): 806-809.
[19] Lewis, James W., et al. “Human brain regions involved in recognizing environmental sounds.” Cerebral Cortex 14.9 (2004): 1008-1021.
[20] Binder, Jeffrey R., et al. “Human temporal lobe activation by speech and nonspeech sounds.” Cerebral Cortex 10.5 (2000): 512-528.
[21]Spencer, J. A., et al. “White noise and sleep induction.” Archives of disease in childhood 65.1 (1990): 135-137.
来源:知乎 www.zhihu.com
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 10 个回答,查看全部。