上知乎日报应该审核更谨慎些,会误导人。写得多,有图,看起来不明觉厉的答案不一定是正确而值得推荐的。第一个答案的解释和概念是混乱的,也有一些错误。其他有几个赞同数不太多的简略答案还靠谱一些。
要理清题主的疑惑,首先要审题:
“设计上,音量 2 的“音量大小”是音量 1 的两倍吗?”
从字面上理解,音量1和音量2是指设备或者软件上的标示,而题主问的是:
1. 从音量1增加到音量2,设备或者软件当中究竟调整了什么
2. 调整后,对产生的声音有什么影响?人的主观感受如何?是不是感觉大了两倍?
晚上回家详细答。
—————————————————————————————————————————-
正式答题
其实这是一个非常复杂的问题。为了好懂,有些地方作了简化,不够严谨。另外已经不玩声音好多年了,有错误请指出。电声部分只能简略回答。希望有从事这方面工作的知友补充。
首先给出答案:从音量1调整到音量2,人感受到的声音大小,一般不会是两倍,但是也有可能是两倍。而且如果你觉得声音大了两倍,另一个人也不一定觉得声音大了两倍,就是这么纠结!还有,除了大小的改变,你听到的声音本质上已经不是同一个了。
我们平时最常用的描述声音的物理量是声压级(SPL),单位是分贝(dB)。比如路边的城市噪音监测(图片来自网络,顺便吐槽下db的B应该大写):
声压级和声音的本质,到本答案后面部分再讲。我们先来看人对声压级变化的主观感受(数据来源丹麦Bruel&Kjaer公司)
通过举个例子来帮助理解上面这张表。假设你原来用一台播放器听歌,再打开一台一模一样的播放器,声音大了一倍吗?不,同样的声源叠加,声压级才变化3dB,一般人刚刚能听出区别。而你同时打开8台一模一样的播放器,声压级才上升9dB,才差不多让你感觉到两倍响的程度。
声音既然是波,那么就携带了能量,这都是声源比如播放器辐射出来的。假设一台播放器的声功率是1W,你听到的声音是音量1,假设音量2是音量1的两倍响,音量3又是音量2的两倍响。音量2对应的声功率等于10W(10台一模一样的播放器同时打开),而音量3对应的声功率等于100W(100台一模一样的播放器同时打开)。要实现同样的音量变化感觉,需要的声功率呈指数级上升。
我们平时欣赏音乐或者看电影的时候,要调节音量不会通过买一大堆不能调音的播放器一起叠加,而是通过音量调节旋钮(也叫电位器,实际上就是一个滑动变阻器)或者软件里面的音量调节来实现的。
举个例子,画个简图,电位器调节功率放大电路的输入,相应的,被功率放大电路驱动的扬声器发出的声音也相应变化了。
上面那个100台播放器的例子意味着什么呢?电位器对功率放大电路的输入调节也要成指数变化,例如下图中的蓝色曲线,就是一个典型的音量调节电位器的性能曲线(虚线是理想的指数函数曲线,蓝色线这样的两节形式对生产制造和成本有利):
横坐标是你旋动的角度百分比,纵坐标是电位器电阻值的变化程度。电阻值变化相应使功率放大电路的电压变化,最后加载在扬声器上,发出的声音也相应变化了。
假如我们把横坐标分成10个档位,分别从音量1到音量10,可能从音量1到音量5(整个调节范围的一半),电阻或者输出电压才改变了10%,而往后只旋转一点点就能改变很大功率,比如从音量5到音量8(也就是50%位置到80%位置),电阻或者输出电压改变了接近60%。
而软件里面的虚拟slide bar或者rotary knob,背后的程序也是同样的原理。比如下面这篇文章:Programming Volume Controls
假设你要是用了线性调节,调节音量时你会感觉到刚开始音量变化很快,到后面怎么调好像都没什么变化。而类指数函数形式来调节音量比较符合人的听觉特点,让你感觉音量调节很均匀。但是具体电位器的性能或者软件到底是按照什么逻辑来设计的,你是不知道的。
—————————————————————
具体的做法是怎么样的,参考评论里面 @诗云 和另一个 @茂哥 的答案。只需要记住,要类指数输出,不要线性输出。这样人的听感才接近线性或者说均匀
—————————————————————
最后音量的输出还涉及到扬声器本身的性能问题,或者叫灵敏度(loudspeaker sensitivity)。打个比方,不同的发动机产生同样的马力,差的发动机烧油就多。而产生同样的声压级,灵敏度差的喇叭消耗的功率就大。换句话说,就算是你知道从音量1增加到音量2时,加载在扬声器上的功率增加了多少,你还是不知道声压级具体升高了多少。
再回过头来看答案:“从音量1调整到音量2,人感受到的声音大小,一般不会是两倍,但是也有可能是两倍”。因为影响因素实在是太多了………
还有另外一半,明天再答:“而且如果你觉得声音大了两倍,另一个人也不一定觉得声音大了两倍,就是这么纠结!还有,除了大小的改变,你听到的声音本质上已经不是同一个了。”
—————————————————————————-
继续答题,这部分更麻烦一点,要把声波转换到频域。先从声音的本质讲起:
关于频域和时域的关系,大家可以去阅读 @Heinrich 写的” 如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧”
如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧 – 与时间无关的故事 – 知乎专栏
人听到的声音本质上就是气压的变化,或者大堆空气分子的振动。声音在空气中传播时,如果你眼睛能看见空气的分子,那么空气大概是下面这张图这样的:
空气分子周期性的聚集和散开,在空气分子聚集的地方,压力比大气压高,反之比大气压低。你的耳朵能够捕捉到这种气压的变化,通过大脑处理以后就听到了声音。人的听觉系统是个极其牛逼的设备,可以感受到20µPa到20Pa之间的压力变化。(一µPa等于百万分之一Pa=1N/m)。
假设我们用音叉敲出两个声音,就是下面这货,相信很多人中学小学都见过,
可以发出两个单一频率的纯音,分别在时域和频域画出来:
先看纵坐标,气压变化的幅值,上面的比下面的大,换句话就是说空气分子的运动幅度比较剧烈,在聚集的地方互相之间靠得更紧,稀疏的地方互相之间离得更远。而聚集分开得越频繁,频率就越高。人耳的牛逼之处再次体现出来,人可以听到20Hz~20000Hz(根据评论 @张尚宇 提醒,现在已经修正到16~16000 Hz了),也就是说空气分子每秒钟拥抱分手20次到20000次之间,我们人都是知道的。但是超过20000次只有蝙蝠知道了。
平时生活当中,我们听到的声音绝大多数情况下都不是纯音,都是很复杂的。比如下面这样:
作了这么多铺垫,关键部分来了~
人对不同频率的声音,敏感度是不同的。
比如说你面前有两个音叉,发出的声音一个频率低,一个频率高。你轻轻的敲了一个高频率的音叉,然后要用很大力敲低频率的音叉才觉得一样响。为了反映人听觉的这一特性,上世纪30年代以来,无数科学家的努力画出了下面这张图,也就是其他答案里面也提到过的等响度曲线,图片来源维基百科。
看了就晕吗?听我慢慢解释。
这张图是怎么画出来的呢?找一大堆人,先给他们听不同大小的1000Hz纯音,然后让他们每个人自己听出其他频率和1000Hz纯音一样响的声音,记录下来,把所有人的结果平均,就得到了上面这张图。
比方说,对我们一般人类,50分贝,100Hz的纯音和40分贝,1000Hz的纯音听起来一样响。而且从图上看,我们人类的耳朵在低频部分敏感度下降得很厉害,高频部分稍有降低。2000~5000Hz处最敏感(就是上图中曲线最低洼的部分)。
最后回到答案的后半部分:
“而且如果你觉得声音大了两倍,另一个人也不一定觉得声音大了两倍,就是这么纠结!”
(1)注意,这张等响度曲线是平均得来的,在过去100年中经过了数次修订,并且这个使用耳机测的,用扬声器对结果还有影响。对每个个体是不一样的。下面这个网页你可以测出你自己的等响度曲线,你可以去感受一下。
Free hearing test on line Equal loudness contours and audiometry
注意:慢慢增加音量!!从表中的最下方开始点起!!不然刚开始声音太大会损伤听力!!!!
“还有,除了大小的改变,你听到的声音本质上已经不是同一个了。”
因为人对不同频率声音的敏感度不同的特性。打个比方,我们录了一场音乐会,是在平均100分贝的声压级下录的。当我们回放的时候,假设声压级50分贝,因为我们人耳对低频和高频的声音不敏感,会感觉听上去“薄”了,因为低频和高频的声音被我们的耳朵滤掉了。所以有些设备里面有等响度补偿的功能,适当增加低频和高频的声音成分,让我们听上去感觉还是一样。
————————————————————————————————–
关于响度的补充内容,看下面@何明涛的答案,其实这个问题跟等响度曲线关系和人对不同频率声音的感知特性关系不太大,既然写了就放在这里吧。
— 完 —
本文作者:南瓜
【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)
此问题还有 12 个回答,查看全部。
延伸阅读:
为什么几乎所有耳塞式的耳机和很多发烧级的头戴式耳机都没有音量调节旋钮?
学习、看书时戴耳机听音乐多大音量合适?