人类可以区分的最大音频比特率是多少?

某些音频比特率高达256kbps。 但是我用92kbps的速度收听非常清晰的音乐。 我开始怀疑,超过x kbps的某个比特率,人类的平均耳朵根本无法区分。 什么是x?

虽然问题不是特定于ubuntu,但它是因为我分裂的ogg开放格式问题而出现的。

mp3到ogg的优点

比特率本身是不可区分的,因为它不是我们听到的音频信息的度量。 它在编码器移除它认为听不见的信息之后的信息大小(因此,“一次性”没有或最小损失)。

好的编码器具有良好的心理声学算法,这意味着他们明智地选择如何去除振幅太小而无法察觉的高频和频率,然后以给定的比特率打包“斩波”波。 比特率越高,编码器必须从原始音频中切除的越少,但是被移除的部分与可用的算法(其心理声学模型)做出的决定与实际比特率有多大的区别。 糟糕的编码器(如古代兴)需要比较好的编码器(如现代跛脚)更高的比特率,以达到相同的感知质量水平。 因为给定相同的位,它选择了什么编码和丢弃什么。

因此,不要想象CD比特率一样考虑MP3比特率。 在CD中,模拟声波只是数字编码,没有任何东西被删除。 所以位越多,你的声波就越准确。 因此,您可以从比特率到感知准确度进行1-1映射。 使用MP3(或OGG)编码或任何依赖于心理声学模型的有损编码都是不可能的

此外,“可区分”是主观的:人类听觉和高频敏感度随着年龄的增长而恶化…所以你现在可能享受96kpbs,但是10(或20)年前肯定会“需要”更多。 不同的人以不同的方式区分高频(或小振幅)。因此对于他们来说 ,即使比特率较低,给定的编码器也可能比另一个好。 此外,设备和环境起着关键作用:在路上的汽车中听音乐与在带有高品质耳机的安静房间中听音乐是不一样的。

还有其他因素……特别是VBR …这意味着比特率不断变化……对于需要更复杂编码的歌曲部分,最高可达320,并且下降到96,无需删除任何内容。 因此,平均128kpbs的VBR文件通常具有比160(或甚至192)恒定比特率(CBR)高得多的质量。

也就是说,128kpbs VBR 对我来说非常好,即使使用优质耳机也是如此。 对于CBR,192足以实现透明度(这意味着我无法区分原始的无损CD音频)。 我33岁,而不是发烧友,所以你的里程可能会有所不同。

一个类比:

现在有一个很好的类比……它可能有助于理解为什么它不可能回答“人耳无法区分的x kbps以上”的问题:

将音频视为房屋及其家具。 你要搬到另一所房子。 你移动的卡车是你的比特:它越大,你可以装到新家的家具就越多。 但由于它是一次单程旅行而卡车不足以容纳所有东西,所以总会留下一些东西,因此会丢失

你能分辨出丢失的东西吗? 你是否同意它取决于所选择被遗忘的东西(或更多) 不是卡车的大小,即使是更大的卡车确实有用呢?

您是否同意无法衡量卡车的大小必须如此“无法区分”,除非卡车足够大以容纳您的所有家具? (这将是无损编码,如FLAC。这比最大的MP3大5倍)。

最后的话:

有人可能会说,人类听力阈值的客观测量是可能的。 确实,您可以测量人耳对于听不到频率的高度,或者给定声音低于“主导”声音多少dB,因为它难以区分。 但是你无法直接将其转换为比特率,因为编码(或丢弃)需要多少比特,这取决于给定歌曲中存在多少比特。

Hydrogenaudio的论坛已就此问题进行了几次ABX测试。 大多数人不能始终如一地分辨出〜160kbps VBR范围内的未压缩源材料和压缩文件之间的区别,但有些音乐确实难以准确压缩,有些人擅长听到甚至320kbps的有损编码的差异。 音乐 。 答案是:这取决于。

你的意思是192 kbps非常非常清楚吗? 92kbps的比特率有点低,我可以很容易地区分出来。 除非你在质量无关紧要的嘈杂环境中聆听(比如听公共汽车上的便携式设备),否则我会避免使用立体声音乐低于~128kbps的VBR。 你牺牲了质量来节省一点空间,在我看来,这种权衡是不值得的。

可以降低一些相当低的比特率(比如80kbps以下)并保持单声道音乐和语音的可接受质量。