声音技术的发展史
1877年爱迪生除了(le)发明电灯,也发明了第一个可以(yi)回放声音的装置,从此之后(hou)声音可以被回放。
可以称之为第(di)一代的留声机,在这之(zhi)前声音无法被回放,只能靠文(wen)字想象。我们利用一个声道或音轨来重(zhong)现声音,我们叫做 Mono 或是单声道。
双声道、立体(ti)声 — Stereo
1931年 EMI 的工程师 AlanBlumlein 认为人类是用两(liang)只耳朵听声音,为何我们只有一(yi)个喇叭呢?所以他发明了 Stereo,Stereo 需(xu)要左右两个喇叭发出不同(tong)的声音,所以如果你有两个喇叭播(bo)放的是一样的声音,我们(men)还是叫做 Mono。Stereo 因为价格与(yu)技术上的问题,一(yi)直到 1960 年代才慢(man)慢普及,那时候 Beatles、猫王都开始尝试用 Stereo 来创造,甚至(zhi)会标示在唱片封(feng)面上。
Stereo 虽然叫做立体声,但他离立体(ti)还有点距离,因为人类大脑对于判断(duan)实体声音超级厉害,以准确度来(lai)说大脑的误差在左右(you)正负3度(3度是如果我们画一个时钟(zhong)是1分钟这么窄(zhai))。
quadraphonic 四声道(dao)
为了要让人的(de)体验更「声」历其境,很自然地(di)会想到增加喇叭的(de)数量,所以后来有了前面两个声道(dao),后面有两个声道的 quadraphonic 四声道。四声道在 1970 年红了一阵子,但很快因(yin)为成本的问题消失。
5.1声道 — 环场(chang)声、环绕声
5.1 声道
我们(men)现在较长听到的环绕音(yin)响或是 surround sound 是 5.1声道,前面有三个声(sheng)道,后面有两个。像(xiang) Dolby Digital,SDDS,DTS 及 Pro Logic II 都是常见的 5.1 声道音效系统。第一次使用(yong)是在 1980年代的电影院一直到现(xian)在。
但像刚刚提到的,大脑对于判(pan)断实体声源超级厉害,所以即使你有5.1环绕音响,你仔细听,还是听得(de)出喇叭的位置,为了解决这个问(wen)题,大家开始增加喇叭数目,每个方(fang)向都增加喇叭,然后那个喇(la)叭就只播放那个方向(xiang)的声音就好,所以就有了 6.1 或是 7.1 声道的环绕,利用增(zeng)加喇叭数目增加声音播放的精确(que)性。
7.1 声道
这种透过增加喇叭数量来增加(jia)声音播放的精确性的解决方案(an),其实不止发生在水平面,也发生在(zai)垂直面。所以后来有了 9.1 环绕,这种放在天花板(ban)上的高置声道( high channel)。11.1声道把天花板的喇叭数量变(bian)成 4 个,增加(jia)喇叭无非是为了增加体(ti)验和故事的真实性,让每个人能(neng)更融入故事。
声音档案(an)制作 — Channel-Based com Sound
了解(jie)了声道的概念后,那制作声音(yin)档案时,我们都希望(wang)用户能更沉浸在声音里,那声(sheng)道又该如何处理呢?举例(li)来说,我今天想让你听(ting)到后面有一只恐龙在叫,前面有个人(ren)在尖叫,现在传(chuan)统的做法是以喇叭的数(shu)量为出发,我们称(cheng)作 channel-based 的作法:
决定声道数(shu)为 7.1 声道(dao)
首先要决定要用几个喇(la)叭,假设在这个例子里我们用(yong) 7 个喇叭的 7.1 声道
分配声音
接着我(wo)要把恐龙的声音跟尖叫的声音平均(jun)分配到他附近的喇叭里面(mian),接着再把七个喇叭(ba)的声音全部包成一个档案,拿到了这个(ge)档案后就要去找出 7.1 声道的喇叭配置,然后播放档案(an)。
播放档案之后理论(lun)上你就能听到恐龙在后面与(yu)前面有人在尖叫,这其实是 1 个萝卜一个坑的道理。所以如果你想要(yao)听到 5.1 声道的声音,你就同时要(yao)有 5.1 声道的档案和 5.1 声道配置的喇(la)叭。
聆听场景与播放(fang)设备不断增加,该如何(he)解决?
现在的时代,除了喇叭配置的选择更多外,播放声(sheng)音的设备跟播放声音的情境、地点(dian)越来越多,然而设备(bei)也有不同的大小与性能(neng)。我们会希望有一种声音格式可以很(hen)有弹性,能适应不同的喇叭配置与情(qing)况,让消费者可以简单切换。声(sheng)音产业为了解决这个问题,目前(qian)有两个方向:
一、Object-based 面向对象(xiang)式
以刚刚的(de)例子(前面有人尖叫,后面有恐龙(long)叫)来说,身为创作者在 object-based 的方式下要决定(ding)「这个恐龙什么时候用多大的音量在哪(na)里大叫」,接着根据不同的喇叭(ba)配置(双声道、 5.1、7.1、 22.2声道) ,分别做好设定,最后再把(ba)信息都打包成档案,这样播放时就可(ke)以依照现有的喇叭配置播放声(sheng)音。
除此之(zhi)外 Object-based 还(hai)可以把每个声源当作是一个对象,举个(ge)例子来说,当你(ni)在看一场直播的球赛(sai),如果球赛里的球(qiu)评、主播、场内的(de)对象都是分别独立的对象,如果你觉得球评很吵(chao),你就可以把球评关掉(diao),只留下场内的声音,你(ni)甚至还能选择主队或是客队的欢呼声,以此创造影音内容的互动,也(ye)让观看的体验更有趣。
二、Scene-based 场景导向式
场景导向式其实是一个(ge)相当大的类别,我们比较常(chang)听到的是 ambisonic 的技术,ambisonic 的概念在 1970 年就被提出(chu),他的概念有点像(xiang) 360度影片,假设我们可以在场地(di)中央放一个麦克风,一口气把整个场地(di)的音场录下来,音场搭配上三维的(de)坐标(X.Y.Z),播放时让喇叭配置依照坐标试着重(zhong)建音场。 360 度(du)影片就是 ambisonic 的应用(yong)之一,也是因为 360度影片,2016年初 Youtube 开始支(zhi)持 ambisonic。
声音技术的革(ge)命正在发生!!
但是有些(xie)问题虽然可以在 Object-based 跟 Scene-based 的技术下(xia)解决一部份,但如果(guo)声音可以突破声道的限制,那(na)就不会有家里明明有环绕音响,但是看(kan)电视的时候听的都是双声道的哀伤。即(ji)使有 Object-based 跟 Scene-based 的技术(shu),但是你的设备都是 mono 跟(gen) stereo 的设备 (e.g. 计算机、电视、手机) 那你听到的东西就还是 mono 或 stereo。
来自musictech
合作投稿微信号:jiang13911458766(←长按复制)
关(guan)注中国音响网微信(xin)号:chinaaudio