写给音频后期工作流的建议

视频与歌曲混音的建议

  1. 前言:

    *. 虽然以前写过关于混音的不同方面的介绍性教程,但确实都比较零碎,不是特别的系统性,所以这次呢打算从我自己平时常用的混音流程,来把之前写的内容串联起来。也会补充很多内容。

    当然不只是关于混音的内容,这个博客上的所有文章都只是代表了我的个人想法,每个人的工作流程可能都不一样,不同的歌又会有所不同,所以仅供参考。

    1. 响度标准:

      1. 视频的音频后期是直接面向流媒体平台的,所以小型工作室往往不存在相互独立的混音、母带流程,这时你需要了解你的视频发布平台的响度规范
      2. 一般建议是平均响度-14LUFS,峰值响度不超过0db,个人习惯是不超过-3LUFS,这是广播电视的常用标准。注:电影的标准是平均响度-27LUFS
      3. b站的响度标准一直是个谜,因为好像是改过几次,我不知道你在看到这篇文章的时候b站的响度标准是多少,所以请务必在网上查询确认一下,默认是 -14LUFS ,这是隔壁油管的响度标准
      4. 一些暴论:其实你可以直接照着 -14LUFS 这个响度进行混音,然后再在总线上加一点高低频和音染优化
        1. 高低频优化:(EQ)
          1. 一般在低频和高频处进行3db以内小幅度的增益。
          2. 将低频用side模式低切掉,高频用side模式进行3db以内小幅度的增益,同理对中频用mid模式进行3db以内小幅度的增益(参考我所的“加宽” 预设)
        2. 音染:(压缩)
          1. 这里的音染指的是谐波染色,即频率倍数于你的音频的声音,而不是一直失真带来的音染
            1. 奇次谐波:奇数倍的声音,特点:阴冷尖锐
            2. 偶次谐波:偶数倍的声音,特点:温暖柔和
            3. 往往模拟电路类插件都会有音染,且会混有多种谐波,(可能会有7、8个谐波,其音染特点由奇、偶次谐波的比例决定)
          2. 由于低端的设备(比如大多数的手机)的低频都不太好,所以可以通过音染,使低频产生数倍于其频率的谐波,从而被观众听见(往往开玩笑地称为幻想的低频)
          3. 这种情况在音乐母带时用于优化鼓组,但制作微电影时也会遇到,因为你会需要去做大量的声音集中于低频、中低频的音效
      5. 第四点在理论上是绝对错误的,母带是绝对不建议在混音的总线上做的,在这里所指的仅是一些3db以内的微调,所以请不要随意地在总线上加大量的限幅,甚至是AI一键母带的插件。
      6. 你确实可以考虑在总线上挂一些为母带设计的EQ和压缩以提高声音的融合度,但其实并不建议,这调整的难度较大,有碍于工作效率,你不如在总线上使用glue胶水类压缩。(请看你的视频的情况使用,因为你的视频未必非常需要提高声音融合度。)
    2. 声卡监听是有必要的,可以使声音更有密度,高频的分离度更好(人话:混音时可以听见更多细节)

    3. 视频混音的思路和音乐混音的思路是不一样的,尤其是EQ,请切记这一点!

  2. 降噪:

    1. 你需要学会AI降噪,手动降噪,人声分离

    2. 笔者常用的降噪软件和插件有很多,例如:RX10,EDR6,它们均含有AI降噪功能,其中RX系列的软件主体和AU都有更为专业的手动降噪方式,即对频谱图进行手动擦除,请根据你的情况使用最新的降噪软件和插件。我通常会用臭氧家的RX来对人声降噪。并且我喜欢把降噪作为一个单独的环节,你们可能会看到很多人是把RX插在宿主里进行降噪的,我不太推荐,原因如下:

      1. 我习惯将降噪和混音的思路区分开,以免相互影响!
      2. RX的AI降噪是很好,但有时候有的细节还是要手动去降。单独用软件操作起来方便一点。
      3. 如果你是用的adobe AU,那么我推荐你用RX的插件。但如果你是用的DAW,比方说我是用的Studio One,那么我建议单独用RX,操作体验会好一点
    3. 人声分离:将音乐和人声分离开来,我使用的是 UVR5 以及 RX系列的music balance功能,请根据你的情况使用最新的人声分离软件

    4. 噪音类型:

      1. 底噪:使用各种门限器gate (eg.肥波 G)
      2. 喷麦:手动擦除或低切(400hz以内,音头附近)
      3. 哨音:手动擦除(一般在1k~2khz内)
      4. 齿音:eq高切(较缓,切掉20k以上,一直延伸到7k左右)、分段压缩(动态eq亦可)、各类de-ess(一般在7~8k左右,因人而异)
      5. 口水音:手动擦除(频谱上为竖状长条)、
      6. 其他噪音类型:各类AI的de-noise插件(慎用!降噪过多会损坏音质,实在需要降噪时,建议重录或者用低音环境噪音音效铺底遮住噪音
  3. 混音与音效搭建(按工程类型):

    1. 歌曲混音:

      1.人声的预处理:

      1. 降噪
      2. clip gain:
        我以前是不太喜欢在预处理阶段对人声做clip gain的,但后来我发现这么做真的香。
        先来说一下我以前的手法,我喜欢在做完对轨、加好eq后,直接在画包络线的时候去控制人声的动态,顺带和伴奏去做避让。这种做法会导致你的动态控制可能不是特别好,但确实比较直接。
        我现在的做法呢,是用包络线先去做clip gain,再加一条包络线做咬字、归韵和避让。这种做法的动态控制会比较好处理。其实也可以用剪开再对各个片段调整音量的方式做clip gain,这样做可能能保留一些歌手对演唱的理解,虽然动态控制时可能会有一点小小的问题。(我见过的一些给视频做音频后期的人中,这么做的会多一点。)
      3. 修音
        见仁见智吧,如果跑得不厉害你也可以直接不修,看甲方要求。并不是所有甲方都会需要修音,比方说可能对方是个成长系vtuber,就想要表现这种成长也犹未可知。(开玩笑的,摆烂不好)
    2. 伴奏的处理(贴唱)
      如果对方翻唱的歌曲专辑下没有提供伴奏,那么你就需要去制作一个。一般的方法有扒带和用UV5来提取伴奏。扒带就不说了,如果是提取伴奏的方式,那么很可能还需要对一些细节在手动处理一下,比方说用RX去进行调整。做好上面一步,或者原专辑提供了伴奏,那么你还需要针对提供给你的人声,对伴奏进行一些优化,比如说让位的处理,这一步开始就是在DAW里做了。

    3.开始混音

    1. 整理分轨

      1. 对轨是一个很容易被忽视的环节。建议先测一些bpm,然后在DAW里设置一下这个速度,这样你就可以参考DAW里表示节拍的竖线了。除此之外就是注意:乐器轨的摆位和音量控制。
    2. eq+压缩

      1. 一般我对所有轨道都会先加一个肥波Q3,来处理一些不好听的声音。
      2. eq的另一个作用就是提供一些音色的变化,一般也是所有轨道都会加。(除了贴唱时的伴奏轨)
      3. 压缩更是很可爱的一个东西,一开始用甚至听不出差别,但用多了以后,现在再去听,对整个声音的质感是会起到很大的作用的。
    3. 混响

      1. 我愿称为“混响+无穷”,混响是混音过程中最有创意的环节。通过在外链的轨道给混响加eq、延迟和压缩可以搞出很多好玩的花样来。
      2. 但值得注意的是,混响的声音反射回来时,高频要注意控制。自然界中,回声的高频会大幅度衰减。
    4. 自动化(包络线)

      1. 也就是咬字、归韵和避让
    5. 总线处理

      1. 一般会考虑用一些能提高融合度的插件,以及一些压缩和限幅器,比如一些特别的eq、胶水压缩。
    6. 简易视频(即仅有BGM和人声干声,略微加点音效):

      1. 试用类型:散文类,日常类等
      2. BGM轨:参考我的EQ“人声让位”预设
      3. 人声轨:记得做clip gain以平衡整体音量,并用EQ提升中频,混响
    7. 采访类视频(即有BGM,人声现场录音,人声干声旁白,略微加点音效):

      1. BGM轨:参考我的EQ“人声让位”预设
      2. 人声轨:
        1. 实录:一般仅降噪,用EQ提升中频,保留临场感
        2. 旁白:记得做clip gain以平衡整体音量,并用EQ提升中频,用混响与实录产生差异化
    8. 微电影:

      1. 写在前面:

        1. 低频、中低频是微电影的灵魂!!!
        2. 电影声音最重要的:临场感!氛围感!
        3. 电影工业的响度标准是:平均-27db
        4. 结合上面三点来做解释:
          1. 生活中很好听很亮的高频是不常见的!理由如下:
            1. 你所听到的声音是被反射回来的声音,在反射的过程中,频率越高,自然的会衰减的越多。
            2. 这一现象给了我们两个启示:
              1. 用音箱监听时要通过低频陷阱的方式改善反射的频率
              2. 做音效搭建时,音效的高频要控制。不止是音效,几乎除了画外音,所有需要有临场感的声音都要控制高频。(参考我的“自然衰减-加宽”预设,注意:人声不要过度加宽!)
          2. 电影工业的响度标准是平均响度-27db,这是基于影院音箱设计的。原因:你不可能爆炸的声音和说话的声音差不多大吧。
            1. 可是我们的发布平台和播放设备并不是这样(默认b站、手机、低端TWS耳机)!
            2. 所以需要注意:剧本不要设计需要大声音的场景!!!
      2. 音效搭建:

        1. 低频、中低频是微电影的灵魂!!!
        2. 如果后来看到这篇文章的人有为影视编写配乐的能力,可以直接跳过这里。
        3. 外景一般比室内有更多更丰富的环境音效,会有更多的发挥空间,做的好的话会有很好的临场感。
          1. 笔者有做过一个视频,其中3分钟全是室内的人物镜头特写,而且是切换频繁的蒙太奇,这种情况几乎是无法做环境音的,只能做好一些物品、动作的音效,发挥的空间就不是很大。
        4. 音效我将其分为2类:氛围音、临场音
        5. 临场音:风声、雨声、大自然的声音、办公室的嘻嘻索索的声音、街道嘈杂的人声、翻书声、脚步声、汽车鸣笛、手机消息音等。一般都可以考虑做低频的声音先入。一般做到音画同步即可,但有时也会做声音先入
        6. 氛围音+BGM
          1. 在没有能力写配乐的情况下:
            1. 剪辑一般会找一些BGM来把握视频的节奏,在有BGM的情况下,建议你根据BGM的节奏(BPM)来做氛围音效
            2. 在没有BGM的情况下,全凭个人功力,建议好好去自己学学
            3. 氛围音效、弦乐建议双声道,并且适量加宽加深!(目的是为了更好的氛围感)但钢琴不建议这样做。
      3. 混音:

        1. BGM轨:参考我的EQ“人声让位”预设
        2. 人声轨:
          1. 台词:参考我的EQ“自然衰减”预设,并注意齿音控制
          2. 内心独白:记得做clip gain以平衡整体音量,并用EQ提升中频,用混响与实录产生差异化
        3. 音效轨:参考我的EQ“自然衰减”预设

音效搭建与设计

  1. 前言:

    以下内容是笔者这一年来通过实践和对一些影片的分析得来的总结。
    笔者曾系统地学过音乐混音,但并没有体系化地学习过音效相关的内容,所以音色设计方面完全是eq的思路,而不是编曲或者使用合成器的思路。使用的也完全是由他人录制并发布的音效,而不是专门去采样录制自己需要的声音。

    在过去一年的实践中有以下几个好处和坏处:
    先说坏处:
    1、无法一步到位直接合成出自己想要的声音 2、使用的音频文件往往需要用EQ进行大幅度的处理 3、会无法找到需要的或者合适的音效音频 (4、因为是耳机混音,声音的空间感存在一定的问题,在不同设备上回放,声音会有“穿帮”的感觉)
    好处也有,不过大概只有一点:平时混音还算有点积累,基本可以用插件将音频塑造出想要的感觉。至于音效的情绪更是几乎全是用自动化(包络线)做的,声音的避让和位置上可以更好的把握住。(位置指的是方位,音量和频率)

  2. 音效的使用

虽然音效可以分成很多类,在这方面有很多人总结成不同的分法,他们对音效的使用也不同。我不知道音效使用有无流派,或者又有多少流派,但可以肯定的是不同风格的影片音效的使用确实存在差异(指的是使用时机和音效的音量均衡)

但我却认为其实只有两类:氛围音效和临场音效——对应电影声音的两个目的:氛围感和临场感

氛围音效,例如使氛围开始紧张的上升音效、使心情开始下沉的下降音效、转场用到的撞击音效……这些音效往往会用在转场处。所以很多人称为转场音效。那么什么是转场?镜头切换?这是一部分。在发生了某种转变时就可以用氛围音效,这可能是镜头的切换,也可能是人物的心情转变,或者是在同一个场景中某些事情发生了(人物动作、物体移动、天气变化等)

临场音效,即镜头所呈现的环境的声音,其目的是营造出一种临场感。

氛围音效(按用途):
  1. 镜头的切换:

(1)这是最容易注意到的,哪怕你是刚入门的新人,用过必剪的话应该会使用过它自带的转场音效(因为在必剪中它是和转场特效绑定的)。
(2)但是注意,并不是所有镜头都需要转场音效!只有那些你需要观众注意到你转场的时候才会用到!
(3)因为转场往往会去踩BGM的点,所以为了使转场不突兀,你应该和BGM搭配使用,比如使音头正好落在鼓点上。

  1. 人物的心情转变

往往角色的内心戏是无法表达的,应该没有台词,此时有两种思路:
(1)直接法:比如紧张,在紧张时人的心脏会越来越快,所以你可以使用速度不断较快的上升音效。(当然可以配合心跳越来越快的声音,虽然通常管这种叫联想音,但此时它是为氛围服务的)。
(2)间接法:比如害怕,你不能直接做害怕,但你可以使用阴森恐怖的配乐。
无论那种方式,还是那句话,你应该有和配乐搭配使用的意识!

  1. 场景中某些事情发生了(比如人物动作、物体移动、天气变化等)

    这种情况可能有人会问,这不是实际现场的声音吗? 那不应该是临场音效吗?

    我要说,音效的使用目的并不是单一的。我是先学的混音,我就发现很多人(尤其是只做广播剧和有声书的人)音效的使用是很“克制”的。因为没有画面,所以音效声音给人声让了很多的位置,情绪则是通过配乐来实现。(不同艺术形式做音效的思路不同,只是介绍一下,没有对错之分,相反你应该相互借鉴)

    然而我认为情绪和氛围是所有声音共同推动的。实际现场发生的声音,我也可以通过各种自动化来塑造它的情绪。比如火车驶离的声音,我就会给的时间比较长,然后会有插件的自动化来推动情绪。(比如明明越来越远,声音越来越小,但混响的回声却越来越大,用越来越大的体积感来烘托离别内心的失落空荡)
    (对比更为常见的思路,往往是一声汽笛+淡出的嗡嗡声,然后失落的心情用配乐来衔接。)

临场音效:
  1. 镜头切换的另外一种思路
    音量与声像的自动化!突然的衰减和增益都会在瞬间改变场景的声学环境(类比画面的透视关系突然改变),同样可以告诉观众你的视角,切换了!

  2. 临场音效的使用
    1. 对轨:
    比如脚步,翻页,搓手等,这些在现场发生的声音应该根据同期的拍摄录音去构建,并根据你的视频情况适量放大,来加深临场感。
    2. 环境重低音
    接第一点,来谈音效的衔接。比如风声就是最常见的环境重低音。你完全可以通过自动化的方式,来进行镜头间的切换

  3. 总结:
    我常常是一个音效重新塑造一下,就可以即有临场感,又有氛围感,也就是说用少量的音效做更多的事情。这算是我的理念之一。
    以上只是我的常用手法之一,我打算进一步去学习配乐的编写,到时候可能又会改变自己的看法。
    但你应该明白一点,你的音效的目的是什么,而不仅仅是画面上有什么。
    速成的话,请根据自己的情况灵活处理!


写给音频后期工作流的建议
https://zyf-42.gitee.io/audio-workflow/
作者
zyf-42
发布于
2023年5月30日
许可协议