视频与歌曲混音的建议

前言：
*. 虽然以前写过关于混音的不同方面的介绍性教程，但确实都比较零碎，不是特别的系统性，所以这次呢打算从我自己平时常用的混音流程，来把之前写的内容串联起来。也会补充很多内容。

当然不只是关于混音的内容，这个博客上的所有文章都只是代表了我的个人想法，每个人的工作流程可能都不一样，不同的歌又会有所不同，所以仅供参考。
1. 响度标准：
  1. 视频的音频后期是直接面向流媒体平台的，所以小型工作室往往不存在相互独立的混音、母带流程，这时你需要了解你的视频发布平台的响度规范
  2. 一般建议是平均响度-14LUFS，峰值响度不超过0db，个人习惯是不超过-3LUFS，这是广播电视的常用标准。注：电影的标准是平均响度-27LUFS
  3. b站的响度标准一直是个谜，因为好像是改过几次，我不知道你在看到这篇文章的时候b站的响度标准是多少，所以请务必在网上查询确认一下，默认是 -14LUFS ，这是隔壁油管的响度标准
  4. 一些暴论：其实你可以直接照着 -14LUFS 这个响度进行混音，然后再在总线上加一点高低频和音染优化
    1. 高低频优化：（EQ）
      1. 一般在低频和高频处进行3db以内小幅度的增益。
      2. 将低频用side模式低切掉，高频用side模式进行3db以内小幅度的增益，同理对中频用mid模式进行3db以内小幅度的增益（参考我所的“加宽” 预设）
    2. 音染：（压缩）
      1. 这里的音染指的是谐波染色，即频率倍数于你的音频的声音，而不是一直失真带来的音染
        
        奇次谐波：奇数倍的声音，特点：阴冷尖锐
        
        偶次谐波：偶数倍的声音，特点：温暖柔和
        
        往往模拟电路类插件都会有音染，且会混有多种谐波，（可能会有7、8个谐波，其音染特点由奇、偶次谐波的比例决定）
      2. 由于低端的设备（比如大多数的手机）的低频都不太好，所以可以通过音染，使低频产生数倍于其频率的谐波，从而被观众听见（往往开玩笑地称为幻想的低频）
      3. 这种情况在音乐母带时用于优化鼓组，但制作微电影时也会遇到，因为你会需要去做大量的声音集中于低频、中低频的音效
  5. 第四点在理论上是绝对错误的，母带是绝对不建议在混音的总线上做的，在这里所指的仅是一些3db以内的微调，所以请不要随意地在总线上加大量的限幅，甚至是AI一键母带的插件。
  6. 你确实可以考虑在总线上挂一些为母带设计的EQ和压缩以提高声音的融合度，但其实并不建议，这调整的难度较大，有碍于工作效率，你不如在总线上使用glue胶水类压缩。(请看你的视频的情况使用，因为你的视频未必非常需要提高声音融合度。)
2. 声卡监听是有必要的，可以使声音更有密度，高频的分离度更好（人话：混音时可以听见更多细节）
3. 视频混音的思路和音乐混音的思路是不一样的，尤其是EQ，请切记这一点！
降噪：
1. 你需要学会AI降噪，手动降噪，人声分离
2. 笔者常用的降噪软件和插件有很多，例如：RX10，EDR6，它们均含有AI降噪功能，其中RX系列的软件主体和AU都有更为专业的手动降噪方式，即对频谱图进行手动擦除，请根据你的情况使用最新的降噪软件和插件。我通常会用臭氧家的RX来对人声降噪。并且我喜欢把降噪作为一个单独的环节，你们可能会看到很多人是把RX插在宿主里进行降噪的，我不太推荐，原因如下：
  1. 我习惯将降噪和混音的思路区分开，以免相互影响！
  2. RX的AI降噪是很好，但有时候有的细节还是要手动去降。单独用软件操作起来方便一点。
  3. 如果你是用的adobe AU，那么我推荐你用RX的插件。但如果你是用的DAW，比方说我是用的Studio One，那么我建议单独用RX，操作体验会好一点
3. 人声分离：将音乐和人声分离开来，我使用的是 UVR5 以及 RX系列的music balance功能，请根据你的情况使用最新的人声分离软件
4. 噪音类型：
  1. 底噪：使用各种门限器gate (eg.肥波 G)
  2. 喷麦：手动擦除或低切（400hz以内，音头附近）
  3. 哨音：手动擦除（一般在1k~2khz内）
  4. 齿音：eq高切（较缓，切掉20k以上，一直延伸到7k左右）、分段压缩（动态eq亦可）、各类de-ess（一般在7~8k左右，因人而异）
  5. 口水音：手动擦除（频谱上为竖状长条）、
  6. 其他噪音类型：各类AI的de-noise插件（慎用！降噪过多会损坏音质，实在需要降噪时，建议重录或者用低音环境噪音音效铺底遮住噪音）
混音与音效搭建（按工程类型）：
1. 歌曲混音：
  
  1.人声的预处理：
  1. 降噪
  2. clip gain：
    我以前是不太喜欢在预处理阶段对人声做clip gain的，但后来我发现这么做真的香。
    先来说一下我以前的手法，我喜欢在做完对轨、加好eq后，直接在画包络线的时候去控制人声的动态，顺带和伴奏去做避让。这种做法会导致你的动态控制可能不是特别好，但确实比较直接。
    我现在的做法呢，是用包络线先去做clip gain，再加一条包络线做咬字、归韵和避让。这种做法的动态控制会比较好处理。其实也可以用剪开再对各个片段调整音量的方式做clip gain，这样做可能能保留一些歌手对演唱的理解，虽然动态控制时可能会有一点小小的问题。（我见过的一些给视频做音频后期的人中，这么做的会多一点。）
  3. 修音
    见仁见智吧，如果跑得不厉害你也可以直接不修，看甲方要求。并不是所有甲方都会需要修音，比方说可能对方是个成长系vtuber，就想要表现这种成长也犹未可知。（开玩笑的，摆烂不好）
2. 伴奏的处理（贴唱）
  如果对方翻唱的歌曲专辑下没有提供伴奏，那么你就需要去制作一个。一般的方法有扒带和用UV5来提取伴奏。扒带就不说了，如果是提取伴奏的方式，那么很可能还需要对一些细节在手动处理一下，比方说用RX去进行调整。做好上面一步，或者原专辑提供了伴奏，那么你还需要针对提供给你的人声，对伴奏进行一些优化，比如说让位的处理，这一步开始就是在DAW里做了。
3.开始混音
1. 整理分轨
  1. 对轨是一个很容易被忽视的环节。建议先测一些bpm，然后在DAW里设置一下这个速度，这样你就可以参考DAW里表示节拍的竖线了。除此之外就是注意:乐器轨的摆位和音量控制。
2. eq+压缩
  1. 一般我对所有轨道都会先加一个肥波Q3，来处理一些不好听的声音。
  2. eq的另一个作用就是提供一些音色的变化，一般也是所有轨道都会加。（除了贴唱时的伴奏轨）
  3. 压缩更是很可爱的一个东西，一开始用甚至听不出差别，但用多了以后，现在再去听，对整个声音的质感是会起到很大的作用的。
3. 混响
  1. 我愿称为“混响+无穷”，混响是混音过程中最有创意的环节。通过在外链的轨道给混响加eq、延迟和压缩可以搞出很多好玩的花样来。
  2. 但值得注意的是，混响的声音反射回来时，高频要注意控制。自然界中，回声的高频会大幅度衰减。
4. 自动化（包络线）
  1. 也就是咬字、归韵和避让
5. 总线处理
  1. 一般会考虑用一些能提高融合度的插件，以及一些压缩和限幅器，比如一些特别的eq、胶水压缩。
6. 简易视频（即仅有BGM和人声干声，略微加点音效）：
  1. 试用类型：散文类，日常类等
  2. BGM轨：参考我的EQ“人声让位”预设
  3. 人声轨：记得做clip gain以平衡整体音量，并用EQ提升中频，混响
7. 采访类视频（即有BGM，人声现场录音，人声干声旁白，略微加点音效）：
  1. BGM轨：参考我的EQ“人声让位”预设
  2. 人声轨：
    1. 实录：一般仅降噪，用EQ提升中频，保留临场感
    2. 旁白：记得做clip gain以平衡整体音量，并用EQ提升中频，用混响与实录产生差异化
8. 微电影：
  1. 写在前面：
    1. 低频、中低频是微电影的灵魂！！！
    2. 电影声音最重要的：临场感！氛围感！
    3. 电影工业的响度标准是：平均-27db
    4. 结合上面三点来做解释：
      1. 生活中很好听很亮的高频是不常见的！理由如下：
        
        你所听到的声音是被反射回来的声音，在反射的过程中，频率越高，自然的会衰减的越多。
        
        这一现象给了我们两个启示：
        
        用音箱监听时要通过低频陷阱的方式改善反射的频率
        
        做音效搭建时，音效的高频要控制。不止是音效，几乎除了画外音，所有需要有临场感的声音都要控制高频。（参考我的“自然衰减-加宽”预设，注意：人声不要过度加宽！）
      2. 电影工业的响度标准是平均响度-27db，这是基于影院音箱设计的。原因：你不可能爆炸的声音和说话的声音差不多大吧。
        
        可是我们的发布平台和播放设备并不是这样（默认b站、手机、低端TWS耳机）！
        
        所以需要注意：剧本不要设计需要大声音的场景！！！
  2. 音效搭建：
    1. 低频、中低频是微电影的灵魂！！！
    2. 如果后来看到这篇文章的人有为影视编写配乐的能力，可以直接跳过这里。
    3. 外景一般比室内有更多更丰富的环境音效，会有更多的发挥空间，做的好的话会有很好的临场感。
      1. 笔者有做过一个视频，其中3分钟全是室内的人物镜头特写，而且是切换频繁的蒙太奇，这种情况几乎是无法做环境音的，只能做好一些物品、动作的音效，发挥的空间就不是很大。
    4. 音效我将其分为2类：氛围音、临场音
    5. 临场音：风声、雨声、大自然的声音、办公室的嘻嘻索索的声音、街道嘈杂的人声、翻书声、脚步声、汽车鸣笛、手机消息音等。一般都可以考虑做低频的声音先入。一般做到音画同步即可，但有时也会做声音先入
    6. 氛围音+BGM
      1. 在没有能力写配乐的情况下：
        
        剪辑一般会找一些BGM来把握视频的节奏，在有BGM的情况下，建议你根据BGM的节奏（BPM）来做氛围音效
        
        在没有BGM的情况下，全凭个人功力，建议好好去自己学学
        
        氛围音效、弦乐建议双声道，并且适量加宽加深！（目的是为了更好的氛围感）但钢琴不建议这样做。
  3. 混音：
    1. BGM轨：参考我的EQ“人声让位”预设
    2. 人声轨：
      1. 台词：参考我的EQ“自然衰减”预设，并注意齿音控制
      2. 内心独白：记得做clip gain以平衡整体音量，并用EQ提升中频，用混响与实录产生差异化
    3. 音效轨：参考我的EQ“自然衰减”预设

音效搭建与设计

前言：
以下内容是笔者这一年来通过实践和对一些影片的分析得来的总结。
笔者曾系统地学过音乐混音，但并没有体系化地学习过音效相关的内容，所以音色设计方面完全是eq的思路，而不是编曲或者使用合成器的思路。使用的也完全是由他人录制并发布的音效，而不是专门去采样录制自己需要的声音。

在过去一年的实践中有以下几个好处和坏处：
先说坏处：
1、无法一步到位直接合成出自己想要的声音 2、使用的音频文件往往需要用EQ进行大幅度的处理 3、会无法找到需要的或者合适的音效音频（4、因为是耳机混音，声音的空间感存在一定的问题，在不同设备上回放，声音会有“穿帮”的感觉）
好处也有，不过大概只有一点：平时混音还算有点积累，基本可以用插件将音频塑造出想要的感觉。至于音效的情绪更是几乎全是用自动化（包络线）做的，声音的避让和位置上可以更好的把握住。(位置指的是方位，音量和频率)
音效的使用

虽然音效可以分成很多类，在这方面有很多人总结成不同的分法，他们对音效的使用也不同。我不知道音效使用有无流派，或者又有多少流派，但可以肯定的是不同风格的影片音效的使用确实存在差异（指的是使用时机和音效的音量均衡）

但我却认为其实只有两类：氛围音效和临场音效——对应电影声音的两个目的：氛围感和临场感！

氛围音效，例如使氛围开始紧张的上升音效、使心情开始下沉的下降音效、转场用到的撞击音效……这些音效往往会用在转场处。所以很多人称为转场音效。那么什么是转场？镜头切换？这是一部分。在发生了某种转变时就可以用氛围音效，这可能是镜头的切换，也可能是人物的心情转变，或者是在同一个场景中某些事情发生了（人物动作、物体移动、天气变化等）

临场音效，即镜头所呈现的环境的声音，其目的是营造出一种临场感。

氛围音效（按用途）：

镜头的切换：

（1）这是最容易注意到的，哪怕你是刚入门的新人，用过必剪的话应该会使用过它自带的转场音效（因为在必剪中它是和转场特效绑定的）。
（2）但是注意，并不是所有镜头都需要转场音效！只有那些你需要观众注意到你转场的时候才会用到！
（3）因为转场往往会去踩BGM的点，所以为了使转场不突兀，你应该和BGM搭配使用，比如使音头正好落在鼓点上。

人物的心情转变

往往角色的内心戏是无法表达的，应该没有台词，此时有两种思路：
（1）直接法：比如紧张，在紧张时人的心脏会越来越快，所以你可以使用速度不断较快的上升音效。（当然可以配合心跳越来越快的声音，虽然通常管这种叫联想音，但此时它是为氛围服务的）。
（2）间接法：比如害怕，你不能直接做害怕，但你可以使用阴森恐怖的配乐。
无论那种方式，还是那句话，你应该有和配乐搭配使用的意识！

场景中某些事情发生了（比如人物动作、物体移动、天气变化等）

这种情况可能有人会问，这不是实际现场的声音吗？那不应该是临场音效吗？

我要说，音效的使用目的并不是单一的。我是先学的混音，我就发现很多人（尤其是只做广播剧和有声书的人）音效的使用是很“克制”的。因为没有画面，所以音效声音给人声让了很多的位置，情绪则是通过配乐来实现。（不同艺术形式做音效的思路不同，只是介绍一下，没有对错之分，相反你应该相互借鉴）

然而我认为情绪和氛围是所有声音共同推动的。实际现场发生的声音，我也可以通过各种自动化来塑造它的情绪。比如火车驶离的声音，我就会给的时间比较长，然后会有插件的自动化来推动情绪。（比如明明越来越远，声音越来越小，但混响的回声却越来越大，用越来越大的体积感来烘托离别内心的失落空荡）
（对比更为常见的思路，往往是一声汽笛+淡出的嗡嗡声，然后失落的心情用配乐来衔接。）

临场音效：

镜头切换的另外一种思路
音量与声像的自动化！突然的衰减和增益都会在瞬间改变场景的声学环境（类比画面的透视关系突然改变），同样可以告诉观众你的视角，切换了！
临场音效的使用
1. 对轨：
比如脚步，翻页，搓手等，这些在现场发生的声音应该根据同期的拍摄录音去构建，并根据你的视频情况适量放大，来加深临场感。
2. 环境重低音
接第一点，来谈音效的衔接。比如风声就是最常见的环境重低音。你完全可以通过自动化的方式，来进行镜头间的切换
总结：
我常常是一个音效重新塑造一下，就可以即有临场感，又有氛围感，也就是说用少量的音效做更多的事情。这算是我的理念之一。
以上只是我的常用手法之一，我打算进一步去学习配乐的编写，到时候可能又会改变自己的看法。
但你应该明白一点，你的音效的目的是什么，而不仅仅是画面上有什么。
速成的话，请根据自己的情况灵活处理！

写给音频后期工作流的建议

https://zyf-42.gitee.io/audio-workflow/

作者

zyf-42

发布于

2023年5月30日

许可协议

写给音频后期工作流的建议

视频与歌曲混音的建议

前言：

降噪：

混音与音效搭建（按工程类型）：

音效搭建与设计

前言：

音效的使用

氛围音效（按用途）：

临场音效：