时间轴
复制文本
Aegisub 在处理复制粘贴时,一切剪切板上的文本都会优先尝试以 ASS 行的形式处理。
从 Aegisub 的字幕栏复制一行或多行时,Aegisub 会将被复制行的 ASS 源代码以纯文本形式复制到剪切板中。
复制得到的纯文本形式 ASS 行和使用文本编辑器(如记事本)打开 ASS 文件所看到的相应行是完全一致的。
粘贴时,Aegisub 会尝试解析文本:
- 若剪切板中的文本符合 ASS 行格式(解析成功),那么将以 ASS 行的形式粘贴到字幕栏中,保留各字段的值;
- 若剪切板中的文本不符合 ASS 行格式(解析失败),那么 Aegisub 会将所有格式不符的行的文本全部放入文本栏中,行的其他字段设置为默认值(行类别 为
Dialogue,开始时间和结束时间为0:00:00.00,样式为Default,其他数字字段均为0,其他文本字段均为空字符串)。
处理校对稿时,由于标准的校对稿为纯文本(.txt)或 Excel 表格(.xls / .xlsx)格式,通常只需要直接从相应编辑器(记事本或 Excel)中复制,并粘贴到字幕栏中即可。
前面我们介绍过,不符合 ASS 行格式的纯文本在粘贴到字幕栏时,会以默认值填充其他所有字段。
因此,我们需要在此时为刚才粘贴的所有行先设置好层级和样式两项属性,然后转入下一项工作。
设置时间轴(戳)
时间轴通常简称为「轴」或「时轴」,也被称为「时间戳」,指的是每一个字幕行的「开始时间」和「结束时间」。
设置轴通常有三种方法,不同方法的使用场景不同,应根据情况适当选择。
通过可视化频谱设置
对于对话轴而言,在可视化频谱图上为台词设置时间轴是最简单高效的方法,也是使用频率最高的上轴方法。
不做任何设置时,Aegisub 的音频可视化区域默认显示的是声音波形而不是频谱,因此使用前需要先通过音频可视化区下方的切换按钮切换到声音频谱模式。
声音的原理与波形图
我们知道,声音由发声源对周围的空气(或其他传导介质,但我们通常只考虑空气)施加变化的压力产生,因此声音的实质是空气的振动。
在发声源附近选择一个点,将该点测量到的气压值(纵轴)随时间变化(横轴)的趋势绘制成图形,即得到了声音的波形。
一个典型的声音波形如图所示。
从波的角度分析该图像,波形的振幅反映的是某个时间点上声波的强度(响度)。
同时,在单位时间内振动的次数越多,频率也就越高,声音的音高也就越高,这是声音的基本原理。
现实中,我们听到的声音通常不是某个固定频率的振动,而是由许多不同频率的振动叠加而成的。
此时如果观察声音的波形图,我们就只能得到各时点声音的响度,而无法获得其他频率的信息,因此不建议使用声音波形图 作为设置时间轴的参考。
通过傅里叶变换处理波形图(分频),我们可以轻松地将各个频率的波形拆分开来。
在波形图的基础上,我们保持横轴(时间)不变,将纵轴表示的物理量改为频率,并引入一个垂直于纸面(屏幕)的轴(通过颜色深浅表示)表示各频率在当前时间点的幅值,便得到了一幅声音的频谱图。
因此,声音的频谱图是一个三维图像。
Aegisub 对于频谱图的计算和绘制扩展了多种模式,用于解决不同的问题:
- 计算
- 默认模式:把原始音频数据做一次整数平均 downmix 为单声道,进行 FFT 计算
- 逐声道模式:对原始音频数据每个声道进行 FFT 计算,然后每个 Frequency-Bin 取多声道的最大值或平均值
- 默认模式 downmix 有时会导致音频相位抵消,声音可以听到但是频谱看不到
- 绘制
- 默认模式:线性映射,绘制像素均匀对应一段 Frequency-Bin 区间
- 感知曲线模式:结合线性和对数映射,提供了五种映射预设
- 按原作者的说法,可以更清晰地展示音乐和人声
相比于波形图,我们可以直观地从频谱图像中获取各个分频的声音响度。
我们知道,各种不同的发声源产生的声波主要聚集的频率不同,此时我们便可以较为快速地从频谱图中判断出各种声音:
- 人声大多聚集在高频附近,且幅值较高;
- 背景噪声通常聚集在低频附近,幅值不高;
- 根据乐器的种类不同,乐器声从低频到高频都有可能,但乐器的声音通常是有节奏、有规律的,非常容易辨识;
有了以上的理论基础,当我们在为台词设置时间轴时,可以通过频谱图快速定位到人声的区间。
根据频谱图设置时间轴的步骤大致如下,读者可根据个人习惯灵活调整步骤。
- 根据频谱图目视判断当前要上轴的句子的大致开始和结束位置,并通过按住鼠标左键在频谱图上拖动以选中该区间;
- 也可以通过在开始位置单击左键、在结束位置单击右键以选中区间;
- 使用音频快捷键
S播放选中区间,确认选中的音频区间大致正确; - 使用音频快捷键(
Q、W、E、D)反复多次试听选中部分的开始时间和结束时间前后附近的音频,直到精确地选中需要的音频区间; - 该行时间戳确认完毕,使用音频快捷键
G提交该行的轴并转到下一行。
注意事项:
- 音频快捷键可参见《重新认识 Aegisub》篇章的「热键(快捷键)」小节;
- 实际操作时,还需考虑前后余量、场景切换、相近连续等优化规则以使轴显得美观易读,详见对话轴规范。
细心的读者可能会注意到频谱图上还分布着一些竖向的粉色实线,这些线代表着视频的关键帧(Keyframe)位置,它们是频谱图中非常重要的参考线。 我们会在对话轴规范中的对帧部分使用它们。