慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗?
FFmpeg 視頻處理入門教程
阮一峰 · 2020-01-14 · via 阮一峰的网络日志

FFmpeg 是視頻處理最常用的開源軟件。

它功能強大,用途廣泛,大量用於視頻網站和商業軟件(比如 Youtube 和 iTunes),也是許多音頻和視頻格式的標準編碼/解碼實現。

FFmpeg 本身是一個龐大的項目,包含許多組件和庫文件,最常用的是它的命令行工具。本文介紹 FFmpeg 命令行如何處理視頻,比桌面視頻處理軟件更簡潔高效。

如果你還沒安裝,可以根據官方文檔 先完成安裝。

一、概念

介紹 FFmpeg 用法之前,需要了解一些視頻處理的基本概念。

1.1 容器

視頻文件本身其實是一個容器(container),裡面包括了視頻和音頻,也可能有字幕等其他內容。

常見的容器格式有以下幾種。一般來說,視頻文件的後綴名反映了它的容器格式。

  • MP4
  • MKV
  • WebM
  • AVI

下面的命令查看 FFmpeg 支持的容器。


$ ffmpeg -formats

1.2 編碼格式

視頻和音頻都需要經過編碼,才能保存成文件。不同的編碼格式(CODEC),有不同的壓縮率,會導致文件大小和清晰度的差異。

常用的視頻編碼格式如下。

  • H.262
  • H.264
  • H.265

上面的編碼格式都是有版權的,但是可以免費使用。此外,還有幾種無版權的視頻編碼格式。

  • VP8
  • VP9
  • AV1

常用的音頻編碼格式如下。

  • MP3
  • AAC

上面所有這些都是有損的編碼格式,編碼後會損失一些細節,以換取壓縮後較小的文件體積。無損的編碼格式壓縮出來的文件體積較大,這裡就不介紹了。

下面的命令可以查看 FFmpeg 支持的編碼格式,視頻編碼和音頻編碼都在內。


$ ffmpeg -codecs

1.3 編碼器

編碼器(encoders)是實現某種編碼格式的庫文件。只有安裝了某種格式的編碼器,才能實現該格式視頻/音頻的編碼和解碼。

以下是一些 FFmpeg 內置的視頻編碼器。

  • libx264:最流行的開源 H.264 編碼器
  • NVENC:基於 NVIDIA GPU 的 H.264 編碼器
  • libx265:開源的 HEVC 編碼器
  • libvpx:谷歌的 VP8 和 VP9 編碼器
  • libaom:AV1 編碼器

音頻編碼器如下。

  • libfdk-aac
  • aac

下面的命令可以查看 FFmpeg 已安裝的編碼器。


$ ffmpeg -encoders

二、FFmpeg 的使用格式

FFmpeg 的命令行參數非常多,可以分成五個部分。


$ ffmpeg {1} {2} -i {3} {4} {5}

上面命令中,五個部分的參數依次如下。

  1. 全局參數
  2. 輸入文件參數
  3. 輸入文件
  4. 輸出文件參數
  5. 輸出文件

參數太多的時候,為了便於查看,ffmpeg 命令可以寫成多行。


$ ffmpeg \
[全局參數] \
[輸入文件參數] \
-i [輸入文件] \
[輸出文件參數] \
[輸出文件]

下面是一個例子。


$ ffmpeg \
-y \ # 全局參數
-c:a libfdk_aac -c:v libx264 \ # 輸入文件參數
-i input.mp4 \ # 輸入文件
-c:v libvpx-vp9 -c:a libvorbis \ # 輸出文件參數
output.webm # 輸出文件

上面的命令將 mp4 文件轉成 webm 文件,這兩個都是容器格式。輸入的 mp4 文件的音頻編碼格式是 aac,視頻編碼格式是 H.264;輸出的 webm 文件的視頻編碼格式是 VP9,音頻格式是 Vorbis。

如果不指明編碼格式,FFmpeg 會自己判斷輸入文件的編碼。因此,上面的命令可以簡單寫成下面的樣子。


$ ffmpeg -i input.avi output.mp4

三、常用命令行參數

FFmpeg 常用的命令行參數如下。

  • -c:指定編碼器
  • -c copy:直接複製,不經過重新編碼(這樣比較快)
  • -c:v:指定視頻編碼器
  • -c:a:指定音頻編碼器
  • -i:指定輸入文件
  • -an:去除音頻流
  • -vn: 去除視頻流
  • -preset:指定輸出的視頻質量,會影響文件的生成速度,有以下幾個可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。
  • -y:不經過確認,輸出時直接覆蓋同名文件。

四、常見用法

下面介紹 FFmpeg 幾種常見用法。

4.1 查看文件信息

查看視頻文件的元信息,比如編碼格式和比特率,可以只使用-i參數。


$ ffmpeg -i input.mp4

上面命令會輸出很多冗餘信息,加上-hide_banner參數,可以只顯示元信息。


$ ffmpeg -i input.mp4 -hide_banner

4.2 轉換編碼格式

轉換編碼格式(transcoding)指的是, 將視頻文件從一種編碼轉成另一種編碼。比如轉成 H.264 編碼,一般使用編碼器libx264,所以只需指定輸出文件的視頻編碼器即可。


$ ffmpeg -i [input.file] -c:v libx264 output.mp4

下面是轉成 H.265 編碼的寫法。


$ ffmpeg -i [input.file] -c:v libx265 output.mp4

4.3 轉換容器格式

轉換容器格式(transmuxing)指的是,將視頻文件從一種容器轉到另一種容器。下面是 mp4 轉 webm 的寫法。


$ ffmpeg -i input.mp4 -c copy output.webm

上面例子中,只是轉一下容器,內部的編碼格式不變,所以使用-c copy指定直接拷貝,不經過轉碼,這樣比較快。

4.4 調整碼率

調整碼率(transrating)指的是,改變編碼的比特率,一般用來將視頻文件的體積變小。下面的例子指定碼率最小為964K,最大為3856K,緩衝區大小為 2000K。


$ ffmpeg \
-i input.mp4 \
-minrate 964K -maxrate 3856K -bufsize 2000K \
output.mp4

4.5 改變分辨率(transsizing)

下面是改變視頻分辨率(transsizing)的例子,從 1080p 轉為 480p 。


$ ffmpeg \
-i input.mp4 \
-vf scale=480:-1 \
output.mp4

4.6 提取音頻

有時,需要從視頻裡面提取音頻(demuxing),可以像下面這樣寫。


$ ffmpeg \
-i input.mp4 \
-vn -c:a copy \
output.aac

上面例子中,-vn表示去掉視頻,-c:a copy表示不改變音頻編碼,直接拷貝。

4.7 添加音軌

添加音軌(muxing)指的是,將外部音頻加入視頻,比如添加背景音樂或旁白。


$ ffmpeg \
-i input.aac -i input.mp4 \
output.mp4

上面例子中,有音頻和視頻兩個輸入文件,FFmpeg 會將它們合成為一個文件。

4.8 截圖

下面的例子是從指定時間開始,連續對1秒鐘的視頻進行截圖。


$ ffmpeg \
-y \
-i input.mp4 \
-ss 00:01:24 -t 00:00:01 \
output_%3d.jpg

如果只需要截一張圖,可以指定只截取一幀。


$ ffmpeg \
-ss 01:23:45 \
-i input \
-vframes 1 -q:v 2 \
output.jpg

上面例子中,-vframes 1指定只截取一幀,-q:v 2表示輸出的圖片質量,一般是1到5之間(1 為質量最高)。

4.9 裁剪

裁剪(cutting)指的是,截取原始視頻裡面的一個片段,輸出為一個新視頻。可以指定開始時間(start)和持續時間(duration),也可以指定結束時間(end)。


$ ffmpeg -ss [start] -i [input] -t [duration] -c copy [output]
$ ffmpeg -ss [start] -i [input] -to [end] -c copy [output]

下面是實際的例子。


$ ffmpeg -ss 00:01:50 -i [input] -t 10.5 -c copy [output]
$ ffmpeg -ss 2.5 -i [input] -to 10 -c copy [output]

上面例子中,-c copy表示不改變音頻和視頻的編碼格式,直接拷貝,這樣會快很多。

4.10 為音頻添加封面

有些視頻網站只允許上傳視頻文件。如果要上傳音頻文件,必須為音頻添加封面,將其轉為視頻,然後上傳。

下面命令可以將音頻文件,轉為帶封面的視頻文件。


$ ffmpeg \
-loop 1 \
-i cover.jpg -i input.mp3 \
-c:v libx264 -c:a aac -b:a 192k -shortest \
output.mp4

上面命令中,有兩個輸入文件,一個是封面圖片cover.jpg,另一個是音頻文件input.mp3-loop 1參數表示圖片無限循環,-shortest參數表示音頻文件結束,輸出視頻就結束。

五、參考鏈接

(完)