我如何使用 Whisper AI 為任何電影製作字幕(免費和離線)
已發表: 2025-10-31並非所有人工智能產品都被誇大了;有一些真正有用的方法,從寫電子郵件到編輯照片再到運行人工智能代理等等。
我一直在不斷測試各種人工智能工具,註冊新工具,嘗試測試版軟件,並將它們與現有競爭對手進行比較,以評估它們的性能。

在探索這個人工智能世界時,我們有責任提供有用的人工智能工具,真正使我們的讀者受益,而且我們一直在這樣做。我們最近的人工智能代理指南就是其中之一,其中介紹了8 個對日常用戶有益的有用人工智能代理。
Whisper 就是這樣一種工具,可讓您將音頻轉錄為文本;它還具有有用的功能,例如字幕,甚至可以生成字幕。雖然現在大多數平台都提供字幕,但仍有大量節目沒有字幕,這使得它們極難理解,常常導致不觀看。此外,由於配音,大多數工作室推出的節目語言選擇有限。
目錄
如何使用 Whisper AI 為任何視頻生成字幕
為此,我使用 Whisper,這是 OpenAI 提供的免費音頻轉錄工具,適用於 Mac 和 Windows。它支持多種語言,甚至可以翻譯成其他語言。它可以轉錄文本,從音頻生成文本,並將其轉換為其他語言;最重要的是,它可以生成任何語言的字幕,甚至可以將其翻譯成英語。
在 Mac、Windows 和 Linux 上安裝和使用 Whisper 的先決條件
您可以在雲端和 Mac 本地運行 Whisper AI。由於我們正在討論免費選項,因此在您的設備上本地運行它是唯一可用的免費選項。但在此之前,以下是每個平台在您的設備上本地運行它的先決條件。
視窗
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg
 
蘋果
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg Linux
 
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg
 
如何在您的設備上本地安裝 Whisper AI
安裝 Whisper 很簡單,需要三個步驟,具體取決於您的設備。我列出了適用於 Windows 和 macOS 的方法。您可以按照以下步驟在設備上本地安裝 Whisper,不會出現任何問題。如果您準備好了,那麼我們就開始吧。
第 1 步:在您的設備上安裝 Python
如果您的設備上已經安裝了Python,則可以跳過此步驟。如果沒有,請訪問:https://www.python.org/ 並將其安裝在您的設備上。

安裝後,使用以下命令檢查它是否安裝在您的設備上。
打開命令提示符 (Windows) 或終端 (Mac/Linux) 並鍵入以下命令:python version。
如果它顯示 Python 版本,例如 Python 3.12.0,則意味著它已成功安裝在您的設備上。如果您沒有看到此內容,請再次執行此過程。
如果您有舊版本的 Python,可以在 Windows、Mac 和 Linux 上使用以下命令進行更新。
- Windows: python -m pip install –升級 pip
 - MacOS: python3 -m pip install –升級 pip
 - Linux: sudo apt install python3.12
 
第 2 步:現在,安裝 Whisper
接下來,在您的設備上安裝 Whisper。打開設備上的終端並使用此命令。
- Windows: pip install -u openai-whisper
 - MacOS: pip install -u openai-whisper。如果看到任何錯誤,請使用以下命令:python3 -m pip install –user -U openai-whisper
 - Linux: pip install -u openai-whisper
 

等待所有文件下載成功。完成後,您將看到類似“已成功下載”的消息。
您可以使用此命令檢查它是否已正確安裝在您的設備上。

命令:耳語-幫助
第三步:接下來,安裝FFmpeg軟件。
接下來,安裝 ffmpeg(音頻所需)來處理設備上的音頻文件。
在蘋果機上:
您可以使用 Homebrew 使用以下簡單命令將其安裝在 Mac 上:brew install ffmpeg
如果您的 Mac 上沒有 Homebrew:
第 1 步:在 Mac 上打開終端
步驟 2:粘貼此命令並按 Enter: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”
步驟 3:輸入密碼並等待所有文件下載完畢。
相關:如何在 macOS 上安裝 Homebrew

步驟 4:使用此命令檢查 Brew 是否已正確安裝在您的設備上。您可以使用此命令:brew –version
安裝ffmpeg軟件
第 1 步:打開終端並使用以下命令:brew install ffmpeg

第 2 步:等待所有必需的文件下載完畢。
步驟 3:使用此命令檢查它是否已成功安裝在您的設備上:ffmpeg -version

對於 Windows:
第 1 步:訪問 https://ffmpeg.org/download.html 並下載 Windows 文件。
第 2 步:將其解壓並像其他軟件一樣安裝在您的設備上。
第 3 步:接下來,驗證您的設備上是否已正確安裝所有內容。打開設備上的終端並輸入以下命令:“whisper help”。如果您看到選項,則表示該應用程序已正確安裝在您的設備上。
如何為視頻生成字幕
步驟1:打開設備上的終端,進入視頻文件所在的文件夾。在這種情況下,我的視頻文件位於我的桌面上。您可以使用以下命令導航到視頻文件夾。

- Windows: cd 桌面
 - MacOS: cd ~/桌面
 
步驟2:轉錄音頻和視頻文件。以下是 Whisper 支持的文件格式列表。
| 支持的視頻格式 | 支持的音頻格式 | 
| .mp4 | .mp3 | 
| .mkv | .wav | 
| .mov | .flac | 
| .webm | .m4a | 
| .avi | .aac | 
| .mpg / .mpeg | .ogg | 
| .flv | .作品 | 
| .wmv | .aiff / .aif | 
| .3gp | .amr | 
| .wma | 
第 3 步:現在,使用以下命令轉錄選擇視頻文件: whisper(在此處添加您的視頻或音頻文件名)–model Turbo –task transcribe
示例:耳語 video.mp4 –model Turbo –task transcribe
步驟 3:根據您選擇的模型,可能會下載新模型。所以等到它下載完成。以下是您可以選擇的各種 Whisper 型號。模型越低,準確度越低。
| 型號名稱 | 參數 | 所需顯存 | 
| 微小的 | 39M | 1GB | 
| 根據 | 74M | 1GB | 
| 小的 | 244M | 2GB | 
| 中等的 | 769M | 5GB | 
| 大的 | 1.55B | 10GB | 
| 渦輪 | 809M | 6GB | 
但是,如果您的設備功能不強大,我建議使用小型或基本模型,因為運行大型模型可能會消耗您的所有系統資源。如果您有較大的媒體文件並且想要高精度,您可以在 Google Colab 上運行 Whisper。這是有關如何操作的視頻教程。

第四步:字幕現已生成。您可以在之前指定的視頻文件夾中找到以下文件。
- 影片. txt 純文本記錄
 - 影片. vtt 網頁字幕格式
 - 影片. srt通用字幕格式(適用於YouTube、VLC等)
 

步驟5:打開文件查看字幕。現在轉到視頻所在的文件夾並打開顯示 video.srt 的文件

步驟 6(可選):如果視頻不是英文,您可以使用以下命令將其翻譯為英文。
命令: whisper(您的視頻或音頻文件名)-模型媒介-語言(在此處輸入您的語言)-任務翻譯
示例:耳語視頻.mp4 –模型媒介 –語言日語 –任務翻譯

步驟7:現在,返回到視頻文件所在的目的地。從那裡,您可以看到 video.SRT 文件,其中包含您使用的視頻的英文字幕。

如何為視頻使用字幕
您可以將字幕導入任何第三方媒體播放器並播放帶字幕的視頻。 VLC 是適用於 Windows 和 macOS 的最佳第三方媒體播放器。以下介紹瞭如何使用它來觀看帶有您使用 Whisper 生成的字幕的電影。
下載 VLC 媒體播放器(免費)
- 對於 Windows
 - 對於 macOS
 
第 1 步:下載後,在您的設備上安裝 VLC 媒體播放器。

第 2 步:在 Windows 上打開 VLC 播放器並導航至“播放列表”選項卡,然後單擊“打開媒體”。

步驟 3:從這裡,點擊瀏覽並選擇視頻文件並啟用“添加字幕文件”,選擇使用 Whisper AI 生成的字幕文件,然後單擊“打開”。

第四步:就這樣,視頻的字幕就生成了。

最後的想法
多年來,這些限制讓我感到沮喪。然而,VLC 已經宣佈人工智能生成實時字幕,但普通用戶仍然無法使用。更令人擔憂的是,這是他們在 Twitter 上的最後一篇帖子,所以在我弄清楚 Whisper 之前我已經失去了希望。
您可以通過這種方式為任何視頻(包括完整電影)生成字幕,具體取決於您設備的資源。如果您的設備功能不強大,您可以在 Google Colab 上運行 Whisper AI。不僅可以生成字幕,您還可以將其翻譯成其他語言,如下面的視頻所示。我希望本指南對您有所幫助。我確保每個步驟都很詳細,以使本指南適合初學者。如果您在設備上本地設置或運行 Whisper AI 時仍然遇到任何問題。您可以在下面評論。
使用 Whisper AI 生成字幕的常見問題解答
1. 我可以使用 Whisper 自動為我上傳的 YouTube 視頻添加字幕嗎?
不需要,如果視頻存儲在您的設備本地,則需要生成字幕,然後在上傳視頻時將其上傳到 YouTube。它不會自動為您上傳的 YouTube 視頻添加字幕。
2. Whisper安裝後可以離線使用嗎?
是的,一旦下載了所需的模型,它就會離線運行,無需互聯網連接。
3. 如何加快舊設備或低端設備上的轉錄速度?
為了加快轉錄速度,您需要使用小模型。您還可以將大視頻文件壓縮為較小的文件,以使此過程更快。要壓縮文件,您可以在終端中使用以下命令:ffmpeg -i video。 mp4 -q:a 0 -映射音頻。 mp3
4. Whisper 可以自動檢測發言者或單獨的對話嗎?
不可以,目前 Whisper 無法自動檢測說話者或單獨的對話;您需要使用單獨的工具,例如Pyannote,來獲取單獨的音頻文件,Pyannote音頻或WhisperX
5. Whisper 生成的字幕對於嘈雜或帶口音的語音是否準確?
是的,它是最好的轉錄模型之一。準確性還取決於您使用的型號;大模型通常會產生更好的精度;但是,它們可能需要更多時間並需要強大的資源才能運行。
