我如何使用 Whisper AI 為任何電影製作字幕(免費和離線)

已發表: 2025-10-31

並非所有人工智能產品都被誇大了;有一些真正有用的方法,從寫電子郵件到編輯照片再到運行人工智能代理等等。

我一直在不斷測試各種人工智能工具,註冊新工具,嘗試測試版軟件,並將它們與現有競爭對手進行比較,以評估它們的性能。

how i used whisper ai to make subtitles for any movie

在探索這個人工智能世界時,我們有責任提供有用的人工智能工具,真正使我們的讀者受益,而且我們一直在這樣做。我們最近的人工智能代理指南就是其中之一,其中介紹了8 個對日常用戶有益的有用人工智能代理

Whisper 就是這樣一種工具,可讓您將音頻轉錄為文本;它還具有有用的功能,例如字幕,甚至可以生成字幕。雖然現在大多數平台都提供字幕,但仍有大量節目沒有字幕,這使得它們極難理解,常常導致不觀看。此外,由於配音,大多數工作室推出的節目語言選擇有限。

目錄

如何使用 Whisper AI 為任何視頻生成字幕

為此,我使用 Whisper,這是 OpenAI 提供的免費音頻轉錄工具,適用於 Mac 和 Windows。它支持多種語言,甚至可以翻譯成其他語言。它可以轉錄文本,從音頻生成文本,並將其轉換為其他語言;最重要的是,它可以生成任何語言的字幕,甚至可以將其翻譯成英語。

在 Mac、Windows 和 Linux 上安裝和使用 Whisper 的先決條件

您可以在雲端和 Mac 本地運行 Whisper AI。由於我們正在討論免費選項,因此在您的設備上本地運行它是唯一可用的免費選項。但在此之前,以下是每個平台在您的設備上本地運行它的先決條件。

視窗

  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg

蘋果

  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg Linux
  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg

如何在您的設備上本地安裝 Whisper AI

安裝 Whisper 很簡單,需要三個步驟,具體取決於您的設備。我列出了適用於 Windows 和 macOS 的方法。您可以按照以下步驟在設備上本地安裝 Whisper,不會出現任何問題。如果您準備好了,那麼我們就開始吧。

第 1 步:在您的設備上安裝 Python

如果您的設備上已經安裝了Python,則可以跳過此步驟。如果沒有,請訪問:https://www.python.org/ 並將其安裝在您的設備上。

install python on to your device.

安裝後,使用以下命令檢查它是否安裝在您的設備上。

打開命令提示符 (Windows) 或終端 (Mac/Linux) 並鍵入以下命令:python version。

如果它顯示 Python 版本,例如 Python 3.12.0,則意味著它已成功安裝在您的設備上。如果您沒有看到此內容,請再次執行此過程。

如果您有舊版本的 Python,可以在 Windows、Mac 和 Linux 上使用以下命令進行更新。

  • Windows: python -m pip install –升級 pip
  • MacOS: python3 -m pip install –升級 pip
  • Linux: sudo apt install python3.12

第 2 步:現在,安裝 Whisper

接下來,在您的設備上安裝 Whisper。打開設備上的終端並使用此命令。

  • Windows: pip install -u openai-whisper
  • MacOS: pip install -u openai-whisper。如果看到任何錯誤,請使用以下命令:python3 -m pip install –user -U openai-whisper
  • Linux: pip install -u openai-whisper

install whisper on your device

等待所有文件下載成功。完成後,您將看到類似“已成功下載”的消息。

您可以使用此命令檢查它是否已正確安裝在您的設備上。

提示:
在設置過程中,如果遇到任何錯誤,請複制錯誤代碼並使用 ChatGPT 來幫助解決問題。您可以將錯誤代碼粘貼到 ChatGPT 中,它可以幫助您解決問題。

命令:耳語-幫助

第三步:接下來,安裝FFmpeg軟件。

接下來,安裝 ffmpeg(音頻所需)來處理設備上的音頻文件。

在蘋果機上:

您可以使用 Homebrew 使用以下簡單命令將其安裝在 Mac 上:brew install ffmpeg

如果您的 Mac 上沒有 Homebrew:

第 1 步:在 Mac 上打開終端

步驟 2:粘貼此命令並按 Enter: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”

步驟 3:輸入密碼並等待所有文件下載完畢。

相關:如何在 macOS 上安裝 Homebrew

check if homebrew works

步驟 4:使用此命令檢查 Brew 是否已正確安裝在您的設備上。您可以使用此命令:brew –version

安裝ffmpeg軟件

第 1 步:打開終端並使用以下命令:brew install ffmpeg

install ffmpeg

第 2 步:等待所有必需的文件下載完畢。

步驟 3:使用此命令檢查它是否已成功安裝在您的設備上:ffmpeg -version

ffmpeg installed on your device

對於 Windows:

第 1 步:訪問 https://ffmpeg.org/download.html 並下載 Windows 文件。

第 2 步:將其解壓並像其他軟件一樣安裝在您的設備上。

第 3 步:接下來,驗證您的設備上是否已正確安裝所有內容。打開設備上的終端並輸入以下命令:“whisper help”。如果您看到選項,則表示該應用程序已正確安裝在您的設備上。


如何為視頻生成字幕

步驟1:打開設備上的終端,進入視頻文件所在的文件夾。在這種情況下,我的視頻文件位於我的桌面上。您可以使用以下命令導航到視頻文件夾。

navigate to your video location

  • Windows: cd 桌面
  • MacOS: cd ~/桌面

步驟2:轉錄音頻和視頻文件。以下是 Whisper 支持的文件格式列表。

支持的視頻格式支持的音頻格式
.mp4 .mp3
.mkv .wav
.mov .flac
.webm .m4a
.avi .aac
.mpg / .mpeg .ogg
.flv .作品
.wmv .aiff / .aif
.3gp .amr
.wma

第 3 步:現在,使用以下命令轉錄選擇視頻文件: whisper(在此處添加您的視頻或音頻文件名)–model Turbo –task transcribe

示例:耳語 video.mp4 –model Turbo –task transcribe

步驟 3:根據您選擇的模型,可能會下載新模型。所以等到它下載完成。以下是您可以選擇的各種 Whisper 型號。模型越低,準確度越低。

型號名稱參數所需顯存
微小的39M 1GB
根據74M 1GB
小的244M 2GB
中等的769M 5GB
大的1.55B 10GB
渦輪809M 6GB

但是,如果您的設備功能不強大,我建議使用小型或基本模型,因為運行大型模型可能會消耗您的所有系統資源。如果您有較大的媒體文件並且想要高精度,您可以在 Google Colab 上運行 Whisper。這是有關如何操作的視頻教程。

run whisper

第四步:字幕現已生成。您可以在之前指定的視頻文件夾中找到以下文件。

  • 影片. txt 純文本記錄
  • 影片. vtt 網頁字幕格式
  • 影片. srt通用字幕格式(適用於YouTube、VLC等)

run whisper to generate subtitles

步驟5:打開文件查看字幕。現在轉到視頻所在的文件夾並打開顯示 video.srt 的文件

subtitles

步驟 6(可選):如果視頻不是英文,您可以使用以下命令將其翻譯為英文。

命令: whisper(您的視頻或音頻文件名)-模型媒介-語言(在此處輸入您的語言)-任務翻譯

示例:耳語視頻.mp4 –模型媒介 –語言日語 –任務翻譯

use this command on macos to translate the audio in a video (or audio file) to english

步驟7:現在,返回到視頻文件所在的目的地。從那裡,您可以看到 video.SRT 文件,其中包含您使用的視頻的英文字幕。

subtitles


如何為視頻使用字幕

您可以將字幕導入任何第三方媒體播放器並播放帶字幕的視頻。 VLC 是適用於 Windows 和 macOS 的最佳第三方媒體播放器。以下介紹瞭如何使用它來觀看帶有您使用 Whisper 生成的字幕的電影。

下載 VLC 媒體播放器(免費)

  • 對於 Windows
  • 對於 macOS

第 1 步:下載後,在您的設備上安裝 VLC 媒體播放器。

vlc player website

第 2 步:在 Windows 上打開 VLC 播放器並導航至“播放列表”選項卡,然後單擊“打開媒體”。

open media

步驟 3:從這裡,點擊瀏覽並選擇視頻文件並啟用“添加字幕文件”,選擇使用 Whisper AI 生成的字幕文件,然後單擊“打開”。

add subtitles to the video

第四步:就這樣,視頻的字幕就生成了。

subtitles for the video

最後的想法

多年來,這些限制讓我感到沮喪。然而,VLC 已經宣佈人工智能生成實時字幕,但普通用戶仍然無法使用。更令人擔憂的是,這是他們在 Twitter 上的最後一篇帖子,所以在我弄清楚 Whisper 之前我已經失去了希望。

您可以通過這種方式為任何視頻(包括完整電影)生成字幕,具體取決於您設備的資源。如果您的設備功能不強大,您可以在 Google Colab 上運行 Whisper AI。不僅可以生成字幕,您還可以將其翻譯成其他語言,如下面的視頻所示。我希望本指南對您有所幫助。我確保每個步驟都很詳細,以使本指南適合初學者。如果您在設備上本地設置或運行 Whisper AI 時仍然遇到任何問題。您可以在下面評論。

使用 Whisper AI 生成字幕的常見問題解答

1. 我可以使用 Whisper 自動為我上傳的 YouTube 視頻添加字幕嗎?

不需要,如果視頻存儲在您的設備本地,則需要生成字幕,然後在上傳視頻時將其上傳到 YouTube。它不會自動為您上傳的 YouTube 視頻添加字幕。

2. Whisper安裝後可以離線使用嗎?

是的,一旦下載了所需的模型,它就會離線運行,無需互聯網連接。

3. 如何加快舊設備或低端設備上的轉錄速度?

為了加快轉錄速度,您需要使用小模型。您還可以將大視頻文件壓縮為較小的文件,以使此過程更快。要壓縮文件,您可以在終端中使用以下命令:ffmpeg -i video。 mp4 -q:a 0 -映射音頻。 mp3

4. Whisper 可以自動檢測發言者或單獨的對話嗎?

不可以,目前 Whisper 無法自動檢測說話者或單獨的對話;您需要使用單獨的工具,例如Pyannote,來獲取單獨的音頻文件,Pyannote音頻或WhisperX

5. Whisper 生成的字幕對於嘈雜或帶口音的語音是否準確?

是的,它是最好的轉錄模型之一。準確性還取決於您使用的型號;大模型通常會產生更好的精度;但是,它們可能需要更多時間並需要強大的資源才能運行。