我如何使用 Whisper AI 为任何电影制作字幕(免费和离线)

已发表: 2025-10-31

并非所有人工智能产品都被夸大了;有一些真正有用的方法,从写电子邮件到编辑照片再到运行人工智能代理等等。

我一直在不断测试各种人工智能工具,注册新工具,尝试测试版软件,并将它们与现有竞争对手进行比较,以评估它们的性能。

how i used whisper ai to make subtitles for any movie

在探索这个人工智能世界时,我们有责任提供有用的人工智能工具,真正使我们的读者受益,而且我们一直在这样做。我们最近的人工智能代理指南就是其中之一,其中介绍了8 个对日常用户有益的有用人工智能代理

Whisper 就是这样一种工具,可让您将音频转录为文本;它还具有有用的功能,例如字幕,甚至可以生成字幕。虽然现在大多数平台都提供字幕,但仍有大量节目没有字幕,这使得它们极难理解,常常导致不观看。此外,由于配音,大多数工作室推出的节目语言选择有限。

目录

如何使用 Whisper AI 为任何视频生成字幕

为此,我使用 Whisper,这是 OpenAI 提供的免费音频转录工具,适用于 Mac 和 Windows。它支持多种语言,甚至可以翻译成其他语言。它可以转录文本,从音频生成文本,并将其转换为其他语言;最重要的是,它可以生成任何语言的字幕,甚至可以将其翻译成英语。

在 Mac、Windows 和 Linux 上安装和使用 Whisper 的先决条件

您可以在云端和 Mac 本地运行 Whisper AI。由于我们正在讨论免费选项,因此在您的设备上本地运行它是唯一可用的免费选项。但在此之前,以下是每个平台在您的设备上本地运行它的先决条件。

视窗

  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg

苹果

  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg Linux
  • Python 3.8+
  • PyTorch 1.10.1+
  • ffmpeg

如何在您的设备上本地安装 Whisper AI

安装 Whisper 很简单,需要三个步骤,具体取决于您的设备。我列出了适用于 Windows 和 macOS 的方法。您可以按照以下步骤在设备上本地安装 Whisper,不会出现任何问题。如果您准备好了,那么我们就开始吧。

第 1 步:在您的设备上安装 Python

如果您的设备上已经安装了Python,则可以跳过此步骤。如果没有,请访问:https://www.python.org/ 并将其安装在您的设备上。

install python on to your device.

安装后,使用以下命令检查它是否安装在您的设备上。

打开命令提示符 (Windows) 或终端 (Mac/Linux) 并键入以下命令:python version。

如果它显示 Python 版本,例如 Python 3.12.0,则意味着它已成功安装在您的设备上。如果您没有看到此内容,请再次执行此过程。

如果您有旧版本的 Python,可以在 Windows、Mac 和 Linux 上使用以下命令进行更新。

  • Windows: python -m pip install –升级 pip
  • MacOS: python3 -m pip install –升级 pip
  • Linux: sudo apt install python3.12

第 2 步:现在,安装 Whisper

接下来,在您的设备上安装 Whisper。打开设备上的终端并使用此命令。

  • Windows: pip install -u openai-whisper
  • MacOS: pip install -u openai-whisper。如果看到任何错误,请使用以下命令:python3 -m pip install –user -U openai-whisper
  • Linux: pip install -u openai-whisper

install whisper on your device

等待所有文件下载成功。完成后,您将看到类似“已成功下载”的消息。

您可以使用此命令检查它是否已正确安装在您的设备上。

提示:
在设置过程中,如果遇到任何错误,请复制错误代码并使用 ChatGPT 来帮助解决问题。您可以将错误代码粘贴到 ChatGPT 中,它可以帮助您解决问题。

命令:耳语-帮助

第三步:接下来,安装FFmpeg软件。

接下来,安装 ffmpeg(音频所需)来处理设备上的音频文件。

在苹果机上:

您可以使用 Homebrew 使用以下简单命令将其安装在 Mac 上:brew install ffmpeg

如果您的 Mac 上没有 Homebrew:

第 1 步:在 Mac 上打开终端

步骤 2:粘贴此命令并按 Enter: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”

步骤 3:输入密码并等待所有文件下载完毕。

相关:如何在 macOS 上安装 Homebrew

check if homebrew works

步骤 4:使用此命令检查 Brew 是否已正确安装在您的设备上。您可以使用此命令:brew –version

安装ffmpeg软件

第 1 步:打开终端并使用以下命令:brew install ffmpeg

install ffmpeg

第 2 步:等待所有必需的文件下载完毕。

步骤 3:使用此命令检查它是否已成功安装在您的设备上:ffmpeg -version

ffmpeg installed on your device

对于 Windows:

第 1 步:访问 https://ffmpeg.org/download.html 并下载 Windows 文件。

第 2 步:将其解压并像其他软件一样安装在您的设备上。

第 3 步:接下来,验证您的设备上是否已正确安装所有内容。打开设备上的终端并输入以下命令:“whisper help”。如果您看到选项,则表示该应用程序已正确安装在您的设备上。


如何为视频生成字幕

步骤1:打开设备上的终端,进入视频文件所在的文件夹。在这种情况下,我的视频文件位于我的桌面上。您可以使用以下命令导航到视频文件夹。

navigate to your video location

  • Windows: cd 桌面
  • MacOS: cd ~/桌面

步骤2:转录音频和视频文件。以下是 Whisper 支持的文件格式列表。

支持的视频格式支持的音频格式
.mp4 .mp3
.mkv .wav
.mov .flac
.webm .m4a
.avi .aac
.mpg / .mpeg .ogg
.flv .作品
.wmv .aiff / .aif
.3gp .amr
.wma

第 3 步:现在,使用以下命令转录选择视频文件: whisper(在此处添加您的视频或音频文件名)–model Turbo –task transcribe

示例:耳语 video.mp4 –model Turbo –task transcribe

步骤 3:根据您选择的模型,可能会下载新模型。所以等到它下载完成。以下是您可以选择的各种 Whisper 型号。模型越低,准确度越低。

型号名称参数所需显存
微小的39M 1GB
根据74M 1GB
小的244M 2GB
中等的769M 5GB
大的1.55B 10GB
涡轮809M 6GB

但是,如果您的设备功能不强大,我建议使用小型或基本模型,因为运行大型模型可能会消耗您的所有系统资源。如果您有较大的媒体文件并且想要高精度,您可以在 Google Colab 上运行 Whisper。这是有关如何操作的视频教程。

run whisper

第四步:字幕现已生成。您可以在之前指定的视频文件夹中找到以下文件。

  • 视频。 txt 纯文本记录
  • 视频。 vtt 网页字幕格式
  • 视频。 srt通用字幕格式(适用于YouTube、VLC等)

run whisper to generate subtitles

步骤5:打开文件查看字幕。现在转到视频所在的文件夹并打开显示 video.srt 的文件

subtitles

步骤 6(可选):如果视频不是英文,您可以使用以下命令将其翻译为英文。

命令: whisper(您的视频或音频文件名)-模型媒介-语言(在此处输入您的语言)-任务翻译

示例:耳语视频.mp4 –模型媒介 –语言日语 –任务翻译

use this command on macos to translate the audio in a video (or audio file) to english

步骤7:现在,返回到视频文件所在的目的地。从那里,您可以看到 video.SRT 文件,其中包含您使用的视频的英文字幕。

subtitles


如何为视频使用字幕

您可以将字幕导入任何第三方媒体播放器并播放带字幕的视频。 VLC 是适用于 Windows 和 macOS 的最佳第三方媒体播放器。以下介绍了如何使用它来观看带有您使用 Whisper 生成的字幕的电影。

下载 VLC 媒体播放器(免费)

  • 对于 Windows
  • 对于 macOS

第 1 步:下载后,在您的设备上安装 VLC 媒体播放器。

vlc player website

第 2 步:在 Windows 上打开 VLC 播放器并导航至“播放列表”选项卡,然后单击“打开媒体”。

open media

步骤 3:从这里,点击浏览并选择视频文件并启用“添加字幕文件”,选择使用 Whisper AI 生成的字幕文件,然后单击“打开”。

add subtitles to the video

第四步:就这样,视频的字幕就生成了。

subtitles for the video

最后的想法

多年来,这些限制让我感到沮丧。然而,VLC 已经宣布人工智能生成实时字幕,但普通用户仍然无法使用。更令人担忧的是,这是他们在 Twitter 上的最后一篇帖子,所以在我弄清楚 Whisper 之前我已经失去了希望。

您可以通过这种方式为任何视频(包括完整电影)生成字幕,具体取决于您设备的资源。如果您的设备功能不强大,您可以在 Google Colab 上运行 Whisper AI。不仅可以生成字幕,您还可以将其翻译成其他语言,如下面的视频所示。我希望本指南对您有所帮助。我确保每个步骤都很详细,以使本指南适合初学者。如果您在设备上本地设置或运行 Whisper AI 时仍然遇到任何问题。您可以在下面评论。

使用 Whisper AI 生成字幕的常见问题解答

1. 我可以使用 Whisper 自动为我上传的 YouTube 视频添加字幕吗?

不需要,如果视频存储在您的设备本地,则需要生成字幕,然后在上传视频时将其上传到 YouTube。它不会自动为您上传的 YouTube 视频添加字幕。

2. Whisper安装后可以离线使用吗?

是的,一旦下载了所需的模型,它就会离线运行,无需互联网连接。

3. 如何加快旧设备或低端设备上的转录速度?

为了加快转录速度,您需要使用小模型。您还可以将大视频文件压缩为较小的文件,以使此过程更快。要压缩文件,您可以在终端中使用以下命令:ffmpeg -i video。 mp4 -q:a 0 -映射音频。 mp3

4. Whisper 可以自动检测发言者或单独的对话吗?

不可以,目前 Whisper 无法自动检测说话者或单独的对话;您需要使用单独的工具,例如Pyannote,来获取单独的音频文件,Pyannote音频或WhisperX

5. Whisper 生成的字幕对于嘈杂或带口音的语音是否准确?

是的,它是最好的转录模型之一。准确性还取决于您使用的型号;大模型通常会产生更好的精度;但是,它们可能需要更多时间并需要强大的资源才能运行。