我如何使用 Whisper AI 为任何电影制作字幕(免费和离线)
已发表: 2025-10-31并非所有人工智能产品都被夸大了;有一些真正有用的方法,从写电子邮件到编辑照片再到运行人工智能代理等等。
我一直在不断测试各种人工智能工具,注册新工具,尝试测试版软件,并将它们与现有竞争对手进行比较,以评估它们的性能。

在探索这个人工智能世界时,我们有责任提供有用的人工智能工具,真正使我们的读者受益,而且我们一直在这样做。我们最近的人工智能代理指南就是其中之一,其中介绍了8 个对日常用户有益的有用人工智能代理。
Whisper 就是这样一种工具,可让您将音频转录为文本;它还具有有用的功能,例如字幕,甚至可以生成字幕。虽然现在大多数平台都提供字幕,但仍有大量节目没有字幕,这使得它们极难理解,常常导致不观看。此外,由于配音,大多数工作室推出的节目语言选择有限。
目录
如何使用 Whisper AI 为任何视频生成字幕
为此,我使用 Whisper,这是 OpenAI 提供的免费音频转录工具,适用于 Mac 和 Windows。它支持多种语言,甚至可以翻译成其他语言。它可以转录文本,从音频生成文本,并将其转换为其他语言;最重要的是,它可以生成任何语言的字幕,甚至可以将其翻译成英语。
在 Mac、Windows 和 Linux 上安装和使用 Whisper 的先决条件
您可以在云端和 Mac 本地运行 Whisper AI。由于我们正在讨论免费选项,因此在您的设备上本地运行它是唯一可用的免费选项。但在此之前,以下是每个平台在您的设备上本地运行它的先决条件。
视窗
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg
 
苹果
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg Linux
 
- Python 3.8+
 - PyTorch 1.10.1+
 - ffmpeg
 
如何在您的设备上本地安装 Whisper AI
安装 Whisper 很简单,需要三个步骤,具体取决于您的设备。我列出了适用于 Windows 和 macOS 的方法。您可以按照以下步骤在设备上本地安装 Whisper,不会出现任何问题。如果您准备好了,那么我们就开始吧。
第 1 步:在您的设备上安装 Python
如果您的设备上已经安装了Python,则可以跳过此步骤。如果没有,请访问:https://www.python.org/ 并将其安装在您的设备上。

安装后,使用以下命令检查它是否安装在您的设备上。
打开命令提示符 (Windows) 或终端 (Mac/Linux) 并键入以下命令:python version。
如果它显示 Python 版本,例如 Python 3.12.0,则意味着它已成功安装在您的设备上。如果您没有看到此内容,请再次执行此过程。
如果您有旧版本的 Python,可以在 Windows、Mac 和 Linux 上使用以下命令进行更新。
- Windows: python -m pip install –升级 pip
 - MacOS: python3 -m pip install –升级 pip
 - Linux: sudo apt install python3.12
 
第 2 步:现在,安装 Whisper
接下来,在您的设备上安装 Whisper。打开设备上的终端并使用此命令。
- Windows: pip install -u openai-whisper
 - MacOS: pip install -u openai-whisper。如果看到任何错误,请使用以下命令:python3 -m pip install –user -U openai-whisper
 - Linux: pip install -u openai-whisper
 

等待所有文件下载成功。完成后,您将看到类似“已成功下载”的消息。
您可以使用此命令检查它是否已正确安装在您的设备上。

命令:耳语-帮助
第三步:接下来,安装FFmpeg软件。
接下来,安装 ffmpeg(音频所需)来处理设备上的音频文件。
在苹果机上:
您可以使用 Homebrew 使用以下简单命令将其安装在 Mac 上:brew install ffmpeg
如果您的 Mac 上没有 Homebrew:
第 1 步:在 Mac 上打开终端
步骤 2:粘贴此命令并按 Enter: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”
步骤 3:输入密码并等待所有文件下载完毕。
相关:如何在 macOS 上安装 Homebrew

步骤 4:使用此命令检查 Brew 是否已正确安装在您的设备上。您可以使用此命令:brew –version
安装ffmpeg软件
第 1 步:打开终端并使用以下命令:brew install ffmpeg

第 2 步:等待所有必需的文件下载完毕。
步骤 3:使用此命令检查它是否已成功安装在您的设备上:ffmpeg -version

对于 Windows:
第 1 步:访问 https://ffmpeg.org/download.html 并下载 Windows 文件。
第 2 步:将其解压并像其他软件一样安装在您的设备上。
第 3 步:接下来,验证您的设备上是否已正确安装所有内容。打开设备上的终端并输入以下命令:“whisper help”。如果您看到选项,则表示该应用程序已正确安装在您的设备上。
如何为视频生成字幕
步骤1:打开设备上的终端,进入视频文件所在的文件夹。在这种情况下,我的视频文件位于我的桌面上。您可以使用以下命令导航到视频文件夹。

- Windows: cd 桌面
 - MacOS: cd ~/桌面
 
步骤2:转录音频和视频文件。以下是 Whisper 支持的文件格式列表。
| 支持的视频格式 | 支持的音频格式 | 
| .mp4 | .mp3 | 
| .mkv | .wav | 
| .mov | .flac | 
| .webm | .m4a | 
| .avi | .aac | 
| .mpg / .mpeg | .ogg | 
| .flv | .作品 | 
| .wmv | .aiff / .aif | 
| .3gp | .amr | 
| .wma | 
第 3 步:现在,使用以下命令转录选择视频文件: whisper(在此处添加您的视频或音频文件名)–model Turbo –task transcribe
示例:耳语 video.mp4 –model Turbo –task transcribe
步骤 3:根据您选择的模型,可能会下载新模型。所以等到它下载完成。以下是您可以选择的各种 Whisper 型号。模型越低,准确度越低。
| 型号名称 | 参数 | 所需显存 | 
| 微小的 | 39M | 1GB | 
| 根据 | 74M | 1GB | 
| 小的 | 244M | 2GB | 
| 中等的 | 769M | 5GB | 
| 大的 | 1.55B | 10GB | 
| 涡轮 | 809M | 6GB | 
但是,如果您的设备功能不强大,我建议使用小型或基本模型,因为运行大型模型可能会消耗您的所有系统资源。如果您有较大的媒体文件并且想要高精度,您可以在 Google Colab 上运行 Whisper。这是有关如何操作的视频教程。

第四步:字幕现已生成。您可以在之前指定的视频文件夹中找到以下文件。
- 视频。 txt 纯文本记录
 - 视频。 vtt 网页字幕格式
 - 视频。 srt通用字幕格式(适用于YouTube、VLC等)
 

步骤5:打开文件查看字幕。现在转到视频所在的文件夹并打开显示 video.srt 的文件

步骤 6(可选):如果视频不是英文,您可以使用以下命令将其翻译为英文。
命令: whisper(您的视频或音频文件名)-模型媒介-语言(在此处输入您的语言)-任务翻译
示例:耳语视频.mp4 –模型媒介 –语言日语 –任务翻译

步骤7:现在,返回到视频文件所在的目的地。从那里,您可以看到 video.SRT 文件,其中包含您使用的视频的英文字幕。

如何为视频使用字幕
您可以将字幕导入任何第三方媒体播放器并播放带字幕的视频。 VLC 是适用于 Windows 和 macOS 的最佳第三方媒体播放器。以下介绍了如何使用它来观看带有您使用 Whisper 生成的字幕的电影。
下载 VLC 媒体播放器(免费)
- 对于 Windows
 - 对于 macOS
 
第 1 步:下载后,在您的设备上安装 VLC 媒体播放器。

第 2 步:在 Windows 上打开 VLC 播放器并导航至“播放列表”选项卡,然后单击“打开媒体”。

步骤 3:从这里,点击浏览并选择视频文件并启用“添加字幕文件”,选择使用 Whisper AI 生成的字幕文件,然后单击“打开”。

第四步:就这样,视频的字幕就生成了。

最后的想法
多年来,这些限制让我感到沮丧。然而,VLC 已经宣布人工智能生成实时字幕,但普通用户仍然无法使用。更令人担忧的是,这是他们在 Twitter 上的最后一篇帖子,所以在我弄清楚 Whisper 之前我已经失去了希望。
您可以通过这种方式为任何视频(包括完整电影)生成字幕,具体取决于您设备的资源。如果您的设备功能不强大,您可以在 Google Colab 上运行 Whisper AI。不仅可以生成字幕,您还可以将其翻译成其他语言,如下面的视频所示。我希望本指南对您有所帮助。我确保每个步骤都很详细,以使本指南适合初学者。如果您在设备上本地设置或运行 Whisper AI 时仍然遇到任何问题。您可以在下面评论。
使用 Whisper AI 生成字幕的常见问题解答
1. 我可以使用 Whisper 自动为我上传的 YouTube 视频添加字幕吗?
不需要,如果视频存储在您的设备本地,则需要生成字幕,然后在上传视频时将其上传到 YouTube。它不会自动为您上传的 YouTube 视频添加字幕。
2. Whisper安装后可以离线使用吗?
是的,一旦下载了所需的模型,它就会离线运行,无需互联网连接。
3. 如何加快旧设备或低端设备上的转录速度?
为了加快转录速度,您需要使用小模型。您还可以将大视频文件压缩为较小的文件,以使此过程更快。要压缩文件,您可以在终端中使用以下命令:ffmpeg -i video。 mp4 -q:a 0 -映射音频。 mp3
4. Whisper 可以自动检测发言者或单独的对话吗?
不可以,目前 Whisper 无法自动检测说话者或单独的对话;您需要使用单独的工具,例如Pyannote,来获取单独的音频文件,Pyannote音频或WhisperX
5. Whisper 生成的字幕对于嘈杂或带口音的语音是否准确?
是的,它是最好的转录模型之一。准确性还取决于您使用的型号;大模型通常会产生更好的精度;但是,它们可能需要更多时间并需要强大的资源才能运行。
