ฉันใช้ Whisper AI เพื่อสร้างคำบรรยายสำหรับภาพยนตร์ใด ๆ ได้อย่างไร (ฟรีและออฟไลน์)

เผยแพร่แล้ว: 2025-10-31

ไม่ใช่ว่าผลิตภัณฑ์ AI ทั้งหมดจะได้รับความนิยมมากเกินไป มีบางอย่างที่มีประโยชน์จริงๆ ตั้งแต่การเขียนอีเมล การแก้ไขรูปภาพ ไปจนถึงการเรียกใช้ตัวแทน AI และอื่นๆ อีกมากมาย

ฉันได้ทดสอบเครื่องมือ AI ต่างๆ อย่างต่อเนื่อง สมัครใช้เครื่องมือใหม่ ทดลองใช้ซอฟต์แวร์เบต้า และประเมินเครื่องมือเหล่านี้กับคู่แข่งที่มีอยู่เพื่อประเมินประสิทธิภาพของพวกเขา

how i used whisper ai to make subtitles for any movie

ในขณะที่สำรวจโลก AI นี้ ถือเป็นความรับผิดชอบของเราในการจัดหาเครื่องมือ AI ที่เป็นประโยชน์ซึ่งเป็นประโยชน์ต่อผู้อ่านของเราอย่างแท้จริง และเราได้ดำเนินการดังกล่าวมาโดยตลอด คู่มือตัวแทน AI ล่าสุดของเราเป็นหนึ่งในนั้น ซึ่งมี ตัวแทน AI ที่มีประโยชน์ 8 รายการที่เป็นประโยชน์ ต่อผู้ใช้ในชีวิตประจำวัน

Whisper เป็นเครื่องมือหนึ่งที่ให้คุณถอดเสียงเป็นข้อความได้ แต่ยังมีความสามารถที่เป็นประโยชน์ เช่น คำบรรยาย และยังสามารถสร้างคำบรรยายได้ด้วย แม้ว่าแพลตฟอร์มส่วนใหญ่จะมีคำบรรยาย แต่ก็ยังมีรายการอีกมากมายที่ไม่มีคำบรรยาย ซึ่งทำให้เข้าใจยากมากและมักจะนำไปสู่การไม่ดู นอกจากนี้ ด้วยการพากย์ทำให้สตูดิโอส่วนใหญ่เปิดตัวรายการที่มีตัวเลือกภาษาที่จำกัด

สารบัญ

วิธีสร้างคำบรรยายและคำบรรยายสำหรับวิดีโอใด ๆ โดยใช้ Whisper AI
ข้อกำหนดเบื้องต้นในการติดตั้งและใช้ Whisper บน Mac, Windows และ Linux

วิธีติดตั้ง Whisper AI ในเครื่องบนอุปกรณ์ของคุณ
วิธีสร้างคำบรรยายสำหรับวิดีโอ
วิธีใช้คำบรรยายสำหรับวิดีโอ
ความคิดสุดท้าย
คำถามที่พบบ่อยเกี่ยวกับการสร้างคำบรรยายโดยใช้ Whisper AI
1. ฉันสามารถใช้ Whisper เพื่อเพิ่มคำบรรยายลงในวิดีโอ YouTube ที่ฉันอัปโหลดโดยอัตโนมัติได้หรือไม่
2. Whisper ทำงานแบบออฟไลน์หลังการติดตั้งหรือไม่
3. ฉันจะเร่งความเร็วในการถอดเสียงบนอุปกรณ์รุ่นเก่าหรือรุ่นล่างได้อย่างไร
4. Whisper สามารถตรวจจับผู้พูดหรือแยกบทสนทนาโดยอัตโนมัติได้หรือไม่
5. คำบรรยายที่สร้างโดย Whisper นั้นแม่นยำสำหรับคำพูดที่มีเสียงดังหรือเน้นเสียงหรือไม่?

ดูเพิ่มเติม ดูน้อยลง

วิธีสร้างคำบรรยายและคำบรรยายสำหรับวิดีโอใด ๆ โดยใช้ Whisper AI

สำหรับสิ่งนี้ ฉันใช้ Whisper ซึ่งเป็นเครื่องมือถอดเสียงฟรีจาก OpenAI ที่มีให้สำหรับทั้ง Mac และ Windows รองรับหลายภาษาและสามารถแปลเป็นภาษาอื่นได้ สามารถถอดเสียงข้อความ สร้างข้อความจากเสียง และแปลงเป็นภาษาอื่นได้ ที่สำคัญที่สุดคือสามารถสร้างคำบรรยายจากภาษาใดก็ได้และแปลเป็นภาษาอังกฤษได้ด้วย

ข้อกำหนดเบื้องต้นในการติดตั้งและใช้ Whisper บน Mac, Windows และ Linux

คุณสามารถเรียกใช้ Whisper AI ในระบบคลาวด์และภายในเครื่อง Mac ของคุณได้ เนื่องจากเรากำลังพูดถึงตัวเลือกฟรี การรันมันในอุปกรณ์ของคุณจึงเป็นเพียงตัวเลือกฟรีเท่านั้น แต่ก่อนหน้านั้น ต่อไปนี้เป็นข้อกำหนดเบื้องต้นสำหรับแต่ละแพลตฟอร์มเพื่อรันภายในอุปกรณ์ของคุณ

หน้าต่าง

ไพธอน 3.8+
PyTorch 1.10.1+
ffmpeg

แม็ค

ไพธอน 3.8+
PyTorch 1.10.1+
ffmpeg ลินุกซ์

ไพธอน 3.8+
PyTorch 1.10.1+
ffmpeg

วิธีติดตั้ง Whisper AI ในเครื่องบนอุปกรณ์ของคุณ

การติดตั้ง Whisper นั้นง่ายดาย และต้องใช้สามขั้นตอน ขึ้นอยู่กับอุปกรณ์ของคุณ ฉันได้ระบุวิธีการสำหรับทั้ง Windows และ macOS แล้ว คุณสามารถทำตามขั้นตอนเพื่อติดตั้ง Whisper ในเครื่องบนอุปกรณ์ของคุณได้โดยไม่มีปัญหาใดๆ ถ้าพร้อมแล้วมาเริ่มกันเลย

ขั้นตอนที่ 1: ติดตั้ง Python บนอุปกรณ์ของคุณ

หากคุณได้ติดตั้ง Python บนอุปกรณ์ของคุณแล้ว คุณสามารถข้ามขั้นตอนนี้ได้ หากคุณไม่ โปรดไปที่: https://www.python.org/ และติดตั้งลงในอุปกรณ์ของคุณ

install python on to your device.

เมื่อติดตั้งแล้ว ให้ใช้คำสั่งต่อไปนี้เพื่อตรวจสอบว่ามีการติดตั้งบนอุปกรณ์ของคุณหรือไม่

เปิด command prompt (Windows) หรือเทอร์มินัล (Mac/Linux) แล้วพิมพ์คำสั่งต่อไปนี้: python version

หากแสดงเวอร์ชัน Python อะไรทำนองนี้ Python 3.12.0 แสดงว่าติดตั้งบนอุปกรณ์ของคุณสำเร็จแล้ว หากคุณไม่เห็นสิ่งนี้ ให้ทำตามขั้นตอนอีกครั้ง

หากคุณมี Python เวอร์ชันเก่า คุณสามารถอัปเดตได้โดยใช้คำสั่งต่อไปนี้บน Windows, Mac และ Linux

Windows: python -m pip ติดตั้ง – อัปเกรด pip
MacOS : python3 -m pip ติดตั้ง – อัปเกรด pip
Linux: sudo apt ติดตั้ง python3.12

ขั้นตอนที่ 2: ตอนนี้ ติดตั้ง Whisper

จากนั้น ติดตั้ง Whisper บนอุปกรณ์ของคุณ เปิดเทอร์มินัลบนอุปกรณ์ของคุณแล้วใช้คำสั่งนี้

Windows: pip ติดตั้ง -u openai-whisper
MacOS: pip ติดตั้ง -u openai-whisper. หากคุณเห็นข้อผิดพลาดใดๆ ให้ใช้คำสั่งนี้: python3 -m pip install –user -U openai-whisper
Linux: pip ติดตั้ง -u openai-whisper

install whisper on your device

รอจนกระทั่งดาวน์โหลดไฟล์ทั้งหมดได้สำเร็จ เมื่อเสร็จแล้ว คุณจะเห็นข้อความคล้ายกับ "ดาวน์โหลดสำเร็จ"

คุณสามารถใช้คำสั่งนี้เพื่อตรวจสอบว่ามีการติดตั้งอย่างถูกต้องบนอุปกรณ์ของคุณหรือไม่

เคล็ดลับ:

ในระหว่างการตั้งค่า หากคุณพบข้อผิดพลาด ให้คัดลอกรหัสข้อผิดพลาดและใช้ ChatGPT เพื่อช่วยแก้ไขปัญหา คุณสามารถวางรหัสข้อผิดพลาดลงใน ChatGPT ซึ่งจะช่วยแก้ไขปัญหาได้

คำสั่ง: กระซิบ – ช่วยด้วย

ขั้นตอนที่ 3: ถัดไปติดตั้งซอฟต์แวร์ FFmpeg

จากนั้น ติดตั้ง ffmpeg (จำเป็นสำหรับเสียง) เพื่อประมวลผลไฟล์เสียงบนอุปกรณ์ของคุณ

บนแมค:

คุณสามารถใช้ Homebrew เพื่อติดตั้งบน Mac ของคุณโดยใช้คำสั่งง่ายๆ นี้: brew install ffmpeg

หากคุณไม่มี Homebrew บน Mac:

ขั้นตอนที่ 1: เปิด Terminal บน Mac ของคุณ

ขั้นตอนที่ 2: วางคำสั่งนี้แล้วกด Enter: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”

ขั้นตอนที่ 3: ป้อนรหัสผ่านและรอจนกว่าไฟล์ทั้งหมดจะถูกดาวน์โหลด

ที่เกี่ยวข้อง: วิธีติดตั้ง Homebrew บน macOS ของคุณ

check if homebrew works

ขั้นตอนที่ 4: ใช้คำสั่งนี้เพื่อตรวจสอบว่า Brew ได้รับการติดตั้งอย่างถูกต้องบนอุปกรณ์ของคุณหรือไม่ คุณสามารถใช้คำสั่งนี้: brew –version

ติดตั้งซอฟต์แวร์ ffmpeg

ขั้นตอนที่ 1: เปิด Terminal แล้วใช้คำสั่งนี้: brew install ffmpeg

install ffmpeg

ขั้นตอนที่ 2: รอจนกระทั่งดาวน์โหลดไฟล์ที่จำเป็นทั้งหมด

ขั้นตอนที่ 3: ใช้คำสั่งนี้เพื่อตรวจสอบว่าติดตั้งบนอุปกรณ์ของคุณสำเร็จหรือไม่: ffmpeg -version

ffmpeg installed on your device

สำหรับวินโดวส์:

ขั้นตอนที่ 1: ไปที่ https://ffmpeg.org/download.html และดาวน์โหลดไฟล์ Windows

ขั้นตอนที่ 2: แตกไฟล์และติดตั้งลงในอุปกรณ์ของคุณเหมือนกับซอฟต์แวร์อื่น ๆ

ขั้นตอนที่ 3: ถัดไป ตรวจสอบว่าทุกอย่างได้รับการติดตั้งอย่างถูกต้องบนอุปกรณ์ของคุณ เปิดเทอร์มินัลบนอุปกรณ์ของคุณและป้อนคำสั่งต่อไปนี้: 'กระซิบช่วย' หากคุณเห็นตัวเลือก แสดงว่าแอปได้รับการติดตั้งอย่างถูกต้องบนอุปกรณ์ของคุณ

วิธีสร้างคำบรรยายสำหรับวิดีโอ

ขั้นตอนที่ 1: เปิดเทอร์มินัลบนอุปกรณ์ของคุณและไปที่โฟลเดอร์ที่มีไฟล์วิดีโออยู่ ในกรณีนี้ ไฟล์วิดีโอของฉันอยู่บนเดสก์ท็อป คุณสามารถใช้คำสั่งต่อไปนี้เพื่อนำทางไปยังโฟลเดอร์ไฟล์วิดีโอ

navigate to your video location

Windows: ซีดีเดสก์ท็อป
MacOS: cd ~/Desktop

ขั้นตอนที่ 2: ถอดเสียงไฟล์เสียงและวิดีโอ นี่คือรายการรูปแบบไฟล์ที่ Whisper รองรับ

รองรับรูปแบบวิดีโอ	รองรับรูปแบบเสียง
.mp4	.mp3
.เอ็มเควี	.wav
.mov	.flac
.webm	.m4a
.avi	.aac
.mpg / .mpeg	.ogg
.flv	.บทประพันธ์
.wmv	.aiff / .aif
.3gp	.amr
	.wma

ขั้นตอนที่ 3: ตอนนี้ ถอดเสียงเลือกไฟล์วิดีโอโดยใช้คำสั่งนี้: กระซิบ (เพิ่มชื่อไฟล์วิดีโอหรือเสียงของคุณที่นี่) –model turbo –task transcribe

ตัวอย่าง: กระซิบ video.mp4 –model turbo –ถอดเสียงงาน

ขั้นตอนที่ 3: สามารถดาวน์โหลดโมเดลใหม่ได้ ทั้งนี้ขึ้นอยู่กับรุ่นที่คุณเลือก ดังนั้นรอจนกว่าจะดาวน์โหลดเสร็จ นี่คือ Whisper รุ่นต่างๆ ที่คุณสามารถเลือกได้ ยิ่งแบบจำลองยิ่งต่ำ ความแม่นยำก็จะยิ่งต่ำลง

ชื่อรุ่น	พารามิเตอร์	VRAM ที่จำเป็น
ขนาดเล็ก	39ม	1 กิกะไบต์
ฐาน	74ม	1 กิกะไบต์
เล็ก	244ม	2 กิกะไบต์
ปานกลาง	769ม	5 กิกะไบต์
ใหญ่	1.55B	10 กิกะไบต์
เทอร์โบ	809ม	6 กิกะไบต์

อย่างไรก็ตาม หากอุปกรณ์ของคุณไม่ทรงพลัง ฉันขอแนะนำให้ใช้รุ่นจิ๋วหรือรุ่นพื้นฐาน เนื่องจากการรันรุ่นใหญ่อาจใช้ทรัพยากรระบบทั้งหมดของคุณ หากคุณมีไฟล์สื่อขนาดใหญ่และต้องการความแม่นยำสูง คุณสามารถเรียกใช้ Whisper บน Google Colab ได้ นี่คือวิดีโอสอนเกี่ยวกับวิธีการ

run whisper

ขั้นตอนที่ 4: ตอนนี้สร้างคำบรรยายแล้ว คุณสามารถค้นหาไฟล์ต่อไปนี้ได้ในโฟลเดอร์วิดีโอที่คุณระบุไว้ก่อนหน้านี้

วิดีโอ txt การถอดเสียงข้อความธรรมดา
วิดีโอ รูปแบบคำบรรยายเว็บ vtt
วิดีโอ รูปแบบคำบรรยายทั่วไป srt (สำหรับ YouTube, VLC ฯลฯ )

run whisper to generate subtitles

ขั้นตอนที่ 5: เปิดไฟล์เพื่อดูคำบรรยาย ตอนนี้ไปที่โฟลเดอร์ที่มีวิดีโอของคุณอยู่และเปิดไฟล์ที่ระบุว่า video.srt

subtitles

ขั้นตอนที่ 6 (ไม่บังคับ): หากวิดีโอไม่ใช่ภาษาอังกฤษ คุณสามารถแปลเป็นภาษาอังกฤษได้โดยใช้คำสั่งต่อไปนี้

คำสั่ง: กระซิบ (ชื่อไฟล์วิดีโอหรือเสียงของคุณ) –จำลองสื่อ –ภาษา (ป้อนภาษาของคุณที่นี่) –แปลงาน

ตัวอย่าง: กระซิบ video.mp4 –รุ่นกลาง –ภาษาญี่ปุ่น –แปลงาน

use this command on macos to translate the audio in a video (or audio file) to english

ขั้นตอนที่ 7: ตอนนี้ กลับไปยังปลายทางที่มีไฟล์วิดีโออยู่ จากนั้น คุณจะเห็นไฟล์ video.SRT ซึ่งมีคำบรรยายภาษาอังกฤษสำหรับวิดีโอที่คุณใช้

subtitles

วิธีใช้คำบรรยายสำหรับวิดีโอ

คุณสามารถนำเข้าคำบรรยายไปยังเครื่องเล่นสื่อของบุคคลที่สามและเล่นวิดีโอพร้อมคำบรรยายได้ VLC เป็นเครื่องเล่นสื่อบุคคลที่สามที่ดีที่สุดสำหรับทั้ง Windows และ macOS ต่อไปนี้คือวิธีใช้เพื่อดูภาพยนตร์พร้อมคำบรรยายที่คุณสร้างโดยใช้ Whisper

ดาวน์โหลดเครื่องเล่นสื่อ VLC (ฟรี)

สำหรับวินโดวส์
สำหรับระบบปฏิบัติการ macOS

ขั้นตอนที่ 1: เมื่อดาวน์โหลดแล้ว ให้ติดตั้ง VLC media player บนอุปกรณ์ของคุณ

vlc player website

ขั้นตอนที่ 2: เปิด VLC Player บน Windows ของคุณแล้วไปที่แท็บเพลย์ลิสต์ จากนั้นคลิกที่ Open Media

open media

ขั้นตอนที่ 3: จากที่นี่ แตะที่เบราส์และเลือกไฟล์วิดีโอและเปิดใช้งาน เพิ่มไฟล์คำบรรยาย เลือกไฟล์คำบรรยายที่คุณสร้างโดยใช้ Whisper AI และคลิกที่ เปิด

add subtitles to the video

ขั้นตอนที่ 4: เพียงเท่านี้ คำบรรยายสำหรับวิดีโอจะถูกสร้างขึ้น

subtitles for the video

ความคิดสุดท้าย

หลายปีที่ผ่านมา ข้อจำกัดเหล่านี้ทำให้ฉันหงุดหงิด อย่างไรก็ตาม VLC ได้ประกาศคำบรรยายที่สร้างโดย AI ซึ่งทำงานแบบเรียลไทม์ แต่ยังคงไม่สามารถใช้งานได้สำหรับผู้ใช้ทั่วไป และที่น่ากังวลยิ่งกว่านั้นคือโพสต์ล่าสุดของพวกเขาบน Twitter ดังนั้นฉันจึงหมดหวังจนกว่าจะเข้าใจ Whisper ได้

นี่คือวิธีที่คุณสามารถสร้างคำบรรยายสำหรับวิดีโอใด ๆ รวมถึงภาพยนตร์ขนาดเต็ม ขึ้นอยู่กับทรัพยากรของอุปกรณ์ของคุณ หากอุปกรณ์ของคุณไม่ทรงพลัง คุณสามารถเรียกใช้ Whisper AI บน Google Colab ได้ ไม่เพียงแค่สร้างคำบรรยายเท่านั้น คุณยังสามารถแปลเป็นภาษาอื่นๆ ได้อีกด้วย ดังที่แสดงในวิดีโอด้านล่าง ฉันหวังว่าคุณจะพบว่าคู่มือนี้มีประโยชน์ ฉันรับรองว่าแต่ละขั้นตอนมีรายละเอียดเพื่อทำให้คู่มือนี้เหมาะสำหรับผู้เริ่มต้น หากคุณยังคงประสบปัญหาใด ๆ ในขณะที่ตั้งค่าหรือใช้งาน Whisper AI ภายในอุปกรณ์ของคุณ คุณสามารถแสดงความคิดเห็นด้านล่าง

คำถามที่พบบ่อยเกี่ยวกับการสร้างคำบรรยายโดยใช้ Whisper AI

1. ฉันสามารถใช้ Whisper เพื่อเพิ่มคำบรรยายลงในวิดีโอ YouTube ที่ฉันอัปโหลดโดยอัตโนมัติได้หรือไม่

ไม่ คุณต้องสร้างคำบรรยายหากวิดีโอถูกจัดเก็บไว้ในอุปกรณ์ของคุณ จากนั้นจึงอัปโหลดไปยัง YouTube เมื่อคุณอัปโหลดวิดีโอ จะไม่เพิ่มคำบรรยายลงในวิดีโอ YouTube ที่คุณอัปโหลดโดยอัตโนมัติ

2. Whisper ทำงานแบบออฟไลน์หลังการติดตั้งหรือไม่

ใช่ เมื่อดาวน์โหลดโมเดลที่ต้องการแล้ว โมเดลจะทำงานแบบออฟไลน์ โดยไม่จำเป็นต้องเชื่อมต่ออินเทอร์เน็ต

3. ฉันจะเร่งความเร็วในการถอดเสียงบนอุปกรณ์รุ่นเก่าหรือรุ่นล่างได้อย่างไร

หากต้องการเร่งการถอดเสียงเป็นคำ คุณต้องใช้โมเดลขนาดเล็ก คุณยังสามารถบีบอัดไฟล์วิดีโอขนาดใหญ่เป็นไฟล์เล็กลงเพื่อให้กระบวนการนี้เร็วขึ้น หากต้องการบีบอัดไฟล์ คุณสามารถใช้คำสั่งต่อไปนี้ในเทอร์มินัล: ffmpeg -i video mp4 -q: a 0 - แมปเสียง mp3

4. Whisper สามารถตรวจจับผู้พูดหรือแยกบทสนทนาโดยอัตโนมัติได้หรือไม่

ไม่ ขณะนี้ Whisper ไม่สามารถตรวจจับผู้พูดหรือแยกบทสนทนาได้โดยอัตโนมัติ คุณต้องใช้เครื่องมือแยกกัน เช่น Pyannote เพื่อรับไฟล์เสียงแยกกัน, Pyannote audio หรือ WhisperX

5. คำบรรยายที่สร้างโดย Whisper นั้นแม่นยำสำหรับคำพูดที่มีเสียงดังหรือเน้นเสียงหรือไม่?

ใช่ มันเป็นหนึ่งในโมเดลการถอดเสียงที่ดีที่สุด ความแม่นยำยังขึ้นอยู่กับรุ่นที่คุณใช้ด้วย โมเดลขนาดใหญ่โดยทั่วไปจะสร้างความแม่นยำได้ดีกว่า อย่างไรก็ตามอาจใช้เวลามากขึ้นและต้องใช้ทรัพยากรที่มีประสิทธิภาพในการทำงาน