8 เจ้าหน้าที่ AI ฟรีที่คุณสามารถใช้ได้ทุกวันเพื่อทำให้ชีวิตของคุณเป็นแบบอัตโนมัติ
เผยแพร่แล้ว: 2025-10-15ตัวแทน AI คือสิ่งที่ยิ่งใหญ่ถัดไปในอุตสาหกรรมเทคโนโลยี แม้ว่าพวกเราหลายคนคิดว่าตัวแทน AI นั้นมีไว้สำหรับผู้ใช้ระดับองค์กร แต่ก็มีประโยชน์มากสำหรับทุกคน
ตัวอย่างเช่น การวิจัยเชิงลึกของ ChatGPT เป็นตัวแทนหนึ่งที่ฉันใช้ทุกวันเพื่อทำให้งานวิจัยส่วนใหญ่เป็นไปโดยอัตโนมัติ เช่นเดียวกับ Notebook LLM ที่เป็นผู้จัดการเอกสาร AI ของฉันที่ช่วยให้ฉันจัดเก็บเอกสารและรับข้อมูลเชิงลึกจากเอกสารนั้น ในทำนองเดียวกัน มีตัวแทน AI หลายร้อยราย ซึ่งบางส่วนให้บริการฟรีด้วย ซึ่งช่วยให้คุณทำงานประจำส่วนใหญ่ในชีวิตประจำวันได้โดยอัตโนมัติ
ฉันได้รวมตัวแทน AI ที่ส่วนใหญ่ใช้งานได้ฟรีหรือฟรีโดยมีข้อจำกัด คุณสามารถปฏิบัติตามคำแนะนำนี้เพื่อตั้งค่าและใช้ตัวแทน AI
สารบัญ
8 เจ้าหน้าที่ AI ที่ดีที่สุดสำหรับงานประจำวัน
เครื่องมือ/ตัวแทน | สิ่งที่คุณสามารถทำได้ |
---|---|
งานความสับสน | คุณสามารถใช้เครื่องมือนี้เพื่อรับสรุปข่าวรายวัน ไฮไลท์หุ้น การแจ้งเตือนการลดราคา และอื่นๆ อีกมากมาย |
โน๊ตบุ๊ค LLM | คุณสามารถใช้เครื่องมือนี้เพื่อสรุปเอกสาร สร้างแผนที่ความคิด/แฟลชการ์ด และอื่นๆ อีกมากมาย เหมาะสำหรับนักเรียน |
ChatGPT / ราศีเมถุน | คุณสามารถใช้สิ่งเหล่านี้เพื่อแก้ไขข้อผิดพลาดด้านไวยากรณ์และการสะกดคำได้เร็วกว่าเครื่องมือแก้ไขไวยากรณ์ส่วนใหญ่ |
Comet Browser (ความฉงนสนเท่ห์) | คุณสามารถทำให้งานเว็บส่วนใหญ่เป็นแบบอัตโนมัติได้โดยใช้สิ่งนี้ คุณสามารถกรอกแบบฟอร์ม ป้อนข้อมูลจำลอง และจัดการงานประจำของเบราว์เซอร์ได้ |
YouTube Summarizers (ความฉงนสนเท่ห์ / Notebook LLM) | คุณสามารถสรุปวิดีโอ Youtube ได้อย่างง่ายดายโดยใช้เครื่องมือนี้ |
กระซิบ (การประชุม) | เครื่องมือที่ดีที่สุดสำหรับการถ่ายโอนบันทึกการประชุม |
วิสเปอร์ (ภาพยนตร์) | คุณสามารถสร้างคำบรรยายภาพยนตร์ของคุณเองด้วยเครื่องมือฟรีนี้ |
AI Coding Agents (เช่น น่ารัก) | คุณสามารถสร้างแอปและเครื่องมือของคุณเองสำหรับปัญหาของคุณเองได้ |
คุณสมบัติงานความสับสน
นับตั้งแต่ฉันค้นพบฟีเจอร์ Perplexity Tasks ฉันได้ประหยัดเวลาหลายชั่วโมงในตอนเช้า
เนื่องจากงานของฉันเกี่ยวข้องกับการค้นหาอินเทอร์เน็ตเพื่อหาแนวโน้มเทคโนโลยีล่าสุดและทำการค้นคว้าและค้นหาข่าวสารล่าสุด ก่อนที่จะ Perplexity Tasks ฉันเคยใช้เวลาหลายชั่วโมงในการเยี่ยมชมทุกเว็บไซต์ อ่านบทความ และจดบันทึก อย่างไรก็ตาม ด้วยงาน Perplexity ฉันมักจะทำงานนี้โดยอัตโนมัติเป็นส่วนใหญ่
ตอนนี้ฉันใช้ระบบอัตโนมัติที่แตกต่างกันสิบแบบทุกวัน โดยที่ AI ค้นหาฉันและแหล่งที่มาและเว็บไซต์ของฉันในอินเทอร์เน็ต และให้รายงานโดยละเอียดและสรุปข่าวโดยละเอียดทุกวัน
ขออภัย คุณสามารถตั้งค่างานได้สูงสุด 10 งานเท่านั้น และฟีเจอร์ Perplexity Tasks มีให้สำหรับผู้ใช้ Pro และ Enterprise เท่านั้น เนื่องจากมีให้บริการสำหรับผู้ใช้ Airtel ทุกคนฟรีในอินเดีย จึงเป็นตัวแทน AI ที่ยอดเยี่ยมในการทำให้งานประจำวันของคุณเป็นอัตโนมัติทุกวัน
ไม่เพียงเท่านั้น เนื่องจากเป็น AI คุณจึงสามารถขอให้จัดรูปแบบข้อมูลตามที่คุณต้องการได้ ตัวอย่างเช่น หากคุณเป็นนักวิเคราะห์ตลาดหุ้น คุณสามารถถาม AI เกี่ยวกับแนวโน้มล่าสุดและทำการวิเคราะห์ความรู้สึกเพื่อดูว่าจะส่งผลต่องานเฉพาะอย่างไร
หากคุณเป็นนักเรียน คุณสามารถใช้มันเพื่อทำให้กระบวนการค้นหางานวิจัยล่าสุดที่เกี่ยวข้องกับโครงการของคุณเป็นไปโดยอัตโนมัติ และนำเสนอการวิเคราะห์โดยละเอียด และแม้แต่แบ่งหัวข้อที่ซับซ้อนออกเป็นบล็อกที่เข้าใจได้สำหรับคุณ ความเป็นไปได้ไม่มีที่สิ้นสุด
ไม่เพียงเท่านั้น คุณยังสามารถใช้ฟีเจอร์งานที่ซับซ้อนเพื่อรับการแจ้งเตือนสำหรับการแจ้งเตือนการลดราคาและผลิตภัณฑ์ที่มีในสต็อกอีกครั้ง
วิธีใช้ฟีเจอร์งาน Perplexity:
ในกรณีนี้ ฉันใช้เบราว์เซอร์ เยี่ยมชม Perplexity.ai และสร้างบัญชีของคุณ
- ไปที่ perplexity.ai และคลิกที่รูปโปรไฟล์ของคุณ
- จากเมนู ให้เลือก งาน
- คลิกที่ ไอคอนเครื่องหมายบวก ที่มุมขวาบนของหน้าจอแล้วเลือก กำหนดเวลา
- จากที่นี่ คุณสามารถป้อนพรอมต์ ตรวจสอบให้แน่ใจว่าพรอมต์มีรายละเอียด เพิ่มวันที่และเวลา และเลือกงานที่เกิดซ้ำ และตั้งค่าเป็นรายวันหรือรายสัปดาห์ ขึ้นอยู่กับความต้องการของคุณ คุณยังสามารถเลือกโมเดลและแหล่งที่มาที่คุณต้องการให้เครื่องมือ AI ดึงข้อมูล และอื่นๆ อีกมากมาย
- และสุดท้ายให้คลิกที่ บันทึก
วิเคราะห์เอกสารของคุณโดยใช้ AI
ตัวแทน Notebook ของ Google สามารถเรียกใช้งานต่างๆ ให้กับคุณได้ หรือแม้แต่ทำให้งานประจำของคุณเป็นไปโดยอัตโนมัติ ฉันใช้ Notebook LLM เป็นตัวจัดการเอกสารเพื่อสรุปเอกสารผลิตภัณฑ์การเรียนรู้ทั้งหมดของฉัน แปลงเป็นรายการสิ่งที่ต้องทำที่นำไปใช้ได้จริง และแม้แต่แปลงเป็นพอดแคสต์เพื่อฟังในขณะที่ฉันกำลังวิ่งจ็อกกิ้งในตอนเช้า
ส่วนที่ดีที่สุดคือ Notebook LLM ไม่เหมือนกับ Google Drive หรือแม้แต่การจัดการเอกสารของบุคคลที่สาม เนื่องจากคุณสามารถจัดเก็บและจัดการเอกสารทั้งหมดได้ในที่เดียว และรับคำตอบทันทีจากเอกสารของคุณ
ไม่เพียงแต่ Notebook สรุป LLM ยังมาพร้อมกับคุณสมบัติที่มีประโยชน์ เช่น ภาพรวมของวิดีโอและเสียง ภาพรวมของเสียงที่ฉันบอกว่าสามารถใช้เพื่อแปลงเอกสารของคุณเป็นพอดแคสต์ และผลลัพธ์ที่ได้ก็ดีมากอย่างน่าประหลาดใจที่ฉันใช้คุณสมบัตินี้บ่อยครั้ง ต่อไปคือภาพรวมของวิดีโอซึ่งเป็นตัวเปลี่ยนเกมสำหรับนักเรียนที่สร้างงานนำเสนอบ่อยครั้ง ด้วยเคล็ดลับง่ายๆ ตอนนี้คุณสามารถแปลงเอกสารจากพื้นที่เก็บข้อมูลของคุณให้เป็นการนำเสนอวิดีโอที่มีรายละเอียดและอื่นๆ อีกมากมาย
คุณสมบัติที่มีประโยชน์อีกประการหนึ่งคือแผนที่ความคิดซึ่งสามารถช่วยให้คุณจดจำข้อมูลในนาทีสุดท้ายได้ เช่น หากคุณเป็นนักเรียนก่อนสอบ คุณสามารถสร้างแผนที่ความคิดและจดจำแนวคิดต่างๆ ได้อย่างง่ายดาย ถัดไปหากคุณเป็นวิศวกรซอฟต์แวร์ที่มีประสบการณ์หรือผู้จัดการของทีม คุณสามารถสร้างแผนที่ความคิดอย่างรวดเร็วเกี่ยวกับเรื่องที่จะหารือในการประชุมครั้งถัดไป และอื่นๆ อีกมากมาย
คุณสมบัติ Notebook LLM ส่วนใหญ่มีให้ใช้งานได้ฟรี ดังนั้นคุณส่วนใหญ่จึงสามารถใช้ประโยชน์จากเครื่องมือเหล่านี้ได้
วิธีใช้ Google NoteBook LLM เพื่อสรุปเอกสาร:
- ไปที่ https://notebooklm.google/ และลงชื่อเข้าใช้ด้วยบัญชีของคุณ
- คลิกที่สร้างใหม่และเพิ่มเอกสารของคุณ คุณสามารถอัปโหลดเอกสารหลายฉบับและแม้แต่เลือกไฟล์จาก Google Drive ของคุณ วางลิงก์ YouTube หรือแม้แต่วางข้อความ
- เมื่อเสร็จแล้ว คุณสามารถตรวจสอบกับเอกสารของคุณในแท็บตรงกลางเพื่อแปลงเอกสารของคุณให้เป็นภาพรวมเสียงหรือวิดีโอ
- เลือกภาพรวมเสียงหรือวิดีโอจากแถบด้านข้างขวาเพื่อสร้างแผนที่ความคิด สร้างแฟลชการ์ด และสร้างบันทึกย่อจากแหล่งที่มาของคุณหากคุณเป็นนักเรียน
แก้ไขข้อผิดพลาดด้านไวยากรณ์และการสะกดคำโดยใช้ AI
คุณสามารถใช้ ChatGPT หรือ Gemini เพื่อแก้ไขการสะกดผิด และฉันใช้มันมานานกว่าหนึ่งปีแล้ว สิ่งเหล่านี้อาจเป็นตัวเปลี่ยนเกม โดยเฉพาะอย่างยิ่งหากคุณมักจะเขียนเอกสารหลายชุด

แม้ว่าจะมีเครื่องมืออย่าง Grammarly แต่ในเวอร์ชันฟรี คุณต้องสังเกตการสะกดผิด วางเมาส์เหนือสิ่งเหล่านั้นเพื่อแก้ไข อาจใช้เวลานานหากคุณมีเอกสารยาวหรือสะกดผิดบ่อยๆ
อย่างไรก็ตาม คุณสามารถทำให้กระบวนการนี้เป็นอัตโนมัติได้โดยใช้เคล็ดลับง่ายๆ นี้ โปรดจำไว้ว่า เนื่องจากเป็น AI จึงสามารถเขียนเอกสารทั้งหมดของคุณใหม่ ซึ่งสามารถแปลงเป็นเนื้อหาที่สร้างโดย AI ได้ ดังนั้นคุณควรระมัดระวังเป็นพิเศษในขณะที่ใช้ AI เพื่อแก้ไขไวยากรณ์
หากคุณใช้ ChatGPT ฉันขอแนะนำให้ใช้โมเดลการคิดเพื่อแก้ไขเฉพาะการสะกดผิดโดยไม่ต้องเปลี่ยนแปลงอะไรเลย อย่างไรก็ตาม หากคุณใช้เวอร์ชันฟรี คุณสามารถใช้ข้อความแจ้งนี้แล้วเพิ่มข้อความของคุณเพื่อแก้ไขเฉพาะการสะกดผิดเท่านั้น
โปรดจำไว้ว่าเครื่องมือ AI มักจะทำให้เกิดภาพหลอนและสามารถเขียนเอกสารของคุณใหม่ทั้งหมดได้ ดังนั้นตรวจสอบให้แน่ใจว่าคุณใช้ข้อความแจ้งเหล่านี้อย่างถูกต้องเพื่อไม่ให้เนื้อหาของคุณสร้างโดย AI
วิธีใช้ ChatGPT เพื่อแก้ไขข้อผิดพลาดด้านไวยากรณ์และการสะกดคำ
- เยี่ยมชม ChatGPT.com หรือใช้แอป ChatGPT
- วางข้อความที่คุณต้องการแก้ไขแล้วป้อนพร้อมท์นี้:
คุณเป็นนักพิสูจน์อักษรมืออาชีพ
งานเดียวของคุณคือแก้ไขข้อผิดพลาดในการสะกดและไวยากรณ์ในข้อความที่กำหนด
ห้ามเปลี่ยนแปลงหรือเรียบเรียงคำใดๆ เว้นแต่จะสะกดผิด
อย่าเปลี่ยนโครงสร้างประโยค รูปแบบเครื่องหมายวรรคตอน หรือการใช้ถ้อยคำ
ห้ามเพิ่ม ลบ หรือจัดเรียงคำใดๆ ใหม่
รักษาข้อความให้เหมือนเดิม เพียงแก้ไขข้อผิดพลาดในการสะกดและไวยากรณ์ นี่คือข้อความ: - เพียงเท่านี้ ChatGPT จะแก้ไขข้อผิดพลาดให้คุณ
ทำให้งานเบราว์เซอร์ของคุณเป็นแบบอัตโนมัติโดยใช้ Comet Browser
เบราว์เซอร์จะเป็นอินเทอร์เฟซหลักเพื่อทำให้งานบนเว็บของคุณเป็นอัตโนมัติในอนาคต และในขณะที่มีเบราว์เซอร์ AI มากมายที่ฝัง AI ไว้ในเบราว์เซอร์แล้ว ณ ตอนนี้ มีเบราว์เซอร์เพียงไม่กี่ตัวเท่านั้นที่สามารถรันงานแบบเอเจนต์ได้ เบราว์เซอร์ยอดนิยมตัวหนึ่งคือ Comet จาก Perplexity และเมื่อเร็ว ๆ นี้ เบราว์เซอร์เปิดให้ทุกคนใช้งานได้ฟรีโดยไม่ต้องรอคิว
ส่วนที่ดีที่สุดคือเป็นหนึ่งในเบราว์เซอร์ตัวแทนที่ดีที่สุดที่คุณสามารถใช้ได้ในขณะนี้ งานตัวแทนส่วนใหญ่มีความแม่นยำสูง ตัวอย่างเช่น ฉันสร้างต้นแบบจำนวนมาก และบางส่วนต้องการให้ฉันป้อนข้อมูลจำลอง ซึ่งอาจใช้เวลานานพอสมควร
ฉันได้ทำให้กระบวนการนี้เป็นแบบอัตโนมัติโดยใช้ Comet ดังนั้นแทนที่จะป้อนข้อมูลแต่ละรายการลงในแบบฟอร์มด้วยตนเอง เบราว์เซอร์ Comet จะกรอกข้อมูลนั้นให้ฉัน และส่วนที่ดีที่สุดก็คือ ในกรณีส่วนใหญ่ เบราว์เซอร์จะทำงานให้เสร็จสิ้นโดยไม่มีปัญหาใดๆ
อย่างไรก็ตาม มีบางครั้งที่ใช้งานไม่ได้ซึ่งต้องป้อนข้อมูลด้วยตนเอง ไม่เพียงแต่คุณสามารถใช้เบราว์เซอร์สำหรับงานประจำของเบราว์เซอร์ เช่น การกรอกรายละเอียดแบบฟอร์ม และบางคนถึงกับใช้เพื่อจบแบบทดสอบหลักสูตรในตอนท้ายของวิดีโอการบรรยาย ซึ่งฉันไม่แนะนำให้ทำ และอีกครั้ง ความเป็นไปได้ไม่มีที่สิ้นสุด หากงานของคุณเกี่ยวข้องกับงานเบราว์เซอร์ คุณสามารถใช้เบราว์เซอร์ตัวแทน Comet AI เพื่อทำให้งานของคุณเป็นแบบอัตโนมัติได้
วิธีใช้เบราว์เซอร์ Comet เพื่อทำงานของคุณโดยอัตโนมัติ:
- ดาวน์โหลดและติดตั้งเบราว์เซอร์ Comet บนอุปกรณ์ของคุณ
- เปิด Comet และสร้างบัญชีของคุณ จากนั้นปฏิบัติตามการติดตั้งหน้าจอเดียวเพื่อสิ้นสุดการตั้งค่า
- เมื่อเสร็จแล้ว ให้ไปที่หน้าเว็บหรือจากมุมขวา แตะที่ ผู้ช่วย และป้อนข้อความแจ้งให้ดำเนินการ
- ตัวอย่างเช่น ที่นี่ฉันใช้ผู้ช่วยเพื่อแสดงข้อมูลจำลองไปยังแอปพลิเคชันของคุณ คุณสามารถใช้มันเพื่อกรอกข้อมูล สรุปวิดีโอของคุณ และแม้แต่งานเบราว์เซอร์เล็กๆ เช่น การคัดลอก การออกจากระบบ ค้นหาราคา และอื่นๆ
สรุปวิดีโอ YouTube
คุณยังสามารถใช้ตัวแทน AI เพื่อดูวิดีโอในนามของคุณและสร้างข้อมูลสรุปได้ โดยเฉพาะอย่างยิ่งมีประโยชน์สำหรับวิดีโอการสอนหรือวิดีโอการเรียนรู้ที่ใช้เวลานานเหล่านั้น
แม้ว่าบทสรุปจะไม่ได้รวมทุกสิ่งที่กล่าวถึงในวิดีโอ แต่คุณสามารถสร้างบันทึกย่อจากวิดีโอนั้นได้ และสร้างแผนที่ความคิดอย่างรวดเร็วเพื่อจำสิ่งที่คุณได้เรียนรู้จากวิดีโอได้อย่างรวดเร็ว
หากคุณเป็นครู คุณสามารถสร้างแบบทดสอบสำหรับนักเรียนเพื่อช่วยให้พวกเขาเข้าใจดีขึ้นได้ ไม่เพียงแค่นั้น หากวิดีโอเป็นภาษาอื่น คุณสามารถสร้างสรุปและแปลเป็นภาษาอื่นได้ และแม้กระทั่งขอให้ AI ช่วยอธิบายในไทม์ไลน์ที่กำหนด และมันก็ทำได้ดีมากในงานเหล่านี้
ตัวอย่างเช่น ในขณะที่ฉันกำลังค้นหา PS6 ฉันสามารถถาม AI ได้เมื่อ PS6 จะเปิดตัว และแม้กระทั่งถามว่าข้อกำหนดที่คาดหวังคืออะไรและอื่นๆ อีกมากมาย AI สามารถสร้างข้อมูลสรุปสั้นๆ ได้
มีตัวสรุป AI YouTube มากมาย ความยุ่งยากมักจะทำงานได้ดีกว่า และแม้แต่ Google Notebook ก็สามารถสรุปวิดีโอได้แม่นยำมาก แถมด้วย Notebook LLM คุณยังสามารถสร้างแผนที่ความคิดเพื่อจำแนวคิดที่สำคัญได้อย่างรวดเร็ว
วิธีสรุปวิดีโอ YouTube ของคุณ
คุณสามารถคัดลอกและวางลิงก์วิดีโอ YouTube ในแอป Perplexity หรือไปที่วิดีโอในเบราว์เซอร์ Chrome ค้นหาและเปิด Assistant และขอให้สรุปวิดีโอได้ คุณยังสามารถวางลิงก์ใน NotebookLLM สำหรับวิดีโอ YouTube ได้อีกด้วย
หากคุณใช้ Notebook LLM คุณยังได้รับคุณสมบัติเพิ่มเติม เช่น การสร้างแผนที่ความคิดและแฟลชการ์ด และยังได้รับจากแหล่งวิดีโอ YouTube อย่างรวดเร็ว ซึ่งดีที่สุดสำหรับนักเรียนและสำหรับการเรียนรู้วิดีโอ YouTube
ทำให้การถอดเสียงการประชุมของคุณเป็นแบบอัตโนมัติด้วย AI
แม้ว่าเครื่องมือการประชุมส่วนใหญ่จะเสนอการถอดเสียงการประชุม แต่มักจะมีข้อจำกัด และเพื่อปกป้องความเป็นส่วนตัว องค์กรส่วนใหญ่จึงปิดใช้งานการถอดเสียงการประชุมตามค่าเริ่มต้น ทำให้คุณเข้าร่วมการประชุมได้ นี่คือจุดที่ตัวแทน Whisper AI มีประโยชน์
Whisper เป็นเครื่องมือ AI ของ OpenAI ที่สามารถฟังการสนทนาของคุณและสร้างบทถอดเสียงให้กับคุณ ซึ่งคุณสามารถใช้ในภายหลังเพื่อสรุปบันทึก สร้างงานที่ดำเนินการได้ และแม้แต่จดจำจุดสำคัญ
คุณยังสามารถรวมเข้ากับ Notebook LLM เพื่อสร้างฐานความรู้การประชุมของคุณ และติดตามการประชุมทั้งหมดของคุณ และเรียกคืนได้ทุกเมื่อที่คุณต้องการ ส่วนที่ดีที่สุดคือ Whisper ทำงานบนอุปกรณ์ของคุณ ดังนั้นคุณไม่จำเป็นต้องกังวลเกี่ยวกับความเป็นส่วนตัวของคุณ และยังใช้งานได้ฟรีอีกด้วย
เนื่องจากมาจาก OpenAI จึงทำงานได้ดีมากในการถอดเสียงการประชุมของคุณ อย่างไรก็ตาม การตั้งค่าในเครื่องอาจเป็นงานที่ยุ่งยาก อย่างไรก็ตาม คุณสามารถปฏิบัติตามวิดีโอด้านล่างสำหรับกระบวนการง่ายๆ ทีละขั้นตอน หรือทำตามขั้นตอนง่ายๆ ด้านล่างเพื่อตั้งค่าในอุปกรณ์ของคุณได้อย่างง่ายดาย
วิธีสรุปและถอดเสียงบันทึกการประชุมของคุณ:
วิธีการตั้งค่า Whisper บนอุปกรณ์ของคุณ:
ขั้นตอนที่ 1: ติดตั้ง Python บนอุปกรณ์ของคุณ
- หากคุณได้ติดตั้ง Python บนอุปกรณ์ของคุณแล้ว คุณสามารถข้ามขั้นตอนนี้ได้ หากคุณไม่ทำ ให้ไปที่: https://www.python.org/downloads และดาวน์โหลด Python 3 หรือเวอร์ชันที่ใหม่กว่า และติดตั้งลงในอุปกรณ์ของคุณ
- เมื่อติดตั้งแล้ว ให้ใช้คำสั่งต่อไปนี้เพื่อตรวจสอบว่ามีการติดตั้งบนอุปกรณ์ของคุณหรือไม่ เปิด Command Prompt (Windows) หรือ Terminal (Mac/Linux) แล้วพิมพ์คำสั่งต่อไปนี้: python –version
- หากแสดงเวอร์ชัน Python อะไรทำนองนี้ Python 3.12.0 แสดงว่าติดตั้งบนอุปกรณ์ของคุณสำเร็จแล้ว หากคุณไม่เห็นสิ่งนี้ ให้ทำตามขั้นตอนนี้อีกครั้ง
ขั้นตอนที่ 2: ตอนนี้ มาติดตั้ง Whisper กันดีกว่า
- หลังจากติดตั้ง Python มาติดตั้ง Whisper บนอุปกรณ์ของคุณกันดีกว่า คุณสามารถเปิดเทอร์มินัลบนอุปกรณ์ของคุณและใช้คำสั่งนี้ คำสั่ง: pip install -U openai-whisper
- รอจนกระทั่งดาวน์โหลดไฟล์ทั้งหมดได้สำเร็จ เมื่อเสร็จแล้ว คุณจะเห็นข้อความประมาณว่าดาวน์โหลดสำเร็จแล้ว
ขั้นตอนที่ 3: ติดตั้ง FFmpeg (จำเป็นสำหรับเสียง)
- ถัดไป คุณต้องติดตั้ง FFmpeg (จำเป็นสำหรับเสียง) เพื่อประมวลผลไฟล์เสียงบนอุปกรณ์ของคุณ ทำตามขั้นตอนด้านล่าง ขึ้นอยู่กับอุปกรณ์ของคุณ
สำหรับแมค:
- คุณสามารถใช้ Homebrew เพื่อติดตั้งบน Mac ของคุณโดยใช้คำสั่งง่ายๆ นี้: brew install ffmpeg
- หากคุณไม่มี Homebrew บน Mac คุณสามารถติดตั้งได้โดยไปที่ลิงก์นี้: https://brew.sh หรือคุณสามารถติดตั้งโดยใช้คำสั่งนี้: /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”
บนวินโดวส์
- ไปที่ https://ffmpeg.org/download.html และดาวน์โหลดไฟล์ Windows แตกไฟล์และติดตั้งลงในอุปกรณ์ของคุณเหมือนกับซอฟต์แวร์อื่น ๆ
- ถัดไป ตรวจสอบว่าทุกอย่างได้รับการติดตั้งบนอุปกรณ์ของคุณอย่างถูกต้องหรือไม่ เปิดเทอร์มินัลบนอุปกรณ์ของคุณ และใช้คำสั่งนี้: กระซิบ –help
- หากคุณเห็นตัวเลือก แสดงว่าติดตั้งบนอุปกรณ์ของคุณอย่างถูกต้อง
ถอดเสียงบันทึกการประชุมของคุณ
- จากนั้น ไปที่ไฟล์การประชุมที่คุณต้องการแปลงเป็นเสียง หรือคุณสามารถใช้ไฟล์การประชุมใดก็ได้ Whisper รองรับรูปแบบไฟล์ต่อไปนี้: .mp3, .wav, .m4a, .mp4, .flac, .webm และอื่นๆ เมื่อสร้างแล้ว ให้บันทึกไฟล์ไว้ในโฟลเดอร์ใดก็ได้
- ตอนนี้ ให้เปิดเทอร์มินัลบนอุปกรณ์ของคุณแล้วไปที่โฟลเดอร์ที่คุณสามารถใช้คำสั่งนี้ในเทอร์มินัลได้ คำสั่ง: cd Desktop/Recordings ในกรณีของฉัน ฉันได้จัดเก็บบันทึกการประชุมทั้งหมดไว้บนเดสก์ท็อป
- ตอนนี้คุณสามารถรันคำสั่งนี้เพื่อแปลงหรือถอดเสียงบันทึกการประชุมได้ คำสั่ง: กระซิบ conference.mp3 – รุ่นเล็ก
- ไม่ใช่แค่การประชุมเท่านั้น Whisper ยังสร้าง conference.txt สำหรับการถอดเสียง: conference.srt สำหรับคำบรรยาย, conference.vtt สำหรับคำบรรยาย, conference.json สำหรับการประทับเวลาโดยละเอียด และอื่นๆ อีกมากมาย
Whisper มาพร้อมกับรุ่นต่างๆ คุณสามารถใช้แบบจำลองนี้ขึ้นอยู่กับขนาดและวัตถุประสงค์ของไฟล์ นอกจากนี้ยังสามารถแปลบันทึกการประชุมจากภาษาอื่นเป็นภาษาอังกฤษได้อีกด้วย คุณสามารถใช้คำสั่งต่อไปนี้เพื่อดำเนินการดังกล่าว: คำสั่ง: w hisperhindi_meeting.mp3 –task แปล –โมเดลขนาดเล็ก เพียงเท่านี้ คุณยังสามารถทำให้กระบวนการนี้เป็นแบบอัตโนมัติได้โดยใช้โค้ด Python ต่อไปนี้:
นำเข้าเสียงกระซิบระบบปฏิบัติการ
model =กระซิบ.load_model("เล็ก")
โฟลเดอร์ = “การบันทึก”
สำหรับไฟล์ใน os.listdir (โฟลเดอร์):
ถ้า file.endswith(".mp3"):
พิมพ์ ("การถอดเสียง:", ไฟล์)
model.transcribe(os.path.join(โฟลเดอร์, ไฟล์))
สร้างคำบรรยายของคุณเองสำหรับภาพยนตร์
ไม่ใช่แค่การประชุม คุณยังสามารถใช้ Whisper เพื่อสร้างคำบรรยายสำหรับวิดีโอใดๆ ก็ได้ รวมถึงภาพยนตร์ที่คุณต้องการรับชม ขอย้ำอีกครั้งว่าคุณสามารถทำตามขั้นตอนที่คล้ายกัน เลือกไฟล์วิดีโอและสร้างข้อความ และโหลดข้อความคำบรรยายลงในเครื่องเล่นสื่อต่าง ๆ เช่น VLC และชมภาพยนตร์พร้อมคำบรรยายของคุณเอง
ต่อไปนี้เป็นวิธีจัดเก็บภาพยนตร์หรือไฟล์วิดีโอใดๆ ลงในโฟลเดอร์ จากนั้นเปิด Terminal ในโฟลเดอร์ที่มีภาพยนตร์เพื่อสร้างคำบรรยาย คุณสามารถใช้คำสั่ง cd [ชื่อโฟลเดอร์] ตอนนี้ใช้ คำสั่งต่อไปนี้: กระซิบ movie.mp4 –model ขนาดเล็ก
รอให้มันทำงานและสร้าง และตอนนี้อยู่ในโฟลเดอร์เดียวกัน ให้ค้นหาไฟล์ .srt ซึ่งเป็นคำบรรยายที่สร้างขึ้นสำหรับวิดีโอ เพียงเท่านี้ คุณก็สามารถโหลดคำบรรยายเหล่านี้ไปยังเครื่องเล่นสื่อใดก็ได้และเริ่มรับชมได้เลย
สร้างเครื่องมือขนาดเล็กสำหรับปัญหาของคุณ
สุดท้ายนี้ คุณสามารถแก้ปัญหาของคุณเองได้โดยใช้เครื่องมือและแอปดิจิทัลขนาดเล็ก และคุณสามารถใช้ตัวแทนการเข้ารหัส AI เพื่อสร้างเครื่องมือและแอปสำหรับคุณได้
ตัวอย่างเช่น ฉันได้สร้างแอปรายการสิ่งที่ต้องทำเวอร์ชันของตัวเองด้วยตัวจับเวลา Pomodoro ในทำนองเดียวกัน ฉันได้สร้างตัวติดตามงาน Kanban ง่ายๆ เพื่อติดตามงานของทีมโดยไม่มีฟีเจอร์ที่ซับซ้อนและล้นหลาม
คุณสามารถใช้ ChatGPT เพื่อสร้างพรอมต์โดยละเอียด และใช้เอเจนต์การเขียนโค้ด AI ฟรี และสร้างแอปหรือเครื่องมือให้กับคุณได้ เจ้าหน้าที่เหล่านี้มีประสิทธิภาพมากจนสามารถจัดเก็บข้อมูลของคุณและสร้างแอประดับผลิตภัณฑ์ได้ โปรดทราบว่าพวกเขาไม่ได้ใช้แอปเหล่านี้สำหรับงานที่มีความละเอียดอ่อน เนื่องจากมีความปลอดภัยน้อยกว่าและสามารถเปิดเผยข้อมูลของคุณได้
วิธีสร้างแอปโดยใช้เครื่องมือ Vibe Coding:
- คุณสามารถใช้เครื่องมือเข้ารหัส Vibe ใดก็ได้ ในกรณีนี้ ฉันกำลังใช้ Lovable
- ไปที่ Lovable.dev และลงชื่อเข้าใช้ด้วยบัญชีของคุณ เวอร์ชันฟรีมี 5 เครดิต ซึ่งคุณต้องใช้เพื่อสร้างแอปขนาดเล็กหรือเครื่องมือตามที่คุณต้องการ
- ในแถบค้นหา ให้ป้อนข้อความแจ้ง คุณสามารถใช้ ChatGPT หรือ Gemini เพื่อปฏิบัติตามข้อความแจ้ง ในกรณีนี้ ฉันกำลังใช้มันสร้างรายการสิ่งที่ต้องทำง่ายๆ หรือสร้างแอปรายการสิ่งที่ต้องทำโดยมีเวลาพร้อมท์
- ป้อนข้อความแจ้งแล้วคลิก Enter และรอสักครู่ แอปจะสร้างเครื่องมือสำหรับคุณ
- เมื่อสร้างแล้ว คุณสามารถขอให้ Lovable Agent สร้างและเชื่อมโยงกับ Supabase เพื่อจัดเก็บข้อมูลทั้งหมดของคุณได้ คุณสามารถป้อนข้อความแจ้งนี้: ตอนนี้เชื่อมต่อแอปกับ Supabase และสร้างแบ็กเอนด์ ตอนนี้แอปจะสร้างแบ็กเอนด์และจัดเก็บข้อมูลทั้งหมดไว้ให้คุณ
- เมื่อทำขั้นตอนเสร็จแล้ว คุณจะสามารถใช้เป็นแอปรายการสิ่งที่ต้องทำเพื่อดูงานทั้งหมดของคุณได้
ทำให้งานประจำของคุณเป็นแบบอัตโนมัติด้วยตัวแทน AI เหล่านี้
ดังนั้น นี่คือตัวแทน AI ที่ดีที่สุดแปดอันดับที่คุณสามารถใช้ได้ทุกวันเพื่อทำให้งานประจำเป็นอัตโนมัติและสร้างความเป็นไปได้ใหม่ๆ แม้ว่าตัวแทนเหล่านี้จะพร้อมใช้งานภายในแอป ซึ่งทำให้ใช้งานง่าย ฉันรวมเฉพาะเวอร์ชันฟรี ยกเว้น Perplexity Pro ซึ่งต้องสมัครสมาชิกระดับ Pro
หากคุณใช้ ChatGPT, Gemini หรือแม้แต่การสมัครสมาชิก Perplexity Pro การวิจัยเชิงลึกเป็นอีกคุณสมบัติหนึ่งที่มีประโยชน์มากในการทำงานอัตโนมัติ ในทำนองเดียวกัน เครื่องมือการเขียน AI ก็เป็นวิธีที่ดีในการสรุปและเขียนข้อความให้กับคุณ ฉันหวังว่าคุณจะพบว่าคู่มือนี้มีประโยชน์ หากคุณมีข้อเสนอแนะใด ๆ คุณสามารถแสดงความคิดเห็นด้านล่าง