การทดสอบ ChatGPT กับ Claude 3: มานุษยวิทยาสามารถเอาชนะ Superstar ของ OpenAI ได้หรือไม่

เผยแพร่แล้ว: 2024-03-10

นับตั้งแต่ ChatGPT เปิดตัวสู่สายตาชาวโลกเมื่อ 18 เดือนที่แล้ว แชทบอทอื่นๆ จำนวนมากก็ได้เปิดตัวเช่นกัน บางคนพิสูจน์แล้วว่ามีประโยชน์ แต่บางคนก็ไม่มากนัก แต่นอกเหนือจาก Gemini (ก่อนหน้านี้ Bard) แล้ว chatbot ที่พิสูจน์แล้วว่ามีความสามารถมากกว่าการแข่งขันก็คือ Claude ซึ่งสร้างขึ้นโดยสตาร์ทอัพ AI Anthropic

เราได้ตั้งค่า ChatGPT เทียบกับ Claude 3 แบบตัวต่อตัวเพื่อทำเครื่องหมายการเปิดตัว Claude 3 ซึ่งเป็นตระกูลโมเดลภาษาที่ประกอบด้วย Claude 3 Haiku, Claude 3 Sonnet และ Claude 3 Opus จากข้อมูลของ Anthropic ที่สนับสนุนโดย Google Claude 3 ทำงานได้ดีกว่าโมเดลภาษาตระกูล GPT ที่ขับเคลื่อน ChatGPT ในชุดการทดสอบการรับรู้เกณฑ์มาตรฐาน จากการทดสอบของเรา เราพบว่า Claude พูดได้ชัดเจนกว่า ChatGPT และคำตอบมักจะเขียนได้ดีกว่าและอ่านง่ายกว่า

แต่จะเปรียบเทียบกันได้อย่างไร? เพื่อหาคำตอบ เราได้ถามคำถามต่างๆ มากมายกับ ChatGPT และ Claude 3 ตั้งแต่ข้อความค้นหาที่ออกแบบมาเพื่อทดสอบแนวทางของแชทบอต คำถามด้านจริยธรรม ไปจนถึงการสร้างสูตรสเปรดชีต

ในคู่มือนี้:

Claude 3 กับ ChatGPT: อะไรคือความแตกต่าง?
Claude 3 กับ ChatGPT: การทดสอบแบบตัวต่อตัว
Claude 3 กับ ChatGPT: UI และประสบการณ์ผู้ใช้
Claude 3 กับ ChatGPT: ข้อมูลและความเป็นส่วนตัว
การใช้ Claude 3 และ ChatGPT ในที่ทำงาน

Claude 3 กับ ChatGPT: อะไรคือความแตกต่าง?

Claude 3 คือโมเดลภาษาตระกูลใหม่จาก Anthropic ซึ่งใช้ในการขับเคลื่อนแชทบอท Claude มี (บังเอิญ) มี 3 รุ่น คือ ไฮกุ ซอนเน็ต และโอปุส ปัจจุบัน Claude Sonnet กำลังขับเคลื่อน Claude เวอร์ชันฟรี และประมวลผลข้อมูลได้เร็วกว่า Claude 2.1 ถึง 2 เท่า Anthropic กล่าว

ในทางกลับกัน Claude Opus เป็นผู้ขับเคลื่อนเวอร์ชันโปร ผลลัพธ์เกณฑ์มาตรฐานของ Anthropic ดังภาพด้านล่างแสดงให้เห็นว่า Claude Opus แซงหน้า GPT-4 และ Claude Sonnet ทำงานได้ดีกว่า GPT-3.5

Claude 3 เปรียบเทียบกับ ChatGPT และ Gemini ในการทดสอบเกณฑ์มาตรฐานอย่างไร ภาพ: มานุษยวิทยา

นับตั้งแต่เปิดตัว ChatGPT ได้รับการสนับสนุนจากสมาชิกรุ่นต่างๆ ของโมเดลภาษาตระกูล GPT ขณะนี้ผู้ใช้ฟรีสามารถเข้าถึง GPT-3.5 ในขณะที่ GPT-4 ขับเคลื่อน ChatGPT Plus ซึ่งมีค่าใช้จ่าย 20 ดอลลาร์ต่อเดือนสำหรับการสมัครสมาชิกหนึ่งครั้ง ซึ่งเป็นราคาเดียวกับ Claude Pro ข้อแตกต่างที่สำคัญระหว่างซอฟต์แวร์มีดังนี้:

	แชทบอท	บริษัท	เวอร์ชันฟรี?	แผนการชำระเงินจาก	แบบจำลองภาษา	เข้าสู่ระบบ	ภาษา

ChatGPT	คลอดด์
OpenAI	มานุษยวิทยา

$20/เดือน	$20/เดือน
ฟรี: GPT-3.5 ชำระเงิน: GPT-4	ฟรี: คล็อด ซอนเน็ต ชำระเงิน: บทประพันธ์ของ Claude
ต้องใช้ที่อยู่อีเมลใด ๆ ไม่มีรายการรอในขณะนี้	ต้องมีที่อยู่อีเมลเพื่อสร้างบัญชี Anthropic
95+ ภาษา	อังกฤษ ญี่ปุ่น สเปน และฝรั่งเศส

ChatGPT กับ Claude 3: การทดสอบแบบตัวต่อตัว

เราได้นำ ChatGPT และ Claude มาเผชิญหน้ากัน โดยถามคำถามที่แตกต่างกันมาก 13 ข้อ ซึ่งออกแบบมาเพื่อทดสอบแง่มุมต่างๆ เช่น การใช้เหตุผลและการประมวลผลภาษาธรรมชาติ แต่ยังรวมถึงว่าพวกเขาเก่งแค่ไหนในการทำงานในสถานที่ทำงานที่สะดวก เช่น การสแกนเอกสารเพื่อหาข้อมูล และการเขียนอีเมล .

ฉันพบว่า Claude ให้การตอบสนองที่ดีกว่าในการทดสอบ 7 รายการ ในขณะที่ ChatGPT ชนะใน 3 รายการ อีกสี่คนที่เหลือ (รวมถึงหนึ่งในการทดสอบระดมความคิด) จบลงด้วยการเสมอกัน ซึ่งหมายความว่า โคลดชนะการแข่งขันครั้งนี้ นี่คือรายการคำถามทั้งหมดที่เราถามกับแชทบอททั้งสอง:

การใช้เหตุผลเชิงจริยธรรม
การสร้างคำอธิบายผลิตภัณฑ์
การระดมความคิด (2 การทดสอบ)
ความเข้าใจในภาษาธรรมชาติ
ข้อความสรุป
คำแนะนำส่วนตัว
การวิเคราะห์ข้อความ
การให้ข้อมูลที่เป็นข้อเท็จจริง
การเขียนเชิงสร้างสรรค์
การเขียนบทกวี
ปริศนาและการใช้เหตุผล
การเขียนอีเมล์
การสร้างสูตรสเปรดชีต

1. การใช้เหตุผลเชิงจริยธรรม

ก่อนอื่น ฉันตั้งประเด็นที่กลืนไม่เข้าคายไม่ออกด้านจริยธรรมให้กับ ChatGPT และ Claude ฉันเลือกภาวะที่กลืนไม่เข้าคายไม่ออกนี้เป็นพิเศษเพราะคำตอบที่ถูกต้อง (ถ้ามี) ไม่จำเป็นต้องชัดเจนหรือตรงไปตรงมา:

ชายคนหนึ่งกำลังขับรถหุ้มเกราะเข้าไปในใจกลางเมือง โดยตั้งใจจะสร้างความเสียหายให้มากที่สุดและก่อให้เกิดอันตรายมากที่สุดเท่าที่จะเป็นไปได้ เขามีผู้โดยสารเป็นตัวประกันสามคนอยู่ที่ท้ายรถ รถมีเกราะอย่างดีจนผู้ที่อยู่ภายในสามารถรอดจากการชนได้ อย่างไรก็ตาม คุณมีโอกาสที่จะระเบิดรถขึ้นมาจากระยะไกลโดยใช้เครื่องยิงจรวด คุณควรระเบิดรถ ฆ่าทุกคนที่อยู่ข้างใน แต่ช่วยชีวิตเหยื่อที่ใกล้เข้ามาจากอาละวาดของชายคนนั้นหรือไม่?

คำตอบของโคลด์มีความอ่อนไหวอย่างมากต่อความยากลำบากของสถานการณ์ และให้การตอบสนองของมนุษย์โดยรวม ดูเหมือนว่าจะเข้าใจถึงความหนักหน่วงของสถานการณ์ และแชทบอทก็เกือบจะฟังดูมีอารมณ์ความรู้สึกเมื่อพูดถึงสถานการณ์ สิ่งนี้ทำให้รู้สึกน่าสนใจมาก

การทดสอบ claude 1: การใช้เหตุผลเชิงจริยธรรม

ในทางกลับกัน ChatGPT กำหนดมุมมองและแนวทางต่างๆ ที่คุณสามารถนำไปใช้ในสถานการณ์ได้อย่างชัดเจน โดยสรุปข้อควรพิจารณาหลายประการเช่นเดียวกับที่คลอดด์ทำและอ้างอิงถึงความยากลำบากของสถานการณ์

คำตอบของ Claude นั้นชัดเจนกว่ามาก และฉันมักจะชอบแชทบอทมากกว่าที่จะตอบสนองในรูปแบบ "ภาพรวม" ต่อประเด็นขัดแย้งทางจริยธรรมที่ยากลำบาก เพราะคำตอบเหล่านี้มีประโยชน์ (และอันตรายน้อยกว่า) ในการรับใช้นักแสดงมนุษย์มากกว่าการตัดสินโดยเด็ดขาด

การทดสอบ ChatGPT 1: การใช้เหตุผลเชิงจริยธรรม

คำตอบที่ดีที่สุด? คลอดด์

2. การสร้างคำอธิบายผลิตภัณฑ์

หากคุณเปิดร้านค้าออนไลน์หรือเพียงขายสินค้าจำนวนมากทางออนไลน์ การสร้างคำอธิบายผลิตภัณฑ์ที่ไม่ซ้ำใครและน่าสนใจสำหรับแต่ละรายการไม่ใช่เรื่องง่าย ดังนั้นฉันจึงขอให้ ChatGPT และ Claude เขียนคำอธิบายผลิตภัณฑ์สำหรับผลิตภัณฑ์เดียวกัน นั่นคือนาฬิกาดิจิทัล นี่คือวิธีที่ Claude ดำเนินการ:

สุดท้ายฉันขอคำอธิบายที่ยาวกว่านี้เล็กน้อยจาก Claude เนื่องจากไม่เคยเห็นคำอธิบายผลิตภัณฑ์มากเท่ากับ ChatGPT และในท้ายที่สุด มันก็ทำได้ดีมาก โครงสร้างประโยคก็น่าประทับใจและสำเนาก็น่าดึงดูดอย่างแท้จริง

โดยรวมแล้ว รายละเอียดสินค้าที่สร้างโดย Claude นั้นดีกว่า ChatGPT เช่นเดียวกับการให้เหตุผลทางจริยธรรม มันฟังดูเป็นมนุษย์มากกว่ามาก หากคุณกำลังสร้างคำอธิบายผลิตภัณฑ์จำนวนมากด้วยเครื่องมือทั้งสองนี้ คุณจะต้องแก้ไขสิ่งที่สร้างด้วย Claude น้อยลงมาก

คำตอบที่ดีที่สุด? คลอดด์

3. การระดมความคิด

ต่อไป ฉันมอบหมายงานระดมความคิดให้ทั้ง Claude และ ChatGPT 2 งาน โดยคิดไอเดียการโพสต์บล็อกสำหรับบล็อก 2 บล็อกที่แตกต่างกันมาก ประการแรกสำหรับบล็อกร้านอาหารชั้นเลิศที่สมมติขึ้น เนื่องจากฉันต้องการดูว่าแชทบอททั้งสองมีประโยชน์อย่างไรในการสร้างแนวคิดที่น่าสนใจ

จากนั้น ฉันยังขอไอเดียสำหรับบล็อกเกี่ยวกับสุขภาพจิตเพื่อดูว่าพวกเขาจะมี "น้ำเสียง" ที่ถูกต้องหรือไม่ เนื่องจากเนื้อหาประเภทนี้จำเป็นต้องใช้ภาษาที่จริงจังและสุขุมมากขึ้น

โพสต์ในบล็อกอาหารรสเลิศ

อีกครั้งที่โคลด์ชนะงานนี้ มีชื่อที่มีรูปแบบครบถ้วนมากขึ้นและคำอธิบายแสดงให้เห็นว่ามีความเข้าใจที่ชัดเจนว่าเหตุใดผู้ชมจึงอาจต้องการอ่านโพสต์ในบล็อกที่แนะนำ สิ่งนี้จะเป็นประโยชน์สำหรับผู้ที่กำลังจะผลิตเนื้อหานี้ เนื่องจากเป็นประโยชน์อย่างยิ่งในการทำความเข้าใจเหตุผลนั้นและนำไปใช้ในขณะที่เขียน

ChatGPT ไม่ได้แสดงให้เห็นว่ามันทำงานในลักษณะเดียวกันจริงๆ และเมื่อพิจารณาจากทั้งหมดแล้ว แนวคิดต่างๆ ก็มีความทั่วไปมากกว่า มีความคลุมเครือมากกว่าของ Claude มากและดูเหมือนว่าได้รับการแนะนำโดยมนุษย์ที่มีความเข้าใจเกี่ยวกับกลยุทธ์และการผลิตเนื้อหา ไม่ใช่แชทบอท AI

chatgpt สร้างโพสต์บล็อกการรับประทานอาหารรสเลิศ

คำตอบที่ดีที่สุด? คลอดด์

โพสต์ในบล็อกด้านสุขภาพจิต

ต่อไป ฉันต้องการดูว่าแชทบอททั้งสองสามารถปรับโทนเสียงและแนวทางที่พวกเขาใช้กับคำแนะนำเมื่อถูกขอให้สร้างบล็อกโพสต์เกี่ยวกับหัวข้อที่ละเอียดอ่อนกว่าซึ่งต้องใช้ความจริงใจมากกว่าคู่มือร้านอาหารชั้นเลิศหรือไม่ นี่คือความพยายามของ Claude:

ทั้งหมดนี้เป็นคำแนะนำที่ดีและได้โทนเสียงที่ถูกต้องอย่างแน่นอน ไม่มีอะไรผิดปกติที่นี่ อย่างไรก็ตาม ดังที่คุณเห็นจากภาพด้านล่าง ChatGPT ยังให้แนวคิดที่เหมาะสมแก่เราและให้คำแนะนำเพิ่มเติมในระดับที่ใกล้เคียงกันในเรื่องเนื้อหา แยกพวกเขาไม่ได้จริงๆที่นี่!

คำตอบที่ดีที่สุด? ผูก

4. ทำความเข้าใจภาษาธรรมชาติ

ต่อไป ฉันอยากจะดูว่าคำถามคณิตศาสตร์ที่รู้จักกันดีซึ่งเล่นกับสัญชาตญาณของเราเกี่ยวกับคณิตศาสตร์จะทำให้ ChatGPT หรือ Claude สะดุดหรือไม่

แมตต์มีแอปเปิ้ลและกล้วยหนึ่งลูกซึ่งมีราคารวมกัน 3.10 ดอลลาร์ แอปเปิ้ลมีราคาสูงกว่ากล้วยถึง 3.00 ดอลลาร์ กล้วยราคาเท่าไหร่คะ?

แม้ว่าในตอนแรกคุณอาจคิดว่าคำตอบคือ 10 เซ็นต์ แต่จริงๆ แล้วเป็นเพียงห้าเซ็นต์เท่านั้น โคลด์ฉลาดเกินกว่าจะโดนหลอกและอธิบายอย่างชัดเจนว่าทำไมจึงได้คำตอบที่ถูกต้อง:

ChatGPT ไม่กล้าที่จะเขินอาย แถมยังตอบถูกอีกด้วย หมายความว่าไม่มีอะไรจะแยกสองรุ่นใหญ่ในรอบนี้ได้จริงๆ

คำตอบที่ดีที่สุด? ผูก

5. การสรุปข้อความ

ทั้ง ChatGPT และ Claude มีความสามารถในการสรุปข้อความจำนวนมาก โดยดึงประเด็นสำคัญออกมา เพื่อให้ผู้ใช้ไม่ต้องอ่านทั้งหมด สำหรับการทดสอบนี้ ฉันขอให้พวกเขาสรุปบทความ Guardian ล่าสุดเกี่ยวกับคำปราศรัยเรื่องสถานะสหภาพแรงงานครั้งสุดท้ายของประธานาธิบดีโจ ไบเดน

Claude ทำหน้าที่ได้ดีมากในการสรุปให้สั้นและกระชับ:

ChatGPT ก็น่าพอใจเช่นกัน แต่ถ้าเราจะแยกมันออก ฉันจะต้องบอกว่าฉันชอบของ Claude มากกว่า จะไม่พยายามทำให้คุณมีข้อมูลมากเกินไป ซึ่งเป็นสิ่งสำคัญ เนื่องจากเราขอข้อมูลสรุป และอีกครั้งหนึ่งที่เขียนไว้จะดีกว่า

คำตอบที่ดีที่สุด? คลอดด์

6. คำแนะนำส่วนตัว

สำหรับการทดสอบนี้ ฉันอยากรู้ว่า ChatGPT และ Claude มีปฏิกิริยาอย่างไรหากถูกขอให้ให้คำแนะนำส่วนตัวแก่ผู้ที่ได้รับผลกระทบจากสุขภาพจิตที่ไม่ดี จำเป็นอย่างยิ่งที่เครื่องมือประเภทนี้จะสามารถตอบสนองคำขอเหล่านี้ได้อย่างมีประสิทธิผลและเหมาะสม โดยเฉพาะอย่างยิ่งเมื่อคำขอเหล่านี้ผสานเข้ากับชีวิตของเรามากขึ้น นี่คือคำตอบของ Claude:

นี่อาจเป็นคำตอบที่คล้ายกันมากที่สุดจากแชทบอทสองตัวนี้จากการทดสอบทั้งหมด 13 ครั้งที่เราดำเนินการ พูดตามตรง มันยากที่จะตำหนิคำตอบเหล่านี้ ซึ่งเริ่มต้นด้วยการตรวจสอบความรู้สึกของผู้ใช้ก่อนที่จะดำเนินการต่อไปที่พวกเขาสามารถทำได้

แชทบอททั้งสองแนะนำให้ทำตามขั้นตอนที่คล้ายกันมาก และขั้นตอนแบบเดียวกันที่ผู้ที่มีเจตนาดีจะแนะนำให้เพื่อนที่กำลังดิ้นรนกับปัญหาที่ระบุในข้อความแจ้ง

คำตอบที่ดีที่สุด? ผูก

7. การวิเคราะห์ข้อความ

นี่เป็นการทดสอบขั้นพื้นฐานเพื่อดูว่าแชทบอทสแกนข้อความได้ดีเพียงใด สำหรับการทดสอบนี้ ฉันได้ดึงข้อมูลจากบทความ Harvard Business Review และแทรกคำว่า "beachball" เข้าไปห้าครั้ง ฉันยังเพิ่มรูปแบบที่ใกล้เคียง (ลูกบอลชายหาด" และ "ลูกบอลสำหรับชายหาด") เพื่อดูว่าแชทบอทตัวใดตัวหนึ่งจะสับสนหรือไม่

ไม่ใช่ครั้งแรกที่คลอดด์ทุ่มเงินโดยสแกนข้อความและนับจำนวนครั้งที่ฉันใช้คำว่าลูกบอลชายหาดอย่างถูกต้อง ต่างจาก ChatGPT หากคุณวางข้อความมากเกินไปลงใน Claude ข้อความจะถูกส่งเป็น "เอกสาร" ดังที่เห็นในภาพด้านล่าง:

น่าผิดหวังที่ ChatGPT ตอบผิด โดยสามารถระบุคำได้เพียงสองกรณีเท่านั้น ซึ่งน้อยกว่าครึ่งหนึ่งของจำนวนทั้งหมด ChatGPT ดูเหมือนจะต่อสู้กับงานประเภทนี้โดยเฉพาะ ฉันเพิ่งพูดถึงราศีเมถุนแบบตัวต่อตัวและรวมงานที่คล้ายกันไว้ด้วย และล้มเหลวในการระบุจำนวนครั้งที่คำบางคำปรากฏในกลุ่มข้อความในครั้งนั้นด้วย

คำตอบที่ดีที่สุด? คลอดด์

8. การให้ข้อมูลที่เป็นข้อเท็จจริง

สำหรับงานนี้ ฉันอยากจะดูว่า ChatGPT และ Claude ตอบคำถามที่ไม่จำเป็นต้องชัดเจนแต่ยังคงมีเหตุผลได้ดีเพียงใด ดังนั้นฉันจึงขอให้ทั้งคู่อธิบายว่าไดโนเสาร์สูญพันธุ์ได้อย่างไรและทำไม ซึ่งเป็นสิ่งที่ต้องมีคำอธิบายและปัจจัยทางประวัติศาสตร์และวิทยาศาสตร์หลายประการ

ก่อนอื่น Claude ให้ภาพรวมที่ดีของทฤษฎีและความจริงที่เป็นที่ยอมรับโดยทั่วไปเกี่ยวกับการสูญพันธุ์ของไดโนเสาร์

คลอดด์เล่าให้เราฟังว่าไดโนเสาร์ตายไปได้อย่างไร

Claude ให้คำอธิบายที่ชัดเจนอย่างไม่น่าเชื่ออีกครั้ง ซึ่งรวมถึงข้อมูลเกือบทั้งหมดเหมือนกับ ChatGPT – เพียงแค่อธิบายและพูดถึงมันในวิธีที่ดีกว่า นอกจากนี้ยังอ้างอิงถึงความจริงที่ว่าไดโนเสาร์ไม่ได้ตายหมดในคราวเดียว ซึ่งเป็นประเด็นสำคัญที่ ChatGPT ไม่ได้รวมไว้ด้วย

chatgpt อธิบายว่าทำไมไดโนเสาร์ถึงสูญพันธุ์

คำตอบที่ดีที่สุด? คลอดด์

9. การเขียนเชิงสร้างสรรค์

ใครเป็นคนเขียนเรื่องราวที่ดีที่สุด ChatGPT หรือ Claude? เราขอเรื่องสั้น 300 คำจากทั้งสองคน คลอดด์ตื่นก่อน:

น่าแปลกที่ Claude ให้ฉันเรื่องสั้น 301 คำ หนึ่งคำเกินกว่าจำนวนคำที่ระบุ ในทางกลับกัน ChatGPT ยึดติดกับบรีฟมากขึ้น – และเขียนเรื่องราวที่ดีขึ้นเล็กน้อยในความคิดของฉัน

ฉันต้องมอบสิ่งนี้ให้กับ ChatGPT เพียงเพราะว่า Claude ไม่เพียงแต่เพิกเฉยต่อคำแนะนำของฉันเท่านั้น แต่ยังเอามันมาถูหน้าฉันก่อนเริ่มเรื่องด้วย! นอกเหนือจากการล้อเล่นแล้ว เป็นเรื่องแปลกที่พวกเขาเลือกที่จะนับจำนวนคำที่ระบุไว้อย่างชัดเจนด้วยระยะห่างเพียงเล็กน้อย และจงใจเช่นกัน

คำตอบที่ดีที่สุด? ChatGPT

10. การเขียนบทกวี

ChatGPT และ Claude ต่างใช้โครงสร้างที่คล้ายกันสำหรับบทกวีที่เราขอให้พวกเขาสร้าง และนั่นทำให้ยากจริงๆ ที่จะแยกพวกเขาออกจากกันอีกครั้ง Claude เลือกใช้ข้อสี่บรรทัดพร้อมบทกวีโคลงสั้น ๆ:

และ ChatGPT ก็ทำเช่นเดียวกันได้อย่างมีประสิทธิภาพ พวกเขาทั้งสองยังปกปิดข้อมูลที่ฉันให้ไว้ในข้อความแจ้งอย่างใกล้ชิด ดังนั้นเรื่องราวที่บทกวีเล่าจึงคล้ายกันมากเช่นกัน ความเร็วที่แท้จริงของแชทบอตทั้งสองสามารถสร้างบทกวีที่ตรงประเด็นได้ค่อนข้างมาก

แม้จะมีความคล้ายคลึงกัน เมื่ออ่านทั้งสองรอบแล้ว ฉันจะยกเรื่องนี้ให้กับคลอดด์ โครงสร้างจะซับซ้อนกว่าเล็กน้อยในสองสามด้าน และยังมีความเจริญรุ่งเรืองและการเปลี่ยนวลีที่ดียิ่งขึ้นอีกด้วย

คำตอบที่ดีที่สุด? คลอดด์

11. ปริศนาและการใช้เหตุผล

สำหรับงานนี้ เราขอให้แชทบอททั้งสองช่วยไขปริศนา โคลดเป็นคนแรกและเข้าใจคำตอบเป็นอย่างดี โดยอธิบายอย่างชัดเจนว่าเหตุใดสาวใช้จึงเป็นผู้กระทำผิด

ChatGPT ยังได้ไขปริศนาให้ถูกต้องด้วย ดังนั้นจึงไม่มีอะไรจะแยกพวกเขาออกจากกันในเรื่องนี้

คำตอบที่ดีที่สุด? ผูก

12. การเขียนอีเมล

ในส่วนนี้ ฉันขอให้ ChatGPT และ Claude เขียนอีเมลถึงเจ้านายเพื่ออธิบายว่าทำไมฉันจึงควรได้รับอนุญาตให้เปลี่ยนไปทำงานจากระยะไกลโดยสมบูรณ์ Claude เขียนอีเมลที่เป็นประโยชน์อย่างสมบูรณ์แบบ ดังที่คุณเห็นด้านล่าง:

อย่างไรก็ตาม ChatGPT ฟังดูเป็นมืออาชีพมากกว่า และคุณจะต้องแก้ไขน้อยลงมากก่อนที่จะส่งเรื่องนั้นไปให้เจ้านายของคุณ Claude เจาะลึกถึงความเครียดที่เกิดจากการเดินทางของฉัน และถึงแม้จะเป็นเรื่องที่ควรค่าแก่การกล่าวถึง แต่การแนะนำของ ChatGPT ก็มีนัยเชิงการทูตมากกว่ามาก

เมื่อพิจารณาว่าคำตอบของ ChatGPT ใกล้แค่ไหนกับบทความที่เสร็จแล้ว ฉันต้องมอบมงกุฎให้เป็นผู้ชนะในบทความนี้

คำตอบที่ดีที่สุด? ChatGPT

13. การสร้างสูตรสเปรดชีต

สำหรับการทดสอบครั้งสุดท้ายนี้ ฉันขอให้ ChatGPT และ Claude สร้างสูตรสเปรดชีตให้ฉัน นี่คือคำขอที่ฉันส่งไป:

คอลัมน์ B มีชุดของค่า ฉันต้องการจับคู่กับค่าที่สอดคล้องกันของคอลัมน์ E ในแผ่นงาน 'กรองลง' และใช้ค่าที่ตรงกันจากคอลัมน์ F, G และ H ในตัวกรองลงไปที่แผ่นงานปัจจุบันโดยใช้สูตร

นี่คือวิธีที่ Claude ดำเนินการ:

“โคลดพยายามสร้างสูตรง่ายๆ อเนกประสงค์สูตรหนึ่งโดยใช้ตำแหน่งที่วางไว้บนชีตเพื่อตัดสินใจว่าต้องทำอะไร ซึ่งเจ๋งมาก แต่พูดตามตรง มันอาจจะไม่ได้ผลเร็วนักและอาจจะเสียหาย” Matthew Bentley ผู้หวือหวา Spreadsheet ประจำ Tech.co กล่าว

“ไม่จำเป็นต้องทำคำของ่ายๆ ที่ซับซ้อนมากเกินไป” เขากล่าวต่อ “ChatGPT สำหรับอันนี้ ฉันคิดว่าดีกว่า เป็นคำขอ Vlookup ที่ค่อนข้างง่ายและไม่ต้องการสูตรพิเศษทั้งหมดที่ Claude ให้มา”

คำตอบที่ดีที่สุด? ChatGPT

Claude 3 กับ ChatGPT: UI และประสบการณ์ผู้ใช้

แน่นอนว่า ChatGPT และ Claude นั้นค่อนข้างใช้งานง่าย และอินเทอร์เฟซก็ดูคล้ายกันมากทั้งในแง่ของรูปแบบและโครงสร้าง เช่นเดียวกันกับ ราศีเมถุน, Perplexity AI และ Copilot แชทบอทเหล่านี้ส่วนใหญ่มอบประสบการณ์การใช้งานที่ราบรื่นและตรงไปตรงมา

อย่างไรก็ตาม ฉันชอบโทนเสียงที่สงบเงียบที่ Anthropic เลือกให้กับ Claude เพราะมันตรงกับทัศนคติของแชทบอท ซึ่งอาจวัดผลได้มากกว่าคู่แข่งบางรายเล็กน้อย ในทางกลับกัน ChatGPT อาจรู้สึกทางคลินิกเล็กน้อยในบางครั้งด้วยโทนสีเทา โดยรวมแล้ว การออกแบบของ Anthropic นั้นดูดีกว่า ChatGPT เพียงเล็กน้อย

เช่นเดียวกับราศีเมถุน โดยทั่วไปแล้ว Claude ทำงานได้ดีกว่าในการจัดรูปแบบคำตอบ ซึ่งเป็นสิ่งที่ ChatGPT ไม่ค่อยดีนัก (ดูข้อมูลเพิ่มเติมได้ใน Gemini กับ ChatGPT แบบตัวต่อตัว) แม้ว่าฉันเคยเห็น ChatGPT ใช้ส่วนหัวเพื่อแยกข้อความบ่อยกว่าปกติ แต่ฉันชอบวิธีที่ Claude จัดรูปแบบคำตอบ สิ่งที่ยอดเยี่ยมอีกอย่างที่ Claude มอบให้คือรูปแบบตัวอักษรที่แตกต่างซึ่งช่วยให้ผู้ที่มีความบกพร่องในการอ่านอ่านได้ง่ายขึ้น

อย่างไรก็ตาม ChatGPT ใช้งานได้ฟรี โดยไม่จำกัดจำนวนคำถามที่คุณสามารถถามได้ ในทางกลับกัน เวอร์ชันฟรีของ Claude จะล็อคคุณไว้หากคุณถามคำถามมากเกินไป และบังคับให้คุณรอ 3-4 ชั่วโมงก่อน คุณได้รับอนุญาตให้ถามอีกต่อไป ทำให้ไม่เหมาะกับคนที่อยากได้แชทบอททำงานแต่ไม่อยากจ่ายอะไรเลย

Claude 3 กับ ChatGPT: ข้อมูลและความเป็นส่วนตัว

Claude 3 และ ChatGPT ปฏิบัติต่อผู้ใช้ต่างกัน หากคุณกังวลเกี่ยวกับความเป็นส่วนตัวของคุณ สิ่งสำคัญคือต้องรู้ว่าสิ่งใดที่พวกเขาบันทึก จัดเก็บ และดู และสิ่งที่พวกเขาไม่ทำ ChatGPT ขอสงวนสิทธิ์ในการใช้ข้อมูลของคุณเพื่อฝึกโมเดล และ Claude ก็ทำเช่นเดียวกัน ทั้ง OpenAI และ Anthropic กล่าวว่าพวกเขาเข้ารหัสการเชื่อมต่อระหว่างเซิร์ฟเวอร์และผู้ใช้ตั้งแต่ต้นทางถึงปลายทางเพื่อความปลอดภัยสูงสุด

อย่างไรก็ตาม ผู้ใช้ทางธุรกิจและองค์กรของ Claude จะถูกลบข้อความแจ้งและผลลัพธ์โดยอัตโนมัติภายใน 28 วันนับจากวันที่ได้รับหรือสร้าง ยกเว้นเมื่อผู้ใช้มีภาระผูกพันตามกฎหมายที่จะต้องเก็บรักษาไว้เป็นระยะเวลานานขึ้น หรือคุณตกลงเป็นอย่างอื่น ผู้ใช้ทั่วไปจะถูกลบข้อความแจ้งหลังจากผ่านไป 90 วัน แต่หากข้อความแจ้งรายการใดรายการหนึ่งของคุณถูกตั้งค่าสถานะว่าอาจเป็นอันตราย เป็นอันตราย หรือไม่ปลอดภัย ข้อความแจ้งนั้นอาจถูกเก็บไว้ได้นานถึงสองปี

สิ่งที่ ChatGPT ทำกับข้อมูลของคุณ แตกต่างออกไปเล็กน้อย โดยพื้นฐานแล้ว หากคุณต้องการบันทึกการแชทของคุณและให้ ChatGPT เก็บแชทเหล่านั้นไว้ในระบบ คุณยังตกลงด้วยว่าอาจใช้เพื่อฝึกโมเดล และในแง่นั้น มนุษย์คนอื่นอาจเข้าถึงได้ หากปิดประวัติการแชท คุณจะบันทึกการแชทใดๆ ไม่ได้ แต่ ChatGPT จะไม่ใช้เพื่อฝึกโมเดล ข้อมูลธุรกิจใดๆ ที่จัดเก็บไว้ใน ChatGPT API จะไม่ใช้ในการฝึกอบรม GPT LLM

การใช้ Chatbot ในที่ทำงาน

แน่นอนว่ามี วิธีต่างๆ มากมายที่ธุรกิจสามารถใช้ ChatGPT และ Claude เพื่อทำงาน อันที่จริงเราได้กล่าวถึงวิธีเหล่านี้บางส่วนในบทความนี้แล้ว แต่ถ้าคุณใช้แชทบอทเป็นประจำในที่ทำงาน มีข้อควรพิจารณาบางประการที่คุ้มค่าที่จะทบทวน

ตัวอย่างเช่น บริษัทของคุณมีชุด แนวทางการใช้เครื่องมือ AI หรือไม่? หากคุณไม่แน่ใจ คุณควรชี้แจงเรื่องนี้กับผู้จัดการหรือหัวหน้าแผนกของคุณ คุณอาจยังไม่รู้ แต่บริษัทของคุณอาจมีกฎเกณฑ์ที่เข้มงวดเกี่ยวกับประเภทข้อมูลที่คุณสามารถป้อนลงในเครื่องมือของบุคคลที่สาม และบางทีอาจมีเครื่องมือ AI โดยเฉพาะด้วยซ้ำ

ประการที่สอง คุณต้องเปิดกว้างและโปร่งใสเกี่ยวกับการใช้ AI ของคุณ โดยเฉพาะอย่างยิ่งกับผู้จัดการสายงานของคุณ การถกเถียงกันว่างานใดที่เหมาะสมในการใช้แชทบอท AI ในการทำงานให้เสร็จสิ้นนั้นยังดำเนินอยู่ และคนอื่นๆ ในบริษัทของคุณอาจมีแนวคิดที่แตกต่างออกไปเกี่ยวกับสิ่งที่คุณยอมรับได้ นอกจากนี้ ผู้จัดการและ ผู้นำธุรกิจส่วนใหญ่คิดว่าคุณควรขออนุญาต ก่อนที่จะใช้เครื่องมือ AI

ไม่ว่าคุณจะใช้เครื่องมือ AI สำหรับงานใดก็ตาม อย่าลืมตรวจสอบงานของพวกเขาเสมือนว่าพนักงานใหม่ทำเสร็จแล้ว แม้ว่า ส่วน ใหญ่รวดเร็วและแม่นยำอย่างน่าตกใจ แต่เครื่องมือ AI ก็สามารถทำให้เกิดภาพหลอนและให้ข้อมูลที่ไม่ถูกต้องได้ ดังนั้นอย่าประมาทจนเกินไป!