HIX Writer

BrowserGPT

HIX Writer

HIX Writer

เข้าถึงเครื่องมือการเขียน AI มากกว่า 120 รายการเพื่อยกระดับประสบการณ์การเขียนของคุณ

ตรวจสอบตัวเขียน HIX
ตรวจสอบตัวเขียน HIX
ดูเครื่องมือการเขียน AI ทั้งหมดกว่า 120 รายการ
BrowserGPT

BrowserGPT

สำรวจผู้ช่วย ChatGPT แบบครบวงจรที่ทรงพลังที่สุดสำหรับเว็บ

ตรวจสอบ BrowserGPT
ตรวจสอบ BrowserGPT
ผลผลิต
Google Doc

พิมพ์ // เพื่อเพลิดเพลินกับความช่วยเหลือ AI ของเราขณะที่คุณเขียนบน Google เอกสาร

Gmail

พิมพ์ // ประดิษฐ์อีเมลที่น่าสนใจและการตอบกลับส่วนตัว

แถบด้านข้าง

สำรวจทางเลือกแถบด้านข้าง Bing ที่มีประสิทธิภาพยิ่งขึ้นสำหรับ Chrome

เครื่องมือค้นหา

ค้นหาคำตอบที่ครอบคลุมของ HIXAI จากผลการค้นหาทั่วไป

แถบค้นหาด่วน

เลือกข้อความออนไลน์เพื่อแปล เขียนใหม่ สรุป ฯลฯ

สื่อสังคม
Twitter

พิมพ์ // เพื่อเขียนโพสต์กระแส Twitter ที่กระชับแต่ทรงพลัง

Instagram

พิมพ์ // เพื่อสร้างคำบรรยายที่น่าสนใจสำหรับโพสต์ Instagram ของคุณ

Facebook

พิมพ์ // เพื่อร่างโพสต์ Facebook แบบโต้ตอบที่มีส่วนร่วมกับชุมชนของคุณ

Quora

พิมพ์ // เพื่อให้คำตอบที่มีคุณค่าและได้รับการโหวตเห็นด้วยใน Quora

Reddit

พิมพ์ // เพื่อสร้างโพสต์ Reddit ที่โดนใจชุมชนเฉพาะ

YouTube

สรุปวิดีโอ YouTube ขนาดยาวได้ด้วยคลิกเดียว

บ้าน > แชท AI > DeepSeek R2: โมเดลโอเพ่นซอร์สใหม่ที่เปลี่ยนเกม

DeepSeek R2: โมเดลโอเพ่นซอร์สใหม่ที่เปลี่ยนเกม

การเปิดตัว DeepSeek R1 ต่อสาธารณะในเดือนมกราคม 2025 ได้เปลี่ยนแปลงภูมิทัศน์ของ AI อย่างมาก แต่ในวันนี้ ฉันจะพูดถึงขั้นตอนต่อไปในวิวัฒนาการของ DeepSeek และบางทีอาจเป็นก้าวกระโดดครั้งใหญ่ครั้งต่อไปในเทคโนโลยี AI ที่เรารู้จัก: DeepSeek R2

ความก้าวหน้าล่าสุดของ DeepSeek

ดีพซีค-r2-1.png

เรื่องนี้ดูเหมือนจะไม่ค่อยได้รับความสนใจมากนัก แต่ทีมวิจัยของ DeepSeek เพิ่งจัดงาน Open-Source Week เมื่อไม่นานนี้ ในงานดังกล่าว ทีม DeepSeek ได้เผยแพร่รีโพโอเพ่นซอร์ส 5 รายการเพื่อแสดงความคืบหน้าล่าสุดและความก้าวหน้าด้าน AI ที่พวกเขาทำ

เครื่องมือสามอย่างที่น่าสังเกตที่สุด ได้แก่:

  • FlashMLA : นี่เป็นเคอร์เนลถอดรหัส MLA ที่มีประสิทธิภาพสำหรับ Hopper GPU
  • DeepEP : ไลบรารีการสื่อสารแรกสำหรับการฝึกอบรมและการอนุมานโมเดล MoE
  • DeepGEMM : ไลบรารี FP8 GEMM ที่ทำงานได้กับทั้ง Dense และ MoE GEMM
ดีพซีค-r2-2.png

แล้วทั้งหมดนี้หมายความว่าอย่างไรกันแน่?

เครื่องมือทั้งหมดนี้ได้รับการออกแบบมาเพื่อให้การพัฒนาและปรับปรุงโมเดลและผลิตภัณฑ์ AI ในอนาคตเป็นเรื่องง่ายและมีประสิทธิภาพมากขึ้น ซึ่งนำฉันไปสู่หัวข้อการสนทนาหลัก: DeepSeek R2

DeepSeek R2: วิวัฒนาการครั้งต่อไปของ AI

ดีพซีค-r2-3.png

งาน Open-Source Week ของ DeepSeek และผลิตภัณฑ์ที่นำมาจัดแสดงในงานทั้งหมดเชื่อมโยงกันอย่างลงตัวกับการเปิดตัว Reasoning 2 หรือ R2 โมเดลที่บริษัทโปรโมตอย่างมาก ซึ่งคาดว่าจะเป็นการอัปเกรดครั้งใหญ่จากโมเดล DeepSeek R1 รุ่นก่อนหน้า

สำหรับใครก็ตามที่ไม่ได้ติดตามข่าวสารและการเปิดตัวที่เกี่ยวข้องกับ DeepSeek ฉันจะอธิบายข้อมูลพื้นฐานให้ฟัง:

DeepSeek R1 ได้รับการพัฒนาในประเทศจีนและเปิดตัวเมื่อต้นปี 2025 นับเป็นเหตุการณ์สำคัญในวงการ AI และส่งผลให้มีการขายหุ้นจากตลาดหุ้นทั่วโลกมากกว่า 1 ล้านล้านดอลลาร์ เหตุใดจึงเป็นเช่นนั้น? เพราะ R1 เป็นโมเดลที่ล้ำหน้าและปฏิวัติวงการมาก จึงมีศักยภาพในการแข่งขันกับโมเดล AI ที่ดีที่สุดจากแบรนด์ใหญ่ๆ ในโลกตะวันตก

ดีพซีค-r2-4.png

การทดสอบแสดงให้เห็นว่าในหลายๆ ด้านนั้นเทียบเท่าหรือดีกว่าสิ่งต่อไปนี้:

มันสามารถทำทุกอย่างนี้ได้ในขณะที่เป็นโอเพนซอร์สและสามารถเข้าถึงได้ฟรี นับเป็นการบุกเบิกในสมัยนั้น และฉันก็เป็นหนึ่งในผู้ที่ชื่นชอบ AI จำนวนมากทั่วโลกที่รู้สึกทึ่งกับเรื่องราวนี้: บริษัทสตาร์ทอัพขนาดเล็กของจีนสามารถบรรลุถึงระดับความเป็นเลิศทางเทคโนโลยีเทียบเท่ากับแบรนด์ยักษ์ใหญ่มูลค่าหลายพันล้านดอลลาร์อย่าง OpenAI

แต่ไม่นานหลังจาก R1 เปิดตัว ฉันและคนอื่นๆ ก็เริ่มสงสัยว่า "อะไรต่อไป?"

ดีพซีค-r2-5.png

รายงานของ Reuters เมื่อไม่นานมานี้เผยว่าทีมพัฒนาของ DeepSeek กำลังเร่งดำเนินการให้โมเดล R2 ออกมาภายในเดือนพฤษภาคม ดังนั้น เราน่าจะได้มันเร็วๆ นี้ และผมบอกคุณได้อย่างแน่นอนว่าโมเดลใหม่นี้จะเปลี่ยนแปลงภูมิทัศน์ของ AI อย่างมากยิ่งกว่า R1

ผลกระทบของ R2

นี่คือสิ่งที่ฉันคาดหวังจาก R2:

  • มันจะถูกมากๆ เหมือนกับ R1 เลย
  • มันจะตรงหรือแม้กระทั่งทำผลงานได้ดีกว่าโมเดลชั้นนำเช่น o3-full หรือ o3-high ของ OpenAI
  • มันจะเหนือกว่ารุ่นอื่นๆ เกือบทั้งหมดในตลาด

และคาดว่าจะเปิดตัวเร็วๆ นี้ หากเชื่อตามรายงานล่าสุด ทีมงาน DeepSeek ซึ่งตั้งอยู่ในเมืองหางโจวดูเหมือนจะกระตือรือร้นที่จะเผยแพร่ข้อมูลนี้มาก และการคาดการณ์ส่วนตัวของฉันก็คือเราอาจเห็นข้อมูลนี้เผยแพร่หลังวันหยุดเทศกาลเชงเม้งของจีน ซึ่งตรงกับวันที่ 6 พฤษภาคม ดังนั้นโปรดติดตามกำหนดการของคุณ

นอกจากนี้ ทีม DeepSeek ยังกล่าวอีกว่ากำลังมุ่งเน้นที่การผลิตโค้ดที่เหนือกว่าเดิมและประสิทธิภาพที่ดีขึ้นในหลากหลายภาษา ไม่ใช่แค่ภาษาอังกฤษและภาษาจีนเท่านั้น ซึ่งเป็นจุดเน้นหลักและตัวเลือกเริ่มต้นของ R1 ซึ่งถือว่าสมเหตุสมผล เนื่องจาก DeepSeek R1 ได้รับความนิยมทั่วโลก และผู้คนต้องการโต้ตอบกับ R2 ในภาษาสเปน ฝรั่งเศส รัสเซีย และอื่นๆ

เราเพียงแค่ต้องมองย้อนกลับไปที่ผลกระทบที่ R1 มีต่อการคาดการณ์ว่า R2 จะส่งผลต่อตลาดโลกอย่างไร การเปิดตัว R1 ส่งผลให้ตลาดหุ้นตกต่ำอย่างหนัก โดยหุ้น NVIDIA, สกุลเงินดิจิทัล และหุ้นทั่วโลกต่างก็ร่วงลงในช่วงไม่กี่วันหลังจากการเปิดตัว ซึ่งนั่นทำให้ผมทึ่งมากในตอนนั้น เพราะเราแทบไม่เคยเห็นอะไรแบบนี้มาก่อน

ดีพซีค-r2-6.png

เหตุใดจึงเกิดขึ้น? ส่วนหนึ่งเป็นเพราะ R1 ถูกสร้างขึ้นโดยใช้ชิป NVIDIA รุ่นเก่าที่มีประสิทธิภาพน้อยกว่า ไม่ใช่รุ่นล่าสุด จึงทำให้เทคโนโลยีล่าสุดของ NVIDIA มีมูลค่าลดลงและไม่น่าประทับใจเมื่อพิจารณาจากมุมมองดังกล่าว นอกจากนี้ยังทำให้บริษัทเทคโนโลยีปัญญาประดิษฐ์ยักษ์ใหญ่จากตะวันตกต้องแข่งขันกันอย่างหนัก ส่งผลให้มูลค่าของบริษัทและผลิตภัณฑ์ของบริษัทลดลง

การเปิดตัว R2 อาจส่งผลกระทบในลักษณะเดียวกันได้ โดยอาจทำลายความโดดเด่นของบริษัท AI ขนาดใหญ่ เช่น OpenAI และ Google และทำให้ภูมิทัศน์สั่นสะเทือนอีกครั้ง และพิสูจน์ให้เห็นว่าคุณไม่จำเป็นต้องใช้ชิปและฮาร์ดแวร์ชิ้นอื่นๆ ที่ล้ำสมัยที่สุดและใหม่ล่าสุดเพื่อสร้างโมเดล AI ที่น่าทึ่ง

ดีพซีค-r2-6-2.png

ความลับสู่ความสำเร็จของ DeepSeek

เมื่อถึงจุดนี้ คุณอาจสงสัยว่า “ความลับเบื้องหลังเรื่องราวความสำเร็จอันเหลือเชื่อของ DeepSeek คืออะไร” ฉันคิดว่าฉันมีคำตอบแล้ว กุญแจสำคัญของความสำเร็จของ DeepSeek อยู่ที่การที่พวกเขาพัฒนานวัตกรรมด้าน AI อย่างรวดเร็ว กล้าที่จะคิดนอกกรอบ และทำสิ่งต่างๆ ที่แตกต่างจากบริษัทใหญ่ที่มีชื่อเสียง

นวัตกรรมทางเทคโนโลยี

ส่วนหนึ่งที่สำคัญคือการลงทุนอย่างหนักในด้านการประมวลผล บริษัทแม่ของ DeepSeek ทุ่มเงินจำนวนมากในการซื้อฮาร์ดแวร์การประมวลผล เช่น คลัสเตอร์ซูเปอร์คอมพิวเตอร์ที่ล้ำสมัย เช่น Firefly ซึ่งใช้ชิป NVIDIA 800 หลายพันชิปในราคาที่ถูกกว่าชิปรุ่นล่าสุดมาก ทำให้ DeepSeek สามารถสร้าง AI ที่น่าทึ่งได้ด้วยงบประมาณที่ค่อนข้างจำกัด

อันที่จริงแล้ว มีเรื่องราวที่น่าสนใจอยู่เบื้องหลังเรื่องนี้ บริษัทที่อยู่เบื้องหลัง DeepSeek ใช้เงินไปประมาณ 1.2 พันล้านหยวนกับคลัสเตอร์ AI ซูเปอร์คอมพิวเตอร์สองคลัสเตอร์ในปี 2020 และ 2021 คลัสเตอร์เหล่านี้ประกอบด้วยชิป NVIDIA 800 ประมาณ 10,000 ตัว และการซื้อครั้งนี้ดึงดูดความสนใจจากหน่วยงานกำกับดูแลขนาดใหญ่บางแห่งในประเทศจีน

ดีพซีค-r2-7.png

หน่วยงานเหล่านี้ถาม DeepSeek ว่าทำไมพวกเขาถึงซื้อชิปจำนวนมากขนาดนั้น และทีมงานต้องอธิบายว่าพวกเขากำลังทำอะไรอยู่ ในที่สุด พวกเขาก็ได้รับ "การอนุมัติ" จากหน่วยงานกำกับดูแล ซึ่งทำให้พวกเขาสามารถดำเนินการต่อได้ ในขณะเดียวกัน บริษัท AI ของตะวันตกกำลังใช้ชิป NVIDIA ระดับไฮเอนด์มากกว่าเดิมถึง 50,000 ชิ้น ซึ่งชิปเหล่านี้ถูกห้ามส่งออกไปยังจีนอย่างแท้จริง

ดังนั้น DeepSeek จึงต้องรับมือกับชิปที่มีคุณภาพต่ำกว่า แต่ยังคงใช้งานได้ โดยเน้นที่ประสิทธิภาพมากกว่าประสิทธิภาพสูงสุด และดึงคุณค่าออกมาให้ได้มากที่สุดจากส่วนประกอบที่มีอยู่ ซึ่งหมายถึงต้นทุนการคำนวณและค่าใช้จ่ายทางอ้อมที่ลดลง ซึ่งส่งต่อไปยังผู้ใช้ปลายทาง เช่น ฉันและคุณ

การกำหนดมาตรฐาน

เมื่อ DeepSeek สร้างโครงสร้างพื้นฐานเบื้องต้นได้แล้ว พวกเขาก็สามารถผลักดันนวัตกรรมต่างๆ ของตนให้ก้าวหน้า ขยายขอบเขตการทำงาน และพัฒนาโมเดลและระบบ AI ต่างๆ ได้อย่างคุ้มต้นทุน พวกเขาไปถึงจุดที่โมเดลของพวกเขาห่างจากการเป็นโมเดลที่ดีที่สุดในโลกอย่างเป็นทางการเพียง 4.5 คะแนนในการทดสอบประสิทธิภาพ

ดีพซีค-r2-8.png

นั่นทำให้ผมตกตะลึง และยิ่งทำให้ผมตื่นเต้นกับ R2 มากขึ้นไปอีก เพราะถ้า R1 เกือบจะกลายเป็นหนึ่งในธุรกิจที่ดีที่สุดแล้ว R2 ก็แทบจะก้าวขึ้นไปอีกขั้นและประสบความสำเร็จมากกว่าเดิมอย่างแน่นอน คงจะน่าตื่นเต้นมากที่จะได้เห็น R2 ออกสู่ตลาดว่ามันยอดเยี่ยมแค่ไหน เทียบกับโมเดลอื่นๆ ได้อย่างไร และบริษัทอื่นๆ จะต้องพยายามไล่ตาม DeepSeek อย่างไร

ราคาที่เป็นธรรม

นอกจากนี้ยังมีปัจจัยด้านราคาอีกด้วย DeepSeek มีจำหน่ายในราคาที่ถูกกว่าโมเดล AI หลักๆ อื่นๆ ในตลาดอย่างมาก ฉันได้เปรียบเทียบแผนภูมิราคาในช่วงเวลาที่ R1 ออกสู่ตลาด และพบว่ามีความแตกต่างกันอย่างน่าตกตะลึง และผู้คนจำนวนมากก็เลิกสมัครใช้ OpenAI อย่างรวดเร็วและแห่กันมาใช้ DeepSeek เมื่อเห็นว่ามันดีและราคาถูกเพียงใด

เราเห็นว่า OpenAI ต้องลดแผนราคาลงอย่างรวดเร็ว เนื่องจาก DeepSeek ราคาถูกกว่าที่ OpenAI คิดราคาในขณะนั้นถึง 40 เท่า ซึ่งเมื่อคิดย้อนกลับไปแล้วก็ยังทำให้ผมรู้สึกทึ่งอยู่ดี

ดีพซีค-r2-9.png

แน่นอนว่าเราไม่ทราบมากนักเกี่ยวกับราคาของ R2 แต่ฉันไม่คาดหวังว่า DeepSeek จะเปลี่ยนกลยุทธ์มากเกินไปกับโมเดลใหม่นี้ มันยังคงเป็นตัวเลือกที่มีราคาไม่แพง ช่วยให้ผู้คนเข้าถึงเทคโนโลยี AI ขั้นสูงได้มากที่สุดโดยไม่ต้องจ่ายเงินจำนวนมากเป็นค่าธรรมเนียมรายเดือน

นอกจากนี้ เมื่อ DeepSeek เผยแพร่เครื่องมือใหม่เหล่านี้ในงานโอเพ่นซอร์ส ขีดจำกัดในการเข้าสู่การพัฒนา AI ก็ลดลงและถูกลง ดังนั้น R2 อาจมีราคาถูกกว่ารุ่น R1 เดิม ซึ่งจะส่งผลให้เกิดคลื่นยักษ์ไปทั่วโลก AI และไกลออกไป

เตรียมพร้อมสำหรับการเปิดตัว DeepSeek R2

โดยรวมแล้ว ฉันตื่นเต้นมากสำหรับการเปิดตัว R2 ที่กำลังจะมีขึ้นจาก DeepSeek สัญญาณทั้งหมดเป็นไปในทางบวก แสดงให้เห็นว่าโมเดลโอเพนซอร์สใหม่นี้จะดีขึ้น ไม่ใช่แค่ R1 เท่านั้น แต่ยังรวมถึงโมเดล AI อื่นๆ ที่เราเคยเห็นมาด้วย โมเดลนี้จะเร็วขึ้น ฉลาดขึ้น และเหนือกว่าในทุกด้าน และเราอาจได้ราคาที่ดีกว่าด้วย โปรดติดตามข่าวสารเพิ่มเติม

กระทู้ที่เกี่ยวข้อง

ดูเพิ่มเติม

บทความที่เกี่ยวข้อง