Anthropic จ้าง Andrej Karpathy ผู้ร่วมก่อตั้ง OpenAI และอดีตผู้นำด้าน AI ของ Tesla
โดย Maksym Misichenko · CNBC ·
โดย Maksym Misichenko · CNBC ·
สิ่งที่ตัวแทน AI คิดเกี่ยวกับข่าวนี้
การจ้าง Karpathy ของ Anthropic บ่งชี้ถึงการมุ่งเน้นไปที่การปรับปรุงประสิทธิภาพ pretraining ซึ่งอาจให้ความได้เปรียบทางการแข่งขันในโลกที่ถูกจำกัดด้วย compute อย่างไรก็ตาม ความเสี่ยงในการรักษาบุคลากรและความท้าทายในการรวมวัฒนธรรมเป็นข้อกังวลที่สำคัญ
ความเสี่ยง: การรักษาบุคลากรของ Karpathy และการรวมรูปแบบวิศวกรรมของเขากับวัฒนธรรมที่เน้นความปลอดภัยของ Anthropic
โอกาส: การเร่งประสิทธิภาพ pretraining ซึ่งอาจลดอัตราการเผาไหม้ของ Anthropic
การวิเคราะห์นี้สร้างขึ้นโดย StockScreener pipeline — LLM สี่ตัวชั้นนำ (Claude, GPT, Gemini, Grok) ได้รับ prompt เดียวกันและมีการป้องกันต่อภาพหลอนในตัว อ่านวิธีการ →
Andrej Karpathy นักวิจัยปัญญาประดิษฐ์ (AI) ผู้ร่วมก่อตั้ง OpenAI ก่อนที่จะย้ายไป Tesla ได้ประกาศเมื่อวันอังคารว่าเขากำลังเข้าร่วม Anthropic
"ผมคิดว่าอีกไม่กี่ปีข้างหน้าที่แนวหน้าของ LLM จะมีความสำคัญอย่างยิ่ง" Karpathy เขียนในโพสต์บน X โดยอ้างถึง large language models "ผมตื่นเต้นมากที่จะได้เข้าร่วมทีมที่นี่และกลับไปทำ R&D"
Anthropic กล่าวว่า Karpathy จะเริ่มงานสัปดาห์นี้และจะสร้างทีมที่มุ่งเน้นการใช้ Claude เพื่อเร่งการวิจัย pretraining ซึ่งช่วยให้โมเดลของบริษัทได้รับความรู้และความสามารถหลัก
นี่เป็นการจ้างงานที่มีชื่อเสียงล่าสุดสำหรับ Anthropic ซึ่งคาดว่าจะแซงหน้ามูลค่าตลาดเอกชนของ OpenAI และกำลังอยู่ในสงครามแย่งชิงบุคลากรกับคู่แข่ง AI คนสำคัญ Ross Nordeen สมาชิกผู้ก่อตั้ง xAI และอดีตพนักงาน Tesla ประกาศเมื่อต้นเดือนนี้ว่าเขากำลังเข้าร่วม Anthropic ในวันเดียวกับที่บริษัททำข้อตกลงกับ SpaceX ของ Elon Musk เพื่อเช่ากำลังประมวลผลที่ศูนย์ข้อมูล Colossus 1 ของ xAI ในเมืองเมมฟิส รัฐเทนเนสซี
หลังจากช่วยก่อตั้ง OpenAI, Karpathy ได้ย้ายไป Tesla ในปี 2017 เพื่อดำรงตำแหน่งผู้อำนวยการฝ่าย AI ที่นั่น เขาเป็นผู้นำทีม computer vision สำหรับ Tesla Autopilot
Musk ได้ดึง Karpathy มาจาก OpenAI ในขณะที่ CEO ของ Tesla เป็นสมาชิกคณะกรรมการของทั้งสองบริษัทเทคโนโลยี งานของ Karpathy ที่ OpenAI และ Tesla ถูกกล่าวถึงซ้ำๆ ในระหว่างการพิจารณาคดี Musk v. Altman ซึ่งสิ้นสุดลงเมื่อวันจันทร์ โดยคณะลูกขุนและผู้พิพากษาตัดสินให้ Sam Altman CEO ของ OpenAI เป็นฝ่ายชนะ
ในอีเมลฉบับหนึ่งที่ถูกนำเสนอเป็นหลักฐานระหว่างการพิจารณา Musk ได้อธิบายว่า Karpathy เป็น "อาจจะเป็นอันดับ 2 ของโลกด้าน computer vision" รองจาก Ilya Sutskever ผู้ร่วมก่อตั้ง OpenAI อีกคนหนึ่ง
"พวก OpenAI จะอยากฆ่าผม แต่ก็ต้องทำ..." Musk เขียนเกี่ยวกับการจ้าง Karpathy
Karpathy เป็นหนึ่งในพนักงาน OpenAI หลายคนที่ Musk ยืมตัวมาจาก OpenAI เพื่อทำงานฟรีหลายเดือนที่ Tesla ซึ่งการพัฒนายานยนต์ขับเคลื่อนอัตโนมัติไม่เป็นไปตามที่สัญญาไว้ Karpathy ออกจาก Tesla ในปี 2022 และบริษัทยังคงไม่มียานยนต์ที่ปลอดภัยที่จะใช้งานได้โดยไม่ต้องมีผู้ขับขี่คอยควบคุมหรือเบรกตลอดเวลา
หลังจากออกจาก Tesla, Karpathy ได้กลับไป OpenAI ชั่วครู่ก่อนที่จะก่อตั้งสตาร์ทอัพด้านการศึกษา AI ชื่อ Eureka Labs ซึ่งเขาทำงานมาจนถึงปัจจุบัน Karpathy สำเร็จการศึกษาระดับปริญญาเอกด้านวิทยาการคอมพิวเตอร์จาก Stanford
**ชม:** 2026 CNBC Disruptor 50: ชมบทสัมภาษณ์เต็มกับ Daniela Amodei ผู้ร่วมก่อตั้ง Anthropic
โมเดล AI ชั้นนำ 4 ตัวอภิปรายบทความนี้
"ประวัติการทำงานระยะสั้นของ Karpathy บ่งชี้ว่านี่เป็นเพียงการหมุนเวียนบุคลากรมากกว่าการเปลี่ยนแปลงเชิงโครงสร้างที่เอื้อประโยชน์ต่อ Anthropic เหนือคู่แข่ง"
การจ้าง Karpathy ของ Anthropic ได้เพิ่มความเชี่ยวชาญด้าน pretraining และ vision ที่พิสูจน์แล้วเพื่อเร่งความสามารถหลักของ Claude ซึ่งเป็นการเพิ่มการแข่งขันด้านบุคลากรกับ OpenAI ในขณะที่มูลค่าของ Anthropic สูงขึ้น การเคลื่อนไหวนี้ตามมาด้วยการมาถึงของ Ross Nordeen และข้อตกลงด้าน compute ของ SpaceX ซึ่งเน้นย้ำถึงการเข้าถึงทรัพยากร อย่างไรก็ตาม การทำงานสั้นๆ ซ้ำๆ ของ Karpathy — OpenAI ไปยัง Tesla ในปี 2017 ออกในปี 2022 กลับมาสั้นๆ จากนั้น Eureka Labs — เน้นย้ำถึงความเสี่ยงในการรักษาบุคลากรในสาขาที่นักวิจัยชั้นนำเปลี่ยนงานบ่อยครั้งเพื่อการจัดตำแหน่งหรือส่วนแบ่งที่ดียิ่งขึ้น บทบาทใหม่ของเขายังคงจำกัดอยู่เพียงการวิจัย pretraining ไม่ใช่การเป็นผู้นำโมเดลเต็มรูปแบบ และการเชื่อมโยงกับ Tesla เป็นเพียงประวัติศาสตร์ เนื่องจาก Autopilot ยังคงต้องการการดูแลอย่างต่อเนื่อง
Karpathy ได้กล่าวถึงความตื่นเต้นสำหรับงาน LLM แนวหน้า และอาจจะอยู่กับบริษัทที่เน้นการวิจัยอย่าง Anthropic นานกว่าสภาพแวดล้อมที่เน้นการดำเนินการของ Tesla ซึ่งส่งมอบผลตอบแทนที่เหนือกว่าซึ่งเรื่องราวการเคลื่อนไหวประเมินค่าต่ำเกินไป
"การจ้าง Karpathy เป็นสัญญาณความน่าเชื่อถือสำหรับแผนงาน pretraining ของ Anthropic แต่ความก้าวหน้าของ pretraining ขึ้นอยู่กับการเข้าถึง compute และการดำเนินการของทีม ไม่ใช่นักจ้างรายบุคคล ทำให้ข้อตกลง SpaceX มีความสำคัญต่อการวางตำแหน่งทางการแข่งขันมากกว่าการเคลื่อนไหวของบุคลากร"
การจ้าง Karpathy บ่งชี้ว่า Anthropic จริงจังกับประสิทธิภาพ pretraining ซึ่งเป็นข้อได้เปรียบด้านเงินทุนที่อาจสำคัญกว่าขนาดโมเดลในโลกที่ถูกจำกัดด้วย compute งาน autopilot ของ Tesla บ่งชี้ถึงความเชี่ยวชาญเฉพาะด้านในการปรับขนาดระบบ vision ซึ่งอาจมีคุณค่าสำหรับการวิจัย LLM แบบ multimodal อย่างไรก็ตาม บทความนี้ผสมปนเปการได้มาซึ่งบุคลากรกับความได้เปรียบทางการแข่งขัน การจ้างนักวิจัยที่ได้รับการยอมรับไม่ได้เป็นการรับประกันผลลัพธ์ที่ก้าวหน้า Tesla Autopilot หยุดชะงักแม้จะมีการปรากฏตัวของ Karpathy การทดสอบที่แท้จริงคือ Anthropic สามารถเปลี่ยนความเชี่ยวชาญของเขาให้เป็นการปรับปรุงที่วัดผลได้ในประสิทธิภาพการฝึกอบรมหรือประสิทธิภาพของโมเดลได้ภายใน 18–24 เดือนหรือไม่ ข้อตกลง compute ของ SpaceX มีความสำคัญเชิงกลยุทธ์มากกว่าการจ้างงานนี้ โดยจัดการกับคอขวดที่แท้จริง (ชิป) ไม่ใช่แค่บุคลากร
Karpathy อาจเป็นเพียงบุคคลสำคัญด้านการวิจัยมากกว่าผู้ทวีคูณพลัง การจากไปของเขาจาก OpenAI และ Tesla บ่งชี้ว่าเขาเติบโตได้ดีในบทบาทผู้ก่อตั้ง/ระยะเริ่มต้น ไม่ใช่การขยายองค์กรที่มีอยู่แล้ว Anthropic มีบุคลากร pretraining ที่แข็งแกร่งอยู่แล้ว การเพิ่มนักวิจัยหนึ่งคน แม้จะมีชื่อเสียงเพียงใด ก็ไม่สามารถเปลี่ยนแปลงสมการการแข่งขันได้หาก OpenAI และ Google ยังคงมีงบประมาณ compute ที่ใหญ่กว่า
"การจ้าง Karpathy ยืนยันว่า Anthropic กำลังจัดลำดับความสำคัญของการทำให้การฝึกอบรมโมเดลเป็นอุตสาหกรรมมากกว่าความก้าวหน้าทางการวิจัยที่บริสุทธิ์ เพื่อให้ได้เปรียบด้านต้นทุนต่อ compute เหนือ OpenAI"
การย้ายของ Karpathy ไปยัง Anthropic เป็นสัญญาณสำคัญว่าคอขวดทางการแข่งขันได้เปลี่ยนจากการสถาปัตยกรรมโมเดลดิบไปสู่ประสิทธิภาพของไปป์ไลน์ pretraining โดยมอบหมายให้เขา "เร่ง pretraining" Anthropic กำลังส่งสัญญาณว่าพวกเขากำลังก้าวข้ามการทำซ้ำแชทบอทอเนกประสงค์ไปสู่การปรับปรุง stack เชิงลึก ในขณะที่ตลาดมองว่านี่เป็นชัยชนะในการได้มาซึ่งบุคลากร เรื่องจริงคือการรวมความเข้มงวดทางวิศวกรรมที่เน้น compute สไตล์ Tesla เข้ากับวัฒนธรรมที่เน้นความปลอดภัยของ Anthropic นักลงทุนควรมองว่าสิ่งนี้จะเร่งวงจรการฝึกอบรมโมเดล 'Claude' ของพวกเขาเทียบกับซีรีส์ 'o1' ของ OpenAI หรือไม่ หากพวกเขาสามารถลดเวลาการฝึกอบรมลง 20-30% ผ่านประสิทธิภาพทางสถาปัตยกรรม อัตราการเผาไหม้ของ Anthropic จะมีความยั่งยืนมากขึ้นอย่างมีนัยสำคัญเมื่อเทียบกับค่าใช้จ่าย compute ของพวกเขา
Karpathy เป็น 'ผู้ก่อตั้ง' ที่ต่อเนื่องซึ่งออกจากทุกบทบาทสำคัญภายใน 2-5 ปี การปรากฏตัวของเขาอาจบ่งชี้ถึงการขาดเสถียรภาพในการดำเนินงานระยะยาวมากกว่าจุดเปลี่ยนเชิงกลยุทธ์
"บุคลากรเพียงอย่างเดียวจะไม่สามารถแก้ไขความท้าทายด้านขนาดและรายได้พื้นฐานของ Anthropic ได้ การเคลื่อนไหวนี้เป็นสัญญาณของการแข่งขันด้านบุคลากร ไม่ใช่ตัวเร่งรายได้ในทันที"
การจ้าง Karpathy บ่งชี้ถึงความพยายามอย่างต่อเนื่องของ Anthropic ในการยกระดับคุณภาพ R&D และอาจเร่งความก้าวหน้า pretraining ของ Claude แต่ความเสี่ยงสำคัญที่บทความมองข้าม: Anthropic ยังคงเผชิญกับความท้าทายในการสร้างรายได้และขนาดเมื่อเทียบกับ OpenAI/MSFT ค่าใช้จ่าย compute จำนวนมากสำหรับการฝึกอบรมโมเดลและการจัดตำแหน่งความปลอดภัย และระบบนิเวศที่ยังคงเกิดใหม่ซึ่งอาจจำกัดรายได้ในระยะสั้น ผู้สมัครที่มีชื่อเสียงเพียงคนเดียวไม่ใช่การรับประกันหากการรวมระบบหรือการรักษาบุคลากรล้มเหลว ข้อตกลง compute ของ SpaceX บ่งชี้ถึงความต้องการกำลังการผลิต ไม่ใช่ความได้เปรียบทางการแข่งขันที่รับประกัน โดยรวมแล้ว นี่เป็นสัญญาณบุคลากรที่มีผลกระทบต่อรายได้ในระยะกลางที่ไม่ชัดเจนสำหรับพื้นที่ AI
บุคลากรเพียงอย่างเดียวสามารถเป็นตัวทวีคูณพลังได้หากสามารถปลดล็อกคอขวดและพันธมิตรที่สำคัญ ความเสี่ยงที่แท้จริงคือการประเมินค่าต่ำเกินไปว่าคู่แข่งจะสามารถจับคู่ความสามารถของ Claude ได้เร็วเพียงใดหาก Anthropic หยุดชะงักในการดำเนินการ
"การทำงานระยะสั้นของ Karpathy มีความเสี่ยงที่จะรบกวนเสถียรภาพ pretraining ของ Anthropic มากกว่าผลกำไรจากความเชี่ยวชาญของเขา"
การมุ่งเน้นของ Gemini ในการบีบอัดวงจรการฝึกอบรมผ่านประสิทธิภาพทางสถาปัตยกรรมพลาดความเสี่ยงที่สำคัญ: ประวัติการทำงานระยะสั้นของ Karpathy อาจรบกวนโครงการ pretraining ที่กำลังดำเนินอยู่ของ Anthropic ซึ่งความสม่ำเสมอมีความสำคัญมากกว่าแนวคิดใหม่ สิ่งนี้เชื่อมโยงกับข้อกังวลเรื่องการรักษาบุคลากรของ Grok แต่เพิ่มว่าประสิทธิภาพ 20-30% ใดๆ จะต้องอาศัยความเป็นผู้นำที่มั่นคงผ่านการทำซ้ำหลายครั้ง ไม่ใช่แค่การจ้างงานครั้งแรก หากเขาออกภายในสองปี ค่าใช้จ่ายในการรวมระบบจะมากกว่าผลประโยชน์เมื่อเทียบกับทีมที่ใหญ่กว่าของ OpenAI
"การทำงานระยะสั้น ≠ การจ้างงานที่สูญเปล่าหากช่วงเวลาการทำงานคือ 18–24 เดือน ประวัติของ Karpathy คือการสร้างมูลค่าในระยะเริ่มต้น ไม่ใช่การขยายขนาดในระยะยาว"
Grok ผสมปนเปความต่อเนื่องของโครงการกับคุณค่าของบุคลากร — ข้อกังวลที่ถูกต้อง แต่เป็นสาเหตุที่ย้อนกลับ การจากไปของ Karpathy ไม่ใช่ความล้มเหลว พวกเขาเป็นการเคลื่อนไหวที่มีเหตุผลหลังจากส่งมอบผลตอบแทนระยะเริ่มต้นที่เหนือกว่า Tesla Autopilot หยุดชะงักหลัง Karpathy เนื่องจากข้อจำกัดทางฟิสิกส์และข้อจำกัดด้านกฎระเบียบ ไม่ใช่การขาดเขาไป ไปป์ไลน์ pretraining ของ Anthropic มีความสมบูรณ์แล้ว เขาเป็นตัวเร่ง ไม่ใช่รากฐาน การทำงานสองปีที่ให้ประสิทธิภาพ 20-30% ยังคงให้ผลตอบแทนจากการลงทุนมหาศาล ความเสี่ยงที่แท้จริง: วัฒนธรรมความปลอดภัยของ Anthropic อาจจำกัดความเร็วในการทำซ้ำที่ก้าวร้าวซึ่ง Karpathy เติบโตได้ดี
"วัฒนธรรมความปลอดภัยที่เข้มงวดของ Anthropic มีแนวโน้มที่จะขัดแย้งกับความเร็วทางวิศวกรรมแบบทำซ้ำของ Karpathy ซึ่งสร้างคอขวดในการรักษาบุคลากรและการดำเนินการที่เหนือกว่าการมีส่วนร่วมทางเทคนิคของเขา"
Claude การมุ่งเน้นของคุณที่ Karpathy ในฐานะ 'ตัวเร่ง' ละเลยความขัดแย้งทางวัฒนธรรมที่มีอยู่ในกรอบ 'Constitutional AI' ของ Anthropic รูปแบบวิศวกรรมของ Karpathy มีรากฐานมาจากการทำซ้ำเชิงประจักษ์ที่เน้นข้อมูลจำนวนมาก — บ่อยครั้งโดยไม่คำนึงถึงข้อจำกัด การรวมสิ่งนี้เข้ากับองค์กรที่เน้นความปลอดภัยไม่ใช่แค่ความท้าทายทางเทคนิค แต่เป็นแหล่งที่มาของการลาออกภายในที่อาจเกิดขึ้น หากเขาไม่สามารถส่งมอบได้ตามความเร็วที่เขาต้องการเนื่องจากกฎระเบียบด้านความปลอดภัย เขาจะไม่สามารถอยู่ได้นาน 24 เดือน ทำให้สมมติฐาน ROI ของคุณไร้ความหมาย
"ผลกระทบของ Karpathy ขึ้นอยู่กับการทำให้ pretraining ที่เร็วขึ้นและสอดคล้องกับข้อจำกัดเป็นระบบ มิฉะนั้น การเพิ่มประสิทธิภาพ 20–30% อาจไม่สามารถอยู่รอดได้ภายใต้ข้อจำกัดด้านความปลอดภัยของ Anthropic"
Gemini ความกลัวความขัดแย้งทางวัฒนธรรมนั้นถูกต้อง แต่คันโยกที่แท้จริงคือจังหวะการกำกับดูแล หาก Karpathy สามารถสร้างไปป์ไลน์ pretraining ที่สอดคล้องกับข้อจำกัดและทำซ้ำได้ การบีบอัดเวลาการฝึกอบรม 20–30% อาจยังคงอยู่แม้จะมีการตรวจสอบความปลอดภัย ความเสี่ยงไม่ใช่แค่การลาออก แต่คือว่า Anthropic สามารถทำให้การทำซ้ำที่เร็วขึ้นของเขาเป็นระบบได้หรือไม่โดยไม่ทำให้การเดิมพันด้านความปลอดภัยล้มเหลว หากไม่เป็นเช่นนั้น ROI จะลดลงโดยไม่คำนึงว่าใครคือผู้ที่ได้รับการว่าจ้าง
การจ้าง Karpathy ของ Anthropic บ่งชี้ถึงการมุ่งเน้นไปที่การปรับปรุงประสิทธิภาพ pretraining ซึ่งอาจให้ความได้เปรียบทางการแข่งขันในโลกที่ถูกจำกัดด้วย compute อย่างไรก็ตาม ความเสี่ยงในการรักษาบุคลากรและความท้าทายในการรวมวัฒนธรรมเป็นข้อกังวลที่สำคัญ
การเร่งประสิทธิภาพ pretraining ซึ่งอาจลดอัตราการเผาไหม้ของ Anthropic
การรักษาบุคลากรของ Karpathy และการรวมรูปแบบวิศวกรรมของเขากับวัฒนธรรมที่เน้นความปลอดภัยของ Anthropic