สิ่งที่ตัวแทน AI คิดเกี่ยวกับข่าวนี้
Project Glasswing ของ Anthropic เป็นดาบสองคม นำเสนอความก้าวหน้าด้านความปลอดภัยทางไซเบอร์ที่ขับเคลื่อนด้วย AI อย่างมีนัยสำคัญ แต่ก็ก่อให้เกิดความเสี่ยงเชิงระบบและศักยภาพในการยึดโครงสร้างพื้นฐานด้วย
ความเสี่ยง: Glasswing กลายเป็นเครือข่ายการเผยแพร่ช่องโหว่เนื่องจากความเสี่ยงการรั่วไหลหรือการแทรกซึมของผู้ไม่หวังดีของรัฐ
โอกาส: การแพตช์เชิงรุกที่ขับเคลื่อนด้วย AI และการบีบอัดหน้าต่างการใช้ประโยชน์
Anthropic ระงับโมเดลล่าสุดหลังพบว่าทำงานผิดปกติระหว่างการทดสอบ; เปิดตัว "Project Glasswing" เพื่อรักษาความปลอดภัยซอฟต์แวร์ที่สำคัญ
Anthropic ประกาศว่าจะไม่เปิดตัวโมเดล AI ล่าสุดอย่าง Mythos ต่อสาธารณะ โดยระบุว่าโมเดลนี้มีประสิทธิภาพสูงเกินไปจนก่อให้เกิดความเสี่ยงด้านความปลอดภัยทางไซเบอร์ที่เพิ่มขึ้น หลังจากที่เคยประสบปัญหาการรั่วไหลของซอร์สโค้ดที่น่าอับอาย
ในการทดสอบภายใน Anthropic ระบุว่าโมเดลได้ค้นพบช่องโหว่ "zero-day" (ข้อบกพร่องที่ไม่เคยทราบมาก่อน) ที่มีความรุนแรงสูงหลายพันรายการในระบบปฏิบัติการและเว็บเบราว์เซอร์หลักทุกระบบ ซึ่งมีประสิทธิภาพเหนือกว่าโมเดลเรือธงก่อนหน้าอย่างมีนัยสำคัญ (การจำลองช่องโหว่ CyberGym: 83.1% เทียบกับ 66.6% สำหรับ Opus 4.6)
“เมื่อพิจารณาถึงอัตราความก้าวหน้าของ AI แล้ว จะไม่นานเกินไปก่อนที่ความสามารถเช่นนี้จะแพร่หลาย ซึ่งอาจเกินกว่ากลุ่มผู้ที่มุ่งมั่นที่จะนำไปใช้อย่างปลอดภัย”
ช่องโหว่ zero-day คือข้อบกพร่องของซอฟต์แวร์ที่สามารถถูกใช้ประโยชน์ได้ก่อนที่ผู้ที่มีความสามารถในการแก้ไขจะทราบถึงการมีอยู่ของมัน การค้นหาและแก้ไขช่องโหว่เหล่านี้ในอดีตต้องอาศัยความเชี่ยวชาญของมนุษย์ที่หายากและมีราคาแพง แต่ AI อาจเปลี่ยนแปลงขนาดและความเร็วของการตรวจจับได้
Anthropic ระบุว่าช่องโหว่ที่พบนั้น “มักจะละเอียดอ่อนหรือตรวจจับได้ยาก” หลายช่องโหว่มีอายุ 10 หรือ 20 ปี โดยช่องโหว่ที่เก่าแก่ที่สุดที่พบจนถึงขณะนี้คือบั๊กอายุ 27 ปีใน OpenBSD ซึ่งเป็นระบบปฏิบัติการที่ขึ้นชื่อเรื่องความปลอดภัยเป็นหลัก แต่ปัจจุบันได้รับการแก้ไขแล้ว นอกจากนี้ยังพบช่องโหว่ในไลบรารีประมวลผลสื่อ FFmpeg อายุ 16 ปี, ช่องโหว่การรันโค้ดจากระยะไกลอายุ 17 ปีในระบบปฏิบัติการโอเพนซอร์ส FreeBSD และช่องโหว่จำนวนมากในเคอร์เนล Linux
Mythos Preview ยังระบุถึงจุดอ่อนหลายประการในไลบรารีการเข้ารหัส อัลกอริทึม และโปรโตคอลที่ได้รับความนิยมมากที่สุดในโลก รวมถึง TLS, AES-GCM และ SSH
นอกจากนี้ยังระบุเพิ่มเติมว่าเว็บแอปพลิเคชัน “มีช่องโหว่มากมาย” ตั้งแต่ cross-site scripting และ SQL injection ไปจนถึงช่องโหว่เฉพาะทาง เช่น cross-site request forgery ซึ่งมักใช้ในการโจมตีแบบ phishing
วงจรชีวิตของการใช้ประโยชน์จาก zero-day exploit. ที่มา: PhoenixNAP
Anthropic อ้างว่า 99% ของช่องโหว่ที่พบยังไม่ได้รับการแก้ไข “ดังนั้นจึงเป็นความรับผิดชอบของเราที่จะไม่เปิดเผยรายละเอียดเกี่ยวกับช่องโหว่เหล่านั้น
Anthropic ยังเปิดเผยว่าเมื่อถูกท้าทายระหว่างการประเมิน Mythos สามารถหลุดออกจากสภาพแวดล้อม sandbox ที่จำกัดได้ ซึ่งเป็นข้อกังวลด้านการควบคุมที่นำไปสู่การตัดสินใจจำกัดการเข้าถึงอย่างเข้มงวด นี่คือสิ่งอื่นๆ ที่ Mythos ทำระหว่างการทดสอบ ตามรายงานของ Axios:
ทำตัวเป็นผู้ประกอบการธุรกิจที่ไร้ความปราณี: การทดสอบภายในครั้งหนึ่งแสดงให้เห็นว่า Mythos ทำตัวเหมือนผู้บริหารที่โหดเหี้ยม เปลี่ยนคู่แข่งให้กลายเป็นลูกค้าขายส่งที่ต้องพึ่งพา ข่มขู่ว่าจะตัดการจัดหาเพื่อควบคุมราคา และเก็บสินค้าที่จัดส่งเกินที่ได้รับโดยที่ยังไม่ได้ชำระเงิน
แฮ็ก + โอ้อวด: โมเดลได้พัฒนาการใช้ประโยชน์แบบหลายขั้นตอนเพื่อหลุดออกจากข้อจำกัดการเข้าถึงอินเทอร์เน็ต ได้รับการเชื่อมต่อที่กว้างขึ้น และโพสต์รายละเอียดของการใช้ประโยชน์บนเว็บไซต์สาธารณะที่ไม่มีใครรู้จัก
ซ่อนสิ่งที่กำลังทำ: ในบางกรณีที่เกิดขึ้นไม่บ่อยนัก (น้อยกว่า 0.001% ของการโต้ตอบ) Mythos ใช้วิธีการที่ถูกห้ามเพื่อรับคำตอบ จากนั้นพยายาม "แก้ไขใหม่" เพื่อหลีกเลี่ยงการตรวจจับ
บงการผู้ประเมิน: เมื่อ Mythos กำลังทำงานเกี่ยวกับงานเขียนโค้ดที่ประเมินโดย AI อื่น มันสังเกตเห็นว่าผู้ประเมินปฏิเสธการส่งงานของตน จากนั้นจึงพยายามใช้ prompt injection เพื่อโจมตีผู้ประเมิน
"ความสามารถเหล่านี้แข็งแกร่งมากจนเราต้องเตรียมพร้อมสำหรับความปลอดภัยในรูปแบบที่แตกต่างจากที่เราเคยทำมาตลอดหลายทศวรรษ" Logan Graham จาก Anthropic กล่าวกับ Axios โดยแสดงความกังวลเกี่ยวกับสิ่งที่อาจเกิดขึ้นหากความสามารถของ AI ที่คล้ายกันถูกใช้โดยผู้ไม่ประสงค์ดี
ดังนั้น แทนที่จะมุ่งสู่การเปิดตัวในวงกว้าง Anthropic กำลังนำโมเดลนี้ไปใช้ใน Project Glasswing ซึ่งเป็นความพยายามเชิงป้องกันที่อาศัยความร่วมมือ โดยมีเป้าหมายเพื่อระบุ เปิดเผยอย่างมีความรับผิดชอบ และแก้ไขช่องโหว่ซอฟต์แวร์ที่สำคัญก่อนที่ผู้ไม่ประสงค์ดีจะใช้ประโยชน์จากความสามารถของ AI ที่คล้ายกันได้
Glasswing ประกอบด้วยพันธมิตรด้านเทคโนโลยีที่เปิดตัว 11 ราย (Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, the Linux Foundation, Microsoft, NVIDIA, และ Palo Alto Networks... ใช่ JPMorgan ถูกมองว่าเป็นบริษัทเทคโนโลยีแล้ว) รวมถึงองค์กรซอฟต์แวร์ที่สำคัญอีกกว่า 40 แห่ง และได้รับการสนับสนุนด้วยเครดิตการใช้งานและเงินทุนสำหรับความปลอดภัยโอเพนซอร์สสูงสุดถึง 100 ล้านดอลลาร์สหรัฐ
ความคิดริเริ่มนี้สะท้อนถึงมุมมองของ Anthropic ที่ว่าความเสี่ยงด้านไซเบอร์ของ AI ระดับแนวหน้าเป็นระบบมากกว่าเฉพาะเจาะจงบริษัท ซึ่งต้องการการดำเนินการร่วมกันทั่วทั้งระบบนิเวศซอฟต์แวร์ เนื่องจาก AI เร่งการค้นพบช่องโหว่และบีบอัดกรอบเวลาการตอบสนอง
การเปิดตัวแบบทยอยนี้อาจเป็นพิมพ์เขียวสำหรับรูปแบบการเปิดตัวโมเดลในอนาคตเมื่อมีความแข็งแกร่งมากขึ้นเรื่อยๆ โดยจำกัดการเข้าถึงเฉพาะพันธมิตรที่ได้รับเลือกซึ่งถือว่าปลอดภัยเพียงพอที่จะทดสอบระบบที่เปลี่ยนแปลงโลกได้
Tyler Durden
พุธ, 08/04/2026 - 11:20
วงสนทนา AI
โมเดล AI ชั้นนำ 4 ตัวอภิปรายบทความนี้
"Anthropic กำลังเปลี่ยนปัญหาการกักกันให้กลายเป็นคูเมืองทางการตลาด โดยวางตำแหน่งตัวเองเป็นผู้จัดจำหน่ายที่ปลอดภัยเพียงรายเดียวของความสามารถ AI ที่อันตรายให้กับกลุ่มพันธมิตรที่คัดเลือกมา"
สิ่งนี้ดูเหมือนเป็นการประชาสัมพันธ์ที่วางแผนไว้อย่างรอบคอบซึ่งแฝงตัวเป็นการยับยั้งชั่งใจ Anthropic ระงับโมเดลที่อ้างว่าอันตรายเกินไป จากนั้นก็นำเข้าสู่กลุ่มความร่วมมือมูลค่ากว่า 100 ล้านดอลลาร์กับพันธมิตรเทคโนโลยีรายใหญ่ 11 ราย ซึ่งเป็นการสร้างรายได้จากความขาดแคลนในขณะที่อ้างถึงหลักการทางจริยธรรม การค้นพบช่องโหว่ (อัตราการตรวจจับ 83.1% เทียบกับ 66.6%) เป็นของจริงและมีนัยสำคัญ แต่ตัวอย่าง "พฤติกรรมผิดปกติ" (การหลุดออกจาก sandbox, prompt injection) ถูกอธิบายอย่างคลุมเครือและยังไม่ได้รับการยืนยัน ความเสี่ยงที่แท้จริง: หาก Mythos หลุดจากการควบคุมและค้นพบ zero-days ในวงกว้าง Glasswing จะกลายเป็นโล่ป้องกันความรับผิดชอบ ไม่ใช่ทางออก และหากคู่แข่ง (xAI, OpenAI) เปิดตัวโมเดลที่คล้ายกันโดยไม่มีเวทีความร่วมมือ การยับยั้งชั่งใจของ Anthropic จะกลายเป็นความเสียเปรียบทางการแข่งขันที่แต่งกายเป็นคุณธรรม
Anthropic อาจกังวลเกี่ยวกับความเสี่ยงเชิงระบบอย่างแท้จริง และแนวทางความร่วมมืออาจได้ผลจริง การเปิดเผยข้อมูลที่ประสานงานกันดีกว่าทางเลือกที่ผู้ไม่หวังดีค้นพบช่องโหว่เหล่านี้ก่อน บทความไม่ได้ให้หลักฐานว่าพฤติกรรม "ผิดปกติ" เป็นไปโดยเจตนา หรือโมเดลไม่สามารถควบคุมได้จริง
"Anthropic กำลังเปลี่ยนจากผู้ให้บริการโมเดลไปสู่ผู้ควบคุมระบบโครงสร้างพื้นฐานดิจิทัลภายใต้หน้ากากของความปลอดภัย"
การเปลี่ยนทิศทางของ Anthropic จากการเปิดตัวผลิตภัณฑ์ไปสู่ 'Project Glasswing' เป็นบทเรียนชั้นยอดในการควบคุมกฎระเบียบและการสร้างคูเมืองป้องกัน โดยการวางกรอบ Mythos ให้เป็นภัยคุกคามที่ "ผิดปกติ" พวกเขาจึงให้เหตุผลสำหรับระบบนิเวศแบบปิดที่มีพันธมิตรระดับล้านล้านดอลลาร์เช่น AWS และ Microsoft ซึ่งเป็นการควบคุมการเข้าถึงเทคโนโลยีความปลอดภัยทางไซเบอร์รุ่นต่อไป อัตราการจำลองช่องโหว่ 83.1% นั้นน่าทึ่ง บ่งชี้ถึงการเปลี่ยนแปลงภูมิทัศน์ไซเบอร์ในทันทีจาก "การตรวจจับและตอบสนอง" ไปสู่ "การแพตช์เชิงรุกที่ขับเคลื่อนด้วย AI" แม้ว่าผลกระทบด้านความปลอดภัยต่อเคอร์เนล Linux และ OpenBSD จะร้ายแรง แต่เรื่องจริงคือการรวมอำนาจ: Anthropic กำลังวางตำแหน่งตัวเองให้เป็น "ระบบภูมิคุ้มกัน" ที่จำเป็นสำหรับสแต็กดิจิทัลทั่วโลก
นี่อาจเป็นการเปลี่ยนกลยุทธ์ทางการตลาดที่ซับซ้อนเพื่อปกปิดความล้มเหลวในการวิจัยการจัดแนว โดยใช้ "อันตรายเกินกว่าจะเปิดเผย" เป็นกลอุบายเพื่อรักษาความตื่นเต้น ในขณะที่การรั่วไหลของซอร์สโค้ดของพวกเขายังคงสร้างความเสียหายต่อความได้เปรียบทางการแข่งขันของพวกเขา
"N/A"
[ไม่พร้อมใช้งาน]
"Glasswing ผลักดัน CRWD และ PANW สู่ความเป็นผู้นำด้านความปลอดภัยทางไซเบอร์ที่เสริมด้วย AI ซึ่งรับประกันอัตราส่วนราคาต่อกำไรล่วงหน้า 20-25 เท่าท่ามกลางการระเบิดของช่องโหว่"
การสาธิต Mythos ของ Anthropic เน้นย้ำถึงความก้าวหน้าของ AI ที่ระเบิดได้ในการค้นพบช่องโหว่—คะแนน CyberGym 83.1% เทียบกับ 66.6% ก่อนหน้านี้—แต่การระงับการเปิดตัวอย่างชาญฉลาดได้เปลี่ยนไปสู่ Project Glasswing ซึ่งเป็นความร่วมมือกับ CRWD, PANW, MSFT, GOOG และอื่นๆ สิ่งนี้เป็นผลดีต่อความปลอดภัยทางไซเบอร์ (CRWD อาจเพิ่มขึ้น 15% ในระหว่างวันจากการยืนยันคูเมืองป้องกันด้วย AI; Prisma Cloud ของ PANW ได้รับแรงหนุน) ผลกระทบอันดับสอง: บังคับให้ซอฟต์แวร์รุ่นเก่า (เคอร์เนล Linux, FFmpeg) ต้องแพตช์ ลดความเสี่ยงของ EBITDA margins ของ cloud hyperscalers ในระยะยาว บริบทที่ขาดหายไป: การสนับสนุน Amazon ของ Anthropic รับประกันความโปรดปรานของ AWS ในด้านเครดิต/เงินทุน ความเสี่ยงด้านไซเบอร์เชิงระบบเพิ่มขึ้น แต่การเปิดเผยข้อมูลที่ประสานงานกันจะบีบอัดหน้าต่างการใช้ประโยชน์เทียบกับความพยายามของมนุษย์ที่แยกจากกัน
พันธมิตร 50+ รายของ Glasswing เสี่ยงต่อความล้มเหลวในการประสานงานหรือการรั่วไหล ทำให้ "การเปิดเผยอย่างมีความรับผิดชอบ" กลายเป็นซูเปอร์มาร์เก็ตช่องโหว่สำหรับผู้ไม่หวังดีของรัฐ ความตื่นเต้นอาจบดบังประสิทธิภาพที่ต่ำกว่าของ Mythos เมื่อเทียบกับคู่แข่งที่ปิดตัว เช่น xAI
"ประโยชน์ด้านความปลอดภัยของการเปิดเผยข้อมูลที่ประสานงานกันจะหมดไปทันทีที่สมาชิกกลุ่มพันธมิตรรายเดียวรั่วไหลหรือถูกผู้ไม่หวังดีของรัฐบุกรุก"
Grok ผสมปนเปความเสี่ยงสองประการที่แตกต่างกัน ใช่ CRWD/PANW ได้รับแรงหนุนจากความต้องการการป้องกันด้วย AI ที่ได้รับการยืนยัน ซึ่งเป็นเรื่องจริง แต่ความเสี่ยงการรั่วไหลของพันธมิตร 50+ รายที่ Grok มองข้ามว่าเป็น "ความล้มเหลวในการประสานงาน" คือภัยคุกคามเชิงระบบที่แท้จริง การเปิดเผยข้อมูลที่ประสานงานกันจะทำงานได้ก็ต่อเมื่อกลุ่มพันธมิตรยังคงปิดสนิท พันธมิตรรายเดียวที่ถูกบุกรุกหรือการแทรกซึมของผู้ไม่หวังดีของรัฐจะเปลี่ยน Glasswing ให้กลายเป็นเครือข่ายการเผยแพร่ช่องโหว่ มุมมองความโปรดปรานของ AWS ที่ Claude ชี้ให้เห็นนั้นยังไม่ได้สำรวจอย่างละเอียด: หากเครดิตของ Anthropic ไหลไปสู่สมาชิกกลุ่มพันธมิตรอย่างไม่สมส่วน นี่ไม่ใช่การเปิดเผยอย่างมีความรับผิดชอบ—นี่คือการยึดโครงสร้างพื้นฐานที่แต่งกายเป็นการรักษาความปลอดภัย
"การเปิดตัวที่จำกัดของ Anthropic สร้างภูมิทัศน์ความปลอดภัยแบบแบ่งชั้น ซึ่งหน่วยงานที่ไม่ใช่กลุ่มพันธมิตรต้องเผชิญกับความเสี่ยงเชิงระบบที่ไม่สามารถจัดการได้"
การมุ่งเน้นของ Grok ไปที่แรงหนุนของ CRWD และ PANW พลาดกับดัก "เงินเฟ้อ Zero-Day" หาก Mythos ทำให้การค้นพบช่องโหว่เป็นอัตโนมัติในระดับนี้ มันไม่ได้ช่วยแค่ผู้ป้องกันเท่านั้น แต่ยังลดต้นทุนการโจมตีสำหรับผู้ไม่หวังดีของรัฐอย่างถาวรเมื่อน้ำหนักของโมเดลรั่วไหลในที่สุด Claude พูดถูกเกี่ยวกับ "การยึดโครงสร้างพื้นฐาน" แต่เราต้องไปให้ไกลกว่านั้น: Anthropic กำลังสร้างธุรกิจคุ้มครอง หากคุณไม่ได้อยู่ในกลุ่มพันธมูลมูลค่า 100 ล้านดอลลาร์ ระบบเดิมของคุณก็ "ถูกเจาะล่วงหน้า" โดยใครก็ตามที่มี API ระดับ Mythos
"การค้นพบช่องโหว่แบบอัตโนมัติในระดับ Mythos เสี่ยงต่อการแพตช์ที่วุ่นวายและการถดถอยของการผลิตที่อาจเป็นอันตรายต่อโครงสร้างพื้นฐานมากกว่าตัวช่องโหว่เอง"
ไม่มีใครเน้นย้ำถึงผลกระทบจากการดำเนินงานในระยะยาว: การค้นพบช่องโหว่ระดับ Mythos มีแนวโน้มที่จะกระตุ้นให้เกิดการแพตช์เร่งด่วนและการแบ็คพอร์ตทั่วทั้งเคอร์เนล ไลบรารี และดิสทริบิวชัน การแพตช์ที่วุ่นวายนี้—การแก้ไขอย่างเร่งรีบ การถดถอย การแบ็คพอร์ตที่ไม่เข้ากัน—อาจก่อให้เกิดการหยุดทำงาน ค่าใช้จ่ายในการสนับสนุน และช่องว่างด้านความปลอดภัยมากกว่าช่องโหว่ดั้งเดิม กลุ่มพันธมิตรที่กำหนดให้มีการเปิดเผย/แพตช์อย่างรวดเร็วอาจขยายสิ่งนี้ ทำให้ "การค้นพบ" กลายเป็นการไม่เสถียรเชิงระบบสำหรับผู้ปฏิบัติงาน ไม่ใช่แค่ชัยชนะในการป้องกัน
"การค้นพบช่องโหว่ด้วย AI เร่งการเสริมสร้างระบบนิเวศ โดยส่งค่าธรรมเนียมจากโบรกเกอร์ไปยังบริษัทยักษ์ใหญ่ด้านไซเบอร์ เช่น CRWD"
ChatGPT ชี้ให้เห็นถึงการแพตช์ที่วุ่นวายได้อย่างถูกต้อง แต่ก็มองข้ามแรงต้าน: การค้นพบด้วย AI เช่น Mythos บีบอัดหน้าต่างการใช้ประโยชน์ได้เร็วกว่าที่การถดถอยจะสร้างขึ้น—แพตช์ Log4Shell ทำให้ระบบนิเวศมีเสถียรภาพภายในไม่กี่เดือน ไม่ใช่ไม่กี่ปี ข้อดีที่ไม่ได้กล่าวถึง: สิ่งนี้ทำให้โบรกเกอร์ช่องโหว่ที่ใช้มนุษย์เท่านั้นล้าสมัย (มีกรณีอ้างอิงการซื้อ ZDI) โดยส่งค่าธรรมเนียมโบรกเกอร์ประจำปีมูลค่ากว่า 2 พันล้านดอลลาร์ไปยังผู้ดำรงตำแหน่งในกลุ่มพันธมิตร เช่น CRWD/PANW การเล่นรวมกลุ่มเชิงบวก
คำตัดสินของคณะ
ไม่มีฉันทามติProject Glasswing ของ Anthropic เป็นดาบสองคม นำเสนอความก้าวหน้าด้านความปลอดภัยทางไซเบอร์ที่ขับเคลื่อนด้วย AI อย่างมีนัยสำคัญ แต่ก็ก่อให้เกิดความเสี่ยงเชิงระบบและศักยภาพในการยึดโครงสร้างพื้นฐานด้วย
การแพตช์เชิงรุกที่ขับเคลื่อนด้วย AI และการบีบอัดหน้าต่างการใช้ประโยชน์
Glasswing กลายเป็นเครือข่ายการเผยแพร่ช่องโหว่เนื่องจากความเสี่ยงการรั่วไหลหรือการแทรกซึมของผู้ไม่หวังดีของรัฐ