Google เปิดตัวโมเดล AI ใหม่ เอเจนต์ AI ส่วนบุคคล ในความพยายามที่จะตามให้ทัน OpenAI และ Anthropic
โดย Maksym Misichenko · CNBC ·
โดย Maksym Misichenko · CNBC ·
สิ่งที่ตัวแทน AI คิดเกี่ยวกับข่าวนี้
คณะกรรมการแบ่งออกเป็นสองฝ่ายเกี่ยวกับกลยุทธ์ AI Gemini ของ Google ในขณะที่บางคนมองเห็นศักยภาพในการเพิ่มการมีส่วนร่วมของผู้ใช้และโอกาสในการสร้างรายได้ใหม่ๆ คนอื่นๆ เตือนถึงความเสี่ยงของการบีบอัดอัตรากำไร การขาดเมตริกการยอมรับของผู้ใช้ และอุปสรรคด้านกฎระเบียบ
ความเสี่ยง: การบีบอัดอัตรากำไรเนื่องจากการทำงานอัตโนมัติของ agent ลดการแสดงผลโฆษณาและคลิก รวมถึงความท้าทายด้านกฎระเบียบสำหรับงานที่ดำเนินการโดย agent และสื่อสังเคราะห์
โอกาส: การมีส่วนร่วมของผู้ใช้ที่เพิ่มขึ้น ช่องทางการสร้างรายได้โฆษณา/ผลิตภัณฑ์ใหม่ และข้อตกลงระดับองค์กรที่อาจเกิดขึ้นซึ่งขับเคลื่อนโดยเศรษฐศาสตร์ AI ที่ถูกกว่า
การวิเคราะห์นี้สร้างขึ้นโดย StockScreener pipeline — LLM สี่ตัวชั้นนำ (Claude, GPT, Gemini, Grok) ได้รับ prompt เดียวกันและมีการป้องกันต่อภาพหลอนในตัว อ่านวิธีการ →
Google กำลังเปิดตัว Gemini เวอร์ชันล่าสุดและโมเดลปัญญาประดิษฐ์ใหม่ที่ออกแบบมาเพื่อจำลองโลกทางกายภาพ ในขณะที่ยักษ์ใหญ่ด้านการค้นหากำลังแข่งขันเพื่อตามให้ทันในการพัฒนาโมเดล พร้อมทั้งให้บริการแบบเอเจนต์แก่ฐานผู้ใช้จำนวนมหาศาล
บริษัทได้ประกาศข่าวนี้ในการประชุมนักพัฒนาประจำปี Google I/O เมื่อวันอังคาร โดยได้รับความสนใจสำหรับผลิตภัณฑ์ใหม่ที่เปิดตัว ในขณะที่ตลาดกำลังให้ความสนใจกับการประเมินมูลค่าที่พุ่งสูงขึ้นของ OpenAI และ Anthropic ซึ่งทั้งสองบริษัทกำลังเตรียมพร้อมสำหรับการเสนอขายหุ้น IPO ในปีนี้
หัวใจสำคัญของกลยุทธ์ AI ของ Google คือ Gemini ซึ่งเป็นชุดโมเดลและเครื่องมือของบริษัท บริษัทกำลังนำเสนอ Gemini 3.5 Flash ซึ่งเป็นส่วนเสริมที่มีน้ำหนักเบาของชุดผลิตภัณฑ์ ซึ่งมีความสามารถที่ทันสมัยในราคาครึ่งหนึ่ง หรือในบางกรณีใกล้เคียงหนึ่งในสามของราคาโมเดลชั้นนำที่เทียบเคียงกันได้ ตามคำกล่าวของ CEO Sundar Pichai
ในการแถลงข่าวกับนักข่าว ก่อนงานเมื่อวันอังคาร Pichai กล่าวว่า Gemini 3.5 Flash "รวดเร็วอย่างน่าทึ่ง" บริษัทกล่าวว่า 3.5 Flash จะเป็นโมเดลเริ่มต้นสำหรับแอป Gemini และโหมด AI ในการค้นหาทั่วโลก
"คุณไม่ต้องแลกคุณภาพกับความหน่วงอีกต่อไป" Google กล่าวในบล็อกโพสต์ บริษัทกล่าวว่าได้เสริมการป้องกันความปลอดภัยทางไซเบอร์สำหรับ Gemini 3.5 Flash เพื่อให้ "มีโอกาสน้อยที่จะสร้างเนื้อหาที่เป็นอันตรายและปฏิเสธที่จะตอบคำถามที่ปลอดภัยโดยไม่ได้ตั้งใจ"
Google กล่าวว่า Gemini 3.5 Pro ซึ่งเป็นเวอร์ชันที่มีน้ำหนักมากกว่า กำลังถูกใช้งานภายใน แต่จะยังไม่พร้อมสำหรับการเผยแพร่ในวงกว้างจนถึงเดือนหน้า
ในด้าน AI แบบเอเจนต์ Google ได้ประกาศ Gemini Spark ซึ่งเป็นเอเจนต์ AI อเนกประสงค์ใหม่ในแอป Gemini ที่สามารถให้เหตุผลเกี่ยวกับข้อมูลในแอปที่เชื่อมต่อกัน Google กล่าวว่าต้องการช่วยผู้ใช้ในการนำทางชีวิตดิจิทัลของพวกเขาโดย "ดำเนินการแทนคุณภายใต้ทิศทางของคุณ" Gemini Spark อยู่ในรุ่นเบต้าและจะพร้อมใช้งานก่อนสำหรับผู้ทดสอบที่เชื่อถือได้และสมาชิก Google AI Ultra โดยเริ่มสัปดาห์หน้า
เมื่อผู้ใช้อินเทอร์เน็ตจำนวนมากขึ้นหันไปหาแชทบอท Google กำลังพยายามโน้มน้าวผู้ใช้การค้นหาแบบดั้งเดิมว่าสามารถเชื่อถือได้ในการช่วยเหลืองานที่ต้องใช้การป้อนข้อมูลน้อยที่สุด หลังจากการใช้จ่ายด้านทุนของบริษัทที่พุ่งสูงขึ้น Wall Street กำลังมองหา Google เพื่อแสดงให้เห็นว่าสามารถสร้างการผสานรวมที่ลึกซึ้งยิ่งขึ้นในผลิตภัณฑ์ต่างๆ ได้ และเอเจนต์อาจเป็นหนทางในการทำเช่นนั้น
ความคาดหวังสำหรับบริษัท AI ยังคงเพิ่มขึ้น โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงโมเดล Mythos ที่เพิ่งเปิดตัวของ Anthropic ซึ่งกล่าวกันว่ามีประสิทธิภาพมากจนพบช่องโหว่ที่ไม่เคยมีมาก่อนหลายพันรายการในโครงสร้างพื้นฐานซอฟต์แวร์ของโลก
กลุ่มผลิตภัณฑ์ AI ของ Google ตอนนี้รวมถึง Omni ซึ่งเป็นโมเดลโลกที่ออกแบบมาเพื่อจำลองสภาพแวดล้อมทางกายภาพ โดยคาดการณ์ว่าจะเกิดอะไรขึ้นต่อไปตามการกระทำของผู้ใช้ โมเดลโลกมักใช้ในหุ่นยนต์และเกม และได้รับการวิจัยอย่างหนักโดย DeepMind ตลอดหลายปีที่ผ่านมา
Omni จะทำงานใน Flash, Gemini App, Google Flow และ YouTube shorts โดยรองรับภาพและเสียง บริษัทกล่าว พร้อมเสริมในบล็อกโพสต์แยกต่างหากว่าผู้ใช้สามารถให้ Omni แก้ไขวิดีโอและสร้างภาพที่สมจริงยิ่งขึ้น
"นำวิดีโอที่คุณถ่ายมา แล้วแค่ขอให้ Omni เปลี่ยนสิ่งที่กำลังเกิดขึ้น" โพสต์กล่าว AI สามารถ "แก้ไขการกระทำ เพิ่มตัวละครหรือวัตถุใหม่"
โมเดล AI ชั้นนำ 4 ตัวอภิปรายบทความนี้
"Google กำลังจัดลำดับความสำคัญของการผสานรวมที่คุ้มค่าเหนือกว่าความเป็นเลิศของโมเดลระดับแนวหน้า ซึ่งจะจำกัดศักยภาพในการปรับราคาในระยะสั้น แม้จะมีการประกาศก็ตาม"
การเปิดตัว Gemini 3.5 Flash เริ่มต้นของ Google และ Gemini Spark agent beta มุ่งเป้าไปที่การผสานรวมที่ลึกซึ้งยิ่งขึ้นใน Search และแอป โดยมีเป้าหมายเพื่อเปลี่ยนผู้ใช้แบบดั้งเดิมให้เป็นผู้ทำงาน AI ให้สำเร็จ อย่างไรก็ตาม การเลื่อน 3.5 Pro ที่มีน้ำหนักมากกว่าออกไปจนถึงเดือนหน้า การเน้นที่ราคาที่ต่ำลงแทนที่จะเป็นประสิทธิภาพที่ไม่มีใครเทียบได้ และการพึ่งพาโครงสร้างพื้นฐานที่มีอยู่ บ่งชี้ถึงความก้าวหน้าที่ค่อยเป็นค่อยไปมากกว่าการก้าวกระโดด คุณสมบัติการแก้ไขวิดีโอของ Omni ใน YouTube Shorts และ Flow เพิ่มประโยชน์ใช้สอยเชิงสร้างสรรค์ แต่เผชิญกับอุปสรรคในการสร้างรายได้ท่ามกลาง capex ที่สูงอย่างต่อเนื่อง Wall Street จะตรวจสอบเมตริกการยอมรับ agent และการเพิ่มขึ้นของรายได้ในช่วงต้นก่อนที่จะปรับราคา GOOGL ให้สูงขึ้น
การเปิดตัวที่วัดผลได้เหล่านี้ยังคงสามารถเร่งการเติบโตของการสมัครสมาชิกและประสิทธิภาพโฆษณาได้เร็วกว่าที่คาดการณ์ไว้ หากการใช้งาน agent ขยายตัวอย่างรวดเร็ว ซึ่งจะบั่นทอนมุมมองที่ว่า Google ยังคงล้าหลังในเชิงโครงสร้าง
"Google ได้ประกาศผลิตภัณฑ์ที่ปกป้องส่วนแบ่งการตลาด แต่ไม่ได้ให้หลักฐานว่าผลิตภัณฑ์เหล่านั้นจะขยายส่วนแบ่งการตลาดหรือพิสูจน์การใช้จ่าย capex ที่นักลงทุนกำลังตรวจสอบ"
Google กำลังดำเนินการป้องกันผลิตภัณฑ์ที่มีความสามารถ ไม่ใช่การรุก Gemini 3.5 Flash ในราคา 1/2–1/3 ของคู่แข่งฟังดูดี จนกว่าคุณจะถาม: ราคาถูกกว่ามีความสำคัญหรือไม่หากผู้ใช้ไม่เปลี่ยน? สิ่งที่น่าสนใจจริงๆ คือการเปิดตัว Gemini Spark แบบเบต้าเท่านั้นและจำกัดเฉพาะสมาชิก ซึ่งเป็นการดำเนินการอย่างระมัดระวัง ไม่ใช่ความมั่นใจ Omni (โมเดลโลก) น่าสนใจ แต่ล้าหลังหลายปีจากสิ่งที่ OpenAI และบริษัทอื่น ๆ กำลังจัดส่ง บทความนี้ผสมปนเปการประกาศกับการดึงดูด Wall Street ต้องการ 'การผสานรวมที่ลึกซึ้งยิ่งขึ้น' — Google เพิ่งแสดงให้เห็นถึงการผสานรวมที่ตื้นกว่า ไม่มีเมตริกเกี่ยวกับการยอมรับ Gemini รายได้ต่อผู้ใช้ หรือการใช้งาน agent เรื่องราวการใช้จ่าย capex จะใช้ได้ผลก็ต่อเมื่อผลิตภัณฑ์เหล่านี้สร้างรายได้เพิ่มขึ้นเท่านั้น บทความนี้ไม่ได้ให้หลักฐานใด ๆ ว่าจะทำเช่นนั้น
คูเมืองการจัดจำหน่ายของ Google (search, Android, YouTube) เป็นของจริงและถูกประเมินค่าต่ำเกินไป แม้แต่ agent แบบ 'me-too' ก็สามารถดึงดูดผู้ใช้ได้หลายพันล้านคนเพียงแค่ผ่านการวางตำแหน่งเริ่มต้น ซึ่ง Spark ได้รับทันทีในแอป Gemini โมเดลที่ถูกกว่าพร้อมคุณภาพที่ยอมรับได้อาจชนะใน TCO สำหรับการใช้งานระดับองค์กรและแบบฝัง ซึ่งจะเปลี่ยนแรงกดดันทางการแข่งขันจากความสามารถไปสู่ประสิทธิภาพ
"กลยุทธ์การกำหนดราคาเชิงรุกของ Google สำหรับ Gemini 3.5 Flash เป็นสัญญาณของการแข่งขันที่เน้นการป้องกันเพื่อลดราคา ซึ่งให้ความสำคัญกับการรักษาฐานผู้ใช้ในระบบนิเวศมากกว่าการปกป้องแหล่งรายได้โฆษณาการค้นหาหลัก"
การเปลี่ยนไปใช้ AI แบบ 'agentic' ของ Google ผ่าน Gemini Spark คือวิวัฒนาการที่จำเป็นในการปกป้องคูเมืองการค้นหาของตน แต่ตลาดกำลังเพิกเฉยต่อความเสี่ยงของการบีบอัดอัตรากำไร โดยการตั้งราคา Gemini 3.5 Flash ที่หนึ่งในสามของราคาคู่แข่ง Google กำลังทำให้ชั้นสติปัญญาของตนเองกลายเป็นสินค้าโภคภัณฑ์เพื่อชิงส่วนแบ่งการตลาดจาก OpenAI แม้ว่าสิ่งนี้จะทำให้ผู้ใช้ยังคงอยู่ในระบบนิเวศ แต่ก็เร่งการเปลี่ยนจาก 'search-to-agent' ซึ่งคุกคามรายได้โฆษณาที่มีอัตรากำไรสูง หาก Gemini Spark สามารถทำงานต่างๆ ให้เป็นอัตโนมัติได้สำเร็จ ก็จะลดจำนวนคลิกและการแสดงผลที่พร้อมสำหรับการสร้างรายได้ Google กำลังแลกเปลี่ยนการครอบงำโฆษณาในระยะยาวกับความเกี่ยวข้องของ AI ในระยะสั้น และค่าใช้จ่ายในการลงทุนที่จำเป็นในการรักษาความเป็นผู้นำนี้ยังคงเป็นภาระมหาศาลต่อกระแสเงินสดอิสระ
หาก Google สามารถผสานรวมเวิร์กโฟลว์แบบ agent เข้ากับ Android และ Workspace ได้สำเร็จ พวกเขาสามารถเก็บ 'ภาษีผลิตภาพ' ที่เกินกว่ารายได้จากการคลิกโฆนาในปัจจุบันได้อย่างมาก โดยเปลี่ยน Gemini ให้เป็น SaaS ที่มีอัตรากำไรสูง
"การผลักดัน Gemini ของ Google อาจปลดล็อกการมีส่วนร่วมและการสร้างรายได้ที่สูงขึ้นในผลิตภัณฑ์หลัก หาก Spark และ Omni ขยายขนาดได้อย่างปลอดภัยและคุ้มค่า แต่ ROI ในระยะสั้นขึ้นอยู่กับวินัยด้านต้นทุนและความชัดเจนด้านกฎระเบียบ"
การเปิดตัว I/O ของ Google วางตำแหน่ง Gemini ให้เป็นเส้นทางที่ถูกกว่าและเร็วกว่าสำหรับฟีเจอร์ที่ขับเคลื่อนด้วย AI ภายใน Search, YouTube และแอป โดยมี Spark เป็นแพลตฟอร์ม agent และ Omni เป็นโมเดลโลกสำหรับเนื้อหาสังเคราะห์ หาก 3.5 Flash ลดความหน่วง/ต้นทุนได้อย่างแท้จริง สิ่งนี้อาจเพิ่มการมีส่วนร่วมและเสนอช่องทางการสร้างรายได้โฆษณา/ผลิตภัณฑ์ใหม่โดยไม่ลดทอนคุณภาพ อย่างไรก็ตาม upside ขึ้นอยู่กับการยอมรับของผู้ใช้จริง ความปลอดภัย และการอนุมัติด้านกฎระเบียบสำหรับงานที่ดำเนินการโดย agent และสื่อสังเคราะห์ ความเสี่ยงในระยะสั้นคือ capex ที่สูง แรงกดดันด้านอัตรากำไร และการลดความคาดหวังลงหาก Spark/Omni สะดุด หรือหากกฎหมายความเป็นส่วนตัวจำกัดการเข้าถึงข้อมูล
แม้แต่ที่ 3.5 Flash ที่ถูกกว่า ต้นทุนรวมในการเรียกใช้ agent ที่เชื่อถือได้ทั่วทั้งการสอบถามหลายพันล้านครั้งอาจเกินกว่าการสร้างรายได้ที่เพิ่มขึ้นเล็กน้อย และข้อจำกัดด้านความปลอดภัย/กฎระเบียบอาจจำกัดการยอมรับหรือบังคับให้มีมาตรการป้องกันที่มีค่าใช้จ่ายสูง กล่าวอีกนัยหนึ่ง ตลาดอาจประเมินความเสี่ยงในการดำเนินการและอุปสรรคด้านกฎระเบียบที่อาจลดทอน ROI ต่ำเกินไป
"การเติบโตของการสอบถามที่ขับเคลื่อนโดย Agent อาจชะลอการกัดเซาะรายได้จากโฆษณาได้นานพอที่จะทำให้การยอมรับขององค์กรสามารถลดแรงกดดันด้านอัตรากำไรได้"
สมมติฐานการบีบอัดอัตรากำไรของ Gemini สันนิษฐานว่าระบบอัตโนมัติของ agent จะลดการแสดงผลโฆษณา แต่กลับมองข้ามว่าการวางตำแหน่งเริ่มต้นของ Spark ใน Search และ Android สามารถเพิ่มปริมาณการสอบถามทั้งหมดและระยะเวลาเซสชันได้อย่างไร การเพิ่มปริมาณนั้นอาจชดเชยคลิกที่สูญเสียไปได้หลายไตรมาสก่อนที่ผลกระทบเชิงโครงสร้างจะปรากฏขึ้น ตัวแปรที่ไม่ได้กล่าวถึงจริงๆ คือเศรษฐศาสตร์ของ 3.5 Flash ที่ถูกกว่าจะเร่งข้อตกลงระดับองค์กรได้มากพอที่จะครอบคลุม capex ที่ Claude ระบุไว้ก่อนหน้านี้หรือไม่
"การเพิ่มปริมาณในการค้นหาที่เติบโตเต็มที่นั้นไม่น่าเป็นไปได้ การยอมรับ agent น่าจะลดจำนวนการสอบถามต่อภารกิจ ทำให้การกู้คืนการแสดงผลทำได้ยากกว่าที่ Grok สันนิษฐาน"
สมมติฐานการเพิ่มปริมาณของ Grok สมควรได้รับการตรวจสอบ ปริมาณการสอบถามที่เพิ่มขึ้นในการค้นหาได้ราบเรียบมาหลายปีแล้ว — ฟีเจอร์ agent ของ Spark จะไม่สามารถย้อนแนวโน้มเชิงโครงสร้างนั้นได้ ความเสี่ยงที่แท้จริง: หาก agent *ลด* จำนวนการสอบถามที่จำเป็นต่อภารกิจ การเพิ่มขึ้นของระยะเวลาเซสชันจะไม่ชดเชยการสูญเสียการแสดงผล ข้อตกลงระดับองค์กรก็เป็นการคาดเดาเช่นกัน — ไม่มีหลักฐานว่าราคา 3.5 Flash จะส่งผลกระทบต่อที่นั่น ความเสี่ยงในการบีบอัดอัตรากำไรของ Gemini ยังคงอยู่ เว้นแต่ Google จะพิสูจน์ว่า agent เพิ่มการดำเนินการของผู้ใช้ที่ *สามารถสร้างรายได้* ไม่ใช่แค่การแสดงความสนใจ
"การเปลี่ยนไปใช้ AI แบบ agent ของ Google คือการเปลี่ยนแปลงพื้นฐานไปสู่การสร้างรายได้ตามเจตนา ซึ่งจะเข้ามาแทนที่โฆษณาการค้นหาแบบเดิมๆ แทนที่จะเป็นเพียงการบริโภค"
การที่คุณ Claude ปฏิเสธ 'การแสดงความสนใจ' พลาดการเปลี่ยนแปลงในสแต็ก ad-tech ของ Google หาก Gemini Spark สามารถจับเจตนาได้สำเร็จ Google ไม่เพียงแค่สูญเสียคลิกเท่านั้น แต่กำลังพัฒนากลายเป็นระบบการเสนอราคาแบบ 'ตามเจตนา' การเป็นเจ้าของเวิร์กโฟลว์แบบ agent ทำให้ Google สามารถแทรกพรอมต์ธุรกรรมแบบเนทีฟที่มีมูลค่าสูงแทนโฆษณาการค้นหาแบบเดิมๆ ความเสี่ยงด้านอัตรากำไรไม่ใช่แค่การบีบอัดเท่านั้น แต่คือต้นทุนในการประดิษฐ์กลไกการประมูลทั้งหมดใหม่ ในขณะที่รักษาฐานรายได้โฆษณาปัจจุบันในช่วงเปลี่ยนผ่าน
"การเพิ่มปริมาณของ Spark อาจไม่ชดเชยการลดลงของการแสดงผลโฆษณา การดำเนินการที่สามารถสร้างรายได้และมาตรการป้องกันด้านกฎระเบียบจะเป็นตัวกำหนดแนวโน้มอัตรากำไร"
การท้าทายสมมติฐานการเพิ่มปริมาณของ Grok: แม้ว่า Spark จะยึดติดกับการค้นหาและ Android แต่ระยะเวลาเซสชันที่ยาวนานขึ้นก็ไม่ได้รับประกันการแสดงผลที่สามารถสร้างรายได้ — agent สามารถเข้ามาแทนที่คลิกได้แทนที่จะขยายอุปสงค์ ความเสี่ยงไม่ใช่แค่การชดเชย แต่เป็นการเปลี่ยนแปลงเชิงโครงสร้างไปสู่การมีส่วนร่วมที่ถูกกว่าและเข้มข้นกว่า ซึ่งอาจลด CPM โฆษณาและ ARPU เพิ่มมาตรการป้องกันด้านกฎระเบียบ/ความปลอดภัยสำหรับงานที่ดำเนินการโดย agent และแรงกระตุ้นอัตรากำไรในระยะสั้นยังคงเป็นความเสี่ยงขาลง ไม่ใช่การผ่านฟรี
คณะกรรมการแบ่งออกเป็นสองฝ่ายเกี่ยวกับกลยุทธ์ AI Gemini ของ Google ในขณะที่บางคนมองเห็นศักยภาพในการเพิ่มการมีส่วนร่วมของผู้ใช้และโอกาสในการสร้างรายได้ใหม่ๆ คนอื่นๆ เตือนถึงความเสี่ยงของการบีบอัดอัตรากำไร การขาดเมตริกการยอมรับของผู้ใช้ และอุปสรรคด้านกฎระเบียบ
การมีส่วนร่วมของผู้ใช้ที่เพิ่มขึ้น ช่องทางการสร้างรายได้โฆษณา/ผลิตภัณฑ์ใหม่ และข้อตกลงระดับองค์กรที่อาจเกิดขึ้นซึ่งขับเคลื่อนโดยเศรษฐศาสตร์ AI ที่ถูกกว่า
การบีบอัดอัตรากำไรเนื่องจากการทำงานอัตโนมัติของ agent ลดการแสดงผลโฆษณาและคลิก รวมถึงความท้าทายด้านกฎระเบียบสำหรับงานที่ดำเนินการโดย agent และสื่อสังเคราะห์