ปัญหาคอขวดของ AI บนคลาวด์: เหตุใดการรันโมเดลบนเครื่องโลคอลจึงกลายเป็นสิ่งจำเป็น

ความเชื่อเรื่องศักยภาพ AI ที่ไม่มีที่สิ้นสุดได้จบลงอย่างเป็นทางการแล้ว เป็นเวลาหลายปีที่อุตสาหกรรมเทคโนโลยีดำเนินงานภายใต้สมมติฐานที่ว่าทรัพยากร AI บนคลาวด์—พลังการประมวลผล พื้นที่จัดเก็บ และความเร็วในการประมวลผล—นั้นแทบจะไม่มีขีดจำกัดสำหรับผู้ที่มีเงินทุนมากพอ อย่างไรก็ตาม รายงานล่าสุดจาก Financial Times ได้ทำลายภาพลวงตานั้น โดยเปิดเผยว่าแม้แต่ยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Meta ก็ยังต้องจำกัดการใช้งาน AI หลังจากที่ Google ไม่สามารถตอบสนองความต้องการกำลังการประมวลผล Gemini จำนวนมหาศาลได้

แม้แต่ยักษ์ใหญ่ก็ยังเผชิญกับข้อจำกัด

ย้อนกลับไปในเดือนมีนาคม Meta ได้พบกับความจริงอันโหดร้าย: แม้จะมีงบประมาณหลายร้อยล้านดอลลาร์สำหรับปัญญาประดิษฐ์ แต่ Google ซึ่งเป็นพันธมิตรหลักด้านคลาวด์ ก็ไม่สามารถจัดหาโครงสร้างพื้นฐานที่จำเป็นเพื่อรองรับความต้องการภายในได้ การขาดแคลนห่วงโซ่อุปทานนี้ ซึ่งเกิดจากการขาดแคลนชิป AI เฉพาะทางและโครงสร้างพื้นฐานด้านพลังงานทั่วโลก ส่งผลให้โครงการภายในหลายโครงการของ Meta ชะลอตัวลง

มีรายงานว่าพนักงานได้รับคำสั่งให้จัดลำดับความสำคัญและจำกัดการใช้โทเค็น ซึ่งแสดงให้เห็นว่าแม้แต่บริษัทที่ทรงพลังที่สุดในโลกก็ยังอยู่ภายใต้ข้อจำกัดทางกายภาพของฮาร์ดแวร์สมัยใหม่

ปัจจัยที่น่าตกใจ: การขาดแคลนฮาร์ดแวร์

แก่นแท้ของปัญหาไม่ได้อยู่ที่การขาดแคลนเงิน แต่เป็นการขาดแคลนพลังงานดิบ Google Cloud แม้จะสร้างรายได้ประมาณ 20 พันล้านดอลลาร์ต่อไตรมาส แต่ก็กำลังดิ้นรนเพื่อให้ทันกับคำสั่งซื้อที่ค้างอยู่ซึ่งมีมูลค่าเกิน 460 พันล้านดอลลาร์ ในฐานะมาตรการที่สิ้นหวังในการขยายขนาด Google ถึงกับต้องเช่ากำลังการผลิต GPU จาก SpaceX โดยจ่ายเงินเกือบหนึ่งพันล้านดอลลาร์ต่อเดือน นี่เป็นการเน้นย้ำถึงปัจจัยที่น่าตกใจของการเติบโตอย่างรวดเร็วของ AI ในปัจจุบันอย่างมีประสิทธิภาพ นั่นคือ โครงสร้างพื้นฐานทางกายภาพ—ชิป หน่วยความจำ และพลังงาน—ไม่ได้ขยายตัวเร็วเท่ากับความทะเยอทะยานของนักพัฒนาซอฟต์แวร์

การเปลี่ยนไปใช้ AI ในพื้นที่

ในขณะที่อุตสาหกรรมกำลังดิ้นรนกับปัญหาคอขวดระดับอุตสาหกรรมเหล่านี้ แนวคิดสำหรับผู้ใช้แต่ละรายและบริษัทขนาดเล็กกำลังเปลี่ยนไปสู่ AI ในพื้นที่ นี่คือเหตุผลว่าทำไมการเรียกใช้โมเดลบนฮาร์ดแวร์ของคุณเองจึงมีความสมเหตุสมผลมากขึ้น:

อธิปไตยของข้อมูลและความเป็นส่วนตัว: การเก็บโมเดลไว้ในพื้นที่ ข้อมูลส่วนบุคคลและคำสั่งของคุณจะไม่ถูกส่งไปยังเซิร์ฟเวอร์ระยะไกล ทำให้เป็นตัวเลือกที่เหนือกว่าสำหรับงานทางการเงิน กฎหมาย หรือสุขภาพที่ละเอียดอ่อน
ความหน่วงและประสิทธิภาพ: AI บนคลาวด์ต้องการการ "เดินทางไปกลับ" อย่างต่อเนื่องซึ่งทำให้เกิดความล่าช้า การรันโมเดลบน NPU (หน่วยประมวลผลประสาทเทียม) ในเครื่องช่วยให้สามารถตอบสนองได้เกือบจะในทันทีสำหรับงานที่ซ้ำซากหรืองานขนาดเล็ก
ความสามารถในการทำงานแบบออฟไลน์: โมเดลในเครื่องทำงานได้โดยไม่คำนึงถึงสถานะการเชื่อมต่อของคุณ ทำให้มีคุณค่าอย่างยิ่งสำหรับนักเดินทางหรือผู้ที่ทำงานในพื้นที่ที่มีอินเทอร์เน็ตไม่เสถียร
ประสิทธิภาพด้านต้นทุนในระยะยาว: การจ่ายค่าโทเค็นตามการสมัครสมาชิกนั้นมีค่าใช้จ่ายสูง การเป็นเจ้าของฮาร์ดแวร์เป็นการลงทุนครั้งเดียวที่สามารถลดต้นทุนได้อย่างมากสำหรับผู้ใช้งานบ่อยและใช้งานหนัก

ความท้าทายข้างหน้า

แม้จะมีประโยชน์ที่ชัดเจน การเปลี่ยนไปใช้ AI ในเครื่องก็ไม่ได้ปราศจากอุปสรรค การขาดแคลนฮาร์ดแวร์ทั่วโลกที่กำลังบีบ Meta อยู่ก็กำลังผลักดันให้ต้นทุนของอุปกรณ์อิเล็กทรอนิกส์สำหรับผู้บริโภคสูงขึ้นเช่นกัน เนื่องจากผู้ผลิตให้ความสำคัญกับซิลิคอนระดับศูนย์ข้อมูล หน่วยความจำแบนด์วิดท์สูง (HBM) และ DRAM สำหรับแล็ปท็อปและเวิร์กสเตชันสำหรับผู้บริโภคจึงมีราคาเพิ่มสูงขึ้น

ท้ายที่สุดแล้ว AI ในพื้นที่เป็นส่วนเสริมที่มีประสิทธิภาพสำหรับบริการคลาวด์มากกว่าที่จะเป็นการทดแทนทั้งหมด ในขณะที่โมเดลคลาวด์ยังคงได้เปรียบในด้าน 'การให้เหตุผลเชิงล้ำ' สำหรับงานที่ซับซ้อนและมีความเสี่ยงสูง การตรวจสอบความเป็นจริงที่เกิดจากวิกฤตอุปทานของ Google-Meta ถือเป็นคำเตือนที่จำเป็น: ยุคของ AI บนคลาวด์ที่เข้าถึงได้ง่ายและไม่จำกัดอย่างแท้จริงได้มาถึงจุดสิ้นสุดแล้ว การลงทุนในฮาร์ดแวร์ในพื้นที่จึงไม่ใช่แค่เพียงงานอดิเรกสำหรับผู้ที่ชื่นชอบเทคโนโลยีอีกต่อไป แต่กำลังกลายเป็นกลยุทธ์เพื่อความน่าเชื่อถือ

ปัญหาคอขวดของ AI บนคลาวด์: เหตุใดการรันโมเดลบนเครื่องโลคอลจึงกลายเป็นสิ่งจำเป็น

แม้แต่ยักษ์ใหญ่ก็ยังเผชิญกับข้อจำกัด

ปัจจัยที่น่าตกใจ: การขาดแคลนฮาร์ดแวร์

การเปลี่ยนไปใช้ AI ในพื้นที่

ความท้าทายข้างหน้า

บทความที่เกี่ยวข้อง

ข้อมูลหลุดเกี่ยวกับแว่นตา Samsung Galaxy Glasses: เผยการผสานรวม AI, การควบคุมด้วยท่าทาง และระบบนิเวศของอุปกรณ์สวมใส่

ต้นทุนที่ซ่อนเร้นของปัญญาประดิษฐ์เชิงสนทนา: เรากำลังลืมวิธีการอ่านไปแล้วหรือเปล่า?

รัฐบาลสหรัฐฯ ยกเลิกข้อจำกัดการส่งออกสำหรับโมเดล AI ที่ทรงพลังที่สุดของ Anthropic