ใครเป็นเจ้าของแพลตฟอร์ม Generative AI?

ใครเป็นเจ้าของแพลตฟอร์ม Generative AI?

โหนดต้นทาง: 1909271

เรากำลังเริ่มเห็นช่วงแรกๆ ของ Tech Stack เกิดขึ้นในปัญญาประดิษฐ์เชิงสร้างสรรค์ (AI) บริษัทสตาร์ทอัพใหม่หลายร้อยแห่งกำลังเร่งรีบเข้าสู่ตลาดเพื่อพัฒนาโมเดลพื้นฐาน สร้างแอพแบบ AI-native และวางโครงสร้างพื้นฐาน/เครื่องมือ

เทรนด์เทคโนโลยีที่ร้อนแรงหลายรายการได้รับการเผยแพร่เกินจริงก่อนที่ตลาดจะตามทัน แต่ความเฟื่องฟูของ AI ในยุคกำเนิดนั้นมาพร้อมกับผลกำไรที่แท้จริงในตลาดจริง และแรงผลักดันที่แท้จริงจากบริษัทจริง โมเดลต่างๆ เช่น Stable Diffusion และ ChatGPT กำลังสร้างสถิติประวัติศาสตร์สำหรับการเติบโตของผู้ใช้ และแอปพลิเคชันหลายตัวมีรายได้ต่อปีสูงถึง 100 ล้านดอลลาร์ภายในเวลาไม่ถึงหนึ่งปีหลังจากเปิดตัว การเปรียบเทียบแบบเคียงข้างกันแสดงโมเดล AI มีประสิทธิภาพเหนือกว่ามนุษย์ ในงานบางอย่างตามลำดับความสำคัญ 

ดังนั้นจึงมีข้อมูลเบื้องต้นเพียงพอที่จะบ่งชี้ว่าการเปลี่ยนแปลงครั้งใหญ่กำลังเกิดขึ้น สิ่งที่เราไม่รู้และตอนนี้กลายเป็นคำถามสำคัญคือ: ที่ใดในตลาดนี้จะมีมูลค่าเพิ่มขึ้น?

ในปีที่ผ่านมา เราได้พบกับผู้ก่อตั้งและผู้ประกอบการสตาร์ทอัพหลายสิบรายในบริษัทขนาดใหญ่ที่จัดการโดยตรงกับ AI กำเนิด เราได้สังเกตเห็นว่า ผู้ขายโครงสร้างพื้นฐาน มีแนวโน้มที่จะเป็นผู้ชนะรายใหญ่ที่สุดในตลาดนี้ โดยสามารถคว้าเงินดอลลาร์ส่วนใหญ่ที่ไหลเข้ากองได้ บริษัทแอพพลิเคชั่น กำลังเติบโตรายรับบนบรรทัดอย่างรวดเร็ว แต่มักมีปัญหากับการรักษาลูกค้า ความแตกต่างของผลิตภัณฑ์ และอัตรากำไรขั้นต้น และส่วนใหญ่ ผู้ให้บริการแบบจำลองแม้ว่าจะเป็นผู้รับผิดชอบต่อการดำรงอยู่ของตลาดนี้ แต่ก็ยังไม่ประสบความสำเร็จในเชิงพาณิชย์ขนาดใหญ่

กล่าวอีกนัยหนึ่งคือ บริษัทต่างๆ ที่สร้างมูลค่าสูงสุด เช่น ฝึกอบรมโมเดล AI เชิงกำเนิดและนำไปใช้ในแอพใหม่ ไม่ได้ครอบคลุมส่วนใหญ่ การทำนายสิ่งที่จะเกิดขึ้นต่อไปนั้นยากกว่ามาก แต่เราคิดว่าสิ่งสำคัญที่ต้องทำความเข้าใจคือส่วนใดของสแต็กที่สร้างความแตกต่างและป้องกันได้อย่างแท้จริง สิ่งนี้จะมีผลกระทบสำคัญต่อโครงสร้างตลาด (เช่น การพัฒนาบริษัทในแนวราบกับแนวดิ่ง) และตัวขับเคลื่อนมูลค่าระยะยาว (เช่น กำไรและการรักษาลูกค้า) จนถึงตอนนี้ เรามีช่วงเวลาที่ยากลำบากในการค้นหาการป้องกันเชิงโครงสร้าง ทุกแห่ง ในกองนอกคูเมืองแบบดั้งเดิมสำหรับผู้ดำรงตำแหน่ง

เราเชื่อมั่นอย่างมากเกี่ยวกับ AI เชิงกำเนิด และเชื่อว่ามันจะมีผลกระทบอย่างใหญ่หลวงในอุตสาหกรรมซอฟต์แวร์และอื่นๆ เป้าหมายของโพสต์นี้คือการทำแผนที่ไดนามิกของตลาดและเริ่มตอบคำถามที่กว้างขึ้นเกี่ยวกับโมเดลธุรกิจ AI เชิงกำเนิด

กลุ่มเทคโนโลยีระดับสูง: โครงสร้างพื้นฐาน โมเดล และแอป

เพื่อทำความเข้าใจว่าตลาด AI กำเนิดเป็นรูปเป็นร่างอย่างไร ก่อนอื่นเราต้องกำหนดลักษณะของสแต็คในวันนี้ นี่คือมุมมองเบื้องต้นของเรา

สแต็คสามารถแบ่งออกเป็นสามชั้น:

  • การใช้งาน ที่ผสานรวมโมเดล AI เชิงกำเนิดเข้ากับผลิตภัณฑ์ที่ผู้ใช้เห็น ไม่ว่าจะใช้งานไปป์ไลน์โมเดลของตนเอง (“แอพแบบ end-to-end”) หรืออาศัย API ของบุคคลที่สาม
  • Models ที่ขับเคลื่อนผลิตภัณฑ์ AI ซึ่งมีให้ใช้งานได้ทั้งในรูปแบบ API ที่เป็นกรรมสิทธิ์หรือเป็นจุดตรวจแบบโอเพ่นซอร์ส (ซึ่งต้องใช้โซลูชันการโฮสต์)
  • โครงสร้างพื้นฐาน ผู้จำหน่าย (เช่น แพลตฟอร์มระบบคลาวด์และผู้ผลิตฮาร์ดแวร์) ที่รันเวิร์กโหลดการฝึกอบรมและการอนุมานสำหรับโมเดล AI เชิงกำเนิด

สิ่งสำคัญที่ควรทราบ: นี่ไม่ใช่แผนที่ตลาด แต่เป็นกรอบในการวิเคราะห์ตลาด ในแต่ละหมวดหมู่ เราได้แสดงตัวอย่างบางส่วนของผู้ขายที่มีชื่อเสียง เราไม่ได้พยายามที่จะครอบคลุมหรือแสดงรายการแอปพลิเคชัน AI กำเนิดที่น่าทึ่งทั้งหมดที่เปิดตัว นอกจากนี้ เราจะไม่ลงลึกเกี่ยวกับเครื่องมือ MLops หรือ LLMops ซึ่งยังไม่ได้มาตรฐานสูงและจะกล่าวถึงในโพสต์ในอนาคต

คลื่นลูกแรกของแอป AI เชิงกำเนิดกำลังเริ่มขยายขนาด แต่ยังมีปัญหากับการรักษาผู้ใช้และการสร้างความแตกต่าง

ในวัฏจักรเทคโนโลยีก่อนหน้านี้ ภูมิปัญญาดั้งเดิมคือการสร้างบริษัทขนาดใหญ่ที่เป็นอิสระ คุณต้องเป็นเจ้าของลูกค้าปลายทาง — ไม่ว่านั่นจะหมายถึงผู้บริโภครายบุคคลหรือผู้ซื้อ B2B เป็นเรื่องน่าดึงดูดใจที่จะเชื่อว่าบริษัทที่ใหญ่ที่สุดใน AI เชิงกำเนิดจะเป็นแอปพลิเคชันของผู้ใช้ปลายทางเช่นกัน จนถึงขณะนี้ยังไม่ชัดเจนว่าเป็นกรณีนี้

แน่นอน การเติบโตของแอปพลิเคชัน AI เชิงกำเนิดนั้นเติบโตอย่างก้าวกระโดด ขับเคลื่อนด้วยความแปลกใหม่และกรณีการใช้งานมากมายเหลือเฟือ อันที่จริง เราทราบว่ามีผลิตภัณฑ์อย่างน้อยสามประเภทที่ทำรายได้ต่อปีเกิน 100 ล้านดอลลาร์ ได้แก่ การสร้างภาพ การเขียนคำโฆษณา และการเขียนโค้ด

อย่างไรก็ตาม การเติบโตเพียงอย่างเดียวไม่เพียงพอที่จะสร้างบริษัทซอฟต์แวร์ที่ทนทาน สิ่งสำคัญคือ การเติบโตจะต้องสร้างผลกำไร — ในแง่ที่ว่าผู้ใช้และลูกค้า เมื่อพวกเขาสมัครใช้งาน จะสร้างผลกำไร (อัตรากำไรขั้นต้นสูง) และคงอยู่ต่อไปเป็นเวลานาน (การรักษาลูกค้าสูง) ในกรณีที่ไม่มีความแตกต่างทางเทคนิคที่ชัดเจน แอป B2B และ B2C จะขับเคลื่อนคุณค่าลูกค้าในระยะยาวผ่านเอฟเฟกต์เครือข่าย การเก็บข้อมูล หรือสร้างเวิร์กโฟลว์ที่ซับซ้อนขึ้นเรื่อยๆ

ใน AI กำเนิด สมมติฐานเหล่านั้นไม่จำเป็นต้องถือเป็นจริงเสมอไป บริษัทแอพต่างๆ ที่เราพูดคุยด้วยมีอัตรากำไรขั้นต้นที่หลากหลาย - สูงถึง 90% ในบางกรณี แต่บ่อยครั้งที่ต่ำถึง 50-60% ซึ่งขับเคลื่อนโดยต้นทุนของการอนุมานแบบจำลองเป็นส่วนใหญ่ การเติบโตบนช่องทางนั้นน่าทึ่งมาก แต่ก็ไม่ชัดเจนว่ากลยุทธ์การได้มาซึ่งลูกค้าปัจจุบันจะปรับขนาดได้หรือไม่ — เราเห็นแล้วว่าประสิทธิภาพการได้ลูกค้าใหม่แบบชำระเงินและการรักษาลูกค้าเริ่มลดลงแล้ว แอพจำนวนมากยังค่อนข้างไม่แตกต่าง เนื่องจากพวกมันใช้โมเดล AI พื้นฐานที่คล้ายกันและไม่พบเอฟเฟกต์เครือข่ายหรือข้อมูล/เวิร์กโฟลว์ที่ชัดเจน ซึ่งยากที่คู่แข่งจะลอกเลียนแบบได้

ดังนั้นจึงยังไม่เป็นที่แน่ชัดว่าการขายแอปสำหรับผู้ใช้ปลายทางเป็นเพียงเส้นทางเดียวหรือแม้แต่เส้นทางที่ดีที่สุดในการสร้างธุรกิจ AI ที่สร้างสรรค์อย่างยั่งยืน ระยะขอบควรดีขึ้นเนื่องจากการแข่งขันและประสิทธิภาพของโมเดลภาษาเพิ่มขึ้น (เพิ่มเติมด้านล่าง) การรักษาควรเพิ่มขึ้นเมื่อนักท่องเที่ยว AI ออกจากตลาด และมีข้อโต้แย้งที่ชัดเจนว่าแอพที่ผสานรวมในแนวตั้งมีข้อได้เปรียบในการผลักดันความแตกต่าง แต่ยังมีอีกมากที่ต้องพิสูจน์

เมื่อมองไปข้างหน้า คำถามสำคัญบางข้อที่บริษัทแอป generative AI ต้องเผชิญ ได้แก่:

  • การผสานรวมในแนวตั้ง (“โมเดล + แอป”) การใช้โมเดล AI เป็นบริการช่วยให้นักพัฒนาแอปทำซ้ำได้อย่างรวดเร็วกับทีมเล็กๆ และแลกเปลี่ยนผู้ให้บริการโมเดลเมื่อเทคโนโลยีก้าวหน้า ในทางกลับกัน ผู้พัฒนาบางคนโต้แย้งว่าผลิตภัณฑ์ is โมเดลและการฝึกอบรมตั้งแต่เริ่มต้นเป็นวิธีเดียวที่จะสร้างการป้องกัน — กล่าวคือการฝึกอบรมซ้ำอย่างต่อเนื่องเกี่ยวกับข้อมูลผลิตภัณฑ์ที่เป็นกรรมสิทธิ์ แต่ก็ต้องแลกมาด้วยต้นทุนที่สูงกว่าความต้องการเงินทุนและทีมผลิตภัณฑ์ที่ว่องไวน้อยกว่า
  • คุณสมบัติการสร้างเทียบกับแอพ ผลิตภัณฑ์ Generative AI มีหลายรูปแบบ: แอปเดสก์ท็อป แอปมือถือ ปลั๊กอิน Figma/Photoshop ส่วนขยายของ Chrome หรือแม้แต่บอท Discord การผสานรวมผลิตภัณฑ์ AI ในที่ที่ผู้ใช้ทำงานอยู่นั้นเป็นเรื่องง่าย เนื่องจากโดยทั่วไปแล้ว UI เป็นเพียงกล่องข้อความ บริษัทใดในจำนวนนี้จะกลายเป็นบริษัทเดี่ยว และบริษัทใดจะถูกดูดซับโดยผู้ครอบครองตลาด เช่น Microsoft หรือ Google ที่รวม AI ไว้ในสายผลิตภัณฑ์ของตนอยู่แล้ว
  • การจัดการผ่านวงจรโฆษณา ยังไม่ชัดเจนว่าการปั่นป่วนมีอยู่ในชุดผลิตภัณฑ์ AI กำเนิดชุดปัจจุบันหรือไม่ หรือเป็นสิ่งประดิษฐ์ของตลาดยุคแรกๆ หรือหากกระแสความสนใจใน AI เชิงกำเนิดจะลดน้อยลงเมื่อกระแสดังกล่าวลดลง คำถามเหล่านี้มีนัยยะสำคัญสำหรับบริษัทแอป เช่น เมื่อใดควรเร่งดำเนินการระดมทุน การลงทุนอย่างจริงจังในการหาลูกค้า กลุ่มผู้ใช้ใดที่จะจัดลำดับความสำคัญ; และเมื่อใดจึงจะประกาศผลิตภัณฑ์-ตลาดที่เหมาะสม

ผู้ให้บริการโมเดลคิดค้น AI เชิงกำเนิด แต่ยังไม่ถึงระดับการค้าขนาดใหญ่

สิ่งที่เราเรียกว่าเจเนอเรทีฟเอไอในปัจจุบันจะไม่มีอยู่จริงหากปราศจากงานวิจัยและงานด้านวิศวกรรมที่ยอดเยี่ยมที่ทำในสถานที่ต่างๆ เช่น Google, OpenAI และ Stability ด้วยสถาปัตยกรรมโมเดลใหม่และความพยายามอย่างกล้าหาญในการปรับขนาดไปป์ไลน์การฝึกอบรม เราทุกคนได้รับประโยชน์จากความสามารถที่น่าทึ่งของโมเดลภาษาขนาดใหญ่ (LLM) และโมเดลการสร้างภาพในปัจจุบัน

แต่รายได้ที่เกี่ยวข้องกับบริษัทเหล่านี้ยังค่อนข้างน้อยเมื่อเทียบกับการใช้งานและเสียงกระหึ่ม ในการสร้างอิมเมจ Stable Diffusion ได้เห็นการเติบโตของชุมชนอย่างรวดเร็ว ซึ่งสนับสนุนโดยระบบนิเวศของอินเทอร์เฟซผู้ใช้ ข้อเสนอที่เป็นโฮสต์ และวิธีการปรับแต่งอย่างละเอียด แต่ความเสถียรทำให้จุดตรวจสอบสำคัญๆ ของพวกเขาหมดไปโดยไม่คิดค่าใช้จ่าย ซึ่งเป็นหลักการสำคัญของธุรกิจของพวกเขา ในรูปแบบภาษาธรรมชาติ OpenAI เหนือกว่าด้วย GPT-3/3.5 และ ChatGPT แต่ สัมพัทธ์ จนถึงตอนนี้มีแอพนักฆ่าไม่กี่ตัวที่สร้างบน OpenAI และราคาก็มีอยู่แล้ว ลดลงหนึ่งครั้ง.

นี่อาจเป็นเพียงปรากฏการณ์ชั่วคราว Stability เป็นบริษัทใหม่ที่ยังไม่ได้มุ่งเน้นไปที่การสร้างรายได้ OpenAI มีศักยภาพที่จะกลายเป็นธุรกิจขนาดใหญ่ โดยได้รับส่วนสำคัญของรายได้จากหมวดหมู่ NLP ทั้งหมด เนื่องจากมีการสร้างแอปพิฆาตมากขึ้น โดยเฉพาะอย่างยิ่งหากพวกเขา รวมเข้ากับกลุ่มผลิตภัณฑ์ของ Microsoft เป็นไปอย่างราบรื่น เนื่องจากมีการใช้งานโมเดลเหล่านี้เป็นจำนวนมาก รายได้จำนวนมากจึงอาจตามหลังอยู่ไม่ไกลนัก

แต่ก็มีกองกำลังต่อต้านเช่นกัน โมเดลที่เผยแพร่เป็นโอเพ่นซอร์สสามารถโฮสต์โดยใครก็ได้ รวมถึงบริษัทภายนอกที่ไม่ต้องแบกรับค่าใช้จ่ายที่เกี่ยวข้องกับการฝึกอบรมโมเดลขนาดใหญ่ (สูงถึงหลายสิบหรือหลายร้อยล้านดอลลาร์) และยังไม่ชัดเจนว่ารุ่นโอเพนซอร์ซใดสามารถรักษาขอบไว้ได้อย่างไม่มีกำหนด ตัวอย่างเช่น เราเริ่มเห็น LLM ที่สร้างขึ้นโดยบริษัทต่างๆ เช่น Anthropic, Cohere และ Character.ai เข้าใกล้ระดับประสิทธิภาพของ OpenAI มากขึ้น ได้รับการฝึกฝนในชุดข้อมูลที่คล้ายกัน (เช่น อินเทอร์เน็ต) และด้วยสถาปัตยกรรมแบบจำลองที่คล้ายกัน ตัวอย่างของ Stable Diffusion ชี้ให้เห็นว่า if โมเดลโอเพ่นซอร์สมีประสิทธิภาพและการสนับสนุนจากชุมชนในระดับที่เพียงพอ จากนั้นทางเลือกที่เป็นกรรมสิทธิ์อาจพบว่าแข่งขันได้ยาก

บางทีสิ่งที่ชัดเจนที่สุดสำหรับผู้ให้บริการโมเดลในตอนนี้ก็คือการทำการค้านั้นเชื่อมโยงกับโฮสติ้ง ความต้องการ API ที่เป็นกรรมสิทธิ์ (เช่น จาก OpenAI) กำลังเติบโตอย่างรวดเร็ว บริการโฮสติ้งสำหรับโมเดลโอเพ่นซอร์ส (เช่น Hugging Face และ Replicate) กำลังกลายเป็นฮับที่มีประโยชน์เพื่อให้แชร์และรวมโมเดลได้อย่างง่ายดาย — และยังมีผลกระทบทางเครือข่ายทางอ้อมระหว่างผู้ผลิตโมเดลและผู้บริโภคอีกด้วย นอกจากนี้ยังมีสมมติฐานที่หนักแน่นว่าเป็นไปได้ที่จะสร้างรายได้ผ่านการปรับจูนและข้อตกลงการโฮสต์กับลูกค้าองค์กร

นอกเหนือจากนั้น ยังมีคำถามใหญ่ ๆ อีกหลายข้อที่ผู้ให้บริการโมเดลต้องเผชิญ:

  • การทำให้เป็นสินค้า มีความเชื่อโดยทั่วไปว่าโมเดล AI จะมาบรรจบกันในประสิทธิภาพเมื่อเวลาผ่านไป เมื่อพูดคุยกับนักพัฒนาแอป เป็นที่ชัดเจนว่ายังไม่เกิดขึ้น โดยมีผู้นำที่แข็งแกร่งทั้งในรูปแบบข้อความและรูปภาพ ข้อได้เปรียบของพวกเขาไม่ได้ขึ้นอยู่กับสถาปัตยกรรมแบบจำลองที่ไม่เหมือนใคร แต่ขึ้นอยู่กับความต้องการเงินทุนสูง ข้อมูลการโต้ตอบของผลิตภัณฑ์ที่เป็นกรรมสิทธิ์ และพรสวรรค์ด้าน AI ที่หายาก สิ่งนี้จะทำหน้าที่เป็นข้อได้เปรียบที่คงทนหรือไม่?
  • ความเสี่ยงในการสำเร็จการศึกษา การพึ่งพาผู้ให้บริการแบบจำลองเป็นวิธีที่ยอดเยี่ยมสำหรับบริษัทแอปในการเริ่มต้น และแม้กระทั่งเพื่อขยายธุรกิจของพวกเขา แต่มีแรงจูงใจให้พวกเขาสร้างและ/หรือโฮสต์โมเดลของตนเองเมื่อถึงขนาด และผู้ให้บริการโมเดลหลายรายมีการกระจายตัวของลูกค้าที่เบ้มาก โดยมีแอพไม่กี่ตัวที่เป็นตัวแทนของรายได้ส่วนใหญ่ จะเกิดอะไรขึ้นหาก/เมื่อลูกค้าเหล่านี้เปลี่ยนไปใช้การพัฒนา AI ภายในองค์กร
  • เงินสำคัญไหม? คำมั่นสัญญาของ AI เชิงกำเนิดนั้นยอดเยี่ยมมาก — และยังอาจเป็นอันตรายอีกด้วย — ซึ่งผู้ให้บริการแบบจำลองหลายรายได้จัดตั้งเป็นองค์กรเพื่อสาธารณประโยชน์ (B corps) ออกหุ้นกำไรต่อยอด หรือรวมสินค้าสาธารณะไว้ในภารกิจของพวกเขาอย่างชัดเจน สิ่งนี้ไม่ได้ขัดขวางความพยายามในการระดมทุนของพวกเขาเลย แต่มีการอภิปรายที่สมเหตุสมผลว่าผู้ให้บริการแบบจำลองส่วนใหญ่จริงหรือไม่ ต้องการ เพื่อจับมูลค่าและหากควร

ผู้ค้าโครงสร้างพื้นฐานสัมผัสทุกสิ่งและเก็บเกี่ยวผลตอบแทน

เกือบทุกอย่างใน AI กำเนิดจะผ่าน GPU ที่โฮสต์บนคลาวด์ (หรือ TPU) ในบางจุด ไม่ว่าจะเป็นผู้ให้บริการแบบจำลอง / ห้องปฏิบัติการวิจัยที่ใช้เวิร์กโหลดการฝึกอบรม บริษัทโฮสติ้งที่เรียกใช้การอนุมาน/การปรับละเอียด หรือบริษัทแอปพลิเคชันที่ดำเนินการทั้งสองอย่างร่วมกัน — ค่าตัว เป็นสัดส่วนหลักของ AI กำเนิด นับเป็นครั้งแรกในรอบระยะเวลาอันยาวนาน ความก้าวหน้าของเทคโนโลยีคอมพิวเตอร์ที่ก่อกวนมากที่สุดนั้นถูกผูกมัดด้วยการประมวลผลอย่างหนาแน่น

เป็นผลให้เงินจำนวนมากในตลาด generative AI ไหลไปสู่บริษัทโครงสร้างพื้นฐานในที่สุด มาใส่บ้าง มาก ตัวเลขคร่าว ๆ รอบตัว: เราประเมินว่าโดยเฉลี่ยแล้ว บริษัทแอปใช้จ่ายประมาณ 20-40% ของรายได้ไปกับการอนุมานและการปรับแต่งแบบละเอียดต่อลูกค้า โดยปกติจะจ่ายโดยตรงกับผู้ให้บริการคลาวด์สำหรับอินสแตนซ์การประมวลผลหรือผู้ให้บริการโมเดลบุคคลที่สาม ซึ่งในทางกลับกันจะใช้รายได้ประมาณครึ่งหนึ่งไปกับโครงสร้างพื้นฐานคลาวด์ ดังนั้นจึงสมเหตุสมผลที่จะเดาว่า 10-20% ของ รายได้รวม ในการกำเนิด AI วันนี้ไปที่ผู้ให้บริการคลาวด์

ยิ่งไปกว่านั้น สตาร์ทอัพที่ฝึกฝนโมเดลของตนเองได้ระดมเงินร่วมลงทุนหลายพันล้านดอลลาร์ ซึ่งส่วนใหญ่ (มากถึง 80-90% ในช่วงแรก) มักจะใช้จ่ายกับผู้ให้บริการคลาวด์ด้วย บริษัทเทคโนโลยีสาธารณะหลายแห่งใช้จ่ายหลายร้อยล้านต่อปีในการฝึกอบรมโมเดล ไม่ว่าจะกับผู้ให้บริการระบบคลาวด์ภายนอกหรือโดยตรงกับผู้ผลิตฮาร์ดแวร์

นี่คือสิ่งที่เราเรียกในแง่เทคนิคว่า “เงินจำนวนมาก” — โดยเฉพาะอย่างยิ่งสำหรับตลาดที่เพิ่งตั้งไข่ ส่วนใหญ่ใช้จ่ายที่ บิ๊ก 3 คลาวด์: Amazon Web Services (AWS), Google Cloud Platform (GCP) และ Microsoft Azure ผู้ให้บริการคลาวด์เหล่านี้รวมกัน ใช้จ่ายมากกว่า $ 100 พันล้านต่อปี ในค่าใช้จ่ายเพื่อให้แน่ใจว่าพวกเขามีแพลตฟอร์มที่ครอบคลุม เชื่อถือได้ และคุ้มราคาที่สุด โดยเฉพาะอย่างยิ่งใน AI เชิงกำเนิด พวกเขายังได้รับประโยชน์จากข้อจำกัดด้านอุปทาน เนื่องจากพวกเขามีสิทธิ์เข้าถึงฮาร์ดแวร์ที่หายากเป็นพิเศษ (เช่น GPU Nvidia A100 และ H100)

ที่น่าสนใจคือเราเริ่มเห็นการแข่งขันที่น่าเชื่อถือเกิดขึ้น ผู้ท้าชิงอย่าง Oracle ได้รุกล้ำด้วยค่าใช้จ่ายด้านการลงทุนและสิ่งจูงใจในการขายจำนวนมาก และบริษัทสตาร์ทอัพไม่กี่แห่ง เช่น Coreweave และ Lambda Labs ก็เติบโตอย่างรวดเร็วด้วยโซลูชันที่มีเป้าหมายเจาะจงไปที่นักพัฒนาโมเดลขนาดใหญ่ พวกเขาแข่งขันกันที่ราคา ความพร้อมใช้งาน และการสนับสนุนส่วนบุคคล พวกเขายังเปิดเผยสิ่งที่เป็นนามธรรมของทรัพยากรที่ละเอียดยิ่งขึ้น (เช่น คอนเทนเนอร์) ในขณะที่ระบบคลาวด์ขนาดใหญ่เสนอเฉพาะอินสแตนซ์ VM เนื่องจากขีดจำกัดการจำลองเสมือนของ GPU

เบื้องหลัง การรันปริมาณงาน AI ส่วนใหญ่ อาจเป็นผู้ชนะที่ใหญ่ที่สุดใน AI เชิงสร้างสรรค์จนถึงตอนนี้: Nvidia บริษัท รายงาน $3.8 billion ของรายได้ GPU ของศูนย์ข้อมูลในไตรมาสที่สามของปีงบประมาณ 2023, รวมถึงส่วนที่มีความหมายสำหรับกรณีการใช้งาน AI เชิงกำเนิด และพวกเขาได้สร้างคูน้ำที่แข็งแกร่งรอบ ๆ ธุรกิจนี้ผ่านการลงทุนหลายสิบปีในสถาปัตยกรรม GPU, ระบบนิเวศของซอฟต์แวร์ที่แข็งแกร่ง และการใช้งานเชิงลึกในชุมชนวิชาการ บทวิเคราะห์ล่าสุด พบว่า GPU ของ Nvidia ถูกอ้างถึงในเอกสารการวิจัยมากกว่าสตาร์ทอัพชิป AI ชั้นนำรวมกันถึง 90 เท่า.

มีตัวเลือกฮาร์ดแวร์อื่นๆ รวมถึง Google Tensor Processing Units (TPUs); AMD Instinct GPU; ชิป AWS Inferentia และ Trainium; และตัวเร่งความเร็ว AI จากสตาร์ทอัพ เช่น Cerebras, Sambanova และ Graphcore Intel ซึ่งมาช้ากว่าเกมก็เข้าสู่ตลาดด้วยชิป Habana ระดับไฮเอนด์และ GPU Ponte Vecchio แต่จนถึงตอนนี้ มีชิปใหม่ไม่กี่ตัวที่มีส่วนแบ่งการตลาดที่สำคัญ ข้อยกเว้นสองประการที่น่าจับตามองคือ Google ซึ่งได้รับแรงดึงจาก TPU ในชุมชน Stable Diffusion และในข้อตกลง GCP ขนาดใหญ่บางแห่ง และ TSMC ซึ่งเชื่อว่าเป็นผู้ผลิต ทั้งหมด ของชิปที่แสดงรายการไว้ที่นี่ รวมถึง Nvidia GPUs (Intel ใช้ส่วนผสมของ fabs ของตัวเองและ TSMC เพื่อสร้างชิป)

กล่าวอีกนัยหนึ่งโครงสร้างพื้นฐานคือเลเยอร์ที่ให้ผลกำไร ทนทาน และดูเหมือนจะป้องกันได้ในสแต็ก คำถามใหญ่ที่ต้องตอบสำหรับบริษัทอินฟรา ได้แก่:

  • ถือครองภาระงานไร้สัญชาติ GPU ของ Nvidia จะเหมือนกันทุกที่ที่คุณเช่า ปริมาณงาน AI ส่วนใหญ่เป็นแบบไร้สถานะ ในแง่ที่การอนุมานแบบจำลองไม่ต้องการฐานข้อมูลหรือพื้นที่เก็บข้อมูลที่แนบมา (นอกเหนือจากน้ำหนักของแบบจำลองเอง) ซึ่งหมายความว่าปริมาณงาน AI สามารถพกพาข้ามคลาวด์ได้มากกว่าปริมาณงานแอปพลิเคชันแบบเดิม ในบริบทนี้ ผู้ให้บริการระบบคลาวด์จะสร้างความเหนียวแน่นและป้องกันไม่ให้ลูกค้าข้ามไปยังตัวเลือกที่ถูกที่สุดได้อย่างไรในบริบทนี้
  • รอดพ้นจากการขาดแคลนชิป ราคาสำหรับผู้ให้บริการคลาวด์และสำหรับ Nvidia เองนั้นได้รับการสนับสนุนจาก GPU ที่ต้องการมากที่สุดซึ่งหายาก ผู้ให้บริการรายหนึ่งบอกเราว่าราคาปลีกสำหรับ A100s เป็นจริงแล้ว เพิ่มขึ้น ตั้งแต่เปิดตัว ซึ่งถือว่าผิดปกติอย่างมากสำหรับฮาร์ดแวร์คอมพิวเตอร์ เมื่อข้อจำกัดด้านอุปทานนี้ถูกขจัดออกไปในที่สุด ด้วยการผลิตที่เพิ่มขึ้นและ/หรือการนำแพลตฟอร์มฮาร์ดแวร์ใหม่มาใช้ สิ่งนี้จะส่งผลกระทบต่อผู้ให้บริการระบบคลาวด์อย่างไร
  • เมฆผู้ท้าชิงจะทะลวงผ่านได้หรือไม่? เราเชื่ออย่างหนักแน่นว่า เมฆแนวตั้ง จะชิงส่วนแบ่งการตลาดจาก Big 3 ด้วยข้อเสนอพิเศษที่มากกว่า ในด้าน AI จนถึงตอนนี้ ผู้ท้าชิงได้สร้างแรงผลักดันที่มีความหมายผ่านความแตกต่างทางเทคนิคในระดับปานกลางและการสนับสนุนจาก Nvidia ซึ่งผู้ให้บริการคลาวด์ที่มีหน้าที่เป็นทั้งลูกค้ารายใหญ่ที่สุดและคู่แข่งรายใหม่ คำถามระยะยาวคือ สิ่งนี้จะเพียงพอที่จะเอาชนะความได้เปรียบด้านสเกลของ Big 3 หรือไม่

ดังนั้น…มูลค่าจะเพิ่มขึ้นที่ไหน?

แน่นอนว่าเรายังไม่รู้ แต่จากข้อมูลเบื้องต้นที่เรามีสำหรับ generative AI รวมกับ ประสบการณ์ของเรากับบริษัท AI/ML ก่อนหน้านี้สัญชาตญาณของเรามีดังต่อไปนี้ 

ทุกวันนี้ไม่ปรากฏว่ามีคูน้ำที่เป็นระบบใน AI กำเนิด ในการประมาณลำดับที่หนึ่ง แอปพลิเคชันขาดความแตกต่างของผลิตภัณฑ์ที่ชัดเจนเนื่องจากใช้โมเดลที่คล้ายกัน แบบจำลองเผชิญกับความแตกต่างระยะยาวที่ไม่ชัดเจนเนื่องจากได้รับการฝึกฝนในชุดข้อมูลที่คล้ายกันซึ่งมีสถาปัตยกรรมที่คล้ายคลึงกัน ผู้ให้บริการระบบคลาวด์ขาดความแตกต่างทางเทคนิคอย่างลึกซึ้งเนื่องจากใช้ GPU เดียวกัน และแม้แต่บริษัทฮาร์ดแวร์ก็ผลิตชิปด้วยคุณภาพแบบเดียวกัน

แน่นอนว่ามีคูน้ำมาตรฐาน: คูน้ำขนาดใหญ่ (“ฉันมีหรือสามารถหาเงินได้มากกว่าคุณ!”) คูเมืองในห่วงโซ่อุปทาน (“ฉันมี GPU แต่คุณไม่มี!”) คูเมืองในระบบนิเวศ (“ ทุกคนใช้ซอฟต์แวร์ของฉันอยู่แล้ว!”) คูน้ำอัลกอริทึม (“เราฉลาดกว่าคุณ!”) คูเมืองกระจาย (“ฉันมีทีมขายแล้วและมีลูกค้ามากกว่าคุณ!”) และคูเมืองข้อมูล (“ฉัน รวบรวมข้อมูลอินเทอร์เน็ตมากกว่าคุณ!”) แต่ไม่มีคูน้ำเหล่านี้มีแนวโน้มที่จะทนทานในระยะยาว และยังเร็วเกินไปที่จะบอกว่าเอฟเฟกต์เครือข่ายโดยตรงที่แข็งแกร่งกำลังเข้าครอบงำในชั้นใด ๆ ของสแต็คหรือไม่

จากข้อมูลที่มีอยู่ ยังไม่ชัดเจนว่าจะมีไดนามิกแบบผู้ชนะรับทั้งหมดในระยะยาวใน AI กำเนิดหรือไม่

นี่เป็นเรื่องแปลก แต่สำหรับเราถือเป็นข่าวดี ขนาดที่เป็นไปได้ของตลาดนี้ยากที่จะเข้าใจ — อยู่ที่ไหนสักแห่งระหว่างนั้น ซอฟต์แวร์ทั้งหมด และ ความพยายามทั้งหมดของมนุษย์ — ดังนั้นเราจึงคาดหวังผู้เล่นจำนวนมากและการแข่งขันที่ดีในทุกระดับของสแต็ค นอกจากนี้ เรายังคาดหวังให้บริษัททั้งแนวราบและแนวสูงประสบความสำเร็จด้วยแนวทางที่ดีที่สุดซึ่งกำหนดโดยตลาดปลายทางและผู้ใช้ปลายทาง ตัวอย่างเช่น หากความแตกต่างหลักในผลิตภัณฑ์ขั้นสุดท้ายคือตัว AI เอง ก็เป็นไปได้ว่าการปรับแนวตั้ง (เช่น การรวมแอปที่ผู้ใช้เห็นเข้ากับโมเดลที่ผลิตเองที่บ้านอย่างแน่นหนา) จะชนะ ในขณะที่หาก AI เป็นส่วนหนึ่งของชุดคุณสมบัติหางยาวที่ใหญ่ขึ้น ก็จะมีแนวโน้มที่จะเกิดแนวนอนมากขึ้น แน่นอน เราควรเห็นการสร้างคูน้ำแบบเดิมมากขึ้นเมื่อเวลาผ่านไป และเราอาจเห็นคูเมืองรูปแบบใหม่เกิดขึ้นด้วย

ไม่ว่าในกรณีใด สิ่งหนึ่งที่เรามั่นใจก็คือ AI เชิงกำเนิดจะเปลี่ยนเกม เราทุกคนกำลังเรียนรู้กฎแบบเรียลไทม์ มีมูลค่ามหาศาลที่จะถูกปลดล็อก และภูมิทัศน์ของเทคโนโลยีจะดูแตกต่างไปจากเดิมมาก และเรามาที่นี่เพื่อมัน!

ภาพทั้งหมดในโพสต์นี้สร้างขึ้นโดยใช้ Midjourney

ประทับเวลา:

เพิ่มเติมจาก Andreessen Horowitz