การหยุดชะงักครั้งต่อไป

การหยุดชะงักครั้งต่อไป

โหนดต้นทาง: 1948254

แมชชีนเลิร์นนิง (ML) เป็นเทคโนโลยีที่ก่อกวนโดยเนื้อแท้ เนื่องจากสถาปัตยกรรมอัลกอริทึมกำลังพัฒนาอย่างรวดเร็วและต้องใช้การประมวลผลอย่างมาก จึงต้องใช้ซิลิคอนที่เป็นนวัตกรรมใหม่เพื่อประสิทธิภาพที่ยอมรับได้ บล็อกนี้พิจารณาว่าเราเคยไปที่ใดและที่ใดที่ ML กำลังจะไป – เข้าสู่ตลาดอื่นที่พร้อมรับการหยุดชะงัก

ML เริ่มต้นในศูนย์ข้อมูล

ในยุคแรก ๆ ของการระเบิดของ ML เมื่อ 8 หรือ 9 ปีที่แล้ว การกระทำทั้งหมดในโลกของ ML นั้นอยู่ในศูนย์ข้อมูล นักวิทยาศาสตร์ด้านข้อมูลได้ค้นพบสถาปัตยกรรมเครือข่ายใหม่อย่างต่อเนื่องและฝึกฝนปริมาณงานที่มากขึ้นในระบบคลาวด์ ในตอนแรก พวกเขาใช้โหนด CPU ของการประมวลผลแบบคลาวด์ทั่วไปที่มีอยู่ แต่ได้ย้ายไปใช้การ์ด Graphic Processing Unit (GPU) ที่มีประสิทธิภาพสูงขึ้นอย่างรวดเร็วสำหรับการฝึกอบรม ML

หลังจากนั้นไม่นาน ซิลิคอนเฉพาะ ML สายพันธุ์ใหม่ทั้งสำหรับการฝึกอบรมและการอนุมาน เช่น Tensor Processing Unit (TPU) ของ Google เริ่มปรากฏในศูนย์ข้อมูล โดยรวมแล้วในช่วงเวลาสั้นๆ ไม่กี่ปี การเกิดขึ้นของ ML ได้เปลี่ยนโฉมหน้าทั้งสถาปัตยกรรมของซิลิคอนสำหรับศูนย์ข้อมูลและรายชื่อผู้ให้บริการซิลิคอนในพื้นที่อย่างมาก

ML ปรากฏในโทรศัพท์มือถือ

อย่างไรก็ตาม แมชชีนเลิร์นนิงไม่ได้ติดอยู่ในระบบคลาวด์เป็นเวลานาน ด้วยเหตุผลหลายประการ ปริมาณงาน ML จึงถูกโยกย้ายไปยังอุปกรณ์และจุดสิ้นสุดที่หลากหลาย ตัวอย่างที่โดดเด่นที่สุดคือโทรศัพท์มือถือ การเปลี่ยนแปลงของอุตสาหกรรมโทรศัพท์มือถือนั้นทำให้ผู้เล่นซิลิคอนรายใหญ่เปลี่ยนแพลตฟอร์มเรือธงเวอร์ชันใหม่ทุกปี ประสิทธิภาพเกณฑ์มาตรฐานของ CPU และ GPU เป็นการทดสอบสารสีน้ำเงินของความเป็นผู้นำด้านประสิทธิภาพเป็นเวลาหลายปี โดยเฉพาะอย่างยิ่งประสิทธิภาพของ GPU ในการเรนเดอร์เกม แต่แล้วอัลกอริทึม ML ก็เริ่มปรากฏบ่อยขึ้นในโทรศัพท์มือถือในปี 2014-15 โดยส่วนใหญ่พบในอัลกอริทึมการถ่ายภาพด้วยคอมพิวเตอร์เพื่อปรับปรุงภาพถ่ายและวิดีโอในโทรศัพท์มือถือ

ในปี 2017 ตัวเร่งความเร็ว ML โดยเฉพาะตัวแรกปรากฏใน Apple iPhone ใน A11 SoC ในปี 2018 หน่วยประมวลผลประสาท (NPU) รุ่นที่สองปรากฏในแพลตฟอร์ม iPhone รวมถึง API ของซอฟต์แวร์ที่จำเป็นในการเปิด NPU นั้นให้กับชุมชนนักพัฒนาแอปพลิเคชันขนาดใหญ่ กระแสตอบรับเป็นไปในเชิงบวกอย่างท่วมท้น และการแข่งขันก็เกิดขึ้นระหว่างนักพัฒนา SoC ของโทรศัพท์มือถือเพื่อผลักดันประสิทธิภาพ ML สู่โทรศัพท์มือถือให้มากขึ้น

ก้าวไปข้างหน้าอย่างรวดเร็วเพียงสี่ปีจนถึงฤดูใบไม้ร่วงปี 2022 การเปิดตัวโปรเซสเซอร์โทรศัพท์มือถือ A-series ล่าสุดและ NPU 17 TOPS ที่ตอนนี้ปรากฏในรูปถ่ายตายเพื่อกินพื้นที่ซิลิกอนมากกว่าระบบย่อย GPU ทั้งหมด ในช่วงเวลาสั้น ๆ ห้าปีนั้น แรงขับเคลื่อนของ SoC ของโทรศัพท์มือถือถูกเปลี่ยนแปลงโดยสิ้นเชิงจากการเรียนรู้ของเครื่องอย่างกะทันหัน

เซ็กเมนต์เซมิคอนดักเตอร์ขนาดใหญ่ถัดไปสำหรับ ML คืออะไร

ประการแรก ตลาดซิลิกอนของดาต้าเซ็นเตอร์เปลี่ยนไป จากนั้นโทรศัพท์มือถือ SoC ตลาดซิลิกอนเฉพาะกลุ่มขนาดเล็กอื่นๆ อีกหลายแห่งได้รับการเปลี่ยนแปลงครั้งใหญ่จากความต้องการด้านประสิทธิภาพของแมชชีนเลิร์นนิง แต่จะเป็นอย่างไรต่อไป ใหญ่ ส่วนเซมิคอนดักเตอร์ที่จะรู้สึกถึงผลกระทบของ ML?

มีโอกาสดีมากที่คุณกำลังอ่านบล็อกนี้บนแล็ปท็อปหรือเดสก์ท็อปพีซี 91% ของพีซีทั่วโลกที่จัดส่งในปี 2021 ขับเคลื่อนด้วยโปรเซสเซอร์ x86 ซึ่งไม่มี NPU เฉพาะเช่น SoC ของโทรศัพท์ที่กล่าวถึงก่อนหน้านี้ สองและสามทศวรรษที่ผ่านมา ผู้ใช้และผู้ซื้อเดสก์ท็อปและแล็ปท็อปพีซีให้ความสนใจอย่างมากกับฟีดและความเร็วของซิลิกอนที่ให้พลังงานแก่เครื่องจักรใหม่ ผู้ที่มีอายุมากพอที่จะจำสงคราม GHz ได้จะนึกถึงความเร็วโปรเซสเซอร์ที่เพิ่มสูงขึ้นเรื่อย ๆ ที่โฆษณาบนเว็บไซต์ ในร้านค้า และในโฆษณา

แต่นั่นเป็นมนุษย์ทั้งรุ่นก่อนหน้านี้ หากคุณกำลังอ่านข้อความนี้ในวันนี้บนแล็ปท็อปสำหรับทำงานที่บริษัทออกให้ มีโอกาสที่หากเครื่องนั้นเสียในวันพรุ่งนี้ คุณจะไม่สนใจหรือให้ความสนใจใดๆ กับข้อมูลจำเพาะของโปรเซสเซอร์หลักในแล็ปท็อปเครื่องใหม่ที่แผนกไอทีของบริษัทจัดส่งให้คุณ คุณจะรู้สึกตื่นเต้นที่เครื่องใหม่ปรากฏขึ้นอย่างรวดเร็ว โดยที่ทุกอย่างทำงานได้อย่างราบรื่น เพราะการตั้งค่าและไฟล์ทั้งหมดของคุณได้รับการสำรองไว้ในระบบคลาวด์ หากทีมไอทีของคุณเป็นระดับแนวหน้า คุณสามารถไปรับประทานอาหารกลางวันและกลับไปใช้เครื่องใหม่ที่ใช้งานได้ตามปกติ และไม่ต้องดูข้อมูลจำเพาะของโปรเซสเซอร์เลยด้วยซ้ำ

ครั้งสุดท้ายที่คุณอ่านข้อมูลจำเพาะสำหรับจำนวนคอร์ GHz และพื้นที่เก็บข้อมูลในแล็ปท็อปที่ทำงานของคุณอย่างละเอียดคือเมื่อใด หากคุณเป็นผู้ใช้ระดับธุรกิจหรือระดับผู้จัดการทั่วไป เป็นไปได้ว่าเป็นเวลากว่าสิบปีแล้วหรือมากกว่านั้นที่คุณให้ความสนใจกับสิ่งใดๆ ที่นอกเหนือไปจากความจุในการจัดเก็บและอายุการใช้งานแบตเตอรี่ แพลตฟอร์มเหล่านี้เป็นเครื่องมือเพิ่มประสิทธิภาพที่แพร่หลายและจำเป็น แต่ซิลิคอนพื้นฐานนั้นค่อนข้างน่าเบื่อ ที่มีแนวโน้มมากที่จะเปลี่ยนแปลง

โมเดล ML เจนเนอเรทีฟ เช่น Stable Diffusion 2.0 และ DALL-E พร้อมที่จะเขย่าแพลตฟอร์มที่มีอยู่ทั่วไปและน่าเบื่อซึ่งขับเคลื่อนเดสก์ท็อป แล็ปท็อป และแท็บเล็ตส่วนใหญ่อย่างสิ้นเชิง เจนเนอเรชั่นแมชชีนเลิร์นนิงสำหรับการสร้างและปรับปรุงรูปภาพได้รับความนิยมอย่างมากในช่วงเก้าเดือนที่ผ่านมา อัลกอริทึมใหม่เหล่านี้สามารถสร้างรูปภาพใหม่ทั้งหมดตามคำอธิบายที่ป้อนข้อความหรือแก้ไขรูปภาพที่มีอยู่ (เพิ่ม ลบ หรือผสมผสานวัตถุ) ไอเดียสุดเพ้อฝันที่ไม่น่าเชื่อ เช่น "นักบินอวกาศบนหลังม้า" หรือ "ทีมฟุตบอล Cal Bears คว้าถ้วยรางวัลชนะเลิศระดับประเทศ" สามารถสร้างขึ้นได้ง่ายๆ โดยมือใหม่ที่ไม่มีทักษะด้านศิลปะหรือประสบการณ์ Photoshop

(ภาพจาก Wikipedia Commons สร้างโดย Stable Diffusion 1.0)

ทุกวันนี้เครื่องมือเหล่านี้แทบจะเข้าถึงผู้ใช้ทางธุรกิจทั่วไปทุกวัน แต่เครื่องมือเหล่านี้ต้องการการประมวลผลที่มากกว่าที่มีอยู่ในแล็ปท็อปธุรกิจมาตรฐานราคา $2000 อย่างเห็นได้ชัด ตัวอย่างเช่น Stable Diffusion 2.0 ที่ทำงานบนการ์ดเสริม GPU บนเดสก์ท็อปมูลค่า 1500 ดอลลาร์ในปัจจุบันบนพีซีประสิทธิภาพสูงบนอิมเมจ 512 × 512 พร้อมตัวอย่างขั้นตอนที่ 200 มีรันไทม์ 2 นาที ปริมาณงานเดียวกันนั้นใช้เวลามากกว่า 30 นาทีสำหรับปัญหามาตรฐาน "แล็ปท็อปสำหรับธุรกิจ" ผู้ใช้ทั่วไปจะไม่มีความอดทนรอถึง 30 นาที นับประสาอะไรกับการวนซ้ำหลายๆ ครั้ง หากการแก้ไขภาพนิ่งเพียงภาพเดียวกินเวลาหนึ่งชั่วโมงหรือมากกว่านั้นในหนึ่งวัน การตัดต่อวิดีโอสั้นๆ นั้นเป็นไปไม่ได้! ผู้ใช้รายนั้นสามารถเข้าถึงเครื่องมือออนไลน์ผ่านทรัพยากรการประมวลผลบนคลาวด์ต่างๆ แต่อาจมีราคาแพงหากใช้บ่อยๆ [OpenAI – ผู้สร้าง ChatGPT – อยู่ในข่าวในเดือนนี้ โดยเพิ่มเงินทุนสำหรับการขยายตัวที่มูลค่าองค์กร $30B นักลงทุนกำลังเสนอราคาเพิ่มมูลค่าบริษัทโดยคาดหวังว่าการใช้งานและรายได้จะเติบโตอย่างต่อเนื่อง!]

เราคาดการณ์ว่าจะใช้เวลาเพียงชั่วพริบตาก่อนที่ความต้องการเครื่องมือเพิ่มประสิทธิภาพภาพและวิดีโอเหล่านี้จะเข้าสู่เครื่องมือทั่วไปในชีวิตประจำวันที่ใช้โดยธุรกิจและผู้บริหารหลายร้อยล้านคน ในฐานะผู้จัดการธุรกิจและผู้สร้างเนื้อหาทางการตลาด ฉันสามารถยืนยันได้ว่ามีหลายครั้งที่ฉันต้องการสื่อสารบางอย่างในสไลด์ที่สามารถดำเนินการได้ดีที่สุดด้วยแอนิเมชั่นหรือภาพหรือลำดับภาพ/วิดีโอ แต่โครงการไม่ใหญ่พอที่จะรับประกันค่าใช้จ่าย และความล่าช้าในการไปหาหน่วยงานสร้างสรรค์ศิลปินภายนอกเพื่อสร้างงานศิลปะในอุดมคติ หาก PowerPoint ที่ไว้ใจได้และมีอยู่ทั่วไปมีชุดเครื่องมือสร้างรูปภาพ/วิดีโอในตัว จำนวนครั้งที่ฉันจะพยายามสร้างจินตภาพแปลกใหม่จะพุ่งสูงขึ้น หรือนึกถึงวิธีมากมายในการปรับปรุงเอกสารทางเทคนิค (บล็อกไดอะแกรม โฟลว์ชาร์ต) เพื่อสื่อสารข้อมูลเพิ่มเติมเป็นลำดับภาพเคลื่อนไหว เครื่องมือประมวลผลคำในปัจจุบันมีความสามารถในการคาดเดาข้อความที่สำคัญอยู่แล้ว และรายงานที่ตีพิมพ์เมื่อต้นเดือนมกราคมแนะนำว่า Microsoft กำลังพิจารณาที่จะรวม ChatGPT ของ OpenAI เข้ากับชุดเครื่องมือ Office เพื่อขยายความสามารถในการเขียนแบบอัตโนมัติของผลิตภัณฑ์เหล่านั้น

มีโอกาสมากมายสำหรับ ML ในการเสริมชุดเครื่องมือซอฟต์แวร์ธุรกิจมาตรฐาน แต่แพลตฟอร์มซิลิกอนในปัจจุบันยังขาดแคลน ML ที่อนุมานแรงม้าในการคำนวณเพื่อให้เครื่องมือดังกล่าวทำงานได้อย่างมีประสิทธิภาพตามเวลาบนแล็ปท็อปขณะนั่งอยู่บนที่นั่งริมทางเดินของ ของเครื่องบินที่ความสูง 30,000 ฟุต หากประสบการณ์จากตลาดเซมิคอนดักเตอร์ของโทรศัพท์มือถือเป็นแนวทางที่เหมาะสม เราอาจคาดหวังที่จะเห็นการเกิดขึ้นอย่างรวดเร็วของพลังประมวลผลแมชชีนเลิร์นนิงที่ใช้งานหนักและตั้งโปรแกรมได้สูงในซิลิคอนที่ออกแบบมาสำหรับธุรกิจ ผู้บริโภค และแล็ปท็อปเพื่อการศึกษา ตลาด แท้จริงแล้ว เมื่อต้นปีใหม่มีการประกาศจาก AMD เกี่ยวกับซิลิกอนสำหรับศูนย์ข้อมูลยุคหน้าซึ่งรวมการเร่งความเร็วของ AI เข้ากับการประมวลผลแบบ x86 และสัญญาว่าจะรวมสถาปัตยกรรมที่เน้น AI เป็นศูนย์กลางเพื่อย้ายข้อมูลลงไปยังแล็ปท็อปในปี 2023 ในทำนองเดียวกัน Meteor ถัดไปของ Intel มีข่าวลืออย่างกว้างขวางว่าแพลตฟอร์ม Lake จะรวมการเร่งความเร็ว ML ไว้ในชิปเซ็ตด้วย

เช่นเดียวกับการผลิดอกออกผลอย่างรวดเร็วของแนวทางการออกแบบ ML ที่หลากหลายในตลาดโทรศัพท์มือถือ เราอาจคาดหวังว่าสถาปัตยกรรม SoC สำหรับพีซี แล็ปท็อป และแท็บเล็ตในทุกรูปแบบและทุกระดับประสิทธิภาพอาจพบกับยุคฟื้นฟูศิลปวิทยาการออกแบบที่หลากหลายในไม่ช้า จาก "น่าเบื่อ" เป็น "น่าตื่นเต้นมาก" ในพริบตา

สตีฟ ร็อดดี้

  (ทุกกระทู้)
Steve Roddy เป็นหัวหน้าเจ้าหน้าที่ฝ่ายการตลาดของ Quadric.io ก่อนหน้านี้ เขาเป็นรองประธานกลุ่มแมชชีนเลิร์นนิงที่ Arm และก่อนหน้านั้นเขาดำรงตำแหน่งรองประธานสำหรับธุรกิจลิขสิทธิ์ IP ที่ Tensilica (ซื้อกิจการโดย Cadence) และ Amphion Semiconductor เขายังดำรงตำแหน่งการจัดการผลิตภัณฑ์ที่ Synopsys, LSI Logic และ AMCC

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิศวกรรม