Generative AI สามารถเติมเงินตลาดโทรศัพท์ได้หรือไม่? - เซมิวิกิ

Generative AI สามารถเติมเงินตลาดโทรศัพท์ได้หรือไม่? – เซมิวิกิ

โหนดต้นทาง: 2926005

ฉันทามติเกี่ยวกับตลาดสมาร์ทโฟนอยู่ระหว่างการลดลงเล็กน้อยและการเติบโตเล็กน้อย ซึ่งบ่งชี้ว่าขาดปัจจัยขับเคลื่อนที่ชัดเจนสำหรับการเติบโตที่แข็งแกร่งยิ่งขึ้น เนื่องจากโอกาสทางธุรกิจ สถานะที่ไม่น่าดึงดูดนี้จึงถูกชดเชยด้วยปริมาณที่แท้จริง ($500B ในปี 2023 ตามแหล่งข้อมูลเดียว) แต่เราใกล้จะได้รับการยอมรับสูงสุดนอกประเทศจีนแล้ว ดังนั้นคำถามที่แท้จริงสำหรับผู้ผลิตโทรศัพท์ต้องเป็น "นักฆ่าคนต่อไปคืออะไร" แอพที่สามารถขยับเข็มได้?”

Generative AI สามารถเติมเงินตลาดโทรศัพท์ได้

ผู้บริโภคอย่างเราเป็นคนไม่แน่นอนและความบันเทิงดูเหมือนจะอยู่ในอันดับสูงในรายการสิ่งที่ต้องมีของเรา แขนอยู่ เดิมพันเกมบนมือถือ. ความเป็นไปได้อีกอย่างหนึ่งอาจเป็น geneative AI สำหรับการสร้าง/จัดการภาพ วอลคอมม์ ได้สาธิตความสามารถทางโทรศัพท์แล้ว ในขณะที่คนอื่นๆ รวมถึง Apple ยังคงมุ่งเน้นไปที่แอปโมเดลภาษาขนาดใหญ่ สำหรับฉัน มันคุ้มค่าที่จะพิจารณาแง่มุมภาพของ AI เชิงสร้างสรรค์ให้ละเอียดยิ่งขึ้น เพื่อให้มีความรู้มากขึ้นอีกหน่อยว่าสิ่งนี้จะเริ่มขึ้นเมื่อใดและเมื่อไร เพื่อความสนุกสนาน ฉันสร้างภาพที่นี่โดยใช้ Image Creator จาก Microsoft Bing

การสร้างตามการแพร่กระจาย

ฉันจะพยายามอธิบายแนวคิดนี้โดยเปรียบเทียบกับ LLM LLM ฝึกฝนเกี่ยวกับลำดับข้อความ ซึ่งจำเป็นต้องเป็นเส้นตรง เยอะมาก. และพวกเขาทำงานกับข้อความโทเค็น โดยเรียนรู้เมื่อพวกเขาเห็นลำดับโทเค็นบางอย่างที่อาจเป็นไปตามลำดับนั้น เหมาะสำหรับข้อความ แต่ไม่ใช่รูปภาพที่เป็น 2 มิติ และโดยทั่วไปไม่สามารถแปลงโทเค็นได้ ดังนั้นแนวทางการฝึกอบรมจึงต้องแตกต่างออกไป ในการฝึกแบบแพร่กระจาย สัญญาณรบกวนแรกจะถูกเพิ่มเข้าไปในภาพการฝึกอย่างต่อเนื่อง (การแพร่กระจายไปข้างหน้า) ในขณะที่เครือข่ายได้รับการฝึกฝนโดยการลดสัญญาณรบกวนของภาพที่แก้ไขเพื่อกู้คืนภาพต้นฉบับแต่ละภาพ (การแพร่กระจายแบบย้อนกลับ) ฟังดูยุ่งเหยิง แต่เห็นได้ชัดว่าวิธีการ denoising (การแก้สมการเชิงอนุพันธ์สุ่ม) มีการกำหนดไว้ชัดเจนและมีประสิทธิภาพ ตัวอย่างหนึ่งคือโมเดล Stable Diffusion ที่เปิดเผยต่อสาธารณะ

จากนั้นจึงสามารถสร้างภาพใหม่จากเครือข่ายที่ได้รับการฝึกอบรมนี้ โดยเริ่มจากภาพสัญญาณรบกวนแบบสุ่ม ตอนนี้คุณต้องมีวิธีในการแนะนำภาพที่คุณต้องการสร้าง Dall.E-2, Midjourney และ Stable Diffusion สามารถรับข้อความแจ้งได้ สิ่งเหล่านี้ขึ้นอยู่กับการฝึกที่ได้รับจากป้ายข้อความที่ให้มาพร้อมกับรูปภาพการฝึก การอนุมานจะรวมข้อมูลที่พร้อมท์ในกระบวนการสนใจในเส้นทางสู่การอนุมานภาพสุดท้าย เช่นเดียวกับ LLM ระบบเหล่านี้ยังใช้หม้อแปลงไฟฟ้า ซึ่งหมายความว่าการรองรับความสามารถนี้ต้องใช้ฮาร์ดแวร์ใหม่

การสร้างไม่ได้จำกัดอยู่เพียงการสร้างภาพตั้งแต่เริ่มต้น มีเทคนิคที่เรียกว่า ภาพวาด สามารถใช้เพื่อปรับปรุงหรือแทนที่บางส่วนของรูปภาพ คิดว่านี่เป็นเวอร์ชันที่ใช้ AI ของการแก้ไขรูปภาพที่ได้รับความนิยมในสมาร์ทโฟนอยู่แล้ว ไม่ใช่แค่สีพื้นฐาน ความสมดุลของแสง การครอบตัดโฟโต้บอมบ์ ฯลฯ แต่ยังแก้ไขปัญหาที่ท้าทายมากขึ้นหรือร่างคอสเพลย์ตัวเองใหม่ – อะไรก็ได้ ตอนนี้ผมเห็นว่ากำลังเป็นที่นิยมอย่างมาก

generative AI จะขยับเข็มหรือไม่?

ฉันไม่รู้ – ดูความคิดเห็นข้างต้นเกี่ยวกับผู้บริโภคที่ไม่แน่นอน กระตุ้นการมองเห็น โดยเฉพาะรอบตัวเรา และการเล่นที่ดึงดูดใจเกือบทุกคน ถ้าคุณสามารถทำได้บนโทรศัพท์ของคุณ ทำไมจะไม่ได้ล่ะ? AI เป็นโดเมนที่เคลื่อนไหวเร็วซึ่งดูเหมือนว่าจะส่งเสริมการเดิมพันครั้งใหญ่ ฉันไม่อยากเดิมพันกับความเป็นไปได้นี้อย่างแน่นอน

ฉันควรกล่าวถึงด้วยว่าการสร้างภาพแบบกำเนิดมีการใช้งานที่จริงจังกว่าอยู่แล้ว โดยเฉพาะอย่างยิ่งในสาขาการแพทย์ที่สามารถใช้เพื่อซ่อมแซมการสแกน CAT ที่มีเสียงดังหรือกู้คืนรายละเอียดที่อาจถูกบล็อกโดยโครงสร้างกระดูก ฉันนึกภาพออกว่าเทคโนโลยีนี้ทำงานในชุดเครื่องมือนิติเวชได้ เราทุกคนเคยดูรายการทีวีมาแล้ว - แอ๊บบี้หรือแองเจลากรอกรายละเอียดที่ขาดหายไปในภาพถ่ายโดยคาดการณ์ด้วยข้อมูลที่ผ่านการฝึกอบรมจากสิ่งที่มองเห็นได้ การสร้างภาพอาจทำให้สิ่งนั้นเป็นไปได้!

แชร์โพสต์นี้ผ่าน:

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิกิ