האם מישהו באמת מופתע שאפל מפתחת AI במכשיר?

האם מישהו באמת מופתע שאפל מפתחת AI במכשיר?

צומת המקור: 3083594

תגובה המאמצים של אפל להוסיף בינה מלאכותית למכשירי iDevices שלה לא צריכים להפתיע אף אחד, אבל השימושים הקיימים של קופרטינו בטכנולוגיה והאילוצים של חומרה ניידת, מצביעים על כך שזה לא יהיה תכונה גדולה של iOS בעתיד הקרוב.

אפל לא הצטרפה לגל האחרון של חיזוק AI הגנרטיבי, אפילו נמנעה בדרך כלל מהמונחים "AI" או "אינטליגנציה מלאכותית" במצגות המרכזיות האחרונות שלה בהשוואה לעסקים רבים. עם זאת, למידת מכונה הייתה וממשיכה להיות יכולת מפתח עבור אפל - בעיקר ברקע בשירות של שיפורים עדינים לחוויית המשתמש.

השימוש של אפל ב-AI לטיפול בתמונות הוא דוגמה אחת לטכנולוגיה הפועלת ברקע. כאשר iThings מצלמים תמונות, אלגוריתמי למידת מכונה יוצאים לעבודה כדי לזהות ולתייג נושאים, להפעיל זיהוי תווים אופטי ולהוסיף קישורים.

בשנת 2024 סוג זה של בינה מלאכותית בלתי נראית לא חותכת את זה. היריבות של אפל מציגות בינה מלאכותית גנרטיבית כיכולת חיונית לכל מכשיר ויישום. על פי הודעה לאחרונה פייננשל טיימס לדווח, אפל קנתה בשקט חברות בינה מלאכותית ופיתחה דגמי שפה גדולים משלה כדי להבטיח שהיא תוכל לספק.

יתרון החומרה של אפל

יחידות עיבוד עצביות (NPUs) בסיליקון הביתי של אפל מטפלות ביישומי AI הקיימים שלה. אפל השתמשה במאיצים, אותם היא מכנה "מנועים עצביים" מאז הופעת הבכורה של מערכת-על-שבב A2017 של 11 ומשתמשת בהם כדי להתמודד עם עומסי עבודה קטנים יותר של למידת מכונה כדי לשחרר את המעבד וה-GPU של המכשיר עבור מטלות אחרות.

ה-NPUs של אפל חזקים במיוחד. ה-A17 Pro נמצא ב- אייפון 15 Pro מסוגל לדחוף 35 TOPS, כפול מזה של קודמו, ובערך פעמיים מזה של כמה NPUs ש-Intel ו-AMD מציעים לשימוש במחשבים אישיים.

שבבי ה-Snapdragon האחרונים של קוואלקום נמצאים שם למעלה עם זה של אפל במונחים של ביצועי NPU. כמו אפל, גם לקוואלקום יש ניסיון של שנים ב-NPU במכשירים ניידים. AMD ואינטל הן חדשות יחסית בתחום.

אפל לא שיתפה את הביצועים של נקודה צפה או מספר שלם עבור ה-GPU של השבב, למרות שהיא הציגה את יכולת הריצה שלה, כמו Resident Evil 4 Remake ו-Assassin's Creed Mirage. זה מצביע על כך שכוח החישוב אינו הגורם המגביל להפעלת דגמי AI גדולים יותר על הפלטפורמה.

תמיכה נוספת בכך היא העובדה שהסיליקון מסדרת M של אפל, המשמש בקווי ה-Mac וה-iPad שלה, הוכיח את עצמו כעוצמתי במיוחד להפעלת עומסי עבודה של AI. בבדיקה שלנו, בהתחשב בזיכרון הולם - נתקלנו בצרות עם פחות מ-16 ג'יגה-בייט - M1 Macbook Air בן שלוש שנים היה יותר ממסוגל להריץ את Llama 2 7B בדיוק של 8 סיביות והיה אפילו יותר קליל עם 4 סיביות גרסה כמותית של הדגם. אגב, אם אתה רוצה לנסות את זה ב-M1 Mac שלך, Ollama.ai הופכת את הריצה של Llama 2 לפשוטה.

המקום שבו אפל עשויה להיאלץ לעשות ויתורים בחומרה הוא עם הזיכרון.

באופן כללי, דגמי בינה מלאכותית זקוקים לגיגה-בייט של זיכרון לכל מיליארד פרמטרים, כאשר הם פועלים בדיוק של 8 סיביות. ניתן לצמצם את זה בחצי או על ידי ירידה לדיוק נמוך יותר, משהו כמו Int-4, או על ידי פיתוח דגמים קטנים יותר, כמותיים.

Llama 2 7B הפך לנקודת התייחסות נפוצה עבור מחשבי AI וסמארטפונים בשל טביעת הרגל הקטנה יחסית ודרישות החישוב שלו בעת הפעלת גדלי אצווה קטנים. באמצעות קוונטיזציה של 4 סיביות, ניתן לחתוך את דרישות הדגם ל-3.5GB.

אבל אפילו עם זיכרון RAM של 8 ג'יגה-בייט באייפון 15 פרו, אנו חושדים שהדור הבא של הטלפונים של אפל עשוי להזדקק ליותר זיכרון, או שהדגמים יצטרכו להיות קטנים יותר וממוקדים יותר. זו כנראה אחת הסיבות שאפל בוחרת לפתח דגמים משלה ולא משתפת פעולה עם דגמים כמו Stable Diffusion או Llama 2 לרוץ ב-Int-4, כפי שראינו מ-Qualcomm.

יש גם כמה ראיות המצביעות על כך שאפל אולי מצאה דרך לעקוף את בעיית הזיכרון. כפי שהבחין על ידי פייננשל טיימס, עוד בדצמבר, חוקרים אפל פרסמו [PDF] מאמר המדגים את היכולת להפעיל LLMs במכשיר באמצעות זיכרון פלאש.

צפו לגישה שמרנית יותר ל-AI

כאשר אפל אכן מציגה פונקציונליות בינה מלאכותית בפלטפורמות השולחני והנייד שלה, אנו מצפים שהיא תנקוט בגישה שמרנית יחסית.

הפיכת סירי למשהו שאנשים לא מרגישים שצריך לדבר איתו כמו ילד בגיל הרך נראה מקום מובן מאליו להתחיל בו. משמעות הדבר היא לתת ל-LLM את העבודה לנתח קלט לטופס ש-Siri יכולה להבין ביתר קלות, כך שהבוט יוכל לספק תשובות טובות יותר.

סירי עלולה להתבלבל פחות בקלות אם תנסח שאילתה באופן עוקף, וכתוצאה מכך תגובות יעילות יותר.

בתיאוריה, זה אמור להיות כמה יתרונות. הראשון הוא שאפל אמורה להיות מסוגלת להתחמק משימוש בדגם קטן בהרבה ממשהו כמו Llama 2. השני, הוא שהיא צריכה להימנע במידה רבה מהנושא של ה-LLM שמייצר תגובות שגויות.

יכול להיות שאנחנו טועים, אבל לאפל יש רקורד של איחור ביישום הטכנולוגיות העדכניות ביותר, אך לאחר מכן מוצאים הצלחה היכן שאחרים נכשלו בכך שלקח זמן לשכלל וללטש תכונות עד שהן באמת שימושיות.

ובשביל מה שזה שווה, AI גנראטיבי עדיין לא הוכיח שהוא להיט: הימור הצ'אטבוט הגדול של מיקרוסופט כדי להפיח חיים במנוע החיפוש האהוב על אף אחד Bing לא תרגם להגדלת נתח שוק משמעותית.

אפל, בינתיים, לקחה את הכתר כשנת 2024 ספק סמארטפונים מוביל תוך פריסת AI בלתי נראה בלבד. ®

בול זמן:

עוד מ הקופה