השבוע ב-AI, 18 באוגוסט: OpenAI בצרות פיננסיות • Stability AI מכריזה על StableCode - KDnuggets

הועלה מחדש על ידי אפלטון

עוקב: 0

### ALT ###
תמונה שנוצרה על ידי עורך עם Midjourney

ברוכים הבאים למהדורת השבוע של "השבוע ב-AI" ב-KDnuggets. פוסט שבועי זה נועד לעדכן אותך בהתפתחויות המשכנעות ביותר בעולם המתקדם במהירות של בינה מלאכותית. מכותרות פורצות דרך שמעצבות את הבנתנו את תפקידה של בינה מלאכותית בחברה ועד למאמרים מעוררי מחשבה, משאבי למידה מעוררי תובנה ומחקר זרקור שדוחף את גבולות הידע שלנו, פוסט זה מספק סקירה מקיפה של הנוף הנוכחי של הבינה המלאכותית. עדכון שבועי זה נועד לעדכן אותך ולעדכן אותך בתחום המתפתח כל הזמן. הישארו מעודכנים וקריאה מהנה!

מדור "כותרות" דן בחדשות וההתפתחויות המובילות מהשבוע האחרון בתחום הבינה המלאכותית. המידע נע בין מדיניות בינה מלאכותית ממשלתית להתקדמות טכנולוגית וחידושים תאגידיים ב-AI.

??? ChatGPT בצרות: OpenAI עשויה לפשוט רגל עד 2024, בוט AI עולה לחברה 700,000 דולר בכל יום

OpenAI עומדת בפני צרות פיננסיות בשל העלויות הגבוהות של הפעלת ChatGPT ושירותי AI אחרים. למרות צמיחה מוקדמת מהירה, בסיס המשתמשים של ChatGPT ירד בחודשים האחרונים. OpenAI נאבקת לייצר רווח יעיל מהטכנולוגיה שלה ולייצר הכנסות בר קיימא. בינתיים, הוא ממשיך להישרף מזומנים בקצב מדאיג. עם התחממות התחרות ומחסור ב-GPU ארגוני שמפריע לפיתוח מודלים, OpenAI צריך למצוא בדחיפות מסלולים לרווחיות. אם היא לא תצליח לעשות זאת, פשיטת רגל עשויה להיות באופק עבור הסטארט-אפ החלוצי של AI.

??? Stability AI מכריזה על StableCode, עוזר קידוד AI למפתחים

Stability AI שחררה את StableCode, מוצר הבינה המלאכותית הגנרטיבית הראשון שלה המותאם לפיתוח תוכנה. StableCode משלבת דגמים מרובים שהוכשרו על למעלה מ-500 מיליארד אסימונים של קוד כדי לספק השלמה אוטומטית חכמה, להגיב להוראות שפה טבעית ולנהל טווחים ארוכים של קוד. בעוד שבינה מלאכותית שיחה כבר יכולה לכתוב קוד, StableCode נבנתה במיוחד כדי להגביר את הפרודוקטיביות של המתכנת על ידי הבנת מבנה הקוד והתלות. עם ההכשרה המיוחדת והמודלים שלה שיכולים להתמודד עם הקשרים ארוכים, StableCode שואפת לשפר את זרימות העבודה של מפתחים ולהוריד את מחסום הכניסה של קודנים שואפים. ההשקה מייצגת את הגיחה של Stability AI לכלי קידוד בסיוע בינה מלאכותית בתוך התחרות הגוברת בחלל.

??? הכירו את Superalignment מאת OpenAI

OpenAI פועלת באופן יזום כדי לטפל בסיכונים פוטנציאליים מ- AI סופר-אינטליגנטית באמצעות צוות Superalignment החדש שלהם, שמשתמש בטכניקות כמו לימוד חיזוק ממשוב אנושי ליישור מערכות AI. המטרות העיקריות הן פיתוח שיטות אימון ניתנות להרחבה תוך מינוף מערכות בינה מלאכותיות אחרות, אימות חוסן המודל ובדיקת מאמץ של צינור היישור המלא אפילו עם מודלים שגויים בכוונה. בסך הכל, OpenAI שואפת להראות שלמידת מכונה יכולה להתבצע בבטחה על ידי גישות חלוציות לכיוון אחראי של מודיעין על.

??? למד תוך כדי חיפוש (ודפדוף) באמצעות AI גנרטיבי

גוגל מכריזה על מספר עדכונים ליכולות הבינה המלאכותית של מנוע החיפוש (SGE) שלה, כולל הגדרות ריחוף לנושאי מדע/היסטוריה, הדגשת תחביר מקודדת צבע לסקירות כלליות של קוד, וניסוי מוקדם בשם "SGE תוך כדי גלישה" המסכם נקודות מפתח ועוזר למשתמשים חקור דפים בעת קריאת תוכן ארוך באינטרנט. מטרות אלה לשפר את ההבנה של נושאים מורכבים, לשפר את העיכול של מידע קידוד ולסייע בניווט ולמידה בזמן שמשתמשים גולשים. העדכונים מייצגים את המשך המאמצים של גוגל לפתח את חוויית החיפוש בינה מלאכותית שלה בהתבסס על משוב משתמשים, תוך התמקדות בהבנה וחילוץ פרטים מרכזיים מתוכן אינטרנט מורכב.

??? Together.ai מרחיבים את Llama2 לחלון הקשר של 32k

LLaMA-2-7B-32K הוא מודל שפת הקשר ארוך בקוד פתוח שפותח על ידי Together Computer, המרחיב את אורך ההקשר של אסימוני LLaMA-2 של Meta ל-32K. הוא ממנף אופטימיזציות כמו FlashAttention-2 כדי לאפשר הסקה והדרכה יעילים יותר. המודל הוכשר מראש באמצעות תערובת של נתונים כולל ספרים, מאמרים ונתוני הדרכה. ניתנות דוגמאות לכוונון עדין של משימות QA וסיכום ארוך צורה. משתמשים יכולים לגשת לדגם דרך Hugging Face או להשתמש ב-OpenChatKit לכוונון עדין מותאם אישית. כמו כל דגמי השפה, LLaMA-2-7B-32K יכול ליצור תוכן מוטה או שגוי, המצריך זהירות בשימוש.

המדור "מאמרים" מציג מערך של יצירות מעוררות מחשבה על בינה מלאכותית. כל מאמר צולל עמוק לתוך נושא ספציפי, ומציע לקוראים תובנות לגבי היבטים שונים של AI, כולל טכניקות חדשות, גישות מהפכניות וכלים פורצי דרך.

??? LangChain Cheat Sheet

עם LangChain, מפתחים יכולים לבנות אפליקציות מבוססות שפת בינה מלאכותית מבלי להמציא מחדש את הגלגל. המבנה הניתן להרכבה מקל על שילוב והתאמה של רכיבים כמו LLMs, תבניות בקשות, כלים חיצוניים וזיכרון. זה מאיץ את יצירת האב-טיפוס ומאפשר שילוב חלק של יכולות חדשות לאורך זמן. בין אם אתם מחפשים ליצור צ'אט בוט, בוט QA או סוכן חשיבה רב-שלבי, LangChain מספקת את אבני הבניין להרכבת AI מתקדם במהירות.

??? כיצד להשתמש ב-ChatGPT כדי להמיר טקסט למצגת PowerPoint

המאמר מתאר תהליך דו-שלבי לשימוש ב-ChatGPT כדי להמיר טקסט למצגת PowerPoint, תחילה מסכם את הטקסט לכותרות ותוכן של שקופיות, ולאחר מכן יצירת קוד Python כדי להמיר את הסיכום לפורמט PPTX באמצעות ספריית python-pptx. זה מאפשר יצירה מהירה של מצגות מרתקות ממסמכי טקסט ארוכים, תוך התגברות על מאמצים ידניים מייגעים. ניתנת הנחיות ברורות לגבי יצירת הנחיות ChatGPT והפעלת הקוד, ומציעה פתרון אוטומטי יעיל לצרכי מצגת.

??? אתגרים פתוחים במחקר LLM

המאמר מספק סקירה של 10 כיווני מחקר מרכזיים לשיפור מודלים של שפות גדולות: הפחתת הזיות, אופטימיזציה של אורך/בניית הקשר, שילוב נתונים מולטי-מודאליים, האצת מודלים, תכנון ארכיטקטורות חדשות, פיתוח חלופות GPU כמו שבבים פוטוניים, בניית סוכנים שמישים, שיפור הלמידה מ משוב אנושי, שיפור ממשקי הצ'אט והרחבה לשפות שאינן אנגלית. הוא מצטט מאמרים רלוונטיים על פני תחומים אלה, ומציין אתגרים כמו ייצוג העדפות אנושיות ללמידת חיזוק ובניית מודלים לשפות בעלות משאבים נמוכים. המחבר מסיק שבעוד שחלק מהנושאים כמו רב לשוניות ניתנים לפתרון, אחרים כמו ארכיטקטורה ידרשו פריצות דרך נוספות. בסך הכל, גם מומחיות טכנית וגם לא טכנית בין חוקרים, חברות והקהילה תהיה קריטית כדי לכוון את ה-LLMs בצורה חיובית.

??? למה אתה (כנראה) לא צריך לכוונן LLM

??? שיטות עבודה מומלצות לשימוש במודל OpenAI GPT

המאמר מתאר שיטות עבודה מומלצות להשגת תפוקות באיכות גבוהה בעת שימוש במודלים של GPT של OpenAI, תוך הסתמכות על ניסיון קהילתי. הוא ממליץ לספק הנחיות מפורטות עם פרטים כמו אורך ופרסונה; הוראות מרובות שלבים; דוגמאות לחיקוי; הפניות וציטוטים; זמן לחשיבה ביקורתית; וביצוע קוד לדיוק. ביצוע טיפים אלה להדרכה של המודלים, כגון ציון שלבים ופרסונות, יכול להוביל לתוצאות מדויקות יותר, רלוונטיות וניתנות להתאמה אישית. מטרת ההנחיות היא לעזור למשתמשים לבנות הנחיות בצורה יעילה כדי להפיק את המרב מהיכולות היצירתיות החזקות של OpenAI.

??? כולנו טועים לגבי AI

המחבר טוען שמזלזלים ביכולות ה-AI הנוכחיות, תוך שימוש בדוגמאות כמו יצירתיות, חיפוש והתאמה אישית כדי להתמודד עם תפיסות שגויות נפוצות. הוא קובע שבינה מלאכותית יכולה להיות יצירתית על ידי שילוב מחדש של מושגים, לא רק לייצר רעיונות אקראיים; זה לא רק מנוע חיפוש מוגדש כמו גוגל; והוא יכול לפתח מערכות יחסים מותאמות אישית, לא רק מיומנויות כלליות. למרות שאיננו בטוח אילו יישומים יוכיחו את עצמם כשימושיים ביותר, המחבר מעודד ראש פתוח ולא ביטול, ומדגיש שהדרך הטובה ביותר לקבוע את הפוטנציאל של AI היא על ידי המשך חקירה מעשית. הוא מסיק שהדמיון שלנו סביב AI מוגבל וסביר להניח שהשימושים בו עולים בהרבה על התחזיות הנוכחיות.

הקטע "כלים" מפרט יישומים וסקריפטים שימושיים שנוצרו על ידי הקהילה למי שרוצה להתעסק ביישומי AI מעשיים. כאן תמצאו מגוון סוגי כלים, מבסיסי קוד גדולים ומקיפים ועד סקריפטים נישה קטנים. שים לב שכלים משותפים ללא אישור, וללא ערובה מכל סוג שהוא. עשה שיעורי בית משלך על כל תוכנה לפני ההתקנה והשימוש!

🛠️ MetaGPT: מסגרת ריבוי הסוכנים

MetaGPT לוקחת דרישה בשורה אחת כקלט ומוציאה סיפורי משתמשים / ניתוח תחרותי / דרישות / מבני נתונים / APIs / מסמכים וכו'. מבחינה פנימית, MetaGPT כולל מנהלי מוצר / אדריכלים / מנהלי פרויקטים / מהנדסים. הוא מספק את כל התהליך של חברת תוכנה יחד עם SOPs מתוזמרים בקפידה.

🛠️ מאמן GPT LLM

המטרה של פרויקט זה היא לחקור צינור חדש ניסיוני להכשרת מודל ספציפי למשימה בעלת ביצועים גבוהים. אנו מנסים להרחיק את כל המורכבות, כך שיהיה קל ככל האפשר לעבור מרעיון -> מודל בעל הכשרה מלאה.

כל שעליך לעשות הוא להזין תיאור של המשימה שלך, והמערכת תייצר מערך נתונים מאפס, תנתח אותו לפורמט הנכון, ותכוון עבורך מודל LLaMA 2.

🛠️ דוקטור GPT

DoctorGPT הוא מודל שפה גדול שיכול לעבור את בחינת הרישוי הרפואי בארה"ב. זהו פרויקט בקוד פתוח עם המשימה לספק לכל אחד את הרופא הפרטי שלו. DoctorGPT היא גרסה של Llama2 של 7 מיליארד פרמטר Large Language Model של Meta, אשר כווננה במערך נתונים של דיאלוג רפואי, ולאחר מכן שופרה עוד יותר באמצעות למידת חיזוק ובינה מלאכותית. מכיוון שהדגם בגודל 3 גיגה-בייט בלבד, הוא מתאים לכל מכשיר מקומי, כך שאין צורך לשלם API כדי להשתמש בו.