->
תמונה: מארק הכמן / IDG דרך Dreamstudio.ai
טום הנקס לא סתם התקשר אליי להציע לי חלק, אבל זה בהחלט נשמע כך.
מאז שהחל PCWorld לסקר את עלייתו של יישומי AI שונים כמו אמנות AI, חיטטתי במאגרי הקוד ב-GitHub ובקישורים בתוך Reddit, שם אנשים יפרסמו שינויים במודלים של AI משלהם עבור גישות שונות.
חלק מהמודלים הללו מגיעים למעשה לאתרים מסחריים, שמגלגלים אלגוריתמים משלהם או מתאימים אחרים שפורסמו כקוד פתוח. דוגמה מצוינת לאתר אודיו קיים של AI היא Uberduck.ai, שמציע ממש מאות דגמים מתוכנתים מראש. הזן את הטקסט בשדה הטקסט ותוכל לגרום לאלון מאסק וירטואלי, ביל גייטס, פגי היל, דאפי דאק, אלכס טרבק, ביוויס, הג'וקר או אפילו סירי לקרוא את השורות המתוכנתות מראש שלך.
העלינו ביל קלינטון מזויף ששיבח את PCWorld בשנה שעברה והדגם כבר נשמע די טוב.
אימון AI לשחזור דיבור כרוך בהעלאת דגימות קול ברורות. ה-AI "לומד" כיצד הדובר משלב צלילים במטרה ללמוד את היחסים הללו, לשכלל אותם ולחקות את התוצאות. אם אתם מכירים את המותחן המעולה מ-1992 נעלי ספורט (עם צוות כוכבים של רוברט רדפורד, סידני פואטייה ובן קינגסלי, בין היתר), אז אתה יודע על הסצנה שבה הדמויות צריכות "לפצח" סיסמה קולית ביומטרית על ידי הקלטת דגימת קול של קול המטרה. . זה כמעט אותו דבר בדיוק.
בדרך כלל, הרכבת מודל קול טוב יכולה לקחת לא מעט אימון, עם דגימות ארוכות כדי לציין כיצד אדם מסוים מדבר. עם זאת, בימים האחרונים צץ משהו חדש: Microsoft Vall-E, מאמר מחקר (עם דוגמאות חיות) של קול מסונתז שדורש רק כמה שניות של אודיו מקור כדי ליצור קול שניתן לתכנות במלואו.
מטבע הדברים, חוקרי בינה מלאכותית וקבוצות אחרות של בינה מלאכותית רצו לדעת אם מודל Vall-E כבר שוחרר לציבור. התשובה היא לא, אם כי אתה יכול לשחק עם דגם אחר אם תרצה, שנקרא צב. (המחבר מציין שזה נקרא צב מכיוון שהוא איטי, וזהו, אבל זה עובד.)
אימון קול AI משלך עם צב
מה שהופך את הצב למעניין הוא שאתה יכול לאמן את הדגם על כל קול שתבחר פשוט על ידי העלאת כמה קטעי אודיו. ה עמוד GitHub של צב מציין שצריך לקבל כמה קליפים של כתריסר שניות בערך. יהיה עליך לשמור אותם כקובץ WAV באיכות ספציפית.
איך הכל עובד? באמצעות שירות ציבורי שאולי לא היית מודע אליו: גוגל קולאב. בעיקרו של דבר, Collab הוא שירות ענן שגוגל מספקת המאפשר גישה לשרת Python. ניתן לאחסן את הקוד שאתה (או מישהו אחר) כותב כמחברת, אותה ניתן לשתף עם משתמשים שיש להם חשבון גוגל גנרי. ה המשאב המשותף של צב נמצא כאן.
הממשק נראה מאיים, אבל זה לא כל כך נורא. תצטרך להיות מחובר כמשתמש Google ולאחר מכן תצטרך ללחוץ על "התחבר" בפינה הימנית העליונה. מילת אזהרה. בעוד שה-Colab הזה לא מוריד שום דבר ל-Google Drive שלך, ייתכן ש-Colabs אחרים. (עם זאת, קבצי האודיו שזה יוצר מאוחסנים בדפדפן אך ניתנים להורדה למחשב האישי שלך.) שים לב שאתה מפעיל קוד שמישהו אחר כתב. ייתכן שתקבל הודעות שגיאה בגלל קלט גרוע או בגלל שגוגל יש שיהוק בקצה האחורי, כגון שאין לו GPU זמין. הכל קצת ניסיוני.
לכל גוש קוד יש סמל "משחק" קטן שיופיע אם אתה מרחף מעליו עם העכבר. תצטרך ללחוץ על "הפעל" על כל בלוק קוד כדי להפעיל אותו, להמתין לביצוע כל בלוק לפני שתפעיל את הבא.
למרות שלא נעבור על הוראות מפורטות על כל התכונות, רק שים לב שהטקסט האדום ניתן לשינוי על ידי המשתמש, כמו הטקסט המוצע שאתה רוצה שהדגם ידבר. בערך שבעה בלוקים למטה, תהיה לך אפשרות לאמן את הדגם. תצטרך לתת שם לדגם ולאחר מכן להעלות את קובצי האודיו. כאשר זה יסתיים, בחר את דגם האודיו החדש בבלוק הרביעי, הפעל את הקוד, ולאחר מכן הגדר את הטקסט בבלוק השלישי. לָרוּץ זֶה בלוק קוד.
אם הכל ילך כמתוכנן, תהיה לך פלט אודיו קטן של הקול שלך לדוגמה. האם זה עובד? ובכן, עשיתי דגם קול מהיר ומלוכלך של עמיתי גורדון מה אונג, שעבודתו מופיעה ב הפודקאסט של החנון המלא כמו גם סרטונים שונים. העליתי דוגמה של מספר דקות ולא את הקטעים הקצרים, רק כדי לראות אם זה יעבוד.
התוצאה? ובכן, זה צלילים אמיתי, אבל לא כמו גורדון בכלל. הוא בהחלט בטוח מהתחזות דיגיטלית לעת עתה. (גם זו אינה אישור לאף רשת מזון מהיר).
אבל דגם קיים שסופר הצב אימן על השחקן טום הנקס נשמע די טוב. זה לא טום הנקס שמדבר כאן! גם טום עשה זאת לֹא הציעו לי עבודה, אבל זה הספיק כדי לרמות לפחות אחד מחבריי.
המסקנה? זה קצת מפחיד: עידן האמונה במה שאנחנו שומעים (ועוד מעט רואים) מסתיים. או שכבר יש.
קודי קופון
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- אודות
- גישה
- חֶשְׁבּוֹן
- למעשה
- להסתגל
- AI
- alex
- אלגוריתמים
- תעשיות
- מאפשר
- כְּבָר
- בין
- amp
- ו
- אחר
- לענות
- יישומים
- גישות
- סביב
- מאמר
- מלאכותי
- אודיו
- מחבר
- זמין
- בחזרה
- רע
- כי
- לפני
- החל
- להאמין
- הצעת חוק
- ביל קלינטון
- ביל גייטס
- ביומטרי
- קצת
- לחסום
- אבני
- דפדפן
- לַחְצָן
- שיחה
- נקרא
- כרטיס
- קטגוריה
- בהחלט
- שרשרת
- תווים
- שבב
- בחרו
- ברור
- קליפים
- ענן
- קוד
- עמית
- משלב
- הערות
- מסחרי
- הושלם
- מסקנה
- בקרות
- בפינה
- קורס
- כיסוי
- אשראי
- CSS
- תַאֲרִיך
- ימים
- תיאור
- מְפוֹרָט
- DID
- דיגיטלי
- לא
- מטה
- להורדה
- תריסר
- נהיגה
- כל אחד
- עורך
- או
- אלון
- אלון מאסק
- יצא
- מספיק
- זן
- שגיאה
- למעשה
- Ether (ETH)
- אֲפִילוּ
- הכל
- דוגמה
- דוגמאות
- מצוין
- לבצע
- קיימים
- מְזוּיָף
- מוכר
- תכונות
- מעטים
- שדה
- שלח
- קבצים
- מתמקד
- לעקוב
- לשעבר
- לשעבר
- רביעית
- חברים
- החל מ-
- מלא
- לגמרי
- גייטס
- ליצור
- מייצר
- לקבל
- מקבל
- GitHub
- מטרה
- Goes
- הולך
- טוב
- GPU
- גדול
- יש
- גובה
- לרחף
- איך
- אולם
- HTML
- HTTPS
- בן אנוש
- מאות
- ICON
- תמונה
- in
- מדד
- להצביע
- הוראות
- מעניין
- מִמְשָׁק
- מאיים
- IT
- יָנוּאָר
- עבודה
- בַּדחָן
- לדעת
- גָדוֹל
- אחרון
- שנה שעברה
- למידה
- קווים
- קישורים
- קְצָת
- לחיות
- נראה
- עושה
- מנהל
- סימן
- מַטרִיצָה
- max-width
- הודעות
- מיקרוסופט
- יכול
- דקות
- ראי
- מודל
- מודלים
- מושק
- שם
- צורך
- חדש
- חדשות
- הבא
- מחברה
- הערות
- הַצָעָה
- המיוחדות שלנו
- ONE
- לפתוח
- קוד פתוח
- אופטימיזציה
- אפשרות
- אחר
- אחרים
- שֶׁלוֹ
- חלק
- מסוים
- סיסמה
- עבר
- PC
- אֲנָשִׁים
- מושלם
- אדם
- אישי
- גובה הצליל
- מתוכנן
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- לְשַׂחֵק
- חיבור
- הודעה
- פּרֶמיָה
- נשיא
- יפה
- יְסוֹדִי
- פּרוֹפִיל
- מספק
- ציבורי
- לאור
- פיתון
- איכות
- חומר עיוני
- קריאה
- לקבל
- לאחרונה
- הקלטה
- Red
- מערכות יחסים
- שוחרר
- דורש
- מחקר
- חוקרים
- משאב
- תוצאה
- תוצאות
- לעלות
- רוברט
- רובוט
- רובוטים
- גָלִיל
- הפעלה
- ריצה
- בטוח
- אותו
- שמור
- סצינה
- שניות
- לחצני מצוקה לפנסיונרים
- SEO
- שרות
- שירותים
- שבע
- משותף
- קצר
- צריך
- בפשטות
- since
- יחיד
- Siri
- אתר
- אתרים
- ישיבה
- להאט
- קטן
- So
- תוכנה
- מישהו
- משהו
- בקרוב
- מָקוֹר
- לדבר
- רַמקוֹל
- מדבר
- מדבר
- ספציפי
- נאום
- התחלה
- החל
- שלב
- מאוחסן
- סיפורים
- כזה
- שולחן
- תָג
- לקחת
- טכנולוגיה
- השמיים
- שֶׁלָהֶם
- דבר
- שְׁלִישִׁי
- דרך
- זמן
- כותרת
- ל
- גַם
- רכבת
- מְאוּמָן
- הדרכה
- תור
- נטען
- העלאה
- כתובת האתר
- משתמש
- משתמשים
- תועלת
- שונים
- גרסה
- באמצעות
- וידאו
- וירטואלי
- קול
- VOICES
- W
- הַמתָנָה
- רציתי
- אזהרה
- מה
- אשר
- בזמן
- מי
- יצטרך
- בתוך
- Word
- תיק עבודות
- עובד
- היה
- כתוב
- שנה
- YouTube
- זפירנט