Root Nationחֲדָשׁוֹתחדשות ITAI חדש Microsoft מחקה את הקול של כל אדם מדגימת אודיו של 3 שניות

AI חדש Microsoft מחקה את הקול של כל אדם מדגימת אודיו של 3 שניות

-

ביום חמישי, חוקרים Microsoft הכריזה על דגם חדש של בינה מלאכותית (AI) בשם VALL-E שיכול לחקות במדויק קול אנושי כאשר ניתן דגימת אודיו של שלוש שניות. ברגע שהוא לומד קול מסוים, VALL-E יכול לסנתז אודיו של אותו אדם אומר כל דבר תוך שמירה על הטון הרגשי של הדובר.

מחבריו מציעים שניתן להשתמש ב-VALL-E לעריכת טקסט לדיבור באיכות גבוהה, שבה ניתן לערוך את ההקלטה של ​​אדם ולשנות מתמלול טקסט (לגרום לו לומר דברים שלא אמרו במקור), וכן ליצירת תוכן שמע בשילוב עם דגמי AI מחוללים אחרים כגון GPT-3.

Microsoft AI VALL-E

Microsoft קורא ל-VALL-E "מודל שפת קודקים עצביים", והוא מבוסס על טכנולוגיה בשם EnCodec שעליה הכריזה Meta באוקטובר 2022. בניגוד לשיטות טקסט-לדיבור אחרות, שבדרך כלל מסנתזות דיבור על ידי מניפולציה של צורות גל, VALL-E מייצרת אודיו בדיד. קודי codec מטקסט והנחיות אקוסטיות. זה בעצם מנתח איך אדם נשמע, מפרק את המידע הזה לרכיבים נפרדים (הנקראים "אסימונים") הודות ל-EnCodec, ומשתמש בנתוני אימון כדי להתאים למה שהוא "יודע" לגבי איך הקול הזה היה נשמע אם הוא היה מדבר ביטויים אחרים בחוץ מהמדגם של שלוש שניות.

Microsoft אימן את יכולות סינתזת הדיבור של VALL-E על ספריית אודיו שהורכבה על ידי Meta בשם LibriLight. הוא מכיל 60 שעות של שידורים בשפה האנגלית מיותר מ-7 קריינים, רובם לקוחים מספרי אודיו זמינים לציבור של LibriVox.

בנוסף לשמירה על גוון הקול והטון הרגשי של הקריין, VALL-E יכול גם לדמות את "הסביבה האקוסטית" של דגימת האודיו. לדוגמה, אם הדגימה התקבלה משיחת טלפון, פלט האודיו המסונתז ידמה את המאפיינים האקוסטיים והתדרים של שיחת הטלפון. גם דוגמאות Microsoft להדגים ש-VALL-E יכול ליצור וריאציות של גוון ווקאלי.

Microsoft AI VALL-E

אולי בשל היכולת של VALL-E לאפשר הונאה והונאה, Microsoft לא סיפק את קוד VALL-E עבור אחרים להתנסות איתו, כך שלא נוכל לבדוק את היכולות שלו. נראה שהחוקרים מודעים לנזק החברתי הפוטנציאלי שטכנולוגיה זו עלולה להביא. בסיום המאמר הם כותבים:

"מכיוון ש-VALL-E יכול לסנתז דיבור ששומר על זהות הדובר, הוא עלול לשאת סיכונים פוטנציאליים של שימוש לרעה במודל, כגון זיוף זיהוי קולי או התחזות לדובר מסוים. כדי להפחית סיכונים כאלה, ייבנה מודל זיהוי שיבחין אם קטע אודיו סונתז באמצעות VALL-E."

אתה יכול לעזור לאוקראינה להילחם נגד הפולשים הרוסים. הדרך הטובה ביותר לעשות זאת היא לתרום כספים לכוחות המזוינים של אוקראינה באמצעות הצלת חיים או דרך העמוד הרשמי NBU.

קרא גם:

מָקוֹרארסטכניקה
הירשם
תודיע על
אורח

0 תגובות
ביקורות משובצות
הצג את כל ההערות