Root Nationחֲדָשׁוֹתחדשות ITכמו בסרטים: הבינה המלאכותית החדשה של גוגל לעיבוד תמונות הופכת את קנה המידה ושיפורם למציאות

כמו בסרטים: הבינה המלאכותית החדשה של גוגל לעיבוד תמונות הופכת את קנה המידה ושיפורם למציאות

-

בטח ראיתם סרטי פנטזיה או תוכניות טלוויזיה שבהן הדמות הראשית מבקשת להגדיל את התמונה ולשפר את התוצאה – להראות פרצוף, או לוחית רישוי, או כל פרט מרכזי אחר. מערכות הבינה המלאכותית העדכניות של גוגל (AI), המבוססות על מה שנקרא מודלים של דיפוזיה, מסוגלים לבצע את הטריק הזה.

זהו תהליך שקשה לשלוט בו מכיוון שהוא בעצם הוספת פרטים לתמונה שהמצלמה לא צילמה במקור, תוך שימוש בניחושים סופר חכמים המבוססים על תמונות אחרות דומות.

Google

בגוגל, טכניקה זו נקראת סינתזת תמונה טבעית, ובתרחיש המסוים הזה, רזולוציית תמונה גבוהה במיוחד. מתחילים בתמונה קטנה ומפוקסלת ומסיימים במשהו חד, ברור וטבעי. זה אולי לא בדיוק המקור, אבל זה מספיק קרוב כדי להיראות אמיתי לעין האנושית.

גוגל הציגה שני כלי AI חדשים לעבודה זו. הראשון נקרא SR3, או Super-Resolution via Repeated Refinement, והוא פועל על ידי הוספת רעש לתמונה ואז הסרתה. באמצעות סדרה של חישובים הסתברותיים המבוססים על מסד נתונים גדול של תמונות וכמה קסם של למידת מכונה, ה-SR3 יכול לדמיין איך נראית גרסה ברזולוציה סופר-גבוהה של תמונת פיקסל ברזולוציה נמוכה.

הכלי השני הוא CDM, או Cascaded Diffusion Models. גוגל מתארת ​​אותם כ"צינורות" שלאורכם ניתן לכוון דגמי דיפוזיה - כולל SR3 - לשיפור קנה המידה של תמונה באיכות גבוהה. זה לוקח מודלים לשיפור והופך אותם לתמונות גדולות יותר.

Google

על ידי שימוש במודלים שונים של שיפור ברזולוציות שונות, גישת ה-CDM מסוגלת לעלות על שיטות שיפור קנה מידה חלופיות, לפי גוגל. מנוע הבינה המלאכותית החדש נבדק ב-ImageNet, מסד נתונים ענק של תמונות אימון בשימוש נפוץ למחקר בזיהוי אובייקטים חזותיים.

התוצאות הסופיות של SR3 ו-CDM מרשימות. בבדיקה סטנדרטית עם 50 מתנדבים אנושיים, תמונות של פנים אנושיות שנוצרו על ידי SR3 טעו כתמונות אמיתיות בערך 50% מהזמן - ובהתחשב שאלגוריתם אידיאלי צריך להגיע ל-50%, זה מרשים. ראוי לחזור על כך שהתמונות המשופרות הללו אינן התאמות מדויקות למקור, הן סימולציות מחושבות בקפידה המבוססות על מתמטיקה של הסתברות.

Google

גוגל מבטיחה הרבה יותר ממנועי הבינה המלאכותית והטכנולוגיות הנלוות שלה - לא רק במונחים של הגדלת תמונות של פרצופים וחפצים טבעיים אחרים, אלא גם בתחומים אחרים של מודלים הסתברותיים.

קרא גם:

מָקוֹרמדע
הירשם
תודיע על
אורח

0 תגובות
ביקורות משובצות
הצג את כל ההערות