Stability AI הוא סטארט-אפ שהוא המפתח של Stable Diffusion, כלי שמשתמש ב-generative AI ליצירת תמונות מרמזי טקסט, הציגה את דגם הדור הבא של Stable Diffusion 3. לדברי נציגי Stability AI, הדגם החדש שלהם, שעדיין אינו זמין באופן נרחב, משפר את איכות התמונה, עובד טוב יותר עם רמזים מרובי אובייקטים, וכן יכול לשחזר בצורה מדויקת יותר טקסט כחלק מהתמונה שנוצרת. זה בדיוק מה שדגמי Stable Diffusion קודמים לא יכלו להתמודד.
מנכ"ל Stability AI, Emad Mosque, פרסם מספר דוגמאות בחשבונו ב- Twitter.
#SD3 יכול לעשות די הרבה טקסט... https://t.co/DfcUzOZymj
— Emad (@EMostaque) פברואר 22, 2024
ההכרזה מגיעה ימים לאחר שהמתחרה הגדולה ביותר של Stability AI, OpenAI, חשפה דגם חדש לגמרי AI Sora, שיכול ליצור סרטוני וידאו בחדות גבוהה כמעט מציאותיים המבוססים על הנחיות טקסט פשוטות. סורה, שעדיין לא זמינה לציבור הרחב, העלתה חששות לגבי הפוטנציאל שלה ליצור צילומים מזויפים בעלי מראה מציאותי. אבל OpenAI אמרה שהיא עובדת עם מומחי דיסאינפורמציה כדי לבדוק את הכלי לפני שהוא זמין באופן נרחב. Stability AI אמר שזה עושה את אותו הדבר.
"[אנחנו] נקטנו וממשיכים לנקוט באמצעים סבירים כדי למנוע שימוש לרעה ב-Stable Diffusion 3 על ידי גורמים חסרי מצפון", כתבה החברה בפוסט בבלוג באתר שלה. "בשיתוף פעולה מתמשך עם חוקרים, מומחים והקהילה שלנו, אנו מצפים לחדשנות נוספת ביושרה ככל שאנו מתקרבים לפרסום פומבי של המודל." עדיין לא ידוע מתי Stable Diffusion 3 ישוחרר לציבור.
נזכיר לכם שלאחרונה כתבנו שדגם ה-Google Gemini AI קיבל תלונות רבות ממשתמשים עקב תמונות שנוצרו בצורה לא מדויקת של אנשים. הכלי יצר תמונות של דמויות היסטוריות, כמו האבות המייסדים של ארצות הברית או האפיפיור, עם צבע עור שונה. אז גוגל אמר את זה משעה את הדור תמונות של אנשים וישחרר בקרוב גרסה משופרת.
קרא גם: