Root Nationסטטטיטכנולוגיותמהן רשתות עצביות וכיצד הן פועלות?

מהן רשתות עצביות וכיצד הן פועלות?

-

היום ננסה להבין מהן רשתות עצביות, איך הן פועלות ומה תפקידן ביצירת בינה מלאכותית.

רשתות עצביות. אנחנו שומעים את הביטוי הזה כמעט בכל מקום. זה מגיע לנקודה שתמצאו רשתות עצביות אפילו במקררים (זו לא בדיחה). רשתות עצביות נמצאות בשימוש נרחב על ידי אלגוריתמי למידת מכונה, אשר כיום ניתן למצוא לא רק במחשבים ובסמארטפונים, אלא גם במכשירים אלקטרוניים רבים אחרים, למשל במכשירי חשמל ביתיים. והאם אי פעם תהיתם מהן הרשתות העצביות האלה?

אל דאגה, זו לא הולכת להיות הרצאה אקדמית. ישנם פרסומים רבים, כולל בשפה האוקראינית, המסבירים באופן מקצועי ומהימן נושא זה בתחום המדעים המדויקים. פרסומים כאלה הם בני יותר מתריסר שנים. איך ייתכן שהפרסומים הישנים האלה עדיין רלוונטיים? העובדה היא שהיסודות של רשתות עצביות לא השתנו, והמושג עצמו - מודל מתמטי של נוירון מלאכותי - נוצר במהלך מלחמת העולם השנייה.

מהן רשתות עצביות וכיצד הן פועלות?

אותו הדבר עם האינטרנט, האינטרנט של היום מתקדם לאין ערוך מאשר בעת שליחת האימייל הראשון. יסודות האינטרנט, הפרוטוקולים היסודיים, היו קיימים כבר מתחילת יצירתו. כל קונספט מורכב בנוי על הבסיס של מבנים ישנים. זה אותו דבר עם המוח שלנו, קליפת המוח הצעירה ביותר אינה מסוגלת לתפקד ללא היסוד האבולוציוני העתיק ביותר: גזע המוח, שנמצא בראשנו מאז ומתמיד עתיק בהרבה מקיומו של המין שלנו על הפלנטה הזו.

קצת בלבלתי אותך? אז בואו נבין ביתר פירוט.

מעניין גם: ChatGPT: הוראות פשוטות לשימוש

מהן רשתות עצביות?

רשת היא אוסף של אלמנטים מסוימים. זוהי הגישה הפשוטה ביותר במתמטיקה, בפיזיקה או בטכנולוגיה. אם רשת מחשבים היא קבוצה של מחשבים מחוברים, אז רשת עצבית היא ללא ספק קבוצה של נוירונים.

רשת עצבית

עם זאת, אלמנטים אלה אינם ברי השוואה במורכבותם לתאי העצב של המוח ומערכת העצבים שלנו, אבל ברמה מסוימת של הפשטה, כמה תכונות של נוירון מלאכותי ונוירון ביולוגי שכיחות. אבל צריך לזכור שנוירון מלאכותי הוא מושג הרבה יותר פשוט מהמקביל הביולוגי שלו, שעליו אנחנו עדיין לא יודעים הכל.

- פרסום -

קרא גם: 7 השימושים המגניבים ביותר של ChatGPT

ראשית היה נוירון מלאכותי

המודל המתמטי הראשון של נוירון מלאכותי פותח ב-1943 (כן, זו לא טעות, במהלך מלחמת העולם השנייה) על ידי שני מדענים אמריקאים, וורן מקולוך ו-וולטר פיטס. הם הצליחו לעשות זאת על בסיס גישה בין-תחומית, המשלבת ידע בסיסי בפיזיולוגיה של המוח (זכור את התקופה שבה נוצר המודל הזה), מתמטיקה וגישות ה-IT הצעירה אז (הם השתמשו, בין היתר, בתורת יכולת החישוב של אלן טיורינג ). מודל הנוירון המלאכותי של McCulloch-Pitts הוא מודל פשוט מאוד, יש לו כניסות רבות, שבהן מידע הקלט עובר דרך משקולות (פרמטרים), שהערכים שלהם קובעים את התנהגות הנוירון. התוצאה המתקבלת נשלחת לפלט בודד (ראה תרשים של הנוירון McCulloch-Pitts).

רשת עצבית
סכימה של נוירון מלאכותי 1. נוירונים שאותות המוצא שלהם מוזנים לכניסה של נוירון נתון 2. מוסיף אותות קלט 3. מחשבון פונקציית העברה 4. נוירונים שהאות של נוירון נתון מופעל אליהם 5. ωi - משקלים של אותות כניסה

מבנה דמוי עץ כזה קשור לנוירון ביולוגי, מכיוון שכאשר אנו חושבים על רישומים המתארים תאי עצב ביולוגיים, זה המבנה דמוי העץ האופייני של דנדריטים שעולה על הדעת. עם זאת, אין להיכנע לאשליה שנוירון מלאכותי קרוב לפחות במידת מה לתא עצב אמיתי. שני החוקרים הללו, מחברי הנוירון המלאכותי הראשון, הצליחו להוכיח שניתן לחשב כל פונקציה ניתנת לחישוב באמצעות רשת של נוירונים מחוברים זה לזה. עם זאת, נזכור שהמושגים הראשונים הללו נוצרו רק כרעיונות שהיו קיימים רק "על הנייר" ולא הייתה להם פרשנות של ממש בדמות ציוד הפעלה.

קרא גם: על מחשבים קוונטיים במילים פשוטות

מהמודל ועד למימושים חדשניים

מקולוך ופיטס פיתחו מודל תיאורטי, אך יצירת הרשת העצבית האמיתית הראשונה נאלצה להמתין יותר מעשר שנים. היוצר שלו נחשב לחלוץ נוסף של חקר הבינה המלאכותית, פרנק רוזנבלט, שיצר ב-1957 את רשת Mark I Perceptron, ואתה בעצמך הראית שבזכות המבנה הזה, המכונה רכשה יכולת שהייתה טבועה בעבר רק בבעלי חיים ובני אדם: היא יכול ללמוד. עם זאת, כעת אנו יודעים שהיו, למעשה, מדענים אחרים שהעלו את הרעיון שמכונה יכולה ללמוד, כולל לפני רוזנבלט.

מארק I Perceptron

חוקרים וחלוצים רבים של מדעי המחשב בשנות החמישים העלו את הרעיון כיצד לגרום למכונה לעשות את מה שהיא לא יכלה לעשות בעצמה. לדוגמה, ארתור סמואל פיתח תוכנית ששיחקה דמקה עם בן אדם, אלן ניואל והרברט סיימון יצרו תוכנית שיכולה להוכיח באופן עצמאי משפטים מתמטיים. עוד לפני יצירת הרשת העצבית הראשונה של רוזנבלט, שני מחלוצי מחקר נוספים בתחום הבינה המלאכותית, מרווין מינסקי ודין אדמונדס, ב-1950, כלומר עוד לפני הופעת התפיסה של רוזנבלט, בנו מכונה בשם SNARC (Stochastic Neural). Analog Reinforcement Calculator) - חיזוק מחשבון אנלוגי עצבי עצבי, הנחשב בעיני רבים למחשב הרשת העצבית הסטוכסטית הראשון. יש לציין של-SNARC לא היה שום קשר למחשבים מודרניים.

SNARC

המכונה החזקה, שעשתה שימוש ביותר מ-3000 צינורות אלקטרוניים ומנגנון טייס אוטומטי חלופי ממפציץ B-24, הצליחה לדמות פעולתם של 40 נוירונים, שהתבררו כמספיקות כדי לדמות מתמטית חיפוש של חולדה אחר יציאה ממבוך . כמובן, לא הייתה חולדה, זה היה רק ​​תהליך של ניכוי ומציאת הפתרון האופטימלי. מכונית זו הייתה חלק מהדוקטורט של מרווין מינסקי.

רשת אדלין

פרויקט מעניין נוסף בתחום הרשתות העצביות היה רשת ADALINE, שפותחה ב-1960 על ידי ברנרד ווית'רו. לפיכך, אפשר לשאול את השאלה: מאחר שלפני יותר מחצי מאה החוקרים הכירו את היסודות התיאורטיים של רשתות עצביות ואף יצרו את מימושי העבודה הראשונים של מסגרות חישוביות כאלה, מדוע לקח כל כך הרבה זמן, עד המאה ה-21, ליצור פתרונות אמיתיים המבוססים על רשתות עצביות? התשובה היא אחת: כוח מחשוב לא מספיק, אבל זה לא היה המכשול היחיד.

רשת עצבית

למרות שבשנות ה-1950 וה-1960, רבים מחלוצי הבינה המלאכותית הוקסמו מהאפשרויות של רשתות עצביות, וחלקם חזו שמקבילה למכונה של המוח האנושי נמצא במרחק של עשר שנים בלבד. זה אפילו מצחיק לקרוא היום, כי עדיין לא התקרבנו אפילו ליצירת מקבילה למכונה של המוח האנושי, ואנחנו עדיין רחוקים מלפתור את המשימה הזו. מהר מאוד התברר שההיגיון של הרשתות העצביות הראשונות היה מרתק ומוגבל כאחד. ההטמעות הראשונות של AI באמצעות נוירונים מלאכותיים ואלגוריתמים של למידת מכונה הצליחו לפתור טווח צר מסוים של משימות.

עם זאת, כשזה הגיע למרחבים רחבים יותר ולפתור משהו רציני באמת, כמו זיהוי תבניות ותמונה, תרגום סימולטני, זיהוי דיבור וכתב יד וכו', כלומר דברים שמחשבים ובינה מלאכותית יכולים לעשות כבר היום, התברר ש- יישומים ראשונים של רשתות עצביות פשוט לא הצליחו לעשות זאת. למה זה כל כך? התשובה ניתנה על ידי מחקרם של מרווין מינסקי (כן, אותו אחד מ-SNARC) וסימור פאפרט, שב-1969 הוכיחו את מגבלות הלוגיקה של הפרצפטרון והראו שהגדלת היכולות של רשתות עצביות פשוטות רק בגלל קנה מידה לא עובדת. היה עוד מחסום אחד, אבל חשוב מאוד - כוח המחשוב שהיה זמין באותה תקופה היה קטן מדי בשביל להשתמש ברשתות עצביות כמתוכנן.

מעניין גם:

- פרסום -

רנסנס של רשתות עצביות

בשנות ה-1970 וה-1980, רשתות עצבים כמעט נשכחו. רק בסוף המאה הקודמת הפך כוח המחשוב הזמין כל כך גדול שאנשים החלו לחזור אליו ולפתח את היכולות שלהם בתחום זה. זה היה אז שהופיעו פונקציות ואלגוריתמים חדשים, המסוגלים להתגבר על המגבלות של הרשתות העצביות הראשונות הפשוטות ביותר. זה היה אז הרעיון של למידת מכונה עמוקה של רשתות עצביות רב-שכבתיות. מה בעצם קורה לשכבות האלה? כיום, כמעט כל הרשתות העצביות השימושיות הפועלות בסביבה שלנו הן רב-שכבתיות. יש לנו שכבת קלט שתפקידה לקבל נתוני קלט ופרמטרים (משקלים). מספר הפרמטרים הללו משתנה בהתאם למורכבות הבעיה החישובית שיש לפתור על ידי הרשת.

רשת עצבית

בנוסף, יש לנו מה שנקרא "שכבות נסתרות" - זה המקום שבו מתרחש כל ה"קסם" הקשור ללמידת מכונה עמוקה. השכבות הנסתרות הן שאחראיות ליכולתה של רשת עצבים זו ללמוד ולבצע את החישובים הדרושים. לבסוף, האלמנט האחרון הוא שכבת הפלט, כלומר, השכבה של הרשת העצבית שנותנת את התוצאה הרצויה, במקרה זה: כתב יד מזוהה, פנים, קול, תמונה נוצרת על סמך התיאור הטקסטואלי, תוצאה של ניתוח טומוגרפי של תמונת האבחון ועוד הרבה.

קרא גם: בדקתי וראיינתי את הצ'אטבוט של בינג

איך רשתות עצביות לומדים?

כפי שאנו כבר יודעים, נוירונים בודדים ברשתות עצביות מעבדים מידע בעזרת פרמטרים (משקלים), אשר מוקצים להם ערכים וחיבורים בודדים. משקלים אלו משתנים תוך כדי תהליך הלמידה, מה שמאפשר להתאים את המבנה של רשת זו בצורה כזו שתניב את התוצאה הרצויה. איך בדיוק הרשת לומדת? זה ברור, זה חייב להיות מאומן כל הזמן. אל תתפלא מהאמרה הזו. אנחנו גם לומדים, והתהליך הזה הוא לא כאוטי, אלא מסודר, נניח. אנחנו קוראים לזה חינוך. בכל מקרה, ניתן לאמן גם רשתות עצביות, והדבר נעשה בדרך כלל באמצעות סט קלט שנבחר כראוי, אשר מכין איכשהו את הרשת למשימות שהיא תבצע בעתיד. וכל זה חוזר על עצמו שלב אחר שלב, לפעמים תהליך הלמידה דומה במידה מסוימת לתהליך האימון עצמו.

לדוגמה, אם המשימה של רשת עצבים זו היא לזהות פרצופים, היא מאומנת מראש על מספר רב של תמונות המכילות פרצופים. בתהליך הלמידה משתנים המשקלים והפרמטרים של השכבות הנסתרות. מומחים משתמשים כאן בביטוי "מזעור פונקציית העלות". פונקציית עלות היא כמות שאומרת לנו כמה רשת עצבית נתונה עושה טעויות. ככל שנוכל למזער את תפקוד העלויות כתוצאה מאימון, כך הרשת העצבית הזו תתפקד טוב יותר בעולם האמיתי. התכונה החשובה ביותר שמבדילה כל רשת עצבית ממשימה שתוכנתה באמצעות אלגוריתם קלאסי היא שבמקרה של אלגוריתמים קלאסיים, על המתכנת לתכנן צעד אחר צעד אילו פעולות התוכנה תבצע. במקרה של רשתות עצביות, הרשת עצמה מסוגלת ללמוד לבצע משימות בצורה נכונה בעצמה. ואף אחד לא יודע בדיוק איך רשת נוירונים מורכבת מבצעת את החישובים שלה.

רשת עצבית

כיום, רשתות עצביות נמצאות בשימוש נרחב, ואולי באופן מפתיע, לעתים קרובות מאוד מבלי להבין כיצד התהליך החישובי ברשת נתונה עובד בפועל. אין צורך בכך. מתכנתים משתמשים ברשתות עצביות מוכנות שנלמדו על ידי מכונה שמוכנות לנתוני קלט מסוג מסוים, מעבדים אותם בצורה המוכרת רק להם ומפיקות את התוצאה הרצויה. מתכנת לא צריך לדעת איך עובד תהליך ההסקה בתוך רשת עצבית. כלומר, אדם נשאר מרוחק מכמות גדולה של חישובים, שיטה להשגת מידע ועיבודו על ידי רשתות עצביות. מאיפה פחדים מסוימים של האנושות לגבי מודלים של בינה מלאכותית. אנחנו פשוט חוששים שיום אחד הרשת העצבית תציב לעצמה משימה מסוימת ובאופן עצמאי, ללא עזרת אדם, תמצא דרכים לפתור אותה. זה מדאיג את האנושות, גורם לפחד וחוסר אמון בשימוש באלגוריתמים של למידת מכונה.

צ'אט gpt

גישה תועלתנית זו נפוצה כיום. גם אצלנו זה כך: אנחנו יודעים להכשיר מישהו בפעילות ספציפית, ויודעים שתהליך האימון יהיה אפקטיבי אם הוא נעשה נכון. אדם ירכוש מיומנויות רצויות. אבל האם אנחנו מבינים בדיוק איך מתרחש תהליך הדדוקציה במוחו, שגרם לאפקט הזה? אין לנו מושג.

המשימה של המדענים היא לחקור את הבעיות הללו ככל האפשר, כדי שהן ישרתו ויסייעו לנו היכן שצריך, ובעיקר לא יהפכו לאיום. כבני אדם, אנחנו מפחדים ממה שאנחנו לא יודעים.

מעניין גם: 

Yuri Svitlyk
Yuri Svitlyk
בן הרי הקרפטים, גאון בלתי מוכר במתמטיקה, "עורך דין"Microsoft, אלטרואיסט מעשי, שמאל-ימין
- פרסום -
הירשם
תודיע על
אורח

0 תגובות
ביקורות משובצות
הצג את כל ההערות