ללמוד מלמידת-מכונה שאנחנו לא יכולים להבין איך היא מבינה את העולם
מערכות למידת-המכונה החדשות שלנו יצטרכו לטפש את עצמן משמעותית כדי להסביר לנו איך הן מגיעות למסקנות. בעשותן כן, הן יצטרכו לזייף את הייצוג שלהן את העולם הזה – ייצוג שאפשר לטעון שהוא נעלה לשלנו לא רק בהיקפו אלא גם בעצם המבנה שלו.יש לכך השלכות על האופן שבו אנו מחנכים את ילדינו.
העובדה המקדמית היא שמערכות למידת-מכונה לא תמיד יכולות להסביר את המסקנות שהן מגיעות אליהן.
הדוגמה המסורתית של מערכת למידת-מכונה היא כזו שמקבלת הכשרה איך להפריד הדוא”ל לספאם ולא-ספאם. אתה מתחיל את התהליך על ידי הזנת אימיילים שבני אדם סיווגו לשתי קטגוריות אלה. המחשב מחפש סדירויות בכל סדרה שייתכן שבן האנוש פספס. לדוגמה, במחקר משנת 2002 התברר כי הכללת המילה describe (“לתאר”) היתה מציין כמעט ודאי לכך שההודעה *איננה* דואר זבל. במקרה זה, התוכנה אכן יכולה לספר לנו איך ולמה היא סיווגה כל הודעה כפי שסיווגה. לדוגמה, אולי היו בה המילים “להתעשר מהר” ו”קל”, שלכל אחת מהן יש משקל-ספאם נכבד.
מאז, למידת-מכונה נכנסה למים עמוקים יותר. רשתות עצביות מלאכותיות שמריצות תוכנת “למידה-עמוקה” יכולות לבצע ניתוחים כל כך מדהימים במורכבותם שבני אדם פשוט לא יכולים להבין איך הן הגיעו למסקנותיהן. לדוגמה, דמיינו מחשב שקיבל פקודה לנתח סדרת מודעות A/B. אלו שתי גרסאות של מודעת רשת, עם הבדלים קלים כמו הצגת המחיר בצד ימין או שמאל, או שימוש ברקע ירוק או כחול. אתר כמו אמזון יציג את שתי הגירסות לחילופין באקראי לכ-100,000 מבקרים, וצפוי לגלות שאחת הגירסאות מקבלת הקלקות בכמה נקודות אחוז יותר מהשנייה. מכאן והלאה, כל המבקרים יראו את הגרסה שהוכיחה את עצמה כיעילה יותר. אבל בדרך כלל אף אחד לא יודע למה גירסה אחת עובדת טוב יותר מרעותה. למעשה, לו ידענו מדוע – למשל, כי רקע כחול תמיד מביא תוצאות טובות יותר מאשר ירוק – אמזון לא היה צריך להריץ בדיקות A/B.
עכשיו דמיינו שאנחנו מזינים לתוך מערכת הלמידה-העמוקה כל מה שאנחנו יודעים על 100,000 האנשים שעליהם ביצענו את בדיקת ה-A/B. תארו לעצמכם שעל כל אדם יש לנו, נניח, 5000 פריטי מידע. זה אכן מספר פיסות המידע ש-Cambridge Analytica, החברה שנשכרה על ידי מסע הבחירות של דונלד טראמפ, טענה לכאורה שיש לה על כל אחד מ-320 מיליון אזרחי ארה”ב. תארו לעצמכם את מערכת הלמידה-העמוקה מסמנת את היחסים העדינים ולעיתים בלתי ניתנים להסבר בתוך הנתונים הללו. אולי הרקע הכחול עובד טוב יותר על גברים מעל גיל 50 שהקליקו על שלושה עמודים בלבד שהיו להם כותרות כתומות ומגיעים מעמוד שמזכיר שמזכיר להם את עיר הולדתם, אבל לא על טינאייג’ריות לבנות שהגיעו לשם אחרי שנעזרו בגוגל להכנת שיעורי בית במתמטיקה אבל רק אם למחרת הוא יום חופש. עכשיו דמיינו את זה הופך הרבה, הרבה יותר מורכב מזה. תוכנות למידת-מכונה אינן מוגבלות במשתנים שהן יכולות לעקוב אחריהם. הן יכולות להבחין במה שנראה כמו קישורים לא רלוונטיים ולייחס להם משקל. על כן, מתקבל על הדעת שתוכנה תוכל לחזות במדוייק איזו גירסה של מודעה תקבל יותר קליקים, אבל תוכל להסביר למה רק באמצעות הצגת סדרה של קישורים ומשקלים שנמצאת מעבר ליכולת התפיסה של המוח.
היכולת של מערכות למידה עמוקה “להבין” את ההתנהגות האנושית המקוונת בלי שיוכלו להסבירה חלה גם על אירועים שקורים בעולם האמיתי. אירועים כאלו כפופים גם להשפעות המרומזות וההידודיות של אלפי משתנים. זה מנוגד להנחה הפשטנית שאנו במערב גדלנו להשתמש בה בעודנו מנווטים בעולם האמיתי: העולם הפיזי נשלט על ידי קומץ חוקים פשוטים שהופכים כל דבר לניתן לחיזוי. אין ספק שיש חוקים פשוטים, אבל הם גורמים לנו לשכוח את העובדה שכמעט כל מה שקורה הוא בלתי צפוי: הפיזיקה מסבירה את מרחק הבלימה של מכוניות, אבל כללים פשוטים אלו לא מאפשרים לנו לחזות שהמכונית לפנינו עומדת לבלום, או שהולך להיות פקק תנועה בגלל תקלה, או שציפור תעוף לתוך הפנסים הקדמיים שלנו, או אפילו מה ישודר ברדיו כאשר התאונה תקרה. אלו מאיתנו בגיל מסוים לא יכולים אפילו לחזות אם אנחנו הולכים למצוא את המפתחות שלנו בזמן. פשוט יש יותר מדי משתנים.
אם זה המצב, ראיית העולם על ידי המכונה משקפת את טבעו של העולם יותר מאשר הפשטתו על ידי המוח שלנו לקומץ של חוקים.
זה חשוב לחינוך.
אנחנו בהחלט רוצים להמשיך ללמד את ילדינו את החוקים והסדירויות. אבל אולי אנחנו צריכים גם ללמד אותם שחוקים אלה חלים על יקום כה מורכב שלעולם לא יהיה לגמרי בהיר לנו. במובן זה, היקום הוא פחות כמו שעון ויותר כמו ענן עשן. שניהם נשלטים על ידי כללים פשוטים, אבל יכולת הניבוי של פעולת השעון היא יוצאת הדופן.
כדאי לנו גם לשנות את הגישה שאנחנו משדרים לגבי הכלים שבהם אנו משתמשים בחיפושינו אחר ידע. תכופות מדי התייחסנו למחשבים, מחשבונים והאינטרנט כקיצורי דרך; אם אתה משתמש בהם, רמזנו, אתה לא באמת לומד דבר. אבל הרבה מהמחקר המתקדם ביותר שלנו כבר מתבצע באמצעות אלגוריתמי למידה-חישובית שרצים על כמויות עצומות של נתונים. אנחנו עומדים להסתמך על מסקנותיהם למרות שאנחנו לא יכולים להבין אותם; אנו נסתמך עליהם כי הם יוכיחו את עצמם כאמינים, וכי אנחנו מבינים שדרך החשיבה שלהם עולה בקנה אחד עם המורכבות העצומה של העולם, הרבה יותר מדרך החשיבה שלנו. אלו הם כלי המחשבה החדשים שלנו, באותה מידה שסרגלים ומדי-זווית הם כלי המחשבה שלנו. ההבדל הוא שאנחנו מבינים איך סרגלים ומדי זווית עובדים.
זה מעורר ענווה לגלות שציוד הלמידה המולד שלנו לא מתאים למשימה שנתנּו לו. המוח מעולה להישרדות, אבל לא בנוי טוב לידע. מצד שני, יש משהו מופלא ביצירת כלים שעכשיו פתאום דוחפים אותנו מעבר למגבלות הבסיסיות, שהיו המצב שלנו עד כה. זוהי התקדמות אבולוציונית ביכולת האנושית לחשוב. אנחנו צריכים להעביר את תחושת ההתרגשות הזאת לילדינו.
המאמר התפרסם במגזין EdTech MindCET. ד”ר דייויד וויינברגר ישתתף מחר (ד’) בכנס Shaping The Future 4 של מטח