הפשרה היצירתית בתביעה ייצוגית נגד גוגל, שהיתה משחררת את הספרים הלכודים בחוקי זכויות היוצרים של ארה”ב, נדחתה בגלל הגבלים עסקיים
ב-2013 פסק בית המשפט המחוזי של מחוז דרום ניו יורק לטובת גוגל בתביעה הייצוגית של גילדת הכותבים האמריקאית ואחרים נגד פרוייקט דיגיטציית הספרים העצום שלה. ביהמ”ש קבע שמדובר בשימוש הוגן, משום שגוגל לא מציגה לגולשים את הספרים במלואם, אלא רק קטעים מהם במסגרת חיפוש, מה שנחשב לשימוש הוגן שאינו מפר זכויות יוצרים. שנתיים קודם לכן דחה בית המשפט הסכם פשרה בין הצדדים, מה שבדיעבד חסך לגוגל תשלום של 125 מיליון דולר שנכללו בהסכם – כמעט שליש מהסכום שהחברה השקיעה בדיגיטציה עצמה, 400 מיליון דולר. אבל הדחייה הזאת גם חירבה מעשה אומנות משפטי שיכול היה לפתור בעיית זכויות יוצרים בת כמאה שנה, ולהוציא מהחושך לאור הדיגיטלי ספרים שהדפסתם הופסקה והם קבורים תחת חוקי זכויות היוצרים האמריקאיים ועלויות גבוהות מדי של איתור בעלי זכויות. ג’יימס סומרס פרסם כתבה מרתקת בנושא באטלנטיק, שממש כדאי לקרוא. אני מדבר עליה היום בתוכנית “לונדון את קירשנבאום” בערוץ 10.
גוגל ספרים (Google Books) החל ב-2002 תחת שם הקוד “פרוייקט אוקיינוס”, אז פנתה גוגל לאוניברסיטת מישיגן, שבה למד המייסד-השותף של גוגל, לארי פייג’, והציעה לדגטל עבורה את 7 מיליון הספרים שבספרייתה, תמורת עותק לגוגל. ב-2004 החלה גוגל לסרוק את הספרים, בשילוב של עבודה אנושית – החברה גילתה שאצבעות אנושיות חבושות מעין קונדומים ורודים הם אמצעי הדפדוף היעיל ביותר שגם לא פוגע בספרים, חומרה – ארבע מצלמות ומערך תאורה שצילמו כל ספר בקצב של 1000 דפים בשעה ולידאר שהקרין רשת תלת-ממדית בתאורת לייזר על הספר כדי לסמן את העקמומיות שלו, ותוכנות – שיישרו את התצלומים לפי רשת הלייזר, במקום שהעובדים המצלמים יבזבזו זמן ביישור ושיטוח ספרים, תיקנו צבע וניגודיות, איתרו מספרי עמודים, שלפו איורים ותרשימים, המירו הערות שוליים ודירגו ספרים לפי חשיבות, כך שהם יהפכו מפריטים פיזיים מנותקים לרשת מידע.

יד של עובד גוגל ב”גוגל ספרים”. צילומסך: The Art of Google Books
בסוף אותה שנה הכריזה גוגל על הפרויקט, תחת השם גוגל פרינט, ששנה אחר כך יוחלף לגוגל ספרים. אחרי אונ’ מישיגן, גוגל חתמה על הסכמים גם עם הרוורד, סטנפורד, אוקספורד, הספריה ציבורית של ניו יורק ועשרות ספריות נוספות, ותוך קצת יותר מעשור סרקה כ-25 מיליון ספרים, כשהכוונה היא לסרוק את כולם – בפוסט ב-2010 טענה החברה שיש בעולם 129,864,880 ספרים בסך הכל, עם הסבר מפורט של מהנדס תוכנה על איך הגיעו למספר הזה.
כצפוי, גילדת הכותבים האמריקאית הגישה ב-2005 תביעה ייצוגית נגד גוגל, בטענה שגוגל סורקת את הספרים ויוצרת עותקים דיגיטליים שלהם בלי לקבל רשות מבעלי זכויות היוצרים. גוגל אכן לא ביקשה רשות, בנימוק שהשירות שהתכוונה להציע הוא חיפוש שיציג קטעים מהספרים, ולא את הספרים במלואם או מכירה שלהם. אבל סיבה נוספת היא שבמסורת של משבשי תעשיות מבוססות זכויות יוצרים וברוח עמק הסיליקון, גוגל לקחה סיכון ופעלה בלי לבקש רשות, מתוך תקווה והערכה שהיא תצליח לשכנע את בעלי הזכויות שהיא מועילה להם – או תביס אותם בזירה הציבורית, ואם זה יגיע לכך, גם המשפטית.
אחרי שהגישו את התביעה, התובעים הבינו שהמהלך של גוגל דווקא עשוי להועיל להם: ספרים ישנים, שהדפסתם ומכירתם הופסקה ושאין להם גירסה דיגיטלית, יוכלו לקבל חשיפה מחודשת, להימכר לציבור הקוראים ולייצר הכנסות חדשות – כשגוגל לוקחת על עצמה את חלק הארי של ההוצאות (דיגיטציה, אחסון מקוון, מכירה וסליקה). הפסד של גוגל במשפט היה מונע ממנה ללכת בכיוון הזה.
אולם גם נצחון של גוגל לא היה פותר את הבעיה, משום שחלק מהספרים הישנים מנועים מלהימכר בגלל תסבוכת משפטית בחוקי זכויות היוצרים האמריקאיים, שנוגעת למה שמכונה “יצירות יתומות”, שלא ידוע מצב זכויות היוצרים שלהן – האם הן שייכות ליוצר או ליורשיו, או שהועברו לאדם או גוף אחר, או פגו והיצירה עברה לנחלת הכלל, כלומר חופשית לשימוש בלי צורך לקבל רשות ולשלם. הבעיה מתמקדת בעיקר בספרים שפורסמו בין 1923 ל-1964 – יש הערכה שמדברת על כך שמחציתם בנחלתם הכלל, אולם לא ידוע אילו מהם, ושל מי הזכויות על המחצית השנייה. נסיון לברר את מצב הזכויות לשם פרסום ספר מחדש יקר מדי לעומת ההכנסות הצפויות, ולעתים בלתי אפשרי.
גוגל וגילדת הסופרים הגיעו לפשרה מבריקה, שחורגת מהמטרה המקורית של התביעה: גוגל תשלם חד-פעמית 125 מיליון דולר, שיכללו תשלומים לבעלי הזכויות של הספרים שסרקה, לסופרים, לכיסוי הוצאות המשפט ולהקמת גוף בשם מרשם זכויות הספרים (Book Rights Registry). גוגל תורשה להמשיך לסרוק ספרים, וגם למכור אותם – כשבמקרה של הספרים הלא-יתומים, בעלי זכויות יוכלו לקבוע את המחיר, לחלק אותם בחינם או לאסור על מכירתם. גוגל תעביר למרשם 63% מהרווחים על מכירת הספרים. המרשם יחלק אותם לבעלי הזכויות שיפנו אליו וידרשו תשלום על יצירותיהם, וישקיע חלק מהכסף שנותר בחיפוש בעלי הזכויות האבודים של היצירות היתומות. מאחר שהתביעה ייצוגית ומייצגת את כל בעלי זכויות היוצרים על ספרים בארה”ב, אישור הפשרה כפסק דין תחול על כל הספרים שם, וכך תפתור את בעיית היצירות היתומות בתעשיית הספרים.
הצדדים הכריזו על הפשרה ב-2008, עבדו על הפרטים והתיקונים זמן רב וב-2011 הפשרה המתוקנת הוצגה לציבור להגשת התנגדויות. 500 כאלו הוגשו, ורבות מהן נסובו סביב המונופול שהפשרה מעניקה לגוגל – על הסריקה, הגישה לחיפוש והמכירה של ספרים בכלל, וכאלו שהדפסתם הופסקה בפרט. מונופול כזה יתן לגוגל יתרון לא הוגן על כל מתחרה נוכחי ופוטנציאלי, ויאפשר לה להפקיע מחירים של מוצרים – ספרים ותוכנם – שהיא בכלל לא יצרה – למשל במחירי מינויים לספרים דיגיטליים שהיא תמכור לאוניברסיטאות וספריות ציבוריות. הנימוקים הללו שכנעו את חטיבת ההגבלים העסקיים של משרד המשפטים, שטענה במסמך שהגישה לבית המשפט שחברה שתרצה להתחרות בגוגל תצטרך לסרוק ספרים בלי רשות, להיתבע ייצוגית על ידי בעלי הזכויות ולחתום על הסכם פשרה, רצף אירועים בלתי סביר לשיחזור. השופט דני צ’ין דחה את הפשרה, ובסוף 2013 דחה את התביעה. בית המשפט מהמעגל השני דחה ב-2015 ערעור של הגילדה על הפסיקה, וב-2016 סירב בית המשפט העליון לבקשת הגילדה לבחון מחדש את פסיקת בית המשפט מהמעגל השני, והותיר אותה על כנה.
🎂 פייסבוק מודה: מנגנון חסימת המשתמשים האוטומטי חשוף למניפולציות
פייסבוק מסרבת לגלות את הסיבות לחסימה שגויה של משתמש בולט, המיליארדר הסיני הגולה גואו וון גואי (郭文贵), בנימוק שהדבר עלול לחשוף את מערכת החסימות למניפולציות.
גואו הוא מיליארדר סיני שמתגורר בארה”ב ומתבטא נגד השלטון הסיני. לאחרונה פרסם גואו האשמות בשחיתות נגד בכירים במפלגה הקומוניסטית השלטת בסין, ובשבוע שעבר הגישה ממשלת סין לאינטרפול בקשה למעצרו. לפי דיווח של העיתונאי פול מוזור בניו יורק טיימס, פייסבוק השעתה ביום שישי את הפרופיל של גואו.
גואו התלונן על החסימה בטוויטר שלו, ובין השאר כתב: “מה זאת אומרת, פייסבוק חסמה אותי? הם כנראה נבהלו מאוד! האם זה יחסום את הגילויים שלי? זה ממש מפוקר. זה מעניין מאוד. הפחד והדאגה שלהם גורמים לי לחשוב שהערך של הראיות המגוונות שלי גדול משדמיינתי”, כך לפי תרגום שפורסם בטיימס.
אחרי שגואו התלונן בפומבי, דוברת מטעם פייסבוק אמרה שהמערכות האוטומטיות של החברה השעו את גואו בטעות, ושמרגע שהחברה יכלה לחקור את הטעות, היא השיבה את הפרופיל לקדמותו. היא אמרה שקשה יהיה לקבוע את הסיבה המדוייקת להשעיה, וכי פרסום הסיבות יאפשר לאחרים לבצע מניפולציות על המערכת. בתגובה לספקולציות של מגיבי טוויטר של גואו, שלפיהן ממשל סין מפעיל אוסף חשבונות מדיה חברתית לדווח על חשבונות של אנשים כמו גואו כדי לגרום להשעייתם, מסרה הדוברת מטעם פייסבוק כי החברה לא מסירה תוכן פשוט על סמך מספר הפעמים שהוא דווח.
尊敬的网友们好:这是什么意思.Facebook 给屏蔽了?这真是把他们吓坏了!这能阻止我爆料吗?这真是无法无天了!这个很有意思.他们的恐惧与担心让我觉得我的各种证据的价值比我想像的还要大!谢谢这些为此工作的人员!我希望你们不会是下一个马健副部长的下场!一切已经是刚刚开始!✊️✊️ pic.twitter.com/sQEzOFGHP9
— 郭文贵 guo wen gui (@KwokMiles) April 21, 2017
אני לא מביא כאן ציטוט מדוייק של הדוברת מאחר שהניו יורק טיימס עצמו הביא את דבריה בציטוט עקיף:
A Facebook spokeswoman said that the company’s automated systems had erroneously suspended Mr. Guo’s account and that once the company was able to investigate the error, it had restored the profile. The precise reason for the suspension would be difficult to determine, the spokeswoman said, adding that publicizing the reasons could allow others to manipulate the system. […] The Facebook spokeswoman said the company does not remove content based simply on how many times it has been reported.
ביקשתי מכתב הטיימס את מילותיה המדוייקות של הדוברת, ואביא את הדברים כאן אם אקבלם.
מפייסבוק ישראל לא התקבלה תגובה כי לא התבקשה תגובה כי אני לא טורח לפנות אליהם לאור העובדה שהם מחרימים אותי, ובפעם הבודדת שהם השיבו לפנייה שלי בחודשים האחרונים, התשובה הגיעה אחרי הדדלייין ויותר מיממה אחרי פנייתי, ובמקום תגובה על השאילתה שלי קיבלתי שאלת הבהרה מטופשת שהם יכלו לבדוק בעצמם, אבל העיקר שטכנית הם יכולים לומר לפרוטוקול שטכנית הם השיבו לפנייה שלי.
📑 פינטר תרגם את דבריו על האלגוריתם החדש של גוגל תרגום באמצעות האלגוריתם החדש של גוגל תרגום
השיפור באלגוריתם של שירות התרגום “גוגל טרנסלייט” היה נושאו של ראיון ב”רבע לדיגיטל”, וראיון מורחב בחדר 404, עם יובל פינטר, דוקטורנט למדעי המחשב בתחום עיבוד שפה באוניברסיטת ג’ורג’יה טק. בהתאם לסוג ההומור המאוד מסויים שלו, פינטר תרגם את הראיון לאנגלית באמצעות גוגל טרנסלייט.
⚖️ ממשל טראמפ דרש לחשוף זהות מפעיל חשבון מורד של רשות ההגירה, טוויטר תבעה והממשל נכנע 🎙️ שישבת
דונלד טראמפ הוא לא אדם שיימנע ממריבה אינטרנטית קטנונית, כפי שעולה ממכתב שקיבלה לוסי, נערה בת 17, מפרקליטיו של טראמפ, שדרשו ממנה להסיר את האתר שהקימה, TrumpScratch.com, שבו הגולשים יכולים להכות בפניו של נשיא ארה”ב באמצעות כפות של חתולים.
טראמפ מתעסק גם עם יריבים במשקל קצת יותר משמעותי, כמו alt_uscis, פרופיל טוויטר צללים שמציג את עצמו כ”התנגדות הגירה”, כלומר ביקורת על רשות האזרחות וההגירה האמריקאית, אחד ממספר רב של פרופילי טוויטר צללים של ארגונים ממשלתיים, שעובדי הארגונים ומתנגדים אחרים פתחו בעקבות בחירתו לנשיאות, בתחילה בנושא ההתחממות הגלובלית ובהמשך בסוגיות אחרות, אשר מצייצים נגדו ומפרסמים מידע שלא נוח לו.
ממשל טראמפ פנה לטוויטר בדרישה לחשוף את זהותו של העומד מאחורי החשבון. את הבקשה הגיש אדם הופמן, סוכן ברשות המסים והגבולות של המשרד לבטחון המולדת האמריקאי. הדרישה היתה לחשוף את זהות המפעיל עד לתאריך שקדם ביום למועד שליחת הבקשה עצמה, ולשמור על הדרישה בסוד. טוויטר השיבה כי חשיפת זהות כזו תדרוש צו בית משפט. הופמן השיב כי לא יונפק צו כזה. בתגובה, טוויטר הגישה תביעה בבית המשפט המחוזי של המחוז הצפוני של קליפורניה. ארגון זכויות האזרח ACLU הודיע שהוא ייצג את מפעיל החשבון ויילחם על זכותו לפי התיקון הראשון לחוקה האמריקאית להתבטא בחופשיות ובאנונימיות.
ממשל טראמפ נחשף כאן כבריון על הנייר – למחרת הגשת התביעה, טוויטר הודיעה שמשכה את התביעה מאחר שהממשל משך את דרישתו לחשוף את פרטי מפעיל החשבון. טראמפ סקראץ’ ממשיך לפעול בכתובת חדשה, kittenfeed.com. יועץ משפטי מטעם ארגון טראמפ (The Trump Organization), אלאן גרטן, מסר לאובזרבר, שחשף את הסיפור: “זה שקרי לחלוטין, שום מכתב כזה לא נשלח על ידינו”.
“ביקורת ואהבה הן לא מילים סותרות”, אמרה מנכ”לית פייסבוק ישראל שלא מתראיינת לעיתונאים ביקורתיים
“ביקורת ואהבה הן לא מילים סותרות. המחשבה שמי שמבקר אותנו לא מעריך אותנו היא טעות. ביקורת יכולה גם לבוא עם הערצה”, אומרת מנכ”לית פייסבוק ישראל, עדי סופר-תאני, בכתבה מצויינת וביקורתית בכלכליסט שבה היא לא מתחמקת מתשובות לשאלות קשות על ח̶ס̶י̶מ̶ה̶ ̶ש̶ר̶י̶ר̶ו̶ת̶י̶ת̶ ̶ש̶ל̶ ̶מ̶ש̶ת̶מ̶ש̶י̶ם̶ כך שגדלה בבית מאוד לא ציני, א̶י̶ ̶ת̶ש̶ל̶ו̶ם̶ ̶מ̶י̶ס̶י̶ם̶ ̶ב̶י̶ש̶ר̶א̶ל̶ ̶ב̶א̶מ̶צ̶ע̶ו̶ת̶ ̶”̶ת̶כ̶נ̶ו̶נ̶י̶ ̶מ̶ס̶”̶ החשיבות של תפקידיה בתנועת “הצופים” וס̶ת̶י̶מ̶ת̶ ̶פ̶י̶ו̶ת̶ ̶ש̶ל̶ ̶מ̶ב̶ק̶ר̶י̶ם̶ אמא שלה כמודל לחיקוי.
ב̶י̶ז̶י̶ו̶ן̶ מומלץ!
🚔 דיווח בווייז על אלימות בכביש מעלה את התהייה למה בעצם אין פונקציה כזאת
“יש פו שיקור אם בכבוק זחוחית שוור שמעיים אליי ועל אמה שלי [השגיאות במקור]”, כתב הערב משתמש ווייז בצ’ט של אפליקציית הניווט, שמצא דרל מקורית לדווח על אלימות בכביש, או למתוח את המשתמשים האחרים.
“נהגתי הביתה בדרכי מהעבודה במסלול שהתווה לי הווייז”, סיפר לי יניב בוהדנה, מפתח תוכנה שעובד בקריית עתידים. “פתאום [כ]שעמדתי ברמזור קפץ לי הדיווח הזה במרחק של מטרים ספורים מהמקום שהייתי” – רחוב פנחס רוזן ליד הצומת עם טבנקין, בערך קילומטר מזרחית לירידה לאיילון. “בשניה הראשונה טעויות הכתיב לא נראו לי הודעה רצינית, ואז [כ]שהתחלתי להבין מה רשום שם הטרידה אותי המחשבה שאולי לא מדובר בשובבות של ילדים ואולי מדובר בדיווח מבוהל של ילד שבחר בווייז במקום לחייג 100 .כיוון שכבר עברתי את המקום בנהיגה לכיוון איילון דיווחתי למשטרה על ההודעה”.
המשטרה נתנה עבודה – שבע דקות אחר כך, שוטר סיור כבר התקשר לבוהדנה מהדרך לקבל מיקום מדויק. אולם כשהגיע למקום לא מצא שם את המתלונן או את המאיים, והעריך שמדובר במעשה קונדס.
בתחילת מרץ, רומן, ילד בריטי בן 4 ששם משפחתו לא פורסם, הציל את אמו מחוסרת ההכרה בכך שהצמיד את אצבעה לקורא טביעות האצבע כדי לפתוח את הסמארטפון שלה, והשתמש בסייעת הדיגיטלית סירי להתקשר למוקד החירום, ששלח פרמדיקים לסייע לה. בהנחה שלא מדובר בתושייה טכנולוגית דומה של ילד במקרה הנוכחי, הרי שהצ’ט של ווייז הוא לא שיטה יעילה במיוחד להודיע על מקרה חירום.
אבל האפליקציה עצמה מושלמת לדיווח על מקרי חירום מסוגים שונים, משום שהיא זמינה, מבוססת מיקום, צוברת נסועה גבוהה וכבר מכילה פיצ’ר של דיווחים על מפגעי תנועה. כל מה שצריך לעשות זה להוסיף לה פונקציה של דיווח על מקרה חירום – כללי או מפורט – עם אפשרות להעביר את הדיווח ישירות מהאפליקציה לכוחות הבטחון וההצלה, להקיים שיחת אודיו/וידאו ישירה ביניהם ולשדר חי מהמקום תמונות/וידאו (שימושי הן לטיפול באירוע בזמן אמת, הן לתיעוד לצרכים בטחוניים ומשפטיים והן לשידור בתקשורת).
🚫 פייסבוק ממשיכה לחסום בשרירותיות, אנחנו ממשיכים לדבר על זה >> [ראיון ב”עושים סדר”]
פרופ’ קרין נהון ואני התארחנו ב”עושים סדר” עם גל גבאי בחינוכית, לדבר על גל החסימות האחרון של פייסבוק:
הזכרתי בראיון את איומי החסימה כלפי העיתונאי אביב מזרחי אחרי שכתב נגד פייסבוק.
💊 מכבי התקפלה, לא תעביר פרטי קרובי לקוחותיה בלי רשותם: “ערים לתגובות, על בסיסן החלטנו שלא תהיה העברת נתונים”
קופ”ח מכבי הודיעה שלשום ללקוחותיה כי תעביר את פרטי קרוביהם, בלי לקבל את רשותם, לחברת הביטוח כלל כדי שזו תמכור להם ביטוח סיעודי. היום מכבי חזרה בה מההחלטה, וציינה שעשתה זאת בעקבות הביקורת הציבורית.
אתמול דיווחתי כאן על האימייל ששלחה מכבי ללקוחותיה, ובו הודיעה להם נילי לוי, מנהלת תחום הביטוח הסיעודי בקופה, כי “פרטי בני המשפחה אשר אינם מבטוחים, יועברו על ידינו לחברת כלל על מנת שזאת תוכל לפנות ולהציע להם להצטרף לביטוח הסיעודי הקבוצתי”. הקופה לא ביקשה רשות להעביר את המידע, אלא הודיעה שמי שלא רוצה שיועבר, יצטרך להתקשר תוך 30 יום לבקש זאת: “במידע ומי מבני המשפחה לא מעוניין בכך, נבקש כי יפנה למוקד הטלפוני הממוחשב של מכבי, להשארת פרטיו (או פרטים של בן משפחה קטין), כך שלא יועברו לכלל חברה לביטוח בע”מ”. בתגובת החברה לפנייתי נטען כי “מדובר במהלך העומד בהגדרות חוק הגנת הפרטיות לרבות ההגדרה של [ה]סכמה מדעת”.
אולם עו”ד יהונתן קלינגר מהתנועה לזכויות דיגיטליות אמר: ““העברה של מידע מגוף אחד למשנהו ללא הסכמה היא פגיעה בפרטיות, במיוחד כאשר מדובר על מידע רפואי. חוק הגנת הפרטיות קובע בסעיף 2(9) ששימוש במידע שלא למטרה שלשמה הוא נמסר (קרי: העברה שלו למישהו אחר למטרות פרסום) היא עבירה שדינה חמש שנות מאסר. לא מזמן, הרשות למשפט, טכנולוגיה ומידע (רמו”ט) החליטה שהאמירה ‘אם לא תגיד שאתה מתנגד נעביר’ אינה חוקית”.
לקוחות מכבי שקיבלו את המכתב הודיעו לקופה בפייסבוק כי היא לא רשאית להעביר פרטים בלי לקבל את הסכמתם, וכמה מהם טענו שמדובר בעבירה על החוק ואיימו שיתבעו אותה אם תעשה זאת.
היום כתבה הקופה לאותם לקוחות בפייסבוק שהיא חוזרת בה מהמהלך:
אנחנו מודים לך על הפניה וערים לתגובות נוספות שעלו ביממות האחרונות. על בסיסן החלטנו שלא תהיה כל העברת נתונים לחברת כלל (ונבהיר כי גם עד עתה לא הייתה כל העברת נתונים כזו).
חשוב לנו מאד, שלחברי מכבי יהיה כיסוי סיעודי וזו הסיבה שיצאנו מלכתחילה למהלך. על כן אנחנו ממליצים גם לך לבדוק האם יש ברשותך כיסוי כזה, ואם לא, אזי לשקול בחיוב לדאוג לכך
[עדכון] מכבי יידעה את הלקוחות באימייל על ביטול המהלך:
🌏 פייסבוק מאפשרת למשתמשים לשתף את המיקום שלהם בזמן אמת 📻 ראיון בגלי ישראל
פייסבוק מאפשרת למשתמשי מסנג’ר לשתף את מיקומם בזמן אמת עם אחרים למשך עד שעה. דיברתי על כך עם יאיר שרקי בגלי ישראל.
ללמוד מלמידת-מכונה שאנחנו לא יכולים להבין איך היא מבינה את העולם
מערכות למידת-המכונה החדשות שלנו יצטרכו לטפש את עצמן משמעותית כדי להסביר לנו איך הן מגיעות למסקנות. בעשותן כן, הן יצטרכו לזייף את הייצוג שלהן את העולם הזה – ייצוג שאפשר לטעון שהוא נעלה לשלנו לא רק בהיקפו אלא גם בעצם המבנה שלו.יש לכך השלכות על האופן שבו אנו מחנכים את ילדינו.
העובדה המקדמית היא שמערכות למידת-מכונה לא תמיד יכולות להסביר את המסקנות שהן מגיעות אליהן.
הדוגמה המסורתית של מערכת למידת-מכונה היא כזו שמקבלת הכשרה איך להפריד הדוא”ל לספאם ולא-ספאם. אתה מתחיל את התהליך על ידי הזנת אימיילים שבני אדם סיווגו לשתי קטגוריות אלה. המחשב מחפש סדירויות בכל סדרה שייתכן שבן האנוש פספס. לדוגמה, במחקר משנת 2002 התברר כי הכללת המילה describe (“לתאר”) היתה מציין כמעט ודאי לכך שההודעה *איננה* דואר זבל. במקרה זה, התוכנה אכן יכולה לספר לנו איך ולמה היא סיווגה כל הודעה כפי שסיווגה. לדוגמה, אולי היו בה המילים “להתעשר מהר” ו”קל”, שלכל אחת מהן יש משקל-ספאם נכבד.
מאז, למידת-מכונה נכנסה למים עמוקים יותר. רשתות עצביות מלאכותיות שמריצות תוכנת “למידה-עמוקה” יכולות לבצע ניתוחים כל כך מדהימים במורכבותם שבני אדם פשוט לא יכולים להבין איך הן הגיעו למסקנותיהן. לדוגמה, דמיינו מחשב שקיבל פקודה לנתח סדרת מודעות A/B. אלו שתי גרסאות של מודעת רשת, עם הבדלים קלים כמו הצגת המחיר בצד ימין או שמאל, או שימוש ברקע ירוק או כחול. אתר כמו אמזון יציג את שתי הגירסות לחילופין באקראי לכ-100,000 מבקרים, וצפוי לגלות שאחת הגירסאות מקבלת הקלקות בכמה נקודות אחוז יותר מהשנייה. מכאן והלאה, כל המבקרים יראו את הגרסה שהוכיחה את עצמה כיעילה יותר. אבל בדרך כלל אף אחד לא יודע למה גירסה אחת עובדת טוב יותר מרעותה. למעשה, לו ידענו מדוע – למשל, כי רקע כחול תמיד מביא תוצאות טובות יותר מאשר ירוק – אמזון לא היה צריך להריץ בדיקות A/B.
עכשיו דמיינו שאנחנו מזינים לתוך מערכת הלמידה-העמוקה כל מה שאנחנו יודעים על 100,000 האנשים שעליהם ביצענו את בדיקת ה-A/B. תארו לעצמכם שעל כל אדם יש לנו, נניח, 5000 פריטי מידע. זה אכן מספר פיסות המידע ש-Cambridge Analytica, החברה שנשכרה על ידי מסע הבחירות של דונלד טראמפ, טענה לכאורה שיש לה על כל אחד מ-320 מיליון אזרחי ארה”ב. תארו לעצמכם את מערכת הלמידה-העמוקה מסמנת את היחסים העדינים ולעיתים בלתי ניתנים להסבר בתוך הנתונים הללו. אולי הרקע הכחול עובד טוב יותר על גברים מעל גיל 50 שהקליקו על שלושה עמודים בלבד שהיו להם כותרות כתומות ומגיעים מעמוד שמזכיר שמזכיר להם את עיר הולדתם, אבל לא על טינאייג’ריות לבנות שהגיעו לשם אחרי שנעזרו בגוגל להכנת שיעורי בית במתמטיקה אבל רק אם למחרת הוא יום חופש. עכשיו דמיינו את זה הופך הרבה, הרבה יותר מורכב מזה. תוכנות למידת-מכונה אינן מוגבלות במשתנים שהן יכולות לעקוב אחריהם. הן יכולות להבחין במה שנראה כמו קישורים לא רלוונטיים ולייחס להם משקל. על כן, מתקבל על הדעת שתוכנה תוכל לחזות במדוייק איזו גירסה של מודעה תקבל יותר קליקים, אבל תוכל להסביר למה רק באמצעות הצגת סדרה של קישורים ומשקלים שנמצאת מעבר ליכולת התפיסה של המוח.
היכולת של מערכות למידה עמוקה “להבין” את ההתנהגות האנושית המקוונת בלי שיוכלו להסבירה חלה גם על אירועים שקורים בעולם האמיתי. אירועים כאלו כפופים גם להשפעות המרומזות וההידודיות של אלפי משתנים. זה מנוגד להנחה הפשטנית שאנו במערב גדלנו להשתמש בה בעודנו מנווטים בעולם האמיתי: העולם הפיזי נשלט על ידי קומץ חוקים פשוטים שהופכים כל דבר לניתן לחיזוי. אין ספק שיש חוקים פשוטים, אבל הם גורמים לנו לשכוח את העובדה שכמעט כל מה שקורה הוא בלתי צפוי: הפיזיקה מסבירה את מרחק הבלימה של מכוניות, אבל כללים פשוטים אלו לא מאפשרים לנו לחזות שהמכונית לפנינו עומדת לבלום, או שהולך להיות פקק תנועה בגלל תקלה, או שציפור תעוף לתוך הפנסים הקדמיים שלנו, או אפילו מה ישודר ברדיו כאשר התאונה תקרה. אלו מאיתנו בגיל מסוים לא יכולים אפילו לחזות אם אנחנו הולכים למצוא את המפתחות שלנו בזמן. פשוט יש יותר מדי משתנים.
אם זה המצב, ראיית העולם על ידי המכונה משקפת את טבעו של העולם יותר מאשר הפשטתו על ידי המוח שלנו לקומץ של חוקים.
זה חשוב לחינוך.
אנחנו בהחלט רוצים להמשיך ללמד את ילדינו את החוקים והסדירויות. אבל אולי אנחנו צריכים גם ללמד אותם שחוקים אלה חלים על יקום כה מורכב שלעולם לא יהיה לגמרי בהיר לנו. במובן זה, היקום הוא פחות כמו שעון ויותר כמו ענן עשן. שניהם נשלטים על ידי כללים פשוטים, אבל יכולת הניבוי של פעולת השעון היא יוצאת הדופן.
כדאי לנו גם לשנות את הגישה שאנחנו משדרים לגבי הכלים שבהם אנו משתמשים בחיפושינו אחר ידע. תכופות מדי התייחסנו למחשבים, מחשבונים והאינטרנט כקיצורי דרך; אם אתה משתמש בהם, רמזנו, אתה לא באמת לומד דבר. אבל הרבה מהמחקר המתקדם ביותר שלנו כבר מתבצע באמצעות אלגוריתמי למידה-חישובית שרצים על כמויות עצומות של נתונים. אנחנו עומדים להסתמך על מסקנותיהם למרות שאנחנו לא יכולים להבין אותם; אנו נסתמך עליהם כי הם יוכיחו את עצמם כאמינים, וכי אנחנו מבינים שדרך החשיבה שלהם עולה בקנה אחד עם המורכבות העצומה של העולם, הרבה יותר מדרך החשיבה שלנו. אלו הם כלי המחשבה החדשים שלנו, באותה מידה שסרגלים ומדי-זווית הם כלי המחשבה שלנו. ההבדל הוא שאנחנו מבינים איך סרגלים ומדי זווית עובדים.
זה מעורר ענווה לגלות שציוד הלמידה המולד שלנו לא מתאים למשימה שנתנּו לו. המוח מעולה להישרדות, אבל לא בנוי טוב לידע. מצד שני, יש משהו מופלא ביצירת כלים שעכשיו פתאום דוחפים אותנו מעבר למגבלות הבסיסיות, שהיו המצב שלנו עד כה. זוהי התקדמות אבולוציונית ביכולת האנושית לחשוב. אנחנו צריכים להעביר את תחושת ההתרגשות הזאת לילדינו.
המאמר התפרסם במגזין EdTech MindCET. ד”ר דייויד וויינברגר ישתתף מחר (ד’) בכנס Shaping The Future 4 של מטח


















