מרכאות לא מיותרות: כמה פעמים מופיע פאבל סלוצקר בגוגל?
פוסט של אהרן פוירשטיין
שלמה אבינרי* כותב היום בהארץ על משפחת החייל החטוף גלעד שליט, ומגלה בורות במיומנות החשובה ביותר לאדם המודרני – שימוש נכון בגוגל.
כך כותב אבינרי:
הייתי מצפה ממשפחת שליט להיות מודעת לכך שיש משהו מקומם בכך ששמו של גלעד – החי – נהפך כמעט למותג לאומי, ואילו שמותיהם של שני החיילים שנהרגו כאשר הוא נפל בשבי נותרו אלמונים. ב”גוגל” בעברית הופיעו, כאשר בדקתי באחרונה, כ-3,400,000 אזכורים לגלעד שליט, 270,000 אזכורים לחנן ברק ו-741 אזכורים לפאבל סלוצקר.
אז למה באמת חנן ברק מוזכר 270000 פעם ופאבל סלוצקר רק 741 ? כי הפרופסור לא השתמש במרכאות, ועל כן השתרבבו לחיפוש שלו הרבה מאוד תוצאות שבהן השם חנן מופיע אי שם ליד ברק, שני שמות נפוצים הרבה יותר בעברית מאשר פאבל וסלוצקר. לו היה שם מרכאות היה מגלה ש”גלעד שליט” אמנם נפוץ הרבה יותר מהשניים האחרים (3.21 מיליון מופעים), אבל ל”חנן ברק” יש רק 2670 אזכורים.
אבל מי סופר.
* שלמה אבינרי הוא פרופסור למדע המדינה וחתן פרס ישראל. איזה קורס חובה הייתם מוסיפים באוניברסיטה (גם לפרופסורים)?
______________________________________
היה זה פוסט של אהרן פוירשטיין, תסריטאי ומורה לקולנוע, ובעל הבלוג "הפרוייקט הגדול" ברשימות
תגובות
15 תגובות לפוסט “מרכאות לא מיותרות: כמה פעמים מופיע פאבל סלוצקר בגוגל?”
פרסום תגובה
עליך להתחבר כדי להגיב.
מה שהופך את הטיעון שלו לחזק יותר.
“לחלוב את גוגל” . קורס מצוין .
הרגע קראתי את אבינרי וחשבתי את אותן המחשבות. מעניין שלגלעד שליט עדיין יש בערך 3.2 מיליון אזכורים גם בתוך מרכאות, ושכשאני חיפשתי “חנן ברק” מצאתי קצת יותר אזכורים משמצאת אתה, 2710.
בכלל, הרגשה נחמדה, CSI-יית כזו, לחפש מתים ושבויים בגוגל. ואפשר גם להוסיף בדיחה שמשלבת טרחנות קשישה גיקיות אווילית וניתוץ פרה, ולומר שעם 3.2 מיליון תוצאות בגוגל, פלא שאי-אפשר למצוא את גלעד שליט?
נמאס לי לחזור שוב ושוב על אותה אמירה. אבל בכל זאת צריך מדי פעם.
אם ב”הארץ” היו עורכים הם היו בודקים בעצמם ומתקנים את המספרים.
נמאס לי לחזור שוב ושוב על אותה אמירה. אבל בכל זאת צריך מדי פעם.
אם ב”הארץ” היו עורכים הם היו בודקים בעצמם ומתקנים את המספרים.
חנן – נמאס לך לחזור שוב ושוב על אותה אמירה ולכן אתה חוזר עליה שוב? :)
לעניות דעתי- הבעיה היא לא עם העורכים- אלא עם החפיף המוחלט שבו אנחנו מתייחסים לעולם הטכנולוגי, לעולם המדעי ולמלים שלנו.
ההנחה שגוגל ודאי צודק. ההנחה שהמידע באמת מונח כאן מבלי שאצטרך ללמוד איך לרדות אותו. הקלות הבלתי נסבלת שאנחנו עושים שימוש במדיה שלא הבנו את יתרונותיה חסרונותיה ודרכיה.
הרי אם אחד מתלמידיו של הפרופסור היה עושה לו גזור העתק מויקיפדיה- הוא היה חוטף על הראש, ואילו כאן במאמר נוקב אל מול פני האומה (ואל מול אנשים מיוסרים) הוא מרשה לעצמו להעיף תובנות. אני לא אומר שהוא לא צודק, פשוט החפיף נראה לי בעייתי, ונראה לי שרבים מאוד מאיתנו לוקים בו.
אותי מטריד משהו אחר לגבי מספר התוצאות שגוגל מחזיר. אם נחפש “עידו קינן” בתוך מירכאות בגוגל הוא יחזיר לנו תשובה לפיה יש “כ-47,900″ תוצאות לחיפוש הזה. אבל אם נעבור עמוד עמוד, כשנגיע לעמוד התוצאות האחרון פתאום יתברר לנו שיש רק כ-279 תוצאות עבור הביטוי שחיפשנו.
זה פער עצום, והוא כמובן לא ייחודי דווקא לחיפוש הספציפי הזה. ובכל זאת, גם לאנשים שמבינים משהו באינטרנט או בחיפוש בגוגל, אין שום בעיה להגיד של”עידו קינן” (שוב, רק לשם הדוגמה) יש כ-47,900 אזכורים בגוגל, למרות שהתוצאה האמיתית רחוקה מאוד-מאוד (מאוד!) מהנתון הזה.
לסמל סלוצקר ז”ל, כשמניחים את שמו במרכאות, יש 1077 אזכורים. אחרי הכל, יש שכותבים פאבל ויש שכותבים פבל, כך ששתי הקומבינציות יחדיו תקפות.
ובכלל, השימוש ב”כמה פעמים הופיע הערך בגוגל” כביטוי למשהו, לכל היותר קלוש וברוב המקרים פתטי.
סקר רב משתתפים על מודעות לשם, למשל, היה עושה עבודה יותר מדוייקת
(כמה אנשים ברחוב, מתוך 100, ידעו מיהו “חנן ברק”, למשל, לעומת “גלעד שליט”)
אבל בסופו של יום, שימוש במספר התוצאות שעלו במנוע החיפו, מעיד על “מחקר מעמיק” שארך מספר שניות מול מחשב, לא על נתון בעל ערך או עם קשר כלשהו למציאות.
יונתן – הנתון על מספר האזכורים שיש לביטוי המותג “עידו קינן” הוא מדויק.
האלגוריתם פשוט מחזיר את מספר עמודי האינטרנט בהם הרובוט של גוגל עבר ומצא את הביטוי הנ”ל.
נכון שהמספר המופיע בתוצאות החיפוש הוא נמוך הרבה. מטעמים מובנים של מהירות וחיסכון במקום, גוגל אינו נותן את כל האזכורים הקיימים בתוצאות החיפוש – היות ורובם אינם רלוונטיים (עמודים הנמצאים באותו אתר וכו’)
מאור, כן, אני יודע שכתוב שם שתוצאות דומות מאוד הוסרו, או משהו כזה, אבל א. גם כשבוחרים לראות את התוצאות שהוסרו התוצאות נעצרות איפשהו באזור ה-500, וב. והרבה יותר חשוב: כן, די ברור לי שיש איזשהו הסבר טכני או טכנולוגי ללמה זה קורה. הנקודה היא שמבחינת ההקשר שבו אנשים נוטים להשתמש בנתון הזה, של כמה פעמים ביטוי מסוים מופיע בגוגל, זה בכלל לא רלוונטי.
אם אני אומר גיגלתי את העידו קינן הזה והוא כנראה כלי רציני, יש לו 47,900 אזכורים באינטרנט, בזמן שבפועל רק שבריר אחוז מתוך המספר הזה הם אזכורים שונים, אז ברור שלנתון הזה, בהקשר הזה, אין למעשה שום משמעות.
לפחות במדעי החברה, נראה שלפרופסרים אסור לדעת לעבודעל מחשב, בהנחה שהעבודה לא כרוכה בניקוב כרטיסיות. הכרתי פעם פרופסור שהסתיר מעוזרי ההוראה שלו עד כמה שהוא מבין בשימוש במחשב ושיחק אותה קלולס לגמרי. מנגד היכרתי אחד אחר שהיה באמת צריך עזרה כל פעם שהיה צריך למצוא את הלינק להורדת מאמר מאתר הספריה.
ומה שמעניין הוא שאם מגגלים עכשיו את השם פאבל סלוצקר מקבלים את חדר 404. יופי עידוק. השתלטת על עוד שם. על מה אתה מתכנן עכשיו ???
גלעד שליט הוא המפורסם ביותר כיוון כל ההפגנות שמארגנת משפחתו.