חוכמת ההמונים נגד ה-PDF של משרד האוצר
בניגוד בוטה לחשיבות הדיון הציבורי והפוליטי במסמך המדיניות שעל בסיסו נכתבים תקציב 2008 וחוק ההסדרים (ולא משנה מאיזה צד של הפוליטיקה אתם מסתכלים עליהם), את המסמך עצמו קשה מאוד להשיג, ולא במקרה. ח”כ שלי יחימוביץ’ (עבודה) קיבלה בתחילה הדלפה של עותק מסומן של המסמך, אותו לא יכלה לפרסם כדי לא לחשוף את המקור. עכשיו היא מפרסמת בבלוג שלה את המסמך המלא, אבל בקובץ PDF.
למה בפורמט PDF הסגור ולא בפורמט טקסט פתוח שמקל על העתקת קטעים לצורך ציטוטם ודיון בהם? יחימוביץ’ מסבירה באימייל שנשלח לרשימת התפוצה שלה:
הספר בקובץ PDF, חס וחלילה לא ב WORD. האדם היחיד במדינה שיש לו קובץ WORD הוא הממונה על התקציבים באוצר קובי הבר, העמודים לא ממוספרים [הם כן – ע”ק], גם החלטות הממשלה לא. אין לוגו. אפילו בשב”כ ובמוסד אין סודיות כזאת. וכל זאת למה? כדי שלא נדע, לא נלמד ולא ננתח את פרטי האסון שהם ממיטים עלינו.
איך מתמודדים עם זה? בעזרת חוכמת ההמונים וביזור המשימות.
1) הנגשה. “אם יש בכם גאון שיודע להפוך את זה לWORD זה יקל עלינו מאד”, מבקשת יחימוביץ’, ואני מוסיף: להמיר את הפדף לפורמט טקסט לא מוגן (txt, rtf, אפילו doc) ולשלוח לה עותק באימייל‘ .
2) חשיפה. לפרסם את הטקסט באתר אינטרנט, בסביבה קהילתית (וויקי, פורום, בלוג, וואטאבר).
3) ניתוח. יחימוביץ’ מבקשת “לשלוח לנו בהקדם הערות ענייניות לסעיפים בספר שאתם מבינים בהם”. אבל אל תעשו את זה לבד – בדיוק בשביל זה העלינו את המסמך לסביבה הקהילתית בסעיף הקודם. דיון משותף ודאי יוביל למסקנות חדות ומנומקות יותר.
לא הבנתי מה הבעיה ב-PDF. זה פורמט פתוח ומתועד (אפילו הגישו אותו לאשרור ISO, אבל הוא עוד לא התקבל), וזה בטח הרבה יותר טוב מ-doc.
אגב, הייתי שמח להעתיק את הטקסט לקובץ txt (לא יודע מה איתך, אבל אני מצליח לסמן קטעים, להעתיק אותם והם אפילו לא מועתקים הפוכים כמו בחלק מהקבצים שנתקלתי בהם), אבל הגרפים לא עוברים והריווח יוצא מכוער ולא קריא. אם מישהו רוצה לסדר אותו במקומי אני יכול לעשות את זה.
ספר בלשי: איך בדיוק הולכים לדפוק אתכם (תקציב המדינה)…
הטקסט שלהלן הוא העתק של פוסט שהתפרסם אצל עידו קינן, שפרסם כמה קטעים מרשימת הדיוור של שלי יחימוביץ’.
…
[…] תגובות יום רביעי, 8/8/07, 01:31 הטקסט שלהלן הוא העתק של פוסט שהתפרסם אצל עידו קינן, שפרסם כמה קטעים מרשימת הדיוור של שלי […]
שלחתי לה גירסת HTML קצת מינימאליסטית שהצלחתי להכין (בלי תמונות, והחלוקה המקורית לפסקאות), אבל התוכן הוא מה שחשוב הרי.
עשיתי את זה, אגב, בעזרת pdftohtml (כאן: http://pdftohtml.sourceforge.net), אבל כמובן שזה לא עבד עם עברית, אז השתמשתי באפשרות ההמרה ל xml שמשום מה כן עבדה טוב, ופירמטתי בעצמי למין html פרימיטבי מאוד.
שכחתי את הקישור לקובץ עצמו:
http://dorshemer.com/kalkalit2008.html
בבקשה: הטבלאות מתחרבשות וכו’, ולכן ראוי להשוות אותו ל-PDF לפני שכותבים משהו, אבל אפשר לעשות קופי פייסט חופשי.
http://shimshon.net/2008budget.doc
עידו, גם אני מצלחיה, אבל רק בחתיכות (עמ – 3 עמ כל פעם). אם אתה יכול להוריד אותם אני אשמח לרווח, להחליף פונטים וכו. לגבי הגרפים, אפשר לגזור אותם בעזרת הsnapshot ולהדביק כקובץ אבל, שוב, זה דורש העתקה נפרדת של כל גרף וגרף.
בלונדינית, הנה, בהצלחה (לא נגעתי בקובץ חוץ מהסרת תוכן העניינים בגלל שזה חסך 50kb והוא גם ככה מיותר). אבל שמתי לב לתופעה הרבה יותר בעייתית מריווח: המספרים יוצאים הפוכים. זה קורה גם כשאת מעתיקה מהקובץ?
נשלח במייל בגרסת וורד
דווקא אם מדובר בהנגשה – פורמט pdf הרבה יותר נגיש מפורמט וורד. הוא גם מבטיח לי (קצת יותר) שהטקסט אותנטי ולא עבר שינויים. הוא שומר על מבנה הקובץ ומתאים לכל מערכות המחשבים ולא תלוי בגרסאות (יקרות) של אופיס וחלונות.
וכמו שגיליתם: אין בעיה להעתיק טקסטים מתוך הפורמט הזה, אם רוצים לצטט.
שלי יחימוביץ אולי לא צריכה להתמצא בטכנולוגיה כדי לבקר את משרד האוצר, אבל מה הבעיה לקחת את הבן החנון של השכן ולשאול אותו איך עושים, הא?
[…] מצטרף לקריאתו של עידו קינן – כל מי שיש בידו הידע הדרוש להעביר את הטקסט אל פורמט […]
PDF זה פורמט תקני ו”פתוח” לא פחות מHTML.
הא? פורמט PDF הוא פורמט חופשי ופתוח שאינו מגביל את השימוש בקובץ וניתן לפתוח אותו בכל מערכת הפעלה. פורמט DOC הוא פורמט קנייני מוגבל שדורש תשלום דמי חסות (רישיון) ואינו מוגדר באף תקן פתוח. מאיזו סיבה יכול להיות שיעידיפו אותו על פני PDF?
לאלון – כי ככה יותר קל למי שלא מבין אפילו את פירוש המלים “פורמט חופשי ופתוח” לחתוך ולהעתיק קטעים ולדון בהם ולהפיץ אותם. וכך, אולי, הפורמט הקנייני הסגור יעזור לנו למנוע, ולו במעט, מזה שיפתחו לנו את ה, אהם, פורמט. זו נראית לי הסיבה שביקשו.
אני עם אלון. בתור משתמש לינוקס, לא בטוח שמסמך הוורד המקורי היה נראה אצלי בצורה טובה – שלא נאמר קריאה. אבל קובץ ה PDF נראה בדיוק כמו שהוא נראה על חלונות או כל מערכת הפעלה אחרת, ואינו דורש תוספת תשלום על מנת לקרוא אותו. כמו כן, גוגל יודעים לאנדקס אותו בדיוק כמו שהם יודעים עם קבצי וורד (ובטח היה להם קל יותר לעשות את זה), והמשתמש הפשוט יכול להעתיק חלקים ממנו או את כולו ולעשות בו מה שהוא חפץ.
אני מסכים שבאינטרנט יותר קל לקרוא HTML (בעיקר עם חלונות והמפלצת שנקראת אקרובט רידר), אבל החסרון הוא שקשה יותר להעביר קובץ HTML עם תמונות בין אנשים במייל, כפי שקרה במקרה של ח”כ יחימוביץ’. במקום לשלוח לה קובץ זיפ המכיל קבצי HTML ועשרות תמונות, היא קיבלה קובץ אחד בפורמט סטנדרטי ופתוח שיודע להציג הכל בצורה יפה ונגישה, אותו היא יכולה להפיץ בקלות מתוך הנחה שכל מי שיקבל אותו יוכל לקרוא אותו (אני לא יודע בדבר נגישות לעיוורים, אבל מעריך שקיים פתרון לזה).
מי שרוצה – יכול להוריד מכאן: בפורמט של doc. ניסיתי להעלות אותו לגוגל דוקס אבל הם לא מוכנים לסבול קובץ כל כך גדול.
אגב, בלינוקס זה כמובן יותר קל – מציג ה pdfים של אובונטו מאפשר להעתיק טקסט בקלות. למעשה הקובץ DOC הזה יוצר באופן אופיס בעזרת פעולת העתק-הדבק אחת בלבד.
מצד שני – נוצרו רווחים, עיצוב התחרבש וכן הלאה – מי שמוכן לקחת את הקובץ ולהמשיך לעבד אותו – יבורך – אני אשמח אם תעבירו אלי תיקונים על מנת לעדכן את שלי.
[…] חדר 404 האפוקליפסה הגיעה מוקדם השנה « חוכמת ההמונים נגד ה-PDF של משרד האוצר […]
גם אני לא מבין את הטרוניה על PDF. על ידי כמעט כל קורא PDF ניתן להעתיק טקסטים ללא כל בעיה. פורמט DOC הוא פורמט קניני לא סגור עם עצמו (נסו לפתוח קובץ שנכתב על ידי WORD 2000 ב-XP) של מיקרוסופט ולכן רע יותר מ-PDF.
שלא לדבר על תאורית הקונספירציה המוזה ששלי מנסה לבנות יחד עם הקובץ הזה, האם היא מעמינה שהשב”כ הרג את רבין ?
[…] נו, אם כבר מאבק קהילתי, לא נצטרף? […]
לפי ההגדרה שלי פורמט פתוח הוא פורמט שמאפשר לכל אחד לערוך שינויים והמרות ללא קשיים מיוחדים. עצם העובדה שלקח לכל הרבה אנשים כמה שעות טובות להעביר את הטקסט מ-PDF ל-html ושזה נעשה באופן חלקי בלבד היא ההוכחה ש-PDF אינו יכול להחשב לפורמט פתוח. זה לא שאי אפשר לעשות את זה, אלא שזה קשה ומסורבל. בדיוק כמו שעבור הכנסת לא בלתי אפשרי לשנות את הצעת חוק ההסדרים – זה רק קשה ומסורבל…
אני מצטער שאני שואל את השאלה הכי בסיסית. מאיפה יחימוביץ, יודעת שזה המסמך? האם זה נובע מאותם מנגנוני ידע שבעזרתם היא החליטה שא’ מבית הנשיא נאנסה? (כלומר מישהו אמר לה והיא החליטה להאמין, וסליחה על הדוגמא הממש לא לענין)