מרססי האתרים
דור שמר (23), תוכניתן מראש העין, השיק את feeds2.be, שירות מבורך ליצירת תזני-רסס (RSS Feeds) חיצוניים לאתרים שאין להם רסס. שמר יוצר את הרססים ידנית, על ידי ניתוח מבנה האתר והכנת תבנית שתדע לשאוב את המידע הרלוונטי. הרססים יושבים על השרת של שמר, ומתעדכנים בשילוב של בקשות מקוראי רסס ומערכת שמחליטה אם לשלוח לקורא עותק מטמון (cache) או לגשת לאתר התוכן ולעדכן את הרסס. אם אתם נתקלים באתר שאין לו רסס, אתם יכולים לחפש אותו ב-feeds2.be, ואם הוא לא קיים – ללחוץ על לינק “Add it!” ולשלוח בקשה. שמר יבנה לו רסס, ואפילו ישלח לכם אימייל כשהרסס יעלה. הנה הכתבה שלי ב-nrg על feeds2.be.
שיפורונים:
• ייסומניה (bookmarklet) שתבדוק אם לאתר שאני גולש בו כרגע יש רסס חיצוני, ואם לא — תשלח בקשה ל-feeds2.be. שמר עובד על ייסומניה כזאת.
• תוסף שייתן אינדיקציה על קיום הרסס החיצוני כאילו היה מוטמע באתר. שמר עובד על תוסף כזה.
• אינדקס מתוייג של כל הפידים שקיימים.
• הוספת מילות מפתח/תגים לרססים להקלה על החיפוש. אם תחפשו עכשיו “מרקר” לא תמצאו את הרסס של דה מרקר, כי המילה “מרקר” לא מופיעה בכותרת הפיד. שמר אומר שישקול זאת.
• הצגת תזן-הרסס המקורי של האתר, במידה ויש כזה. כרגע, אם תחפשו ynet תקבלו 0 תוצאות, למרות של-ynet יש רסס משלו. שמר: “הצעה בעייתית קצת, אבל אולי תישקל בעתיד”.
• הצגת הודעה על אתרים שדרשו להסיר את הרסס החיצוני. שמר לא מתכוון להתווכח עם אתרים כאלה – “אם אתר כלשהו יבוא אלי ויבקש להסיר את הפיד, אני אעשה את זה מיד. זה יהיה חבל לי ולגולשים, אבל אם זו הבקשה של האתר, שיהיה ככה” – אבל כדאי שהגולשים יידעו שאתר כזה לא רק שלא השקיע בהשקת רסס לנוחיות גולשיו, אלא גם מונע יוזמה חופשית כזאת, מסיבות אלו ואחרות.
המתכנת דביר וולק עבד לפני יותר משנה על שירות דומה, אבל מחוסר זמן לא סיים ולא השיק אותו. וולק: “עשיתי עת זה כ-proof of concept על תוכנה קטנה ב-PHP, שאפשר להגדיר לה מאוד בקלות בכמה שורות XML איך לעבד עמוד HTML ולנתח לרסס, והיא יודעת גם לעשות caching לרסס. לקח לי חמש דקות לכתוב כמה שורות שהפכו את עמוד המבזקים של ynet לרסס, בתור ניסיון”.
בניגוד ל-feeds2.be, השירות של וולק אמור לאפשר לכל אחד לבנות ולפרסם תזן-רסס, במידה והוא מבין בתכנות ובביטויים רגולריים: “אתה עושה XML שבו אתה אומר לתוכנה באיזה תבניות HTML הטקסטים הרלוונטיים מוקפים – מה מפריד בין אייטם לאייטם, מה מגדיר את הכותרת, את כותרת המשנה, את התאריך – ולפי הכללים האלה היא הולכת ומייצרת את זה ב-XML טהור והופכת את זה ל-RSS. יש ממשק פשוט נורא שנותן לך לבנות את ה-XML, לדבג אותו ולפרסם באתר”.
“זה עוד רחוק מלהיות גמור”, אומר וולק. “אין לי זמן לעבוד על זה, אבל אם מישהו רוצה להרים את זה אני מוכן לשחרר את זה תחת רשיון GPL”. אם מישהו רוצה להיענות לאתגר, הוא מוזמן לשלוח אימייל לת”ד 404, ואני אעביר את הפניות לוולק.
טוב, אתה יודע שיש לך עכשיו 404 אייטמים בנושא “אינטרנט”, נכון?
לא הכרתי את השירות המדובר של דביר, וחבל. על פניו אנחנו עושים בדיוק אותו הדבר – שימוש בביטויים רגולרים כדי להמיר HTML ל RSS.
אחד הגלגולים המקוריים של feeds2.be היה ממש כזה – תוכנת קוד פתוח להורדה שתאפשר למשתמשים בה להכין ביטויים רגולרים. בסוף החלטתי ללכת על כיוון יותר ריכוזי וידידותי למשתמש, אבל אין מניעה לפתוח את מנגנון יצירת הפידים למשתמשים מתוחכמים יותר (ואולי כדאי, בהתחשב בכך שמאז פרסום הכתבה קיבלתי כבר כמאה בקשות חדשות).
הבלוג של feeds2be ממזולג. הבלוג מבוסס על וורדפרס. מעניין כמה נקוד המקור שייך לו. ראוי להוסיף גילוי נאות.
מיזלוג
קוד מקור
דורפל:
יש לי הצעה קטנה לשיפור. במקום לבקש כתובת מייל של מי שמבקש להוסיף פיד, תתן מייד את כתובת הפיד – למרות שהוא עוד לא קיים, את הכתובת אתה יכול כבר להקצות. פידים כאלה, שעוד לא קיימים, יכילו item אחד ובו כתוב שהפיד יעודכן בקרוב.
כמובן, אלא אם כן אתה *רוצה* לאסוף כתובות מייל של המשתמשים.
נועם.
דור, אתה גאון. יש אמנם שירות כזה כבר כמה זמן באנגלית, אבל שלך עובד הרבה יותר טוב וגם תומך בעברית – שיחקת אותה בענק.
בדיוק השבוע חשבתי על לעשות דבר כזה… משהו בסגנון של מה שדביר רצה לעשות.
נו טוב, אז עכשיו נחסכה לי הטרחה (או שאני אכנע לרצון ואבנה משהו בכל זאת)
האתר הזה: http://www.syndic8.com/
קיים כבר לפחות שנה, אם איני טועה.
עידוק, נראה לי שפרסום הכתבה שלך ב-NRG ממש לא עשה טוב ליוזמה של דורפל. עכשיו לחיצה על הלינקים ב-NRG מובילה לדף 404 (כמה אירוני)… טוב, זה היה צפוי. לפחות רואים את הכותרת וכותרת משנה בפידים. מעניין איך זה יתפתח הלאה.
עמית – על איזה לינקים אתה מדבר? הלינקים לפידים? אם כן, כנראה דובר בתקלה שלא קשורה בצורה ישירה לכתבה, ותוקנה.
מה שכן, יש לי בעיה חדשה עכשיו – עודף בקשות לפידים חדשים, בכמות שאני לבדי לא מצליח להתמודד איתה… מישהו מוכן לרתום כתף?
עמית – אפקט נרג?
איך אפשר לעזור ? אני לא מבין ב-AJAX יותר מדי אבל בסה”כ יש לי ידע די טוב במדעי המחשב. אם תראה לי דוגמה של איך ניתחת את שאר הפידים אולי אני אצליח לחקות את זה עבור פידים אחרים ?
אגב, התקלה אכן תוקנה וסליחה לאנשי נרג’ שחשדתי בהם בקונספירציה אנטי-רססית
אין כאן צורך לתכנת. כל מה שצריך לעשות זה לקרוא קוד HTML ולהרכיב ביטוי רגולרי שמייצג אייטם.
אני שוקל לפרסם קריאה למנתדבים עם ידע מתאים, כדי שיוכלו לעבור על אוסף הבקשות ולעבד אותן, מה שייקל עליי להתרכז בשאר הדברים (פיצ’רים חדשים לאתר, בעיקר)
זהירות, האולר השוויצרי עוד יכול לפצוע אותך….
יֶדָּע: סך כל האמיתות, התכנים והעקרונות הקיימות בהכרתו של האדם. כֹּח: היכולת להביא את הידע לעולם המוחשי. מה שהבדיל את האנושות משאר בריאי הח…
[…] My first interview ever was published yesterday at Nrg.co.il, which to me was the official site launch. We’ve recieved about 400 entries directly from the article, and 200 more from what hopefully will be the beginning of a very long tail [here, here and here]. I honestly didn’t anticipate this kind of good response. Thank you all! […]
1. מטבע הדברים, ייסומניה לא עובדת “ברגע שגולשים לאתר מסוים”. אתה אולי מתכוון לקיפוף?
2. השירות http://feed43.com נותן (לפחות לכאורה) את מה שדביר תכנן לכתוב.
ספלינטור – לא שמתי לב לטעות הזאת. הכוונה היתה בהתחלה ייסומניה שתאפשר לגולש לבדוק האם האתר קיים אצלנו, ואם לא לבקש שיתווסף. בשלב הבא, להוסיף תוסף פיירפוקס שיוסיף אינדיקציה על קיום הפיד כאליו היה מוטמע ישירות באתר.
עידו מוזמן לתקן את הניסוח כאן, אבל אני לא יודע עד כמה זה משמעותי.