בראיון ליאהו שנערך לפני מספר שבועות, חושף פרופ' רודי שטודר מעט ממה שקורה בעולם החיפוש הסמנטי. פרופ' שטודר נחשב לשם דבר בעולם המחקר של מערכות מידע וטכנולוגיות סמנטיות, ולכן כדאי לקרוא את מה שיש לו לומר.
מעבר לנקודת המבט המעניינת, מאדם שעוסק בנושא באופן יומיומי ומעמיק, עולות בראשי כמה מחשבות בעקבות הקריאה:
1. נחמד לראות שטכנולוגיות של הבעת סמנטיקה מיושמות לא רק בהקשר הצר של עיבוד שאילתות מדויק יותר. טכנולוגיות סמנטיות משמשות גם לפירוש הכוונות של המשתמש – מתן הקשר לשאילתות. וגם להצגת תוצאות בצורה שמובילה את המשתמש באופן טבעי לתשובות ולשאילתות טובות יותר במסעו אחרי התשובה הרלוונטית. רוב הנסיונות שאני מכיר עד היום לשיפור הרלוונטיות של תוצאות החיפוש עדיין מתבססות על חיפוש מונחה מילות מפתח. היכולת להביע הקשר לשאילתה בצורה פורמלית היא יכולת חזקה והיא כנראה המפתח לתוצאות חיפוש יותר טובות.
2. בעיה עיקרית שעומדת בפני הישום של הרשת הסמנטית על פי החזון המקורי נעוצה באופי של הרשת כמדיום פתוח ולא מנוהל באופן מרכזי. כמו שפרופ' שטודר מציין, טכנולוגיות סמנטיות כבר מיושמות במספר מקרים בהצלחה לא מבוטלת, אפילו בפרויקטים לא קטנים. אבל ההקשר שבו הטכנולוגיות האלה בולטות לטובה הוא הקשר של אינטגרציה של מערכות מידע, בסביבות סגורות ונשלטות שבהן אנחנו יכולים לכפות משמעות (אונטולוגיה) מסוימת של מושגים. יכולת ההסקה שטמונה בטכנולוגיות כמו RDF ו OWL מתבססת על חוקים של לוגיקה פורמלית. בסביבה סגורה שבה כל המושגים ידועים הלוגיקה הזו היא יחסית ברורה וחד משמעית. בסביבה פתוחה, כמו הרשת, השימוש בלוגיקה הוא לא כ"כ חד משמעי. מכיוון שבסביבה פתוחה כמו הרשת, לא כל העובדות ידועות לנו, אנו חייבים לחיות עם האפשרות של סתירות במידע שאנו מסיקים. ישומים של רשת סמנטית צריכים לדעת להתמודד עם כאלה סיטואציות. כמו שאומר פרופ' שטודר, אנחנו יחסית בסדר בפן של הסמנטיקה, אבל יש עוד הרבה מה לעשות בפן של הרשת, שבלעדיה, כל הסמנטיקה שבעולם לא תעזור. האתגר הוא גם הנדסי, וגם חברתי. מבחינה הנדסית, יש עוד מה לעשות, אבל זה כנראה ענין של זמן. בפן החברתי – שיתוף מידע, פתיחות וסטנדרטים, אנחנו כנראה גם כן בדרך – ווב 2.0 תרם לכך לא מעט. בכל מקרה, זה יקח קצת זמן, אבל כנראה שהדורות הבאים ידעו לעשות את זה יותר טוב.
3. טענה ידועה (ופסימית) בנוגע לאימוץ החזון של הרשת הסמנטית נוגעת לעובדה שהיא לא תתרומם משום שאנשים/אתרים לא יפרסמו מטה-דאטה. באופן אישי אני קצת יותר אופטימי, ולא בגלל שאני רואה את כולם עולים על העגלה אלא מפני שלדעתי זה רק ענין של זמן. ככל שפרסום מטה-דאטה יהפוך למשימה יותר קלה, נוכל להתחיל לראות יותר ויותר מסדי נתונים חשופים בצורה שתאפשר שימוש חוזר (ומקרי) במידע המפורסם. אני חושב שאנחנו נתפלא לדעת כמה מידע קיים כבר בצורה מובנית ומוכן פחות או יותר לגילוי. עם הזמן הרשת היא פחות של מסמכים ויותר של מידע מובנה או סמי-מובנה. אם כבר, הפער היותר גדול קיים בישום של הטכנולוגיות הסמנטיות – לתת ערך לכמויות המטה-דאטה שיווצרו. כאן, לעניות דעתי, הדרך היא יותר ארוכה ופחות ברורה. אפליקציות כמו SearchMonkey הן אכן תחילת הדרך, אבל זו באמת רק ההתחלה. חלק מהבעיה היא שלדעתי הישומים המסחריים ההמוניים הם פחות ברורים (לא ישומים של מיזוג מערכות מידע בארגונים). פרופ' שטודר מצביע על הפוטנציאל המסחרי של שילוב בין רשתות חברתיות לבין הרשת הסמנטית אבל לצערי לא מרחיב בנושא. אני, בינתיים, סקפטי.
4. אפרופו ישומים של רשת סמנטית ואימוץ של טכנולוגיות סמנטיות: אחת המכשלות העיקריות היא אכן רמת הסיבוכיות שמעורבת באימוץ של הטכנולוגיות הנ"ל. זה לא תמיד עסק פשוט להבין את כל הלוגיקה המעורבת ע"מ לייצר אפליקציה משמעותית שמתבססת על טכנולוגיות סמנטיות. אנחנו עוד בשלב שקשה לנו להסביר מה זה, לא כל שכן מה עושים עם זה. אין ספק שחשוב להמציא כלים שיעשו את העבודה קלה יותר. יש התחלה לזה, אבל זה עדיין רחוק מלהיות טריוויאלי. יש כאן אתגר חשוב לא פחות מפרסום או מציאת מטה-דאטה: לכתוב את הכלים שישמשו מפתחים של אפליקציות סמנטיות. אפרופו הזדמנויות עסקיות.



תגובות אחרונות