JOKOPOST | עיתון המאמרים והבלוגים המוביל בישראל

facebook twitter linkedin
  • ראשי » 
  • IT
  •  » מה המיוחד בעיבוד נתונים דיגיטלי?

מה המיוחד בעיבוד נתונים דיגיטלי?

הבנת הקשיים בפיתוח תוכנות בינה מלאכותית

מה המיוחד בעיבוד נתונים דיגיטלי? פרופסור יהושפט גבעון
אוגוסט 16
09:30 2019

אחת התכונות הנובעות מהתקן הדיגיטלי היא שכל הכלים הדיגיטליים בכל מופע של קיומם, מבצעים אך ורק תהליכי עיבוד מיוחדים במינם, השונים באופן רדיקלי מהתהליכים המתבצעים באמצעות המנגנונים המוכרים לנו מעידן התעשייה. תכונה זו מסבירה כמה קשיים מהותיים בפיתוח תוכנות בינה מלאכותית וברצוני להסביר אותה גם לקהל הרחב.

תכונה זו מופיעה בגלוי בהגדרות של טיורינג, פוסט וצ'רץ', והיא חבויה בהגדרה של גודֶל וקלייני. היות והגדרות אלה שקולות זו לזו, מספיק לאתר באחת מהן תכונה כלשהי, כדי לדעת שהיא תתגלה בכל הכלים הדיגיטליים. לשם כך צריך להכיר את ההגדרות משנות ה-30. אתאר כאן בקווים כלליים את התכונה שברצוני לדון בה, האופיינית לתהליכי עיבוד הנתונים הדיגיטליים, כפי שהיא מופיעה בהגדרה של טיורינג ממאמרו משנת 1936.

כדי להגדיר מהו חישוב יעיל, צפה טיורינג במומחיוֹת לחישובים בנות זמנו, ניתח את אופן פעולתן וגזר ממסקנותיו את הצעתו להגדרת מושג החישוב היעיל. אחרי מיצוי והפשטת פעולתן למינימום קיצוני, הוא טען שמספיק שיהיה בידינו מנגנון מצבים סופי, הפועל על סרט נייר משובץ (כדוגמת מכונות הטלפרינטר שהיו בשימוש במשרדים ממש בראשית המאה ה-20) בצעדים נבדלים. בכל צעד, תפעולו יהיה כתיבה, מחיקה ו/או קריאה במשבצת אחת ויחידה בסרט, עם אפשרות תנועה הלוך ושוב, במרחק של משבצת אחת לכל היותר.

המנגנון הזה יפעל לפי טבלת הוראות, כך שבכל פעם מצב המנגנון באותו רגע, והתו הנקרא במשבצת הנוכחית, קובעים, חד-ערכית, את פעולת המנגנון בפירוט הבא: ההוראה תקבע כתיבת תו במקום התו הנוכחי, תנועה, לכל היותר למרחק של משבצת אחת, ומעבר למצב הפעולה הבא של המנגנון, או סיום הפעולה כולה. המנגנון יתחיל לפעול במצב תחילי מסוים שנקבע מראש לכל הנתונים האפשריים של החישוב. למנגנון הזה שהגדיר טיורינג, קוראים היום לזכרו, "מכונת טיורינג".

אני מבקש להסב את תשומת ליבכם לתכונה החשובה של כל התהליכים שמכונות טיורינג מבצעות: החישוב המתבצע במכונת טיורינג מושפע אך ורק ממה שקורה בנקודת פעולה מקומית ומשפיע אך ורק על מה שקורה בנקודה זו: בלשון מכונות טיורינג, מהמצב הנוכחי של המנגנון ומתכולת המשבצת הנקראת. הקלט של החישוב יהיה תכולת הסרט בתחילת החישוב. פעולת מכונת טיורינג איננה מוגדרת על ידי תכונות גלובליות של הקלט, ולכן אקרא לה "פעולה לוקלית", כי היא מתרחשת, בכל שלב, בנקודה מקומית אחת של הקלט או של הפלט. לכל הכלים הדיגיטליים יש "קוצר ראייה" שכזה.

ההבדל שבין תהליכי עיבוד לוקליים ובין תהליכי עיבוד לא-לוקליים חיוני מבחינה מעשית, כי בשימוש בכלים הדיגיטליים אנו מבקשים לנצל עיבוד נתונים לוקלי, כדי לקבל תוצאות של תהליכים שאינם לוקליים. למשל, כאשר אנו מבקשים לסכם קבוצת מספרים, גם אם המספרים מיוצגים לפי ספרותיהם, בשיטה זו או אחרת, פעולת הסיכום הנדרשת חייבת לספק לנו תוצאה כוללת המוגדרת על פי הערכים המספריים הכוללים של סדרות הספרות כמייצגות מספרים. התגלית של אל-ח'ואריזמי במאה ה-9 הייתה שניתן לקבל את התוצאה המבוקשת באמצעות תהליך לוקלי, המוכר לכולנו כתהליך המיושם על הספרות, אחת לאחת, ולא על המספרים בשלמותם. את התהליך המיוחד הזה ניסו ללמד אותנו, כחשבון, בגיל צעיר.

מתכנתת המנסה להגדיר תהליך לאיתור משפט בטקסט נתון, שיתבצע בכלי דיגיטלי, יהיה עליה להגדיר תהליך שיהיה לוקלי שיספק אותה תוצאה, כי כלים דיגיטליים אינם יכולים לעבוד עם משפטים שלמים, אלא רק עם התווים שמרכיבים אותם, תו אחד בכל פעם. מספר התווים האפשריים הוא סופי ואילו מספר המשפטים האפשריים אינו מוגבל. רק כאשר יש בידינו תהליך לוקלי שמספק את דרישותינו, כלי דיגיטלי יוכל לבצע אותו. הדבר כמובן אפשרי, אבל, כאשר אנו מנסים להשתמש בכלים דיגיטליים כדי לאתר טקסטים על פי התוכן שלהם, ללא הגדרה תקפה של התוכן המבוקש באמצעות פרטים לוקליים, משימת האיתור תהיה בלתי-אפשרית. מתעוררת השאלה, האם תוכן של מאמר ניתן להגדרה באמצעות פעולות לוקליות?

לפעמים אנו מתקשים בביצוע משימות שאינן לוקליות ומנסים להתמודד איתן באמצעות משימות לוקליות. אם לא נבדוק מה אנו עושים, נפיק תוצאות שגויות. לדוגמה, זה יכול להתרחש בניסיונות לסכם מאמר או ספר. ההגדרה של סיכום היא באמצעות תכונה גלובלית: אנו רוצים שיהיה בידינו ביטוי קצר יחסית, לתוכן המרכזי הכולל של המאמר או של הספר. לכאורה, המשימה פשוטה, צריך לקרוא את הטקסט ולזהות את כל התכנים המבוטאים בפסקאותיו, ולברור מתוכם את התוכן החשוב ביותר. כך אנו ממירים את משימת הסיכום המקיפה לסדרה של סיכומים מקומיים שממנה נבחר בסיכום אחד, כאילו התוכן המרכזי של המאמר הוא אחד מהתכנים של פסקאותיו. ברור שכך נחמיץ את התוכן המרכזי של טקסטים רבים. מי שכותב מאמר, ונדרש לכתוב לו תקציר, לא יכתוב את התקציר אלא אחרי שיסיים לכתוב את המאמר כולו. כך קורה גם בכתיבת מבוא לספר.

לא נוכל ליצור תוכנות לכתיבה מוצלחת של סיכומים, תקצירים או מבואות, מבלי שנדע תחילה לאפיין אותם באמצעות תכונות לוקליות. גם בתחום זיהוי ויזואלי, המתכנתים מחפשים תכונות לוקליות לייצוג התכונה שאותה הם מבקשים לצוד: זהותו, מצב רוחו של האדם המצולם, נטיותיו, או מה הוא תוכן הציור שלפנינו. נסו לבצע חיפוש של תמונה בגוגל באמצעות התוכן שלה ותגלו עד כמה עלובה תהיה תוצאת החיפוש.

עלינו לזכור שלא כל תהליך ניתן לביצוע באמצעות תהליכים לוקליים, גם אם מדובר בתהליך מוגדר שחל על טקסטים. את זה הוכיחו חוקרי הגדרות מושג החישוב היעיל עוד בשנות ה-30. מי שלמד תכנות כהלכה יודע מבשרו עד כמה קשה לבנות תהליכים לוקליים לביצוע משימות שמוגדרות באמצעות תכונות גלובליות. אפילו בדיקת שגיאות ופגמים בתוכנות איננה יכולה להתבצע באמצעות תהליכים לוקליים.

נחזור אל השאלה ששאל טיורינג בשנת 1950: האם מכונות יכולות לחשוב? דיון בתשובתו המקורית של טיורינג במאמרו "מכונות חישוב ואינטליגנציה" תמצאו במאמר "מבחן טיורינג, מה הוא יכול לבחון" שפרסמתי באתר זה. בבואנו לדון בבינה מלאכותית, נצטרך לשאול האם כל תהליכי החשיבה שלנו ניתנים לביצוע באמצעות תהליכים לוקליים? מי שמשתמש במונח "עיבוד" כדי להצביע על חשיבה, מתעלם מכל הקשיים שמתעוררים בעקבות הצורך בהגדרת תהליכים לוקליים כדי לממש חשיבה, למשל, על ידי כלים דיגיטליים.

על המחבר / המחברת

יהושפט (שפי) גבעון

יהושפט (שפי) גבעון

פרופסור. לימודי פיסיקה, פסיכולוגיה ניסויית, ופילוסופיה לתואר ראשון ולימודי מתמטיקה לתואר שני (האונ' העברית). תואר שני ושלישי במדעי התקשורת והמחשבים (אונ' מישיגן).

4 תגובות

  1. פרשן פוליטי
    פרשן פוליטי אוגוסט 17 2019, 12:23
    כעת הבנתי שאתה בוחר:

    רק לא בינה מלאכותית

    השב לתגובה
    • יהושפט גבעון
      יהושפט גבעון ספטמבר 07 2019, 17:57
      אינני מבין כיצד אתה מסיק מסקנות

      הסברתי את אחד הקשיים העקרוניים בפיתוח בינה מלאכותית: כל תוכנה פועלת על נתוניה באופן לוקלי ואילו משימות תבוניות מוגדרות כעיבוד נתונים לא לוקלי. הקושי הוא בהגדרת תהיליכי עיבוד לוקליים עבור משימות שאינן נתונות ככה. כל מי שניסה את כוחו בתכנות משימות תבוניות מכיר את המצב הזה.
      מזה אתה מסיק שאני בוחר "רק לא בינה מלאכותית". לא מבין.

      השב לתגובה
  2. הייטקיסט
    הייטקיסט אוגוסט 20 2019, 13:37
    הבינה המלאכותית בכמה תחומים

    מתפתחת במהירות מסחררת ומביאה הישגים שאסור לזלזל בהם

    השב לתגובה
    • יהושפט גבעון
      יהושפט גבעון ספטמבר 07 2019, 18:02
      מי שעקב אחרי התפתחות הבינה המלאכותית

      מאז שנות החמישים, יודע, שמנסים לפתח אותה, והתפתחותה איננה מסחררת. לדוגמה, משימת התרגום האוטומטי הוצבה בראש משימות הפיתוח של מפתחי הבינה המלאכותית עוד בשנות החמישים. ראה לאן הגענו במשך שבעים שנה!!!

      השב לתגובה

כתוב תגובה

הוסף תגובה:

<

* אני מתחייב לפעול על פי תנאי השימוש באתר


התגובות יפורסמו לפי שיקול דעת העורך

כתבות נוספות

פוסטים אחרונים בIT

יתר המאמרים במדור
Do NOT follow this link or you will be banned from the site!