נתונים, מידע וידע: על הפקת ידע במאגר


כאמור, מאגר מידע אינו מאגר של ידע; הוא מכיל נתונים ופריטי מידע בלתי-תלויים, ובניית הידע היא בעיקרה תהליך אישי של הלומד, שבו הוא מקשר בין פריטי המידע ויוצר בעבורם הקשרים אישיים. מכיוון שעיקר הלמידה במאגר מתמקדת בהפקת ידע מנתונים ומפריטי מידע, ומכיוון שאין הבחנה מוחלטת בין נתונים, מידע וידע, ננסה לחדד כאן ככל האפשר את משמעותם של מושגים אלה. כך ניטיב להבין את תהליכי הלמידה של לומדים הנעזרים במאגר מידע.

קריאת חובה

רימור (2002), (קריאת חובה), וסלומון (2000), עמ' 59-57 (קריאת רשות), דנים בסוגיית העיבוד של נתונים למידע ולידע, ובהבחנה הסמנטית ביניהם. מומלץ שתקרא עמודים אלה כרקע ללימוד הסעיף.

הבה נפתח את דיוננו בביצוע תרגיל קצר שימחיש את הרצף שבין נתונים, מידע וידע:

תרגיל

מה תלבש מחר?
אתה מתכונן לנסיעה לניו יורק ליומיים הקרובים, ועליך להחליט כיצד להתלבש בהתאם למזג האוויר שם. היעזר במאגר נתוני מזג האוויר כבסיס להחלטתך.


אפשר לפרק את התהליך הקוגניטיבי שהפעלת בביצוע התרגיל לשלושה שלבים:

  1. עיון בנתונים: המאגר הציג בפניך נתונים מספריים המציינים את טווח הטמפרטורות בניו יורק בכל אחד מהימים הקרובים. אלה הם נתונים אובייקטיביים שהתקבלו ממכשירי מדידה. במצבם הגולמי, נתונים אלה הם עדיין חסרי משמעות בעבורך כלומד, ועליך לפרשם כדי שתוכל לצקת בהם משמעות.
  2. פירוש: בשלב זה ניתחת את הנתונים האובייקטיביים על סמך ניסיונך, פירשת אותם במונחי מזג אוויר, והקנית להם משמעות סובייקטיבית על-ידי שהחלטת שטווח טמפרטורות מסוים מציין עבורך יום קר או חם. חשוב להדגיש שפירוש הנתונים הוא תהליך סובייקטיבי, התלוי במידה רבה במפרש ובנסיבות של יצירת הפירוש. למשל, יש להניח שאדם המתגורר באזור הקוטב יפרש 15 מעלות צלסיוס כיום חם, ואילו אדם המתגורר בקו המשווה יפרש אותן מעלות כיום קר.
  3. יצירת "מידע בהקשר", או הפיכת מידע לידע: כאן קישרת את הפירוש מסעיף 2 ללבוש, לבחירת הבגד המתאים. במילים אחרות, יצרת הקשר מסוים למידע, והפכת אותו לידע.

אפשר לתאר את תהליך הלמידה שביצעת במאגר המידע בעזרת הרצף:

נתונים מידע ידע

במונחים של תהליכי למידה, אפשר לתאר את הלמידה גם כתהליך של הענקת פירוש אישי למידע בהקשר מסוים:

עיון בנתונים פירוש יצירת מידע בהקשר

בתהליך זה הלומד מעניק לנתונים פירוש אישי, היוצק בהם משמעות והופך אותם, בעזרת מערכת ענפה של קשרים, ל"מידע בהקשר", או לידע (סלומון, 2000; רימור, 2002; גבעון ורימור, 2001; Wurman, 2000). לפי גישה זו, נתונים (data) הם הפריטים היסודיים הקיימים במאגר. הנתונים עשויים להיות אלפא-נומריים (טקסטים או מספרים), תמונות יחידות, רצפי תמונות (וידאו; אנימציה) או קולות. אלא שבמקרים רבים הנתונים לבדם אינם מספקים מידע. המידע תלוי במידה רבה בהקשר שבו הוא מופיע, והקשר זה ניתן לו על-ידי תהליכים קוגניטיביים שמבצע הלומד. למשל, במדינת ישראל סביר שהנתון "שנת 1948" יפורש בהקשר של עצמאות מדינית (שנת הקמת המדינה), ואילו בבריטניה הוא יפורש בהקשר של ספורט (קיום המשחקים האולימפיים בלונדון). כלומר: אותו נתון עשוי להוביל ליצירת פריטי מידע שונים, והדבר תלוי בנסיבות ובאדם המפרש. מידע (information) הוא אפוא תוצר הפירוש של נתונים. את המידע אפשר לבטא בשלל אופנים כגון גרפים, מפות וטקסטים, המצביעים על תובנות, מגמות ודגמי פיזור שהלומד זיהה בנתונים. למשל, במטלה שלעיל אפשר להציג את המידע במפות ברומטריות, במפות משקעים או במפות טמפרטורה.

ואולם, רכישת מידע כשלעצמה אין בה די ליצירת ידע (knowledge) – היכולת של הלומד לבצע פעולות בעזרת המידע שרכש. לשם כך עליו לבצע תהליך קוגניטיבי נוסף בנתונים ובמידע. לפי תורת האינפורמציה (information science) (וראו גם אצל Wurman, 2000), מידע מוגדר כ"כל גירוי המצמצם אי-ודאות". במונחי התרגיל שביצעת לעיל, עצם קיומם של ענני גשם הוא מידע על האפשרות שירד גשם, ומצמצם בכך את דרגות האי-ודאות לגבי הבגדים שכדאי להצטייד בהם. אבל קיום העננים עדיין איננו ידע. הידע עצמו הוא "מידע בהקשר", או רשת של קשרים שהלומד יוצר בין הפריטים. במשימת בחירת הביגוד לנסיעה יצרת קשר בין נתוני מזג האוויר שבמאגר, ניסיונך בעבר עם טמפרטורות שונות והעדפותיך האישיות לקור או לחום, ואז יכולת להחליט אילו בגדים תלבש בניו יורק. כל פריט מידע נוסף שהבאת בחשבון צמצם במשהו את דרגת האי-ודאות ואִפשר לך לשפר את הדיוק בהחלטתך.

הלמידה בעזרת מאגרי מידע היא תהליך קונסטרוקטיביסטי במהותו, המחייב את הלומד לנתח נתונים בלתי-תלויים, לפרשם בהקשר מסוים, ולבנות מהם ידע. מאגרי המידע מייצגים מבנה עמום (ill-structured) של תחום הדעת, ובתהליך הלמידה הלומד יוצק לתוכו משמעויות אישיות או משמעויות המצויות בזיקה ל"מקובל" (למשל, בחברה או בתחום הדעת הנדון). בנוגע ליצירה אישית של ידע, חשוב לציין כאן את עבודתם של אלכסנדר ועמיתיה (Alexander et al., 1991), הטוענים שכמעט אין במציאות ידע מוחלט ואובייקטיבי, מדגישים את ההיבט האישי של יצירת הידע, ומגדירים ידע כ"מסקנה" שהפרט מנסח לעצמו על סמך אוסף ההתנסויות, הזיכרונות, האמונות והנתונים העומדים לרשותו.

ההבחנה בין נתונים, מידע וידע אינה תמיד מובהקת. ברור לנו מעמדם של נתונים גולמיים, כמו מספרי תאונות הדרכים באתר הלשכה המרכזית לסטטיסטיקה: אלה הם נתונים ראשוניים, לא מעובדים ולא מפורשים. אך מהו מעמדה של מפת מזג האוויר המופיעה במאגר של מפות אקלים? מצד אחד היא נתון במאגר, אבל מהצד האחר היא גם תוצר של עיבוד, סינתזה ופירוש של נתוני מזג אוויר ראשוניים, ולכן יש לראות בה פריט מידע. לפיכך יש המציעים (למשל, Wurman, 2000) להבחין בין נתונים ראשוניים ולא מעובדים לבין נתונים שניוניים (תוצר העיבוד של נתונים ראשוניים), נתונים שלישוניים (תוצר העיבוד של נתונים שניוניים) וכן הלאה. גישה זו בעייתית משום שנתון מסוים עשוי להיות ראשוני במקרה אחד ושניוני במקרה אחר, לפי ההקשר שמעניק לו הלומד.

תרגיל

מהו מעמדו של נתון?
מצא במאגר המידע של המשטרה נתונים ראשוניים, שניוניים ושלישוניים. מהם השיקולים שהפעלת בבחירתך?


חוקרים רבים (למשל, גבעון, 1996) טוענים שהתרגום המדויק של database צריך להיות "מסד נתונים" (data), ולא "מאגר מידע" (information) (ראו דיון מפורט בנושא אצל גבעון ורימור, 2001). אלא שכיום, בעידן האינטרנט ורשתות המידע הענפות, היטשטשו במידה רבה ההגדרות, וברבים מהמאגרים אפשר למצוא מידע מעובד לצד נתונים גולמיים ומאמרים המציגים ידע מובנה.

בניגוד למידע המוגדר והסופי המצוי בספרים ובכרטסות, המושגים "נתונים" ו"מידע" מקבלים במאגרים הממוחשבים פירושים גמישים ומורחבים. פירושים אלה נובעית בעיקר משניים ממאפייניהן העיקריים של הסביבות הדיגיטליות:

  1. מאחר שאפשר לעדכן את הנתונים במאגר באופן שוטף, לעתים מדי כמה דקות, הנתונים והמידע נעשו גמישים וזמניים. ראה, למשל, את האתר WORLDPOPCLOCK, המציג נתונים שוטפים על גודל אוכלוסיית העולם. נסה להיכנס אליו יום אחר יום ותגלה שהוא מתעדכן באופן כה שוטף עד שקשה לומר מהי אוכלוסיית העולם בחודש נתון. דבר דומה תגלה במאגרים ממוחשבים רבים אחרים, בעיקר כאלה המצויים באינטרנט (למשל, מאגרים הכוללים נתוני מזג אוויר, נתונים על נדידת ציפורים, מספרי טלפון וכו'). השווה את ערכם ושימושיותם של נתונים המצויים במדריך טלפונים מודפס עם אלה המצויים במאגר מספרי הטלפון של בזק, או את לוח הזמנים המודפס של אגד, או את לוח הזמנים המודפס של אגד עם הלוח המצוי במרכז המידע הדיגיטלי שלו. בעידן האינטרנט יש באפשרותנו לבסס את הלמידה על נתונים עדכניים ודינמיים, המצויים בהשתנות מתמדת, שכמותם לא היו בספרים שאגרו נתונים קשיחים בדפוס, או אף בתקליטורים שעליהם נשמרו מאגרי מידע ממוחשבים עד לפני שנים מעטות.
  2. טכנולוגיית ההיפרמדיה: ביחידה 2 הכרת את טכנולוגיית ההיפרמדיה המאפשרת יצירת קישורים בין פריטי מידע שונים. טכנולוגיה זו מסייעת רבות ללומדים המפיקים ידע בעבודתם עם מאגרי מידע ממוחשבים, שכן בעזרת מארג הקישורים שהקימו בין הנתונים, הם יכולים להעניק להם פירושים מגוונים. הדבר הוביל בעשור האחרון להרחבה ולהגמשה של הגדרת המושג "פריט מידע". היכולת להגדיר פריט מידע על-ידי קישורו לנתונים רבים, מאפשרת להתנתק מההגדרה הקלסית של פריט מידע כאובייקט פיסי ממשי, המצוי במקום מוגדר במאגר. למשל, המפה הברומטרית של ארה"ב או מפת נדידת הציפורים (איור 2) אינן קיימות כפריטי מידע ממשיים בשום מאגר. ברגע שנכנסת אל המאגר, הן נוצרו אד-הוק עקב הפעלה אוטומטית של מספר רב של קישורים ואינטגרציה בין הגדרות ונתונים רבים המצויים בכמה מאגרים. אפשר אפוא להרחיב את ההגדרה של פריטי מידע ולהחילה גם על ישויות וירטואליות שהמשתמש יוצר בעבודתו במאגר בעזרת טכנולוגיית ההיפרמדיה.

    איור 2. מידע הנוצר במאגרי נתונים בעזרת הפעלת מערכות חישובים על הנתונים

חומר למחשבה

איך, לדעתך, משפיעים הארעיות של הנתונים הזמינים וריבוי הפירושים הניתנים להם על טיב הידע שאנו מפיקים מהם? הבא דוגמאות.

סוגי ידע

בספרות הפסיכולוגית והפדגוגית קיימים סיווגים רבים של ידע (ראה, למשל, אצל Wagner, 1991; Fenstermacher, 1994, והרפז, 2000), והם מתעדכנים כל העת (ראו, למשל, את מאמרם של אנדרסון ועמיתיו (Anderson et al. 2001), המציע גרסה עדכנית לסיווג הידע המסורתי של בלום). מפאת קוצר היריעה לא נפרט כאן את הסיווגים הרבים, ונזכיר רק את אלה הרלוונטיים ביותר ללמידה במאגרי מידע. אחד הסיווגים מבחין בין ידע סמוי או מובלע (tacit, implicit knowledge) לבין ידע מפורש (explicit knowledge). ידע סמוי הוא ידע מעשי שנרכש באופן לא-פורמלי, מניסיון אישי, ואינו מבוטא במפורש ("אני יודע שכשיורד גשם קל, אני יכול להסתדר בלי מטרייה"). ידע מפורש הוא ידע פורמלי שהלומד מודע אליו ויודע לנסחו במילים (אני יודע שבירת אנגליה היא לונדון). ידע מסוג אחר הוא ידע היקשי (implied knowledge) – ידע שהלומד מקיש, או מסיק, מנתונים (למשל: על סמך ממצאים ארכאולוגיים מתקופת הברזל אפשר להקיש שמלכות דוד היתה קטנה בהרבה מהמתואר בתנ"ך). מוכרת גם ההבחנה בין "לדעת איך" – knowledge how ("אני יודע איך למדוד טמפרטורה") לבין "לדעת מה" – knowledge that ("אני יודע שבניו יורק יורד כעת גשם"). "לדעת איך" מכונה גם ידע תהליכי (procedural knowledge, כגון איך נוצרים עננים) ו"לדעת מה" – ידע הצהרתי (declarative knowledge), המתאר עובדות (למשל, גובהו של הר מירון הוא 1208 מטרים מעל פני הים).

במחקרה על תהליכי יצירת ידע במאגרים, הדגישה רימור (2002) את החשיבות הנודעת לארבעה סוגי ידע, ששניים מהם נזכרו לעיל:

חומר למחשבה

חזור למשימת תאונות הדרכים שביצעת בתחילת היחידה. תאר את תהליך הלמידה שלך במונחים של המודל נתונים – מידע – ידע. מתי והיכן השתמשת בנתונים? מה היו תהליכי הפיכת המידע לידע? היכן השתמשת בכל אחד מסוגי הידע שתוארו לעיל?

כפי שנוכחתם לדעת בתרגיל שביצעתם בתחילת היחידה, פעילותם של לומדים במאגר אינה מסתכמת באיתור נתונים ומידע. הלמידה במאגרים מחייבת את הלומד המשכיל להבין ולנתח מגוון רחב של היבטים כתנאי לעשיית שימוש מושכל באותם מאגרים. היבטים אלה כוללים, למשל, את היכולת לנתח את מבנה המאגר וארגון המידע שבו, לזהות מהם המנגנונים המסייעים בחיפוש מידע ובשליפתו ולדעת להשתמש בהם, להפעיל מנגנוני בקרה והערכה של תהליך הלמידה, ולנתח את המנגנונים המאפשרים עיבוד, הבניית ידע והצגתו. בעמודים הבאים יידונו היבטים אלה, תוך התנסות בביצוע משימות למידה במאגרים.



לעמוד הקודם לראש העמוד לעמוד הבא