11 מושגי יסוד חשובים לאנליסטים מתחילים
- Tal Peleg
- 29 באוק׳
- זמן קריאה 3 דקות
שאנחנו מתחילים לעבוד עם דאטה, אנחנו נתקלים בהרבה מונחים שחוזרים על עצמם: טבלאות, שדות, רשומות, מדדים, מימדים, אגרגציות ועוד. אבל מה בדיוק המשמעות של כל אחד מהם?
בפוסט הזה נעשה סדר - ונעבור על 11 מהמושגים הבסיסיים והחשובים ביותר בעולם הדאטה, שכל אנליסט צריך להכיר.
טבלה (Table)
טבלה היא המבנה המרכזי שבו הנתונים נשמרים - כמו גיליון אקסל שמורכב משורות ועמודות, רק בצורה מסודרת ומוגדרת היטב. כל עמודה בטבלה נקראת שדה (Field) ומייצגת סוג מידע מסוים, כמו שם לקוח, סכום רכישה או תאריך עסקה.
כל שורה נקראת רשומה (Record) ומייצגת מופע יחיד של הנתון - לקוח אחד, הזמנה אחת או מוצר אחד.
המבנה הקבוע הזה מאפשר לבצע חיפושים, סינונים וניתוחים בצורה יעילה מאוד, וגם לקשר בין טבלאות שונות - למשל בין לקוחות להזמנותיהם.

שדה (Field)
שדה הוא עמודה אחת בטבלה, שמייצגת סוג מסוים של מידע - למשל שם לקוח, גיל, או תאריך רכישה. לכל שדה יש טיפוס נתונים (Data Type) שמגדיר את סוג הערכים שהוא יכול להכיל. לדוגמה: שדה “שם מוצר” יכיל טקסט בלבד, בעוד ששדה “מחיר” יכיל מספרים.

טיפוסי נתונים (Data Types)
טיפוס הנתונים מגדיר איזה סוג נתונים השדה יכול להכיל - טקסט, תאריך, מספר, ואפילו נתונים מתקדמים יותר כמו תמונות, קבצי JSON או נתונים גיאוגרפיים (GeoSpatial). בחירה נכונה של טיפוס נתונים משפיעה על דיוק הנתונים ועל האופן שבו ניתן לנתח אותם בהמשך.
רשומה (Record)
רשומה היא שורה אחת בטבלה - אובייקט יחיד שמכיל את כל הנתונים הרלוונטיים לו. למשל, בטבלת לקוחות, כל רשומה תייצג לקוח אחד – עם שמו, גילו ותאריך הרכישה האחרון שלו. הוספת לקוח חדש? בעצם הוספתם רשומה חדשה לטבלה.

אגרגציה (Aggregation)
אגרגציה היא פעולה שמקבצת קבוצת ערכים לערך מסכם אחד. למשל: סכום הרווחים החודשיים, ממוצע הציונים של מוצר, או ספירת כמות המוצרים שנמכרו. אלו פעולות שאנחנו עושים כל הזמן - באקסל, SQL או Power BI - באמצעות פונקציות כמו SUM, AVERAGE ו-COUNT.
מדד (Measure)
מדד הוא שדה מספרי שאפשר לבצע עליו חישובים - כמו סכום, ממוצע או ספירה.
לדוגמה: רווח, מספר לקוחות חדשים, או כמות מוצרים שנמכרו. מדדים עוזרים לנו למדוד ביצועים ותוצאות עסקיות.

מימד (Dimension)
מימד הוא שדה שמתאר את הנתונים - למשל “קטגוריית מוצר”, “אזור גיאוגרפי” או “תאריך”.
המימד נותן הקשר למדדים. במקום לראות “סך המכירות”, נוכל לראות סך המכירות לפי אזור או לפי חודש.

שימו לב - ההבחנה בין מדד למימד תלויה בשאלה העסקית.
אותו שדה יכול לשמש פעם כמדד ופעם כמימד, בהתאם לאופן שבו אנחנו משתמשים בו.
סוגי ערכים – בדיד, רציף וסדרתי
עוד דרך לחלק נתונים היא לפי אופי הערכים עצמם:
בדיד (Discrete) – ערכים נפרדים, לרוב טקסטואליים, כמו עיר מגורים או סוג מוצר. אין רצף או מרחק מדיד ביניהם.
רציף (Continuous) – ערכים מספריים על רצף, כמו גיל, מחיר או טמפרטורה. בין כל שני ערכים יש אינסוף ערכים אפשריים.
סדרתי (Ordinal) – קטגוריות שיש להן סדר, אבל המרחק ביניהן לא קבוע. לדוגמה: “לא מרוצה”, “די מרוצה”, “מרוצה מאוד”.
ההבדל הזה חשוב כי הוא משפיע על איך נכון לנתח את הנתונים ואיזו ויזואליזציה לבחור.
מטא־דאטה (Metadata)
מטא־דאטה הוא “מידע על המידע”.
הוא לא הנתון עצמו, אלא התיאור שמסביר עליו: מי יצר את הקובץ, מתי הוא עודכן, מה המשמעות של כל שדה, לאיזו תקופה הוא מתייחס ועוד. המידע הזה שעוזר לנו להבין את ההקשר ולמנוע טעויות בפירוש הנתונים.
דוגמה שמחברת הכול
נניח שאנחנו רוצים לנתח טבלת מכירות:
כל שורה בטבלה היא רשומה אחת - עסקה.
כל עמודה היא שדה - כמו אזור, גודל אריזה, מועד מכירה, כמות.
האזור ו-גודל האריזה הם מימדים - הם מחלקים את הנתונים לקטגוריות.
כמות האריזות היא מדד - זה מה שאנחנו מודדים.
אם נסכום את כמות האריזות לפי אזור - זו אגרגציה.
והמטא דאטה יספר לנו שמדובר במכירות של רבעון ראשון לשנת 2025, במטבע דולר.
אלה היו 11 מושגי יסוד שכל אנליסט צריך להכיר כדי להבין את שפת הדאטה.
ככל שמבינים טוב יותר את היסודות האלה - כל ניתוח, שאלה עסקית או דשבורד נהיים ברורים יותר.
אם אתם רוצים לקחת את הצעד הבא - ללמוד איך לגשת למסדי נתונים וליישם את כל המושגים האלה - הכנתי מדריך חינמי שילמד אתכם את יסודות SQL ב-20 דקות בלבד. אפשר לצפות במדריך כאן: Datapoint.training/learnbasicsql מעוניינים בהדרכות דאטה לארגון שלכם? דברו איתנו




תגובות