
על הסדנא
פייתון היא אחת השפות המרכזיות והנפוצות בעולם ניתוח הנתונים - הרבה בזכות ספריית Pandas, שהפכה לכלי עבודה מהותי עבור אנליסטים ומקצועני דאטה.
בקורס נלמד כיצד להיעזר בפנדס כדי לייבא, לנקות, לעבד ולנתח נתונים בצורה מהירה, גמישה ויעילה - ממש כמו בכלי BI, רק באמצעות קוד.
על הקורס
בסיום הקורס ידעו המשתתפים להשתמש בפייתון כדי לכתוב תהליכי אנליזה אוטומטיים מקצה לקצה, כולל ייבוא, ניקוי ניתוח והצגה ויזואלית של נתונים.
יעדי הקורס
עיקר המיקוד של הקורס הוא ניתוח נתונים מתקדם בסביבת פייתון, ולכן הוא מתאים במיוחד ל:
-
סטטיסטיקאים המעוניינים להרחיב את יכולות העבודה שלהם בסביבת קוד מודרנית.
-
אנשי דאטה - מפתחי BI, אנליסטים, Data Scientists, Data Engineers ואנשי תשתיות נתונים - המחפשים לחזק את יכולות העיבוד, הניתוח והאוטומציה שלהם.
-
עובדים הנדרשים לטפל בכמויות גדולות של מידע ממקורות ופורמטים שונים כחלק מהתפקיד.
בנוסף, הקורס מועיל לכל מי שבא במגע עם נתונים בשגרה היומיומית ורוצה לשפר את היכולת לנתח, לעבד ולהפיק מהם תובנות בצורה יעילה ומדויקת.
קהל יעד
-
הקורס מצייד את אנשי הדאטה בארגון בכלי חדש ועוצמתי המאפשר לנתח כמויות נתונים גדולות ביעילות גבוהה.
-
הפחתת תלות בכלי BI כבדים במקרים של ניתוחים נקודתיים.
-
קידום תרבות של ניתוח מבוסס קוד, עם שקיפות מלאה בתהליכים.
-
שיפור אינטגרציה והפחתת FRICTION בהעברת נתונים בין מערכות.
-
שיפור תהליכים וחיסכון בזמן ע"י יצירת אוטומציות.
ערך עסקי
4 מפגשים | 16:00 - 9:00
משך ההכשרה
-
טעינת נתונים ממקורות שונים
-
עבודה עם קבצי Excel ו־CSV.
-
התחברות למסדי נתונים וקריאה של טבלאות.
-
שליפת נתונים מ־Web APIs.
-
ניהול תהליכי טעינה ממקורות מגוונים בצורה עקבית.
-
-
יצירת ועריכת מבני DataFrame
-
יצירת מערכים וטבלאות נתונים.
-
מחיקת עמודות שאינן דרושות.
-
הגדרת אינדקסים לשיפור סדר ויעילות.
-
הוספת שדות מחושבים בהתאם לצורכי הניתוח.
-
-
סינון, מיון ושילוב נתונים
-
סינון רשומות לפי תנאים שונים.
-
מיון נתונים לפי מאפיינים רלוונטיים.
-
מיזוג מידע מטבלאות שונות.
-
חיבור מקורות נתונים לצורך ניתוח משותף.
-
-
ניקוי ותקנון נתונים (Data Cleaning)
-
הסרת כפילויות ושמירה על איכות הנתונים.
-
טיפול בערכים חסרים לפי טכניקות נפוצות.
-
פיצול ומיזוג שדות בהתאם למבנה הנתונים.
-
טרנספורמציות טקסט לניקוי ועיבוד מידע.
-
-
ניתוח סטטיסטי בסיסי ומתקדם
-
ביצוע חישובים סטטיסטיים נפוצים.
-
הקבצות (GroupBy) לצורך חישוב נתונים לפי חתכים.
-
יצירת טבלאות ציר (Pivot Tables) לצורך סיכום וניתוח.
-
-
עבודה עם תאריכים וזמן (Time Series Analysis)
-
המרה ופורמט של נתוני זמן.
-
ביצוע חישובים על נתוני טיימסטמפ.
-
ניתוח סדרות זמן לצורך תובנות לאורך ציר הזמן.
-
-
אופטימיזציה של טבלאות ונתונים
-
שיפור מבנה הטבלה לטובת מהירות ויעילות.
-
בחינת סוגי נתונים מתאימים.
-
צמצום משקל הנתונים וחיסכון בזיכרון.
-
-
עיצוב והצגה ויזואלית בסיסית
-
עיצוב מותנה לשיפור הקריאות.
-
יצירת גרפים בסיסיים להצגת נתונים.
-
הדגשה של מגמות ודפוסים ויזואליים.
-
