
על הסדנא
למידת מכונה (Machine Learning) היא תחום העוסק ביצירת תהליכים שמאפשרים למערכות ללמוד מתוך נתונים - בלי צורך לתכנת כל כלל במפורש. תהליכים אלו מאפשרים לזהות דפוסים, להפיק תובנות ולענות על שאלות מורכבות מתוך מידע גולמי. היום, ML נמצא כמעט בכל תחום עסקי וטכנולוגי: מפיתוח מודלים לחיזוי והתראות, דרך בינה מלאכותית ונהיגה אוטונומית, ועד ניתוח שפה וראייה ממוחשבת.
הקורס מתמקד בלמידת מכונה בסיסית מנקודת מבט של ניתוח נתונים - שילוב של תשתית תיאורטית מוצקה עם יישום מעשי בפייתון.
ייחודו של הקורס הוא בכך שאינו דורש רקע אקדמי מעמיק: אנחנו מפשטים את העקרונות מאחורי האלגוריתמים המרכזיים בשפה ברורה ואינטואיטיבית, ומתמקדים בהבנת ההיגיון שלהם ובתרגול מעשי - בלי להעמיס משוואות מתמטיות מיותרות.
על הקורס
מטרת הקורס להקנות למשתתפים את היכולות הבאות:
-
הבנה טובה של עקרונות סטטיסטיים בלמידת מכונה.
-
היכרות עם הסוגים השונים של למידת מכונה ועם מושגים חשובים.
-
היכרות עם אלגוריתמים נפוצים, מתי מתאים להשתמש בהם וכיצד לממש אותם בשפת פייתון.
-
הכנת נתונים לתהליכי למידת מכונה (Preprocessing)
-
כיצד לבדוק יעילות של מודל, כיצד להשוות מול מודלים אחרים וכיצד לבצע אופטימיזציה כדי לשפר את המודל שיצרנו.
-
תרגול מעשי של תהליכי למידת מכונה end-to-end.
יעדי הקורס
-
אנליסטים, כלכלנים, סטטיסטיקאים, מפתחי BI ואנשי מקצוע אחרים שעובדים עם נתונים בהיקף גדול ורוצים להעמיק את יכולות הניתוח שלהם.
-
עובדים המעוניינים לעשות את הצעד הראשון לעולם ה–Data Science, ולהבין בצורה פרקטית את העקרונות והשימושים המרכזיים של למידת מכונה.
-
מפתחי פייתון הרוצים להרחיב את סט היכולות שלהם ולהוסיף התמחות בלמידת מכונה.
קהל יעד
בקורס נלמד מושגי סטטיסטיקה רלוונטיים להבנת מודלי למידת מכונה, אבל תמיד כחלק מהעבודה עם המודלים עצמם - לא כתיאוריה מנותקת. הדגש הוא על הבנה אינטואיטיבית ויישום בפייתון, ולא על מתמטיקה מורכבת או כתיבת אלגוריתמים מאפס. לכן לא נדרש רקע מוקדם בסטטיסטיקה.
כן נדרשת היכרות בסיסית עם פייתון, מאחר והתרגול כולו בשפה. ידע קודם ב־NumPy או Pandas אינו חובה, אך בהחלט מהווה יתרון.
דרישות קדם
3 מפגשים | 16:00 - 9:00
משך ההכשרה
נושאים מרכזיים
הכנת הנתונים
בקרת איכות
-
חשיבות תהליכי QA לתהליכי ML
-
הבנת סוגי משתנים
-
טיפול בערכים חסרים / ריקים ושגיאות
-
זיהוי וטיפול בערכי קיצון
-
בדיקות שכיחות, טווחים והבנת התפלגויות
ביצוע Univariate Profiling
-
משתנים קטגוריים מול משתנים מספריים (מדדים)
-
משתנים בדידים מול משתנים רציפים
-
יצירת היסטוגרמות
-
ממוצע, חציון, שכיח
-
אחוזונים, הטיות ושונות
ביצוע Multivariate Profiling
-
מתאמים (קורלציות)
-
הצגת יחסים בין משתנים מסוגים שונים
-
מפות חום
למידת מכונה מונחית (Supervised Learning)
מבוא ללמידת מכונה
-
מה זה למידת מכונה ומהם העקרונות בבסיסה
-
סוגים שונים של למידת מכונה
-
דוגמאות ללמידת מכונה בעולם האמיתי
סיווג (Classification)
-
מהו סיווג
-
פיצול נתונים והימנעות מהתאמת יתר
-
מודלים נפוצים לסיווג
-
KNN
-
Naïve Bayes
-
עצי החלטה (Decision Trees)
-
Random Forest
-
רגרסיה לוגיסטית
-
Sentiment Analysis
-
בחירת מודל מתאים והשוואה בין ביצועי מודלים
-
ביצוע אופטימיזציה ו-Parameter Tuning
-
הנדסת תכונות ( Feature Engineerin
רגרסיה (Regression)
-
מבוא לחיזוי באמצעות רגרסיה
-
מקרי שימוש נפוצים
-
סוגי רגרסיה שונים
-
רגרסיה לינארית פשוטה (Univariate Linear Regression)
-
רגרסיה לינארית מורכבת (Multiple Linear Regression)
-
רגרסיה בלתי לינארית
-
שימוש ברגרסיה לחיזוי על פני ציר זמן (Time Series)
-
זיהוי מגמות ועונתיות
-
למידת מכונה בלתי-מונחית (Unsupervised Learning)
מבוא ללמידת מכונה בלתי-מונחית
-
למידת מכונה מונחית VS בלתי-מונחית
-
מקרי שימוש נפוצים
-
טכניקות נפוצות
-
יצירת מקבצים וסגמנטציה
מבוא ליצירת מקבצים (Clustering)
-
K-Means
-
קיבוץ היררכי
-
איתור תצפיות חריגות
-
איתור תצפיות חריגות על סדרת זמן
