כריית מידע -- תשע"ה

סילאבוס הקורס

ציוני תרגילים

 

1. מבוא לכריית מידע

אחד הקבצים שקבלתי לפני עיבוד

קובץ WEKA על סרטן (אחרי העיבוד שלי)

2. עצי החלטות (DECISION TREES)

תרגיל כיתה -- להגשה

קובץ עם ערכים רציפים לתרגיל כיתה

קובץ של פטריות (mushrooms)

קובץ בלי ערכים רציפים  (NOMINAL) לתרגיל כיתה

תרגיל #1

קבצים לתרגיל 1:

קובץ של גשרים (bridges)

קובץ של גן החיות (zoo)

3. ריגרסייה (REGRESSION)

תרגיל 2

קבצים לתרגיל 2

Spambase

Spambase_real

Thyroid

4. Clustering

עץ החלטה שמפריד בין השיטות (שלמדנו עד עכשיו)

תרגיל #3

5. מדדים לבדיקת המודל - Recall, Precision, F-Measure

תרגיל #4

6. מדדים לבדיקת המודל -- ROC, AUC, LIFT ומניעת OVERFITTING

תרגיל 5

7. שיטות לקחת עלות של סיווג--MetaCost.

תרגיל 6

8. שיטות סטטיסטיות

קבצים לתרגיל 7

הקבצים המקוריים של תרגיל 7

קובץ לתרגיל 7 אחרי FEATURE SELECTION

התחלת פתרון לחלק השני

תרגיל 7

9. ASSOCIATION

תרגיל 8-- תודה ליוני טובול!

10. COLLABORATIVE FILTERING

תרגיל 9 (תרגיל בחירה / השלמה)

11. איחזור מידע חלק א'

קבצי הקלט לתרגילים 10 ו11

קובץ של השלד לתרגיל 10

קובץ של השלד לתרגיל 11

תרגיל 10 (תרגיל של שבועיים ואפשר לעבוד בזוגות בהינתן אישור ממני מראש)

איחזור מידע חלק ב'

תרגיל 11

מושגים שיהיו על המבחן

מבחן לדוגמא מאת דוד-חי

קישורים מעניינים