Samenvatting Week 4
Samenvatting
Key Points
- KNN: Classificeert op basis van de k dichtstbijzijnde datapunten ("meeste stemmen").
- Euclidische afstand: Rechte lijn afstand. Manhattan: langs de assen.
- Accuracy: % correct voorspeld. Kan misleidend zijn bij ongebalanceerde data.
- Confusion Matrix: Toont verdeling van correcte/incorrecte voorspellingen.
- KNN als OOP: Class met attributen (k, trainingsdata) en methoden (fit, predict).
- Toets 1: 20% eindcijfer, 45 min, LU 1 & 2.