Samenvatting Week 4

Samenvatting Week 4

Samenvatting

Key Points

  • KNN: Classificeert op basis van de k dichtstbijzijnde datapunten ("meeste stemmen").
  • Euclidische afstand: Rechte lijn afstand. Manhattan: langs de assen.
  • Accuracy: % correct voorspeld. Kan misleidend zijn bij ongebalanceerde data.
  • Confusion Matrix: Toont verdeling van correcte/incorrecte voorspellingen.
  • KNN als OOP: Class met attributen (k, trainingsdata) en methoden (fit, predict).
  • Toets 1: 20% eindcijfer, 45 min, LU 1 & 2.