Regularisering

Regularisering är en teknik som används inom maskininlärning för att minska risken för överanpassning (overfitting) av modellen på träningsdatan. Det innebär att man lägger till en straffterm till förlustfunktionen som tar hänsyn till storleken på modellens vikter (weights). Syftet är att minska storleken på vikterna i modellen och därmed öka dess allmänna förmåga att generalisera till nya, obekanta data.

En vanlig form av regularisering kallas L2-regularisering eller Ridge-regression, där man lägger till en straffterm som är proportionell mot kvadraten av vikternas storlek.

Ett exempel kan vara att försöka träna en modell som ska förutsäga huspriser baserat på faktorer som antal rum, yta och geografiskt läge. Genom att använda L2-regularisering kan man minska risken för att modellen överanpassar sig på träningsdatan genom att ge högre vikt åt vissa faktorer än andra.

Rulla till toppen