O conceito de viés e variância
Ao longo do processo de construção de um modelo de aprendizado, devemos ajustá-lo da melhor forma, sendo assim, lidamos com diferentes métricas. Para avaliar se o modelo está realmente aprendendo com os dados ou se está muito específico, precisamos entender o conceito de viés e variância. O post feito por Purva Huilgol, no blog Analytics Vidhya, explica, por meio de um exemplo de classificação de pacientes com diabetes, que quando a variância é muito alta, proporciona um modelo com overfitting; quando o viés é muito alto, temos um underfitting. Nenhum desses casos é bom, pois quando há um overfitting, o modelo construído não irá generalizar bem para novos dados, diferentes daqueles que foram usados para treino. Já quando há um underfitting, o modelo construído é muito simples e pode levar a resultados falsos positivos e/ou falsos negativos. Portanto, nossos modelos devem ter um balanceamento entre viés e variância, e assim, o score dos dados de teste será o mais próximo possível dos dados de treino.
Por: Germano Barcelos