En definitiva, habla de 4 lugares desde dónde puede provenir el error:
- Ruido en los datos en entrenamiento
- Ruido en los datos de prueba
- Representación insuficiente (no se han considerado las características correctas o suficientes)
- Ejemplos insuficientes (los datos de entrenamiento no son suficientemente densos en algunas regiones)
Claro, después que lo leí, se "caía de maduro"... pero no siempre es fácil verlo.
Lectura interesante y recomendada.
2 comentarios:
Hola! he estado revizando tu blog, y lo he encontrado muy interesante, aun sigues alimentando tu blog? quiera tratar algunos temas sobre la clasificacion automatica de textos y conocer un poco masde tema..
Hola!. La verdad es que he estado más bien alejado del tema. Cada cierto tiempo leo algo, pero ya no publico comentarios, resúmenes u observaciones; lo que claramente es un error porque luego olvido lo que leí.
Lo que sí debo comentar, es que ha avanzado una enormidad el tema desde que lo empecé a estudiar: está mucho mejor definido y acotado; y sin duda hay muchísimo material, desgraciadamente casi todo pagado.
Publicar un comentario