😜¡No seas un inocente del #DataScience !
⚠️Aunque el #MachineLearning puede ser una herramienta poderosa, siempre es importante evaluar y validar tus modelos antes de confiar demasiado en ellos.
😱¿Cómo evaluar y validar modelos de #ML? 👉(Hilo 🧵)
✅ Dividir los datos disponibles en dos (o más) conjuntos. Se entrena el modelo con un conjunto de entrenamiento y luego se mide su rendimiento en un conjunto de prueba. Así obtienes una estimación del rendimiento del modelo en datos que no ha visto antes #ML#IA#DataScience
✅ Utilizar métricas de evaluación apropiadas: Dependiendo del tipo de problema y modelo, existen diferentes métricas que se pueden utilizar para evaluar el rendimiento del modelo.
E.g. para clasificación la precisión o recall, para regresión el error cuadrático medio o RMSE #ML
✅ Validación cruzada: dividir los datos en varios conjuntos y entrenar y evaluar el modelo varias veces, cada vez utilizando un conjunto diferente como prueba y promediando los resultados. Da una estimación más robusta del rendimiento del modelo ya que utiliza más datos. #ML#IA
✅ Validación del rendimiento en el mundo real, una vez que se ha implementado. Esto puede incluir medir la precisión del modelo en tareas reales o monitorear el rendimiento del modelo a lo largo del tiempo para ver si mantiene su rendimiento #DataScience#MachineLearning#ML#IA
• • •
Missing some Tweet in this thread? You can try to
force a refresh
🤦🏻♀️Muchos usan RStudio durante años sin conocer esta herramienta👀
🎯Complementos: extensiones para ejecutar funciones avanzadas de #RStats sin código
👉Haz clic en el botón Addins del menú de RStudio, y el código correspondiente se ejecuta sin que tengas que escribir el código
👉Los complementos de RStudio se distribuyen como 📦paquetes #RStats
👉Una vez instalado y activado el paquete R, los complementos estarán disponibles de inmediato en RStudio
✅Ejemplo 📦addinexamples
🔗 rstudio.github.io/rstudioaddins/
🚫No seleccionar la prueba de hipótesis o el modelo de regresión correcto para tu objetivo🎃
¿Cuáles son las hipótesis? ¿Cómo son las muestras? ¿Qué tipo de prueba/modelo elegir? ¿Una cola o dos colas? ¿Qué hacer si mis datos no cumplen los supuestos? BOOO!! 👻
👉Utilizar un grupo de estudio no representativo🚫
Ej: Una encuesta dice que “el 41% de los clientes de banca minorista utilizaría la banca móvil si estuviera disponible”, pero solo se encuestó a personas con dispositivos móviles😝 maximaformacion.es/blog-dat/30-re… #HorrorStats#Halloween
🤌Seleccionar un estadístico de centralidad inadecuado: ¿la media, la mediana o la moda?🤦🏻♀️
Ej: "Un hombre se ahogó en un charco de agua cuya profundidad promedio era de 1 pulgada".