Rosana Ferrero 📈📊🙌 Profile picture
Oct 31, 2022 12 tweets 13 min read Read on X
🤯Tercer y última parte de ERRORES QUE DAN MIEDO en #DataScience 🎃

☠️ERRORES mortales que incluso los expertos cometen⚰️
rosanaferrero.blogspot.com/2016/09/los-7-…

Continúa leyendo, si te atreves...👻
#HorrorStats #HappyHalloween #DataAnalytics #Halloween #FelizLunes #dataviz #RStats #Python #ML
🚫No realizar una investigación reproducible💀

“Every analysis you do on a dataset will have to be redone 10-15 times before publication. Plan accordingly” Trevor A.Branch

No crear un informe replicable, reproducible y reutilizable sí que DA MIEDO

#HorrorStats #HappyHalloween
🚫No seleccionar la prueba de hipótesis o el modelo de regresión correcto para tu objetivo🎃

¿Cuáles son las hipótesis? ¿Cómo son las muestras? ¿Qué tipo de prueba/modelo elegir? ¿Una cola o dos colas? ¿Qué hacer si mis datos no cumplen los supuestos? BOOO!! 👻

#HorrorStats #ML
🚫No distinguir la significación estadística de la significación práctica🤦🏻‍♀️p-valor nos dice la dirección y tamaño del efecto la magnitud

Que exista una diferencia no significa que sea grande

Muestras muy grandes detectan diferencias muy pequeñas. Big Data da MIEDO!
#HorrorStats
🚫Decir "se comprueba la hipótesis nula H0" o "H0 es cierta"

👉Así como la falta de evidencia no demuestra que el acusado es inocente, un resultado no estadísticamente significativo (e.g. p>.05) no demuestra que H0 sea verdadera. Solo “no hay suficiente evidencia"💀
#HorrorStats
🚫Decir "el p-valor es la probabilidad de que H0 sea cierta"

😱Las hipótesis son o no son. p-valor mide la fuerza de la evidencia contra H0. A menor p-valor, mayor evidencia contra H0 a largo plazo🧙

Sientes ESCALOFRÍOS?
#HorrorStats #DataScience #Halloween2022 #RStats #Python
🚫Considerar que el nivel de significación alfa=5% es un mandamiento⛪️

😉El valor 5% es simplemente una convención conveniente, podría ser el 10% o el 1%, no existe un umbral real.

🎃#HorrorStats #DataScience #RStats #Python #Analytics #dataviz #analisisdedatos 👻
Lee más👇
🚫No informar el p-valor exacto ni los resultados completos de la prueba de hipótesis.

😱p-valor depende de:
📌tamaño de efecto (ES), ES grandes son más fáciles de detectar.
📌tamaño de muestra (N). muestras grandes dan pruebas más sensibles
📌Diseño de estudio...

#HorrorStats
🚫No considerar el Error tipo III: resolver el problema incorrecto.

☠️¿Las hipótesis son las correctas? ¿Cuán plausible es H0? ¿Cuáles son las consecuencias de rechazar H0? El contexto es crucial

👻#HorrorStats #Halloween #Halloween2022 #DataScience #dataviz #RStats #Python 🎃
🚫Desconocer la potencia estadística

¿Alguna vez te lo has preguntado?
👉¿Puedo confiar en el resultado?
👉¿Cuántas muestras necesito?

Conocer la potencia estadística nos permite ahorrar tiempo y dinero en nuestras investigaciones, ¡¿cómo no te lo contaron antes?!

#HorrorStats
Interpretar correctamente los resultados de un análisis puede ser muy difícil😱

😎Para volverte un PRO en #DataScience no cometas los errores que te he mostrado en este hilo y usa esta guía para planificar y diseñar investigaciones rigurosas👇
#Halloween
maximaformacion.es/recursos/disen…
Recuerda👇

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

Aug 7
📊 ¿No sabes qué gráfico elegir? Esta mini-guía te evitará errores comunes 🚫📈
Una visualización mal elegida no solo confunde: puede hacerte tomar malas decisiones.

Si quieres que tus gráficos transmitan ideas con claridad, empieza con tres preguntas clave:👇

#stats #dataviz Image
1. ¿Qué quieres mostrar?
🔹 Comparaciones
🔹 Relaciones
🔹 Distribuciones
🔹 Composición o proporciones

2. ¿Cuántas variables tienes?
¿Una sola? ¿Dos? ¿Un conjunto complejo?

3. ¿Importa el tiempo?
¿Son datos estáticos o evolucionan en el tiempo?

🖼 Imagen: Cédric Scherer
💡 Consejos clave:
✔ Menos es más: elige siempre la opción más simple que cuente bien tu historia
✔ Si los datos cambian en el tiempo, usa gráficos de líneas
✔ Para comparar proporciones, las barras apiladas funcionan mejor que el de sectores (pie)

#stats #DataViz #Analytics
Read 4 tweets
Aug 6
🔥¿Seguro que tus resultados “NO son significativos”? Quizá lo único que falta es potencia🔥
La potencia de una prueba mide si tienes suficiente evidencia para darte una oportunidad justa de cambiar de opinión.
Más potencia = más protección contra conclusiones erróneas. ¿CÓMO?👇 Image
🔍 La potencia estadística es la probabilidad de detectar un efecto genuino cuando realmente existe.
Si hay algo ahí, ¿tienes lo que necesitas para darte cuenta?

👉Se calcula: Potencia = 1 - β,
con β la probabilidad de cometer un error tipo II (no detectar un efecto que existe). Image
🎯¿Por qué debería importarte?
Porque una prueba con baja potencia te puede dejar ciego sin que lo sepas.
Y eso es peligroso

🧪En ciencia, podrías descartar tratamientos útiles.
📉En marketing, podrías cancelar campañas que sí funcionan.

#stats #datascience #PotenciaEstadística Image
Read 8 tweets
Aug 5
👀 ¿Estás haciendo las preguntas correctas? Porque la estadística no soluciona estudios con preguntas tontas.💥
Sí, puedes aplicar fórmulas complejas, tener modelos brillantes, usar IA y… fracasar estrepitosamente.

¿Por qué? Te lo cuento...👇🧵

#stats #analytics #datascience Image
💥 Porque un buen análisis no empieza con datos, sino con una buena pregunta.
👉 No basta con responder bien. Hay que preguntar bien.
👉 No es solo usar datos. Hay que resolver los problemas correctos.
👉 Antes de hacer análisis, asegúrate de que tu pregunta no sea una trampa. Image
🧠 DESCARGA esta PLANTILLA PARA FORMULAR BUENAS PREGUNTAS ANALÍTICAS

💭 ¿Y tú? ¿Alguna vez te diste cuenta tarde de que tu pregunta era equivocada?
Cuéntalo sin vergüenza: todos hemos caído en el error tipo III alguna vez.
¡Te leo!

#stats #analytics #datascience #Estadística Image
Read 4 tweets
Aug 3
📌 El p-valor es uno de los elementos más malinterpretados de la estadística. Y aunque lo usamos a diario… muchos no entienden bien qué significa ni cómo se debe usar.

Y eso tiene consecuencias: decisiones mal tomadas, resultados sobreinterpretados y modelos que no funcionan.😱 Image
💥 El p-valor es el elemento sorpresa de la estadística.
Un p-valor < nivel significación (e.g. alfa = 0.05) te dice:
🧪 “Oye, si el mundo fuera como tú creías (hipótesis nula + supuestos)… esto que estás viendo sería MUY raro”.

Y ahí es cuando toca replantearse las cosas. Image
📉 ¿Qué NO es un p-valor?
❌ No te dice si una hipótesis es cierta o falsa.
❌ No mide la probabilidad de que un resultado se deba “al azar”.
❌ No es un certificado de “verdad estadística”. Image
Read 10 tweets
Jul 30
🔥 Errores estadísticos graves que siguen vivos en 2025 (aunque no lo creas)🔥
Sí, en 2025 podemos generar imágenes hiperrealistas de gatos tocando el piano, pero cuando se trata de análisis de datos, seguimos tropezando con los mismos errores de hace décadas.
Los 5 más comunes👇 Image
🔹 1. ¿Cuál es la !#? pregunta?
El error más común (y el más subestimado) es no tener clara qué tipo de pregunta estás intentando responder:
🧠 Descripción, exploración, inferencia, predicción, causalidad, modelización
👉 Cada una guía el análisis y requiere enfoques distintos. Image
🔹 2. El diseño del estudio no es un detalle técnico, es la base del análisis.
Seguimos viendo análisis donde no se indica con detalle de dónde vienen los datos.
🧠 Experimento, Encuesta, Muestreo aleatorio o por conveniencia
👉 Determina sesgos, test/modelo válido, y confianza. Image
Read 7 tweets
Jul 29
👀 Hay una herramienta de IA que me encanta y ahora con las nuevas funciones, es todavía más bestia (y ya sabéis que no suelo decir esto a la ligera).
Es de Google, es GRATIS, y funciona con tus propios documentos, así que no alucina sino que te da respuestas referenciadas.👇
🧠 #NotebookLM sirve no solo para organizar mi información, sino también para interactuar con ella, aprender, crear y gestionar proyectos.
Pero es que además ahora trae algunas NOVEDADES muy interesantes...
#InteligenciaArtificial #GestiónDeInformación #Productividad #GoogleAI Image
NotebookLM integra Gemini 2.0/2.5 para:
1️⃣ Descubrir Fuentes
2️⃣ Crear Mapas Mentales
3️⃣ Crear Audios Overviews Multilingües (Convierte tus documentos en podcasts, también en español)
4️⃣ Compartir Cuadernos
5️⃣ Disponible en Móvil (accede desde cualquier lugar)
6️⃣ ¡Y en Classroom! Image
Read 9 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(