
🎯 Distribuciones de Probabilidad: la base silenciosa del Machine Learning
En machine learning, todo modelo asume una forma sobre cómo se comportan tus datos. Conocer las distribuciones de probabilidad te permite validar esas suposiciones y evitar errores de interpretación.
🔵 Distribución Normal (Gaussiana)
- La famosa “campana”.
- 📌 Valores concentrados en el promedio
- 📌 Simétrica
- 📌 Presente en fenómenos naturales (altura, errores de medición)
- 👉 Imagina que la mayoría de tus datos están “en el medio” y pocos en los extremos.
🟢 Distribución Binomial
- Modela cuántas veces ocurre un “éxito” en varios intentos.
- 📌 Ejemplos: clics en anuncios, resultados de A/B tests
- 👉 Es como lanzar una moneda varias veces y contar cuántas veces sale cara.
🟠 Distribución de Poisson
- Cuenta cuántos eventos ocurren en un intervalo.
- 📌 Tickets por día, errores por hora, eventos raros
- 👉 Imagina contar cuántas veces pasa algo en un periodo, sabiendo que ocurre a un ritmo promedio.
💡 Entender estas distribuciones te ayuda a elegir mejor tus modelos, validar supuestos y tomar decisiones basadas en datos con más confianza.
También publicado en LinkedIn.
