
🚢 Aprender Machine Learning con el Titanic#
El dataset del Titanic es un clásico para principiantes porque sus datos son muy fáciles de entender. 🎯
El objetivo: predecir si un pasajero sobrevivió al desastre.
Usamos características como edad, género y clase del pasajero para hacer estas predicciones.
Este proyecto te enseña pasos esenciales como:
- 🧹 Limpieza de datos y cómo tratar valores faltantes
- ✂️ Dividir el conjunto en datos de entrenamiento y prueba
- 📈 Aplicar algoritmos simples:
- regresión logística para un resultado binario
- árboles de decisión que responden preguntas secuenciales
Una vez entrenado el modelo, se evalúa con métricas como exactitud o precisión.
Es una gran introducción para trabajar con datos reales y aprender técnicas básicas de evaluación.
Para ponerlo en práctica, puedes usar Python y librerías como pandas y scikit-learn. Aquí tienes un ejemplo breve:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# cargar datos (ej. desde Kaggle)
df = pd.read_csv('titanic.csv')
X = df[['Pclass','Sex','Age']].copy()
X['Sex'] = X['Sex'].map({'male':0,'female':1})
X = X.fillna(X.mean())
y = df['Survived']
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, random_state=42)
model = LogisticRegression()
model.fit(X_train, y_train)
pred = model.predict(X_test)
print('Exactitud:', accuracy_score(y_test, pred))Este código muestra los pasos básicos: carga, limpieza, división, entrenamiento y evaluación.
📝 Explicación en pocas palabras#
Imagina que tienes una tabla con pasajeros y sus características.
El objetivo es que una máquina lea esos datos y, basándose en patrones, te diga si alguien podría haber sobrevivido.
Es como enseñar a un amigo a adivinar el final de una historia sabiendo sólo algunas pistas.
🔑 El truco está en preparar bien los datos y luego comprobar si la “adivinanza” funciona.
Más información en el link 👇

