
🚀 Contenedores esenciales para Ingeniería de Datos (con comandos Docker)#
El artículo destaca un set de contenedores listos para usar que aceleran cualquier proyecto de datos.
Acá te dejo un resumen de los comandos necesarios para levantarlos.
🧰 Tecnologías y comandos#
🐳 PostgreSQL#
Para bases de datos
docker run
--name postgres
-e POSTGRES_PASSWORD=postgres
-p 5432:5432
-d
postgres🐳 MySQL#
Para bases de datos
docker run
--name mysql
-e MYSQL_ROOT_PASSWORD=root
-p 3306:3306
-d
mysql🔄 Apache Airflow#
Para orquestación
docker run -d -p 8080:8080 puckel/docker-airflow webserver⚡ Apache Spark#
Para procesamiento distribuido
docker run -it --rm -p 8888:8888 jupyter/pyspark-notebook📦 MinIO (S3 compatible)#
Para almacenamiento tipo S3
docker run -p 9000:9000 -p 9001:9001 \
-e "MINIO_ROOT_USER=admin" \
-e "MINIO_ROOT_PASSWORD=password" \
quay.io/minio/minio server /data --console-address ":9001"📊 Metabase#
Para visualización rápida
docker run -d -p 3000:3000 --name metabase metabase/metabase🧩 Explicación en pocas palabras#
Si estás empezando:
Un contenedor es como una caja portátil que trae todo lo necesario para que una herramienta funcione sin configuraciones complicadas.
En vez de instalar todo a mano, simplemente ejecutás un comando como:
docker run ...y el servicio arranca igual en cualquier computadora.
Esto te permite aprender, probar y desplegar soluciones de datos sin dolores de cabeza.
Más información en el link 👇
También publicado en LinkedIn.

