Ir al contenido
  1. Posts/

Contenedores para Ingeniería de Datos

··252 palabras·2 mins·

🚀 Contenedores esenciales para Ingeniería de Datos (con comandos Docker)
#

El artículo destaca un set de contenedores listos para usar que aceleran cualquier proyecto de datos.
Acá te dejo un resumen de los comandos necesarios para levantarlos.

🧰 Tecnologías y comandos
#

🐳 PostgreSQL
#

Para bases de datos

docker run 
    --name postgres
    -e POSTGRES_PASSWORD=postgres
    -p 5432:5432 
    -d 
    postgres

🐳 MySQL
#

Para bases de datos

docker run 
    --name mysql 
    -e MYSQL_ROOT_PASSWORD=root 
    -p 3306:3306 
    -d 
    mysql

🔄 Apache Airflow
#

Para orquestación

docker run -d -p 8080:8080 puckel/docker-airflow webserver

⚡ Apache Spark
#

Para procesamiento distribuido

docker run -it --rm -p 8888:8888 jupyter/pyspark-notebook

📦 MinIO (S3 compatible)
#

Para almacenamiento tipo S3

docker run -p 9000:9000 -p 9001:9001 \
  -e "MINIO_ROOT_USER=admin" \
  -e "MINIO_ROOT_PASSWORD=password" \
  quay.io/minio/minio server /data --console-address ":9001"

📊 Metabase
#

Para visualización rápida

docker run -d -p 3000:3000 --name metabase metabase/metabase

🧩 Explicación en pocas palabras
#

Si estás empezando:
Un contenedor es como una caja portátil que trae todo lo necesario para que una herramienta funcione sin configuraciones complicadas.
En vez de instalar todo a mano, simplemente ejecutás un comando como:

docker run ...

y el servicio arranca igual en cualquier computadora.
Esto te permite aprender, probar y desplegar soluciones de datos sin dolores de cabeza.

Más información en el link 👇

También publicado en LinkedIn.
Juan Pedro Bretti Mandarano
Autor
Juan Pedro Bretti Mandarano