
Permítanme compartir algunas de las ideas expuestas en EAGE Digital 2022.
Hoy, el big data se define por varias ‘V’:#
Volumen#
Los datos son abundantes.
- El tamaño se mide no en KiB o MiB, sino en TiB.
- Pero solo transferimos el 5% de lo que capturo en los sensores.
Veracidad#
- Necesitamos buenos datos para construir un buen modelo.
- Los buenos datos deben tener calidad, incluyendo control de datos faltantes y bajo ruido.
Por lo general, una limitación para esta veracidad es que quien captura los datos no es quien los usa, por lo que no tiene incentivo para mejorarlos.
Variedad#
La variedad no está solo en los datos disponibles, sino también en la forma en que los usamos.
Por ejemplo, consideremos la definición de pozo para un ingeniero de yacimientos, un ingeniero de producción o un geólogo. Sin duda, cada uno tiene un enfoque distinto y, por tanto, un uso diferente de los datos.
Para captar la variedad, hoy contamos con:
- Lagos de datos
- Datos estructurados y no estructurados
Velocidad#
Los datos pueden capturarse cada segundo, día o mes…
Hoy, la computación en la nube, IIoT, 5G (o 3G cuando esté disponible), el cifrado y los procesos por lotes o en tiempo real ayudan a mejorar el flujo y la frecuencia de los datos.
Valor#
Los datos deben ser útiles.
Los datos son un activo para la empresa.
Aprendizaje automático#
El sexto aspecto del big data es cómo usar esta valiosa información para crear una empresa que tome decisiones impulsadas por datos e insights.
Problemas de negocio#
No te enamores de la tecnología, enamórate del problema.
Al pensar en el problema, no te preocupas por quién es el propietario de los datos.
Leyes de la física Conocemos los métodos fundamentales y empíricos para resolver problemas técnicos.
Con la disponibilidad del aprendizaje automático, no necesitamos forzar lo que ya sabemos.
Solo intentamos ampliar lo que sabemos usando datos.
ML estadístico de datos La facilidad de Python y las múltiples librerías disponibles permiten que cualquiera construya un modelo de aprendizaje automático decente.
Como se discutió en la conversación entre Cann y Crompton:
- Python ya no es un animal
- R ya no es una letra
- Amazon, no un río
El ML está ayudando a romper silos porque combino datos de todas las disciplinas.
El ML ayuda a encontrar modelos descriptivos y predictivos para resolver nuestro problema de negocio. Para ello, necesitamos emplear a nuestros especialistas actuales para construir modelos estadísticos que respeten su conocimiento.
Analítica avanzada#
La analítica avanzada ayuda a hacer predicciones en segundos, siempre conociendo el grado de incertidumbre.
Ayuda a detectar y clasificar patrones nunca antes pensados.
Desafía a tus expertos a replantear las soluciones.
Por ejemplo, en campos como:
- Mantenimiento predictivo
- Entrada de agua
- Interferencia entre pozos
- Paneles y recomendaciones para plunger lift
- Petrofísica
- Interpretación sísmica
- Monitoreo en tiempo real, modelado y recomendaciones
- Integración de datos entre múltiples fuentes
- Eficiencia energética
- Diseño del BHA (Bottom Hole Assembly) de perforación
- Optimización del ROP (Rate of Penetration) en perforación
- Tiempo de conexión en una operación de perforación de pozo

Lo más importante, nunca olvides 3 cosas:#
- Cada modelo de analítica avanzada debe tener un impacto monetario en el negocio.
- A veces es bueno aplicar la regla de Pareto y comprobar cómo el 20% de la complejidad del modelo puede resolver el 80% del problema.
- La mejor solución es la más rápida que resuelve el problema. No simplifiques en exceso.
Referencias adicionales:


