Cloudera extiende las ventajas de los open data lakehouse

Jesús Sánchez, 24 octubre 2022

Comienzan los Días Naranjas en PcComponentes. Hay un montón de artículos con descuentos impresionantes!!!

Ver mejores ofertas

Debido a que la mayoría de las empresas se concentran en el desarrollo de aplicaciones, es sencillo olvidar la importancia de los datos en la transformación digital. Pasar a aplicaciones nativas de la nube y basadas en contenedores en nubes públicas o privadas es crucial, pero también lo son los esfuerzos para gestionar y analizar los enormes volúmenes de datos que la mayoría de las empresas generan por sí mismas o a los que tienen acceso.

El enfoque de la “nube híbrida”, que permite la portabilidad de los datos y las herramientas de análisis entre nubes públicas y privadas, se está convirtiendo en un concepto cada vez más importante.


Esta actividad implica la toma de decisiones sobre cómo utilizar los activos de datos. Los “data lakehouses” ya están ganando popularidad entre las empresas de todos los tamaños. La combinación de un lago de datos con un almacén de datos da lugar a la creación de un lago de datos.

Los lagos de datos permiten recopilar volúmenes masivos de datos no estructurados y semiestructurados, como texto, imágenes, audio y vídeo, entre otros tipos de datos. Por otro lado, los almacenes de datos incluyen datos organizados en forma de tablas con una variedad de números, valores y otra información y se utilizan para aplicaciones que consultan bases de datos estándar.

La capacidad y la adaptabilidad de los datos pueden aumentarse utilizando potentes herramientas analíticas que se almacenan en los almacenes de datos en los lagos de datos, lo que es posible gracias a los data lakehouses. También se pueden mezclar componentes de los dos tipos diferentes de estructuras de datos para realizar análisis más avanzados mediante estas herramientas, algo que muchas aplicaciones de IA y ML consideran útil.

La idea de un lago de datos es promovida por Cloudera, una empresa que tiene sus raíces en las herramientas de software de big data Hadoop de código abierto que han impulsado el aumento de los lagos de datos. Las nuevas capacidades de Cloudera Data Platform (CDP) se presentaron en el evento Evolve 2022 organizado por Cloudera. Estas mejoras están diseñadas para facilitar el acceso a los lagos de datos.

Los datos y las herramientas de análisis ahora pueden moverse con facilidad entre Amazon Web Services (AWS), Microsoft Azure y la nube privada de una empresa. Según Cloudera, el concepto de “datos híbridos” proporciona a los datos la flexibilidad de las aplicaciones de la nube híbrida al tiempo que evita el bloqueo.

Cloudera ha hecho posible dar cabida a los datos híbridos mediante el uso de tres nuevas capacidades: Con la ayuda de los Servicios de Datos Portátiles, las empresas pueden migrar las apps y servicios analíticos desarrollados para un conjunto de datos entre entornos públicos y privados sin tener que cambiar una sola línea de código. El servicio de Replicación Segura de Datos duplica los datos entre entornos para proporcionar a las empresas el acceso a la información que necesitan para un esfuerzo específico. Por último, pero no por ello menos importante, Universal Data Distribution combina la alimentación de datos en vivo en las soluciones de gestión de datos empresariales que ofrece la empresa mediante la importación de flujos de datos utilizando la nueva herramienta Cloudera DataFlow que ha desarrollado la empresa. Apache NiFi es utilizado por DataFlow, al igual que la mayoría de los productos de Cloudera.

Todos los instrumentos necesarios para ejecutar cargas de trabajo de análisis de datos en una amplia gama de tipos de datos a través de una amplia variedad de plataformas y ubicaciones están disponibles en los tres servicios. Esto no sólo proporciona a las empresas la flexibilidad que han llegado a apreciar de las arquitecturas de nube híbrida, sino que también pone a su disposición nuevas oportunidades.

Además, puede utilizarse para evaluar una carga de trabajo analítica en muchos entornos para determinar las ventajas que ofrecen las distintas nubes en términos de aceleración de hardware o plataforma (pública o privada). para ayudar a las organizaciones en la construcción de un tejido de datos flexible que sea capaz de adaptarse al entorno de cada proyecto o conjunto de datos.

En la misma línea que la computación en nube, las herramientas de aplicación disponibles en la actualidad deben soportar sistemas híbridos y multi-nube. Por ello, las empresas ya han desarrollado o están en proceso de crear un soporte flexible. En consecuencia, tiene mucho sentido extender este tipo de estrategia a las herramientas de datos y análisis que suelen utilizarse para alimentar estas aplicaciones. Las recientes incorporaciones de CDP realizadas por Cloudera lo acercan un poco más.

Jesús Sánchez

Redactor

Entusiasta del mundo del audio y la imagen. Con un agudo oído para la calidad del sonido y un buen ojo para la excelencia visual, desentraño la magia que se esconde tras los últimos gadgets de audio y las tecnologías de televisión más punteras. Acompáñame en un viaje para mejorar tu entretenimiento.

Consentimiento