Motores de integración de datos de AWS Glue

Elija el motor de integración de datos correcto para sus conjuntos de habilidades de usuarios y cargas de trabajo de análisis

AWS Glue es un servicio de integración de datos sin servidor que brinda varios motores de integración de datos para respaldar a sus usuarios y cargas de trabajo. Con AWS Glue, puede utilizar el motor apropiado para cualquier carga de trabajo, según las características de su carga de trabajo y las preferencias de sus desarrolladores y analistas.

Presentación de AWS Glue para Ray

Características clave

AWS Glue para Apache Spark

AWS Glue brinda una infraestructura optimizada para el rendimiento y sin servidor destinada a la ejecución de Apache Spark para llevar a cabo trabajos de integración y extracción, transformación y carga (ETL) de datos. AWS Glue para Apache Spark admite el procesamiento de lotes y transmisiones, y acelera la ingesta, el procesamiento y la integración de datos. Puede crear y actualizar su lago de datos y el almacenamiento de datos, y extraer información de los datos con más rapidez.

AWS Glue para Ray

Con AWS Glue para Ray, sus ingenieros de datos y desarrolladores pueden procesar grandes conjuntos de datos mediante Python y sus bibliotecas populares. AWS Glue utiliza Ray (Ray.io), un marco de computación unificado de código abierto para escalar cargas de trabajo de Python. AWS Glue para Ray incluye bibliotecas de procesamiento de datos de Python populares, de modo que puede incorporar sus propias bibliotecas para personalizar su trabajo de integración de datos.

AWS Glue para Python Shell

Con AWS Glue para Python Shell, puede utilizar un trabajo de Python Shell para ejecutar scripts de Python en AWS Glue. Mediante estos trabajos, puede escribir trabajos de análisis y de integración de datos complejos en Python. Los trabajos de AWS Glue para Python Shell ahora ofrecen bibliotecas de análisis comunes listas para usar, incluidas Pandas, NumPy y Amazon SageMaker Data Wrangler. Puede usar la funcionalidad integrada para conectarse a una gran variedad de bases de datos, almacenamientos de datos y servicios de AWS.