Características de Amazon Aurora

¿Por qué Amazon Aurora?

Amazon Aurora es un servicio de base de datos relacional que combina la velocidad y la disponibilidad de las bases de datos comerciales de alta gama con la simplicidad y la rentabilidad de las bases de datos de código abierto. Aurora es compatible con MySQL y PostgreSQL, de forma que las herramientas y las aplicaciones de MySQL existentes puedan ejecutarse sin necesidad de modificar nada.

Alto rendimiento y escalabilidad

Las pruebas en puntos de referencia estándar, como SysBench, han mostrado un aumento en el rendimiento 5 veces superior que MySQL estándar y 3 veces superior que PostgreSQL estándar en equipo similar. Aurora utiliza distintas técnicas de software y equipo para garantizar que el motor de base de datos pueda utilizar plenamente los recursos de computación, la memoria y las redes disponibles. Las operaciones de E/S utilizan técnicas de sistemas distribuidos, como los cuórums, para mejorar la estabilidad del rendimiento.

Amazon Aurora sin servidor es una configuración de escalamiento automático bajo demanda para Aurora, en la que la base de datos activa, cierra, amplía o reduce su capacidad automáticamente según las necesidades de la aplicación. Con Amazon Aurora sin servidor puede ejecutar su base de datos en la nube sin administrar ninguna instancia de base de datos. También puede usar las instancias de Aurora sin servidor v2 junto con las instancias aprovisionadas en sus clústeres de bases de datos nuevos o existentes.

Puede usar las API de Amazon Relational Database Service (Amazon RDS) o la Consola de administración de AWS para escalar las instancias proporcionadas y potenciar la implementación al alza o a la baja. Las operaciones de escalado de los recursos de cómputo normalmente se llevan a cabo en cuestión de unos minutos.

Aurora escala automáticamente las E/S para satisfacer las necesidades de las aplicaciones más exigentes. También aumenta el tamaño del volumen de la base de datos a medida que aumentan las necesidades de almacenamiento. Su volumen se expande en incrementos de 10 GB, hasta un máximo de 128 TiB. No necesita aprovisionar almacenamiento excesivo para la base de datos a fin de afrontar futuros aumentos. Al utilizar la configuración de Amazon Aurora optimizado para E/S en sus clústeres de bases de datos, Aurora también ofrece un ahorro de costos de hasta un 40 % cuando el gasto en E/S supera el 25 % del gasto en bases de datos de Aurora. Para obtener más información, visite “Almacenamiento y fiabilidad de Aurora”.

Puede aumentar el rendimiento de lectura para admitir solicitudes de aplicaciones de volumen alto con la creación de hasta 15 réplicas de Amazon Aurora. Las réplicas de Aurora comparten el mismo almacenamiento subyacente que la instancia de origen, lo que reduce los costos y evita la necesidad de escribir en los nodos de réplica. Esto libera más capacidad de procesamiento para atender las solicitudes de lectura y reduce el tiempo de retraso de la réplica, que suele limitarse a milisegundos de un solo dígito. Aurora suministra un punto de conexión del lector para que la aplicación pueda conectarse sin tener que hacer un seguimiento de las réplicas a medida que se agregan y eliminan. También admite el escalado automático, que agrega y elimina réplicas en respuesta a los cambios en las métricas de rendimiento que especifique. Para obtener más información, consulte “Using Amazon Aurora Auto Scaling with Aurora Replicas”.

Aurora admite réplicas de lectura entre regiones. Las réplicas entre regiones proporcionan lecturas locales rápidas a los usuarios y cada región puede tener 15 réplicas de Aurora adicionales para ampliar la escala de las lecturas locales. Consulte “Base de datos global de Amazon Aurora” para obtener más información.

Los puntos de conexión personalizados le permiten distribuir y equilibrar las cargas de trabajo entre diferentes conjuntos de instancias de base de datos. Por ejemplo, puede aprovisionar un conjunto de réplicas de Aurora para utilizar un tipo de instancia con mayor capacidad de memoria a fin de ejecutar una carga de trabajo de análisis. A continuación, un punto de conexión personalizado puede ayudarlo a dirigir la carga de trabajo a estas instancias configuradas correctamente, mientras que las demás instancias se mantienen aisladas de la carga de trabajo.

Las lecturas optimizadas de Amazon Aurora son una nueva capacidad de relación precio-rendimiento que ofrece hasta 8 veces una mejora en la latencia de las consultas y hasta un 30 % de ahorro en costos en comparación con instancias que no la tienen. Es ideal para aplicaciones con grandes conjuntos de datos que superan la capacidad de memoria de una instancia de base de datos.

Las instancias de Optimized Reads utilizan almacenamiento local a nivel de bloques SSD con tecnología de NVMe (disponible en las instancias r6gd con tecnología de Graviton y r6id con tecnología de Intel) para mejorar la latencia de consultas de las aplicaciones con conjuntos de datos que superan la capacidad de memoria de una instancia de base de datos. Optimized Reads incluye mejoras de rendimiento, como el almacenamiento en caché por niveles y los objetos temporales, para aprovechar al máximo las instancias de la base de datos.

Con una latencia de consultas hasta 8 veces mejor, puede ejecutar de manera eficaz cargas de trabajo con un uso intensivo de E/S y de lectura intensiva, como paneles operativos, detección de anomalías y búsquedas de similitudes con pgvector. Las lecturas optimizadas de Amazon Aurora PostgreSQL con pgvector aumentan hasta 9 veces las consultas por segundo para la búsqueda vectorial en las cargas de trabajo que superan la memoria de instancias disponible. Optimized Reads está disponible para Aurora con compatibilidad con PostgreSQL.

La consulta paralela de Amazon Aurora permite hacer consultas analíticas más rápidas sobre sus datos actuales. Puede agilizar las consultas en hasta dos órdenes de magnitud, mientras se mantiene un alto rendimiento en la carga de trabajo de transacciones principal. Si lleva el procesamiento de consultas a la capa de almacenamiento de Aurora, gana una gran cantidad de potencia de informática, a la vez que reduce el tráfico de la red. Utilice Consultas en paralelo para ejecutar cargas de trabajo transaccionales y analíticas una junto a la otra en la misma base de datos de Aurora. Consultas en paralelo se encuentra disponible para Aurora con compatibilidad con MySQL.

Amazon DevOps Guru es un servicio de operaciones en la nube con la tecnología de machine learning (ML) que ayuda a mejorar la disponibilidad de la aplicación. Amazon DevOps Guru para RDS le permite utilizar información basada en ML para ayudar a detectar y diagnosticar fácilmente problemas de bases de datos relacionales asociados al rendimiento y está diseñado para resolverlos en minutos en lugar de días. Los desarrolladores y los ingenieros de DevOps pueden utilizar DevOps Guru para RDS para identificar automáticamente la causa raíz de los problemas de rendimiento y obtener recomendaciones inteligentes para ayudar a abordar el problema, sin necesidad de recibir ayuda de expertos en bases de datos.

Para comenzar, solo tiene que ir a la consola de administración de Amazon RDS y habilitar la opción de información de rendimiento de Amazon RDS. Una vez que habilite esta opción, vaya a la Consola de Amazon DevOps Guru y habilite el servicio para sus recursos de Amazon Aurora, otros recursos compatibles o toda su cuenta.

Alta disponibilidad y durabilidad

Amazon RDS supervisa constantemente el estado de la base de datos de Amazon Aurora y de la instancia subyacente de Amazon Elastic Compute Cloud (Amazon EC2). En caso de que se produzca algún error en la base de datos, Amazon RDS reiniciará automáticamente la base de datos y los procesos asociados. Aurora no necesita la reproducción de recuperación tras bloqueo de los registros de rehacer de la base de datos, lo que reduce en gran medida los tiempos de reinicio. También aísla la memoria caché del búfer de la base de datos de los procesos de la base de datos, lo que permite que la memoria caché sobreviva a un reinicio de la base de datos.

Si se produce un error de la instancia, Aurora utiliza la tecnología de Amazon RDS Multi-AZ para automatizar la conmutación por error a una de las 15 réplicas de Aurora que haya creado en cualquiera de las tres zonas de disponibilidad. Si no se han aprovisionado réplicas de Aurora, en caso de error, Amazon RDS intentará automáticamente crear una nueva instancia de base de datos de Aurora para usted. Minimice el tiempo de conmutación por error reemplazando los controladores de la comunidad de MySQL y PostgreSQL con los de código abierto y de disminución compatibles AWS JDBC Driver for MySQL y AWS JDBC Driver for PostgreSQL. También puede usar RDS Proxy para reducir los tiempos de conmutación por error y mejorar la disponibilidad. Cuando ocurren conmutaciones por error, Amazon RDS Proxy enruta las solicitudes directamente a la nueva instancia de la base de datos, lo que reduce los tiempos de conmutación por error en hasta un 66 % y conserva las conexiones de las aplicaciones.

En el caso de las aplicaciones distribuidas globalmente, puede utilizar una base de datos global de Aurora, donde una sola base de datos de Aurora puede abarcar varias regiones de AWS y permitir lecturas locales rápidas, así como una rápida recuperación ante desastres. Una base de datos global de Aurora utiliza la replicación basada en almacenamiento para replicar una base de datos en varias regiones, con una latencia típica de menos de un segundo. Puede utilizar una región secundaria como opción de copia de seguridad en caso de que necesite recuperarse rápidamente de una degradación o interrupción regional. Una base de datos en una región secundaria se puede promover a capacidades completas de lectura o escritura en menos de 1 minuto. Para obtener más información, visite “Uso de bases de datos globales de Amazon Aurora”.

El volumen de almacenamiento de la base de datos de Aurora está segmentado en fragmentos de 10 GiB y se replica en tres zonas de disponibilidad, cada una de las cuales conserva 2 copias de cada escritura. El almacenamiento de Aurora es tolerante a errores y administra de manera transparente la pérdida de hasta dos copias de datos sin que ello afecte la disponibilidad de escritura de la base de datos y hasta tres copias sin que incida en la disponibilidad de lectura. El almacenamiento de Aurora también se corrige automáticamente: los bloques de datos y los discos se analizan de manera continua para detectar errores y se reemplazan de forma automática.

La capacidad para realizar copias de seguridad de Aurora permite realizar recuperaciones de instancias a un momento dado. Esto permite restaurar su base de datos a cualquier segundo durante su periodo de retención, hasta los últimos 5 minutos. El periodo de retención de la copia de seguridad automática puede configurarse hasta 35 días. Las copias de seguridad automáticas se almacenan en Amazon Simple Storage Service (Amazon S3), un servicio diseñado para ofrecer una durabilidad del 99,999999999 %. Las copias de seguridad de Aurora son automáticas, progresivas y continuas, y no afectan el rendimiento de la base de datos.

Las instantáneas de base de datos son copias de seguridad iniciadas por el usuario de su almacén de instancias en Amazon S3 que se conservarán hasta que las elimine explícitamente. Utilizan las instantáneas progresivas automáticas para reducir el tiempo y el almacenamiento necesarios. Puede crear una nueva instancia a partir de una instantánea de base de datos cuando lo desee.

Backtrack permite regresar una base de datos a un punto anterior en el tiempo sin tener que restaurar datos a partir de una copia de seguridad. Esto le permite recuperarse rápidamente de los errores de los usuarios, como colocar la tabla incorrecta o eliminar la fila incorrecta. Cuando active Backtrack, Aurora conservará los registros de los datos durante el período especificado para la función. Por ejemplo, puede configurar Backtrack para permitirle trasladar su base de datos hasta 72 horas atrás. Backtrack finaliza la tarea en segundos, inclusive con bases de datos de gran tamaño, porque no es necesario copiar registros de datos. Puede ir hacia adelante o hacia atrás para encontrar el punto inmediatamente anterior al error.

La posibilidad de volver atrás también es útil para desarrollos o pruebas, particularmente en situaciones donde las pruebas eliminen o invaliden los datos. Solo tiene que retroceder al estado original de la base de datos y ya podrá ejecutar otra prueba. Puede crear una secuencia de comandos que llame a Backtrack a través de una API y luego ejecute la prueba, para una integración simple en su marco de prueba. Backtrack se encuentra disponible para Aurora con compatibilidad con MySQL.

Alto nivel de seguridad

Aurora se ejecuta en Amazon Virtual Private Cloud (Amazon VPC), lo que lo ayuda a aislar la base de datos en su propia red virtual y a conectarse a la infraestructura de TI local mediante VPN con IPsec cifradas estándar de la industria. Para obtener más información acerca de Amazon Relational Database Service (RDS) en Amazon VPC, consulte la guía del usuario de Amazon RDS. Además, al utilizar Amazon RDS, puede configurar los ajustes del firewall y controlar el acceso a la red de sus instancias de base de datos.

Aurora está integrado con AWS Identity and Access Management (IAM) y brinda la capacidad de controlar las acciones que sus usuarios y grupos de IAM pueden realizar en recursos específicos de Aurora (por ejemplo, instancias de base de datos, instantáneas de base de datos, grupos de parámetros de base de datos, suscripciones de eventos de base de datos, grupos de opciones de base de datos). Además, puede etiquetar los recursos de Aurora y controlar las acciones que pueden realizar los usuarios y los grupos de IAM en grupos de recursos que tengan la misma etiqueta (y valor de etiqueta). Para obtener más información sobre la integración de IAM, consulte la documentación de autenticación de base de datos de IAM.

Aurora lo ayuda a cifrar sus bases de datos mediante las claves que crea y controla a través de AWS Key Management Service (KMS). En una instancia de base de datos que se ejecuta con el cifrado de Aurora, los datos almacenados en reposo en el almacenamiento subyacente están cifrados, al igual que las copias de seguridad, las instantáneas y las réplicas automatizadas que se encuentran en el mismo clúster. Aurora utiliza SSL (AES-256) para proteger los datos en tránsito.

Aurora lo ayuda a registrar eventos de bases de datos con impacto mínimo en el rendimiento de la base de datos. Posteriormente, los registros se pueden analizar para fines de administración de bases de datos, seguridad, gobernanza, conformidad normativa, entre otros. También puede supervisar la actividad con el envío de registros de auditoría a Amazon CloudWatch.

Amazon GuardDuty ofrece detección de amenazas en Aurora para identificar posibles amenazas a los datos almacenados en las bases de datos de Aurora. La protección de GuardDuty para RDS perfila y supervisa la actividad de inicio de sesión en las bases de datos existentes y nuevas de su cuenta y utiliza modelos de ML personalizados para detectar con precisión los inicios de sesión sospechosos en las bases de datos de Aurora. Si se detecta una posible amenaza, GuardDuty genera un resultado de seguridad que incluye los detalles de la base de datos e información contextual valiosa sobre la actividad sospechosa. La integración de Aurora con GuardDuty brinda acceso directo a registros de eventos de bases de datos sin que sea necesario modificar sus bases de datos y, además, está diseñada para que no tenga un impacto en el rendimiento de la base de datos.

Rentabilidad

No hay ningún compromiso inicial con Aurora. Usted paga un cargo por hora por cada instancia que lanza y, cuando termine de usar una instancia de base de datos de Aurora, puede eliminarla. No es necesario sobreaprovisionar el almacenamiento como margen de seguridad y solo se pagará por el almacenamiento que realmente consuma. Para obtener más detalles, consulte la página de precios de Aurora.

Aurora ofrece la flexibilidad necesaria para optimizar el gasto en bases de datos al elegir entre dos opciones de configuración en función de sus necesidades de precio-rendimiento y previsibilidad de precios, independientemente del consumo de E/S de su aplicación. Las dos opciones de configuración son Aurora I/O-Optimized y Aurora Standard. Ninguna de las dos opciones requiere un aprovisionamiento inicial de E/S o almacenamiento y ambas pueden escalar la E/S para dar soporte a las aplicaciones más exigentes.

Aurora I/O-Optimized es una configuración de clúster de bases de datos. Ofrece una mejor relación precio-rendimiento para los clientes con cargas de trabajo con un uso intensivo de E/S, como los sistemas de procesamiento de pagos, los sistemas de comercio electrónico y las aplicaciones financieras. Si su gasto en E/S supera el 25 % del gasto total en bases de datos de Aurora, puede ahorrar hasta un 40 % en los costos de las cargas de trabajo intensivas de E/S con Aurora optimizado para E/S. Con Aurora optimizado para E/S, usted paga por las instancias de base de datos y el almacenamiento. No se cobran cargos por las operaciones de E/S de lectura y escritura, lo que permite predecir los precios para todas las aplicaciones, independientemente de la variabilidad de la E/S.

Aurora Standard es una configuración de clústeres de bases de datos que ofrece precios rentables para la gran mayoría de las aplicaciones con un uso de E/S bajo o moderado. Con Aurora Standard, usted paga por las instancias de bases de datos, el almacenamiento y las E/S de pago por solicitud.

Para una aplicación de análisis intensivo, los costos de E/S son por norma general el factor que más influye en el costo de la base de datos. E/S se refiere a las operaciones entrantes y salientes que realiza el motor de base de datos de Aurora en la capa de almacenamiento virtualizado basado en SSD. Cada operación de lectura de la página de la base de datos cuenta como una E/S. El motor de base de datos de Aurora emite lecturas en la capa de almacenamiento para recuperar páginas de base de datos que no se encuentran en la caché del búfer. Cada página de la base de datos tiene 8 KB en la edición compatible con MySQL de Aurora y 16 KB en la edición compatible con PostgreSQL de Aurora.

Aurora se diseñó para eliminar operaciones de E/S innecesarias. Esto permite reducir costos y garantizar que los recursos estén disponibles cuando se necesiten para el tráfico de lectura y escritura. Las operaciones de E/S de escritura solo se consumen cuando se envían registros de transacciones a la capa de almacenamiento con el fin de hacer que las escrituras sean duraderas. Las operaciones de E/S de escritura se cuentan en unidades de 4 KB. Por ejemplo, un registro de transacciones de 1024 bytes cuenta como una operación de E/S. Sin embargo, el motor de base de datos de Aurora puede agrupar por lotes las operaciones de escritura simultáneas cuyo registro de transacciones es inferior a 4 KB para optimizar el consumo de E/S. A diferencia de los motores de bases de datos tradicionales, Aurora nunca envía páginas de bases de datos modificadas a la capa de almacenamiento, lo que genera más ahorros en el consumo de E/S.

Puede ver cuántas operaciones de E/S consume su instancia de Aurora en la Consola de administración de AWS. Para buscar el consumo de operaciones de E/S, vaya a la sección RDS de la consola, observe la lista de instancias, seleccione las instancias de Aurora y luego busque las métricas “Billed read operations” (Operaciones de lectura facturadas) y “Billed write operations” (Operaciones de escritura facturadas) en la sección de supervisión.

Se cobrará por las operaciones de E/S de lectura y escritura cuando configure los clústeres de bases de datos según la configuración de Aurora Standard. No se cobrará por las operaciones de E/S de lectura y escritura cuando configure los clústeres de bases de datos para Aurora optimizado para E/S. Para obtener más información sobre los precios de las operaciones de E/S, visite la página de precios de Amazon Aurora.

Las lecturas optimizadas de Aurora para Aurora PostgreSQL ofrecen a los clientes con aplicaciones sensibles a la latencia y grandes conjuntos de trabajo una alternativa atractiva de precio y rendimiento para cumplir sus SLA empresariales. Los clientes también tienen más flexibilidad para ampliar sus conjuntos de datos sin la necesidad de aumentar con frecuencia el tamaño de sus instancias de base de datos para obtener una mayor capacidad de memoria. Optimized Reads incluye mejoras de rendimiento, como el almacenamiento en caché por niveles y los objetos temporales.

El almacenamiento en caché por niveles ofrece una latencia de consultas hasta 8 veces mejor y un ahorro de costos de hasta un 30 % para aplicaciones con uso intensivo de E/S y lectura, como paneles operativos, detección de anomalías y búsquedas de similitudes basadas en vectores. Estas ventajas se obtienen, ya que los datos almacenados en caché se expulsan de la memoria caché del búfer de la base de datos en memoria hacia el almacenamiento local para acelerar los accesos posteriores a esos datos. El almacenamiento en caché por niveles solo está disponible para Aurora PostgreSQL con la configuración Aurora I/O-Optimized.

Los objetos temporales logran un procesamiento de consultas más rápido al colocar tablas temporales generadas mediante Aurora PostgreSQL en el almacenamiento local, lo que mejora el rendimiento de las consultas que implican ordenaciones, agregaciones de hash, uniones de alta carga y otras operaciones con uso intensivo de datos.

Completamente administrado

La introducción a Aurora es fácil. Simplemente inicie una nueva instancia de base de datos de Aurora a través la Consola de administración de Amazon RDS o realice una sola llamada a la API o la CLI. Las instancias de base de datos de Aurora están preconfiguradas con parámetros y configuraciones adecuadas para la clase de instancia de base de datos que ha seleccionado. Puede lanzar una instancia de base de datos y conectar su aplicación en cuestión de minutos sin configuración adicional. Los grupos de parámetros de base de datos ofrecen un control minucioso y un ajuste detallado de la base de datos.

Aurora ofrece, sin cargo adicional, métricas de Amazon CloudWatch para las instancias de base de datos. Puede usar la consola de administración de AWS para ver más de 20 métricas operativas clave de las instancias de base de datos, incluidos el uso de la capacidad de cómputo, de memoria y de almacenamiento, el procesamiento de consultas, el índice de aciertos de caché y las conexiones activas. Además puede usar el Monitoreo mejorado para recopilar métricas de la instancia de sistema operativo en la que se ejecuta su base de datos. Puede utilizar la Información de rendimiento de Amazon RDS, una herramienta de supervisión de bases de datos que facilita la detección de problemas de rendimiento de la base de datos y la adopción de medidas correctivas, con un panel fácil de entender que visualiza la carga de la base de datos. Por último, también puede utilizar Amazon DevOps Guru para RDS para detectar fácilmente problemas de rendimiento, identificar automáticamente la causa raíz de los problemas de rendimiento y obtener recomendaciones inteligentes para ayudar a solucionar el problema sin necesitar la ayuda de expertos en bases de datos.

Los despliegues azul-verde de Amazon RDS permiten actualizar bases de datos de manera más segura, sencilla, rápida y sin pérdida de datos en la edición compatible con MySQL de Aurora como así también en su edición compatible con PostgreSQL. En unos pocos pasos, los despliegues azul-verde crean un entorno de ensayo que refleja el entorno de producción y mantiene los dos entornos sincronizados mediante la replicación lógica. Puede realizar cambios, como actualizaciones de versiones principales o secundarias, modificaciones de esquemas y cambios en la configuración de parámetros, sin que ello afecte a la carga de trabajo de producción.

Al promover el entorno de ensayo, las implementaciones azul-verde bloquean las escrituras tanto en el entorno azul como en el verde hasta que se haya completado la conmutación. Las implementaciones azul-verde utilizan barreras de protección de conmutación integradas que desconectan la promoción si se excede el tiempo de inactividad máximo tolerable, detectan errores de replicación, comprueban el estado de las instancias y mucho más.

Aurora mantendrá actualizada la base de datos con los parches más recientes. Puede controlar si su instancia recibe parches y cuándo a través de DB Engine Version Management. Cuando es posible, Aurora aplica parches sin tiempo de inactividad: si se presenta un momento oportuno, la instancia se actualiza, se preservan las sesiones de las aplicaciones y el motor de la base de datos se reinicia mientras se aplica el parche, lo que solo provoca una disminución transitoria (cinco segundos aproximadamente) del rendimiento.

Aurora puede notificarle por correo electrónico o SMS sobre eventos importantes de la base de datos, como una conmutación por error automatizada. Puede utilizar la consola de administración de AWS o las API de Amazon RDS para suscribirse a más de 40 eventos de base de datos diferentes asociados a las bases de datos de Aurora.

Aurora admite operaciones de clonación eficientes y ágiles, en las que clústeres de bases de datos completos de varios terabytes pueden clonarse en cuestión de minutos. La clonación es útil para varios fines, como el desarrollo de aplicaciones, la realización de pruebas, las actualizaciones de bases de datos y la ejecución de consultas analíticas. La disponibilidad inmediata de datos puede agilizar de manera significativa el desarrollo de software y los proyectos de actualización, además de lograr análisis más precisos.

Puede clonar una base de datos de Aurora en solo unos pocos pasos y no incurre en cargos de almacenamiento, excepto si utiliza espacio adicional para almacenar cambios en los datos.

Puede detener e iniciar manualmente una base de datos de Aurora en solo unos pocos pasos. Esto simplifica y economiza el uso de Aurora para fines de desarrollo y pruebas, donde la base de datos no necesita estar funcionando todo el tiempo. Parar la base de datos no elimina los datos. Consulte la documentación de inicio y detención para obtener más detalles.

Integraciones sin ETL

La integración sin ETL de Amazon Aurora en Amazon Redshift permite el análisis y machine learning (ML) casi en tiempo real mediante Amazon Redshift sobre petabytes de datos transaccionales de Aurora, lo que elimina la necesidad de crear y mantener complejos canales de datos que realicen operaciones de extracción, transformación y carga (ETL). Los datos transaccionales se replican de forma automática y continua en cuestión de segundos después de escribirse en Aurora y están disponibles sin problemas en Amazon Redshift.

Una vez que los datos estén disponibles en Amazon Redshift, puede analizarlos de inmediato y aplicar características avanzadas como el intercambio de datos, las vistas materializadas y Amazon Redshift ML para obtener información holística y predictiva. Puede consolidar varias tablas de varios clústeres de bases de datos de Aurora y replicar los datos en un almacén de datos de Amazon Redshift para ejecutar análisis unificados en varias aplicaciones y orígenes de datos. Al utilizar tanto Aurora sin servidor como Amazon Redshift sin servidor, puede generar análisis casi en tiempo real de los datos transaccionales sin administrar ninguna infraestructura para canalizaciones de datos. Lea nuestra documentación sobre cómo trabajar con las integraciones sin ETL de Aurora con Amazon Redshift.

IA generativa

Aurora ofrece funciones que permiten que los modelos de machine learning (ML) e inteligencia artificial (IA) generativa funcionen con los datos almacenados en Aurora en tiempo real y sin moverlos. Con la edición compatible con PostgreSQL de Amazon Aurora, puede acceder a las funciones de bases de datos vectoriales para almacenar, buscar, indexar y consultar incrustaciones de ML con la extensión pgvector.

Una incrustación vectorial es una representación numérica que representa el significado semántico del contenido, como texto, imágenes y video. La IA generativa y otros sistemas de IA y ML utilizan incrustaciones para capturar el significado semántico de la entrada de este contenido en un modelo de lenguaje grande (LLM). Puede almacenar incrustaciones de modelos de ML e IA, como los de Amazon Bedrock y Amazon SageMaker, en sus bases de datos de Aurora. Lea nuestra documentación sobre las versiones de extensiones para Aurora PostgreSQL.

Amazon Aurora PostgreSQL está disponible como base de conocimientos para Amazon Bedrock, lo que permite conectar los orígenes de datos privados de su organización con los modelos fundacionales (FM) y habilitar flujos de trabajo automatizados de generación aumentada por recuperación (RAG) en los modelos. Esto hace que sus FM conozcan mejor su dominio y organización específicos. Lea nuestra documentación sobre cómo utilizar Aurora PostgreSQL como base de conocimientos para Amazon Bedrock.

Machine learning de Aurora (Aurora ML) también simplifica la incorporación de predicciones de modelos de IA generativa a la base de datos de Aurora. Aurora ML expone los modelos de ML como funciones de SQL, lo que permite usar la versión estándar de SQL para llamar a modelos de ML, pasarles datos y devolver predicciones, resúmenes de texto u opiniones como resultados de consultas. Con Aurora ML, puede hacer que el proceso de agregar nuevas incrustaciones en su base de datos Aurora PostgreSQL mediante la extensión pgvector sea en tiempo real a través de llamadas periódicas a un modelo de SageMaker o Amazon Bedrock, que devuelve las incrustaciones más recientes y actualizadas.

Soporte para las migraciones

Las herramientas estándar de importación y exportación de MySQL funcionan con Aurora. También puede crear con facilidad una nueva base de datos de Aurora a partir de una instantánea de base de datos de Amazon RDS para MySQL. Las operaciones de migración basadas en instantáneas de base de datos suelen tardar menos de una hora en completarse, pero este tiempo variará en función del volumen y el formato de los datos que se van a migrar.

Como alternativa, AWS Database Migration Service (AWS DMS) ofrece herramientas nativas integradas desde la consola de DMS para una migración sin problemas. Al no tener instancias de replicación para aprovisionar ni escalar, puede iniciar una migración de base de datos con unos pocos clics y pagar solo por hora por el tiempo utilizado.

También puede configurar una replicación basada en binlog entre una base de datos de edición compatible con MySQL de Aurora y una base de datos MySQL externa que se ejecute tanto fuera como dentro de AWS.

Las herramientas de importación y exportación estándares de PostgreSQL trabajan con Aurora, incluidos pg_dump y pg_restore. Aurora también es compatible con la importación instantánea de Amazon RDS para PostgreSQL y la replicación de AWS Database Migration Service (AWS DMS).

Aurora proporciona un entorno ideal para mover cargas de trabajo de bases de datos fuera de las bases de datos comerciales. Aurora tiene capacidades funcionales que se asemejan a las que tienen los motores de bases de datos comerciales y ofrece el rendimiento empresarial, la durabilidad y la gran disponibilidad requerida por la mayoría de cargas de trabajo de bases de datos empresariales. AWS Database Migration Service (AWS DMS) ayuda a acelerar las migraciones de bases de datos a Aurora con características administradas, como DMS Schema Conversion y DMS sin servidor. DMS Schema Conversion evaluará y convertirá de forma automática los esquemas y objetos de origen para que sean compatibles con el clúster Aurora de destino. Mientras tanto, DMS sin servidor automatiza el aprovisionamiento, la supervisión y el escalado de los recursos de migración.

Babelfish para Aurora PostgreSQL es una nueva capacidad para la edición compatible con PostgreSQL de Aurora que permite que Aurora entienda comandos hechos desde aplicaciones escritas para Microsoft SQL Server. Con Babelfish, Aurora PostgreSQL ahora entiende T-SQL, el dialecto SQL propietario de Microsoft SQL Server, y es compatible con el mismo protocolo de comunicaciones, por lo que sus aplicaciones que se escribieron originalmente para SQL Server ahora pueden trabajar con Aurora con menos cambios de código. Como resultado, se reduce el esfuerzo necesario para modificar y trasladar a Aurora las aplicaciones que se ejecutan en SQL Server 2005 o posterior, lo que permite migraciones más rápidas, de menor riesgo y más rentables. Babelfish es una capacidad integrada de Aurora y no tiene costo adicional. Puede habilitar Babelfish en su clúster de Aurora en solo unos pasos en la consola de RDS.

Productividad para los desarrolladores

Las extensiones de lenguaje de confianza (ELC) para PostgreSQL son un conjunto de desarrollo que le permiten crear con rapidez extensiones de alto rendimiento y ejecutarlas de manera segura en Amazon Aurora sin la necesidad de que AWS certifique el código. Los desarrolladores pueden usar lenguajes de confianza populares, como JavaScript, PL/pgSQL, Perl y SQL para escribir extensiones de manera segura. TLE está diseñado para prevenir el acceso a recursos no seguros y limita los defectos de extensión a una única conexión de base de datos. Los administradores de bases de datos tienen un control detallado en línea sobre quiénes pueden instalar extensiones y pueden crear un modelo de permisos para ejecutarlas. TLE está disponible para todos los clientes de Aurora sin costo adicional.

Aurora ofrece capacidades de machine learning directamente desde la base de datos, lo que le permite agregar predicciones basadas en ML a sus aplicaciones mediante el conocido lenguaje de programación SQL. Con una integración simple, optimizada y segura entre los servicios de machine learning de Aurora y AWS, tiene acceso a una amplia selección de algoritmos de aprendizaje automático sin tener que crear integraciones personalizadas o mover datos. Más información sobre machine learning de Aurora.

Aurora trabaja junto con Amazon RDS Proxy, un proxy de base de datos completamente administrado y altamente disponible que hace que las aplicaciones sean más escalables, más resistentes a los errores de la base de datos y más seguras. RDS Proxy permite que las aplicaciones agrupen y compartan conexiones establecidas con la base de datos, lo que mejora la eficiencia de la base de datos y la escalabilidad de la aplicación. Reduce los tiempos de conmutación por error conectándose automáticamente a una nueva instancia de base de datos mientras preserva las conexiones de la aplicación. Mejora la seguridad a través de integraciones en AWS IAM y AWS Secrets Manager.

La API de datos es una API HTTPS segura y sencilla para ejecutar consultas SQL en bases de datos de Aurora que acelera el desarrollo de aplicaciones modernas. La API de datos elimina las tareas de configuración de redes y aplicaciones necesarias para conectarse de forma segura a una base de datos de Aurora, lo que hace que el acceso a Aurora sea tan sencillo como hacer una llamada a la API. La API de datos elimina el uso de controladores de bases de datos y software de agrupación de conexiones del lado del cliente. También mejora la escalabilidad de las aplicaciones al agrupar y compartir automáticamente las conexiones a las bases de datos. La API de datos mejora la seguridad a través de integraciones en AWS IAM y AWS Secrets Manager.

Los desarrolladores pueden llamar a la API de datos a través de aplicaciones creadas con un SDK de AWS. La API de datos también brinda acceso a las bases de datos de Aurora para las API GraphQL de AWS AppSync.