Atributos do Amazon Aurora

Por quê usar o Aurora?

O Amazon Aurora é um serviço de banco de dados relacional que combina a velocidade e a disponibilidade de bancos de dados comerciais avançados com a simplicidade e a economia de bancos de dados de código aberto. O Aurora é totalmente compatível com MySQL e PostgreSQL, permitindo que aplicações e ferramentas existentes sejam executadas sem a necessidade de modificação.

Alta performance e escalabilidade

Testes em benchmarks padrão, como o SysBench, mostraram um aumento no throughput de até cinco vezes acima do MySQL padrão e de três vezes acima do PostgreSQL padrão em hardware semelhante. O Aurora usa uma variedade de técnicas de software e hardware para garantir que o mecanismo de banco de dados seja capaz de usar integralmente a computação, a memória e as redes disponíveis. As operações de E/S usam técnicas de sistemas distribuídos, como quóruns, para melhorar a consistência da performance.

O Amazon Aurora Sem Servidor é uma configuração de escalabilidade automática sob demanda para o Aurora na qual o banco de dados é inicializado, encerrado e escala a capacidade com base nas necessidades da aplicação. Com o Amazon Aurora Sem Servidor, é possível executar seu banco de dados na nuvem sem que seja necessário gerenciar nenhuma instância de banco de dados. Você também pode usar instâncias do Aurora Sem Servidor v2 junto com instâncias provisionadas em seus clusters de banco de dados existentes ou novos.

Você pode usar as APIs do Amazon Relational Database Service (Amazon RDS) ou o Console de Gerenciamento da AWS para aumentar ou reduzir a escala na vertical de instâncias provisionadas de sua implantação. As operações de escalabilidade de computação normalmente são concluídas em alguns minutos.

O Aurora ajusta a escala de E/S automaticamente para atender às necessidades de suas aplicações mais exigentes. Também aumenta o tamanho do volume do seu banco de dados à medida que suas necessidades de armazenamento aumentam. O volume crescerá em incrementos de 10 GB até um máximo de 128 TiB. Você não precisa provisionar armazenamento em excesso para seu banco de dados para lidar com o crescimento futuro. Ao usar a configuração do Amazon Aurora Otimizado para E/S para os clusters de banco de dados, o Aurora também oferece até 40% de economia de custos quando os gastos com E/S excedem 25% dos gastos com o banco de dados do Aurora. Para saber mais, acesse Armazenamento e confiabilidade do Aurora.

Você pode aumentar o throughput de leitura para oferecer suporte a altos volumes de solicitações de aplicações criando até 15 réplicas do Amazon Aurora. As réplicas do Aurora compartilham o mesmo armazenamento subjacente da instância de origem, diminuindo os custos e evitando a necessidade de fazer gravações nos nós da réplica. Isso libera mais capacidade de processamento para atender às solicitações de leitura e reduz a defasagem das réplicas para menos de dez milissegundos, na maioria das vezes. O Aurora oferece um endpoint leitor para que a aplicação possa se conectar sem necessidade de acompanhar as réplicas adicionadas e removidas. Ele também oferece suporte ao ajuste de escala automático, adicionando e removendo automaticamente réplicas em resposta a alterações nas métricas de performance especificadas. Para saber mais, acesse Como usar o ajuste de escala automático do Amazon Aurora com réplicas do Aurora.

O Aurora oferece suporte a réplicas de leitura entre regiões. As réplicas entre regiões fornecem leituras locais rápidas para seus usuários e cada região tem 15 réplicas do Aurora adicionais para escalar ainda mais as leituras locais. Consulte Amazon Aurora Global Database para obter detalhes.

Os endpoints personalizados permitem distribuir e balancear as cargas em diferentes conjuntos de instâncias de bancos de dados. Por exemplo, você pode provisionar um conjunto de réplicas do Aurora para usar um tipo de instância com maior capacidade de memória para executar uma workload de análises. Um endpoint personalizado pode ajudar a rotear a workload para essas instâncias configuradas adequadamente e isolar as demais instâncias dela.

O Amazon Aurora Optimized Reads é um novo recurso de custo-benefício que oferece latência de consulta até 8 vezes maior e economia de custos de até 30% em comparação com instâncias sem o recurso. Ele é ideal para aplicações com grandes conjuntos de dados que excedem a capacidade de memória de uma instância de banco de dados.

As instâncias do Optimized Reads usam armazenamento SSD local em nível de bloco baseado em NVMe, disponível em instâncias r6gd baseadas em Graviton e r6id baseadas em Intel, para melhorar a latência de consulta de aplicações com conjuntos de dados que excedem a capacidade de memória de uma instância de banco de dados. O Optimized Reads inclui aprimoramentos de performance, como armazenamento em cache hierárquico e objetos temporários, para permitir que você aproveite ao máximo suas instâncias de banco de dados.

Com uma latência de consulta até 8 vezes maior, você pode executar eficientemente workloads com leituras pesadas e uso intenso de E/S, como painéis operacionais, detecção de anomalias e pesquisas de semelhanças com o pgvector. As Leituras otimizadas pelo Amazon Aurora para PostgreSQL com pgvector aumentam as consultas por segundo para pesquisa vetorial em até 9 vezes em workloads que excedem a memória disponível da instância. O Optimized Reads está disponível para o Aurora com compatibilidade com PostgreSQL.

O Amazon Aurora Parallel Query oferece consultas analíticas mais rápidas com seus dados atuais. O recurso pode acelerar as consultas em até duas ordens de magnitude, sem afetar a alta taxa de transferência das workloads transacionais essenciais. Com a transferência do processamento de consultas para a camada de armazenamento do Aurora, o recurso obtém uma grande quantidade de capacidade computacional e reduz o tráfego de rede. Use o Parallel Query para executar workloads transacionais e analíticas lado a lado no mesmo banco de dados do Aurora. O Parallel Query está disponível para Aurora com compatibilidade com MySQL.

O Amazon DevOps Guru é um serviço de operações na nuvem com tecnologia de machine learning (ML) que ajuda a melhorar a disponibilidade das aplicações. Com o Amazon DevOps Guru para RDS, você pode usar insights baseados em ML para ajudar a detectar e diagnosticar facilmente problemas de banco de dados relacional relacionados à performance. Ele foi projetado para resolvê-los em minutos, em vez de dias. Os desenvolvedores e engenheiros de DevOps podem usar o DevOps Guru para RDS para identificar automaticamente a causa raiz dos problemas de performance e obter recomendações inteligentes para ajudar a resolvê-los, sem precisar da ajuda de especialistas em banco de dados.

Para começar a usar, basta acessar o Console de Gerenciamento do Amazon RDS e habilitar o Insights de Performance do Amazon RDS. Com o Insights de Performance ativado, acesse o console do Amazon DevOps Guru para habilitá-lo nos recursos do Amazon Aurora, em outros recursos compatíveis ou em toda a conta.

Alta disponibilidade e resiliência

O Amazon RDS monitora continuamente a integridade do banco de dados Aurora e da instância subjacente do Amazon Elastic Compute Cloud (Amazon EC2). No caso de falha do banco de dados, o Amazon RDS reiniciará automaticamente o banco de dados e processos associados. Nas recuperações de falha, o Aurora não precisa reproduzir os logs de repetição do banco de dados, o que reduz significativamente os tempos de reinicialização. O serviço também isola o cache do buffer do banco de dados dos processos do banco de dados, o que permite que o cache sobreviva a uma reinicialização do banco de dados.

Em caso de falha da instância, o Aurora usa a tecnologia Multi-AZ do Amazon RDS para automatizar o failover para uma de até 15 réplicas do Aurora criadas em qualquer uma das três zonas de disponibilidade. Em caso de falha, se nenhuma réplica do Aurora tiver sido provisionada, o Amazon RDS tentará criar automaticamente uma nova instância de banco de dados do Aurora. Minimize o tempo de failover substituindo os drivers MySQL e PostgreSQL da comunidade pelo AWS JDBC Driver for MySQL e AWS JDBC Driver for PostgreSQL compatíveis com código aberto e drop-in. Você também pode usar o RDS Proxy para reduzir os tempos de failover e melhorar a disponibilidade. Quando failovers ocorrem, o Amazon RDS Proxy roteia as solicitações diretamente para a nova instância do banco de dados, reduzindo os tempos de failover em até 66% e preservando as conexões da aplicação.

Em aplicações distribuídas globalmente, é possível usar um Aurora Global Database, em que um único banco de dados do Aurora pode abranger várias regiões da AWS para permitir leituras locais e recuperação de desastres rápidas. Um Aurora Global Database usa a replicação baseada em armazenamento para replicar um banco de dados em várias regiões, com a latência típica de menos de um segundo. Você pode usar uma região secundária como uma opção de backup caso precise se recuperar rapidamente de uma redução regional ou interrupção. Um banco de dados em uma região secundária pode ser promovido para ter os recursos completos de leitura e gravação em menos de 1 minuto. Para saber mais, acesse Como usar o Amazon Aurora Global Database.

O volume de armazenamento do banco de dados do Aurora é segmentado em partes de 10 GiB e replicado em três zonas de disponibilidade, com cada zona de disponibilidade mantendo duas cópias de cada gravação. O armazenamento do Aurora é tolerante a falhas e trata de forma integrada a perda de até duas cópias de dados sem afetar a disponibilidade de gravação do banco de dados, bem como a perda de até três cópias sem afetar a disponibilidade de leitura. Além disso, o armazenamento do Aurora conta com recuperação automática: os blocos de dados e os discos são verificados continuamente para detecção de erros e substituição automática.

O recurso de backup do Aurora permite a recuperação para um ponto no tempo da sua instância. Isso permite que você restaure seu banco de dados a qualquer segundo durante o período de retenção, até os últimos cinco minutos. O período de retenção do backup automático pode ser configurado para até 35 dias. Os backups automáticos são armazenados no Amazon Simple Storage Service (Amazon S3), que foi projetado apresentar uma durabilidade de 99,999999999%. Os backups do Aurora são automáticos, incrementais e contínuos e não afetam a performance do banco de dados.

Os snapshots do banco de dados são backups iniciados pelo usuário da sua instância armazenada no Amazon S3 que serão mantidos até que você explicitamente os exclua. Eles aproveitam os snapshots incrementais automáticos para diminuir o tempo e o armazenamento necessários. Você pode criar uma nova instância de banco de dados com base em um Snapshot onde desejar.

O Backtrack permite mover rapidamente um banco de dados para um ponto anterior no tempo, sem a necessidade de restaurar dados de um backup. Com esse recurso, você pode se recuperar rapidamente de erros de usuário, como excluir a tabela errada ou a linha errada. Quando você habilita o Backtrack, o Aurora retém todos os registros de dados pela duração de Backtrack especificada. Por exemplo, você pode configurar o Backtrack para permitir que o banco de dados volte até 72 horas no tempo. O Backtrack é concluído em segundos, mesmo para bancos de dados grandes, pois elimina a necessidade de cópia de registros de dados. Você pode avançar e recuar para encontrar o ponto logo antes da ocorrência do erro.

O Backtrack também é útil para desenvolvimento e teste, em especial, em situações nas quais o teste exclui ou invalida os dados. Basta voltar o banco de dados ao estado original, e você estará pronto para uma nova execução de teste. É possível criar um script que chama o Backtrack por meio de uma API e executa o teste. Esse script pode ser integrado facilmente ao framework de teste. O Backtrack está disponível para o Aurora com compatibilidade com MySQL.

Altamente seguro

O Aurora é executado na Amazon Virtual Private Cloud (Amazon VPC), que ajuda a isolar o banco de dados em sua própria rede virtual e se conectar à infraestrutura de TI on-premises usando VPNs IPsec criptografadas padrão do setor. Para saber mais sobre o Amazon Relational Database Service (RDS) na Amazon VPC, consulte o Guia do usuário do Amazon RDS. Além disso, ao usar o Amazon RDS, é possível configurar as definições do firewall e controlar o acesso de rede às suas instâncias de banco de dados.

O Aurora é integrado ao AWS Identity and Access Management (IAM) e oferece a capacidade de controlar as ações que seus usuários e grupos do IAM podem realizar em recursos específicos do Amazon Aurora (por exemplo, instâncias de banco de dados, snapshots de banco de dados, grupos de parâmetros de banco de dados, assinaturas de eventos de banco de dados e grupos de opções de banco de dados). Também é possível atribuir tags aos recursos do Aurora e controlar as ações que seus usuários e grupos do IAM podem executar em grupos de recursos que têm a mesma tag (e valor de tag). Para obter mais informações sobre a integração do IAM, consulte a documentação sobre autenticação de banco de dados do IAM.

O Aurora ajuda a criptografar bancos de dados usando chaves criadas e controladas pelo AWS Key Management Service (KMS). Em uma instância de banco de dados em execução com a criptografia do Aurora, os dados ociosos mantidos no armazenamento subjacente são criptografados, bem como os backups automáticos, as réplicas de leitura e os snapshots desses dados no mesmo cluster. O Aurora usa SSL (AES-256) para proteger os dados em trânsito.

O Aurora ajuda a registrar eventos de banco de dados em logs com impacto mínimo na performance do banco de dados. Posteriormente, os logs podem ser analisados para fins de gerenciamento de banco de dados, segurança, governança, conformidade normativa e outras finalidades. Também é possível monitorar a atividade enviando logs de auditoria para o Amazon CloudWatch.

O Amazon GuardDuty oferece detecção de ameaças para o Aurora para ajudar você a identificar possíveis ameaças aos dados armazenados em bancos de dados Aurora. A Proteção do RDS para GuardDuty monitora e cria perfis da atividade de login em bancos de dados novos e existentes na sua conta e usa modelos de ML para detectar logins suspeitos com precisão em bancos de dados do Aurora. Se uma ameaça em potencial for detectada, o GuardDuty gera uma descoberta de segurança que inclui detalhes do banco de dados e informações contextuais avançadas sobre a atividade suspeita. A integração do Aurora com o GuardDuty oferece acesso direto aos logs de eventos do banco de dados sem exigir que você modifique seus bancos de dados e foi projetada para não causar impacto na performance do banco de dados.

Econômico

Não há compromisso inicial com o Aurora. Você paga uma taxa por hora para cada instância executada e, quando terminar de usar uma instância de banco de dados do Aurora, você pode excluí-la. Não é necessário provisionar armazenamento excedente como margem de segurança. Você paga apenas pelo armazenamento realmente consumido. Para ver mais detalhes, acesse a página de preços do Aurora.

O Aurora oferece a flexibilidade de otimizar seus gastos com o banco de dados, escolhendo entre duas opções de configuração com base em suas necessidades de desempenho e previsibilidade de preço, independentemente do consumo de E/S da sua aplicação. As duas opções de configuração são Aurora I/O-Optimized e Aurora Standard. Nenhuma das opções exige provisionamento inicial de E/S ou armazenamento e ambas podem escalar E/S para suportar seus aplicativos mais exigentes.

O Aurora I/O-Optimized é uma configuração de cluster de banco de dados. Ele oferece melhor relação performance/preço para clientes com workloads com uso intensivo de E/S, como sistemas de processamento de pagamentos, sistemas de comércio eletrônico e aplicações financeiras. Se o gasto de E/S exceder 25% do gasto total do banco de dados do Aurora, é possível economizar até 40% nos custos das workloads com uso intensivo de E/S ao usar o Aurora otimizado para E/S. Com o Aurora otimizado para E/S, você paga pelas instâncias e pelo armazenamento do banco de dados. Não há cobranças pelas operações de E/S de leitura e gravação, fornecendo previsibilidade de preço para todas as aplicações, independentemente da variabilidade de E/S.

O Aurora Standard é uma configuração de cluster de banco de dados que oferece preços econômicos para a grande maioria dos aplicativos com uso de E/S baixo a moderado. Com o Aurora Standard, você paga por instâncias de banco de dados, armazenamento e E/S com pagamento por solicitação.

Para uma aplicação que faz muitas análises, os custos de E/S normalmente são os que mais contribuem para o custo do banco de dados. As operações de E/S são executadas pelo mecanismo de banco de dados Aurora na sua camada de armazenamento virtualizado com base em SSDs. Cada operação de leitura de página de banco de dados conta como uma E/S. O mecanismo de banco de dados Aurora emite leituras na camada de armazenamento para obter as páginas de banco de dados que não estão presentes no cache do buffer. Cada página do banco de dados tem 8 KB no Aurora with PostgreSQL compatibility e 16 KB no Aurora with MySQL compatibility.

O Aurora foi projetado para eliminar operações de E/S desnecessárias com o objetivo de reduzir custos e garantir a disponibilidade de recursos para atender ao tráfego de leitura/gravação. As operações de E/S de gravação são consumidas apenas durante o envio de registros de log para a camada de armazenamento com o intuito de tornar as gravações mais duradouras. As operações de E/S de gravação são contadas em unidades de 4 KB. Por exemplo, um registro de log de transação com 1.024 bytes conta como uma operação de E/S. Porém, operações de gravação simultâneas com log de transação inferior a 4 KB poderão ser armazenadas juntas em lotes pelo mecanismo de banco de dados Aurora para otimizar o consumo de E/S. Diferentemente dos mecanismos de banco de dados tradicionais, o Aurora nunca envia páginas de banco de dados modificadas para a camada de armazenamento, o que resulta em economias de consumo de E/S ainda maiores.

Você pode ver quantas operações de E/S a sua instância do Aurora está consumindo acessando o Console de Gerenciamento da AWS. Para localizar o seu consumo de E/S, consulte a seção RDS do console, pesquise na lista de instâncias, selecione as suas instâncias do Aurora e procure pelas métricas “Operações de leitura faturadas” e “Operações de gravação faturadas” na seção de monitoramento.

Você é cobrado pelas operações de E/S de leitura e gravação ao configurar seus clusters de banco de dados com a configuração Aurora Standard. Você não é cobrado pelas operações de E/S de leitura e gravação ao configurar seus clusters de banco de dados para o Aurora Otimizado para E/S. Para obter mais informações sobre os preços das operações de E/S, visite a página de preços do Amazon Aurora.

O Aurora Optimized Reads para Aurora PostgreSQL oferece aos clientes que possuem aplicações sensíveis à latência e conjuntos de trabalho grandes uma alternativa atraente de preço/performance para atender a seus SLAs de negócios. Os clientes também têm mais flexibilidade para aumentar seus conjuntos de dados sem a necessidade de aumentar frequentemente suas instâncias de banco de dados para obter maior capacidade de memória. O Optimized Reads incluei aprimoramentos de performance, como armazenamento em cache hierárquico e objetos temporários.

O armazenamento em cache hierárquico oferece latência de consulta até 8 vezes maior e economia de custos de até 30% para aplicações com leituras pesadas e uso intenso de E/S, como painéis operacionais, detecção de anomalias e pesquisas de semelhanças com base em vetores. Esses benefícios são obtidos quando os dados em cache são automaticamente removidos do cache de buffer do banco de dados na memória para o armazenamento local, a fim de acelerar os acessos subsequentes desses dados. O armazenamento em cache hierárquico apenas está disponível para o Aurora PostgreSQL com a configuração otimizada para E/S do Aurora.

Objetos temporários alcançam um processamento de consultas mais rápido ao colocar tabelas temporárias geradas pelo Aurora PostgreSQL no armazenamento local, melhorando a performance de consultas que envolvem classificações, agregações de hash, junções de alta carga e outras operações com uso intenso de dados.

Totalmente gerenciado

Começar com o Aurora é fácil. Basta iniciar uma instância de banco de dados do Aurora usando o Console de Gerenciamento do Amazon RDS ou uma única chamada de API ou CLI. As instâncias de banco de dados do Aurora são pré-configuradas com parâmetros e definições apropriados para a classe da instância de banco de dados selecionada. É possível lançar uma instância de banco de dados e conectar sua aplicação em minutos, sem necessidade de configuração adicional. Os grupos de parâmetros de bancos de dados fornecem controle granular e ajuste fino do seu banco de dados.

O Aurora oferece métricas do Amazon CloudWatch para suas instâncias de banco de dados sem custo adicional. Você pode usar o AWS Management Console para visualizar mais de 20 métricas operacionais principais para suas instâncias de banco de dados, incluindo computação, memória, armazenamento, transferência de consultas, taxa de acertos do cache e conexões ativas. Além disso, você pode usar o Enhanced Monitoring para coletar métricas da instância do sistema operacional onde o banco de dados é executado. Você pode usar os Insights de Performance do Amazon RDS, uma ferramenta de monitoramento de banco de dados que facilita a detecção de problemas de performance e toma as providências para corrigi-los, com um painel fácil de entender que visualiza a carga do banco de dados. Por fim, você também pode usar o Amazon DevOps Guru para RDS para detectar facilmente problemas de performance, identificar automaticamente a causa raiz desses problemas e obter recomendações inteligentes para ajudar a resolvê-los sem precisar da ajuda de especialistas em banco de dados..

As implantações azuis/verdes do Amazon RDS permitem fazer atualizações de banco de dados mais seguras, simples e rápidas sem perda de dados nas edições do Aurora compatíveis com MySQL e PostgreSQL. Em poucas etapas, as implantações azuis/verdes criam um ambiente de preparação, que faz o espelhamento do ambiente de produção, e mantêm os dois ambientes sincronizados com o uso da replicação lógica. Você pode fazer alterações, como upgrades de versão principal/secundária, modificações de esquema e alterações na configuração de parâmetros, sem afetar a workload de produção.

Durante a promoção do seu ambiente de preparação, as implantações azuis/verdes bloqueiam as gravações em ambos os ambientes, azul e verde, até que a troca seja concluída. As implantações azuis/verdes usam barreiras de proteção integradas de troca que esgotam o tempo limite da promoção quando ela excede o tempo de inatividade máximo tolerável, detecta erros de replicação, verifica a integridade de instâncias etc.

O Aurora manterá seu banco de dados atualizado com os patches mais recentes. É possível controlar a aplicação de patches na instância de banco de dados por meio do gerenciamento de versão do mecanismo do banco de dados. O Aurora usa a aplicação de patches sem tempo de inatividade sempre que possível. Se ocorrer uma janela de tempo adequada, a instância será atualizada no local, as sessões das aplicações serão preservadas e o mecanismo de banco de dados será reiniciado enquanto a aplicação do patch está em execução, gerando uma queda de taxa de throughput temporária (aproximadamente cinco segundos).

O Aurora pode notificá-lo por e-mail ou SMS sobre eventos de banco de dados importantes, como um failover automatizado. É possível usar o Console de Gerenciamento da AWS ou as APIs do Amazon RDS para assinar mais de 40 eventos de banco de dados diferentes associados às suas implementações do Amazon Aurora.

O Aurora oferece suporte a operações de clonagem rápidas e eficientes que permitem clonar clusters de banco de dados de vários terabytes em alguns minutos. A clonagem é útil para diversas finalidades, incluindo desenvolvimento de aplicativos, testes, atualizações de banco de dados e execução de consultas analíticas. A disponibilidade imediata de dados pode acelerar consideravelmente projetos de desenvolvimento e atualização de software, bem como aumentar a precisão das análises.

É possível clonar um banco dados do Aurora em apenas algumas etapas, e isso não incorrerá em cobranças de armazenamento, exceto se você usar espaço adicional para armazenar as alterações de dados.

É possível parar e iniciar manualmente um banco de dados do Aurora em apenas algumas etapas. Isso torna fácil e acessível o uso do Aurora para fins de desenvolvimento e testes, atividades que não exigem a execução contínua do banco de dados. Parar o banco de dados não exclui seus dados. Consulte a documentação sobre parar/iniciar para obter mais detalhes.

Integrações ETL zero

A Integração ETL zero do Amazon Aurora com o Amazon Redshift permite analytics e ML quase em tempo real usando o Amazon Redshift em petabytes de dados transacionais do Aurora, eliminando a necessidade de criar e manter pipelines de dados complexos que realizam operações de extração, transformação e carregamento (ETL). Os dados transacionais são replicados de maneira automática e contínua em questão de segundos depois de serem gravados no Aurora e disponibilizados facilmente no Amazon Redshift.

Quando os dados estiverem disponíveis no Amazon Redshift, você poderá analisá-los imediatamente e aplicar atributos avançados, como compartilhamento de dados, visões materializadas e ML do Amazon Redshift para obter insights holísticos e preditivos. Você pode consolidar várias tabelas de vários clusters de banco de dados do Aurora e replicar seus dados em um data warehouse do Amazon Redshift para executar análises unificadas em várias aplicações e fontes de dados. Ao usar o Aurora sem servidor e o Amazon Redshift sem servidor, é possível gerar analytics quase em tempo real sobre dados transacionais sem precisar gerenciar infraestruturas de pipelines de dados. Leia nossa documentação sobre como trabalhar com integrações ETL zero do Aurora com o Amazon Redshift.

IA generativa

O Aurora oferece recursos para permitir que modelos de machine learning (ML) e inteligência artificial (IA) generativa funcionem com dados armazenados no Aurora em tempo real e sem migrá-los. Com o Amazon Aurora edição compatível com PostgreSQL, é possível acessar recursos de banco de dados de vetores para armazenar, pesquisar, indexar e consultar incorporações de ML com a extensão pgvector.

Uma incorporação de vetor é uma representação numérica que representa o significado semântico do conteúdo, como texto, imagens e vídeo. A IA generativa e outros sistemas de IA/ML usam incorporações para capturar o significado semântico da entrada desse conteúdo em um grande modelo de linguagem (LLM). É possível armazenar incorporações de modelos de ML e IA, como os do Amazon Bedrock e do Amazon SageMaker, em bancos de dados do Aurora. Leia nossa documentação sobre versões de extensões do Aurora PostgreSQL.

O Amazon Aurora PostgreSQL está disponível como base de conhecimento para o Amazon Bedrock conectar as fontes de dados privadas da sua organização aos modelos de base (FM) e permitir fluxos de trabalho de geração aumentada via recuperação (RAG) neles. Isso faz com que seus FMs tenham mais conhecimento sobre seu domínio e organização específicos. Leia nossa documentação sobre como usar o Aurora PostgreSQL como base de conhecimento para o Amazon Bedrock.

O machine learning do Aurora (Aurora ML) também simplifica a adição de predição de modelos de IA generativa ao banco de dados Aurora. O Aurora ML expõe modelos de ML como funções SQL, permitindo usar SQL padrão para chamar modelos de ML, passar dados para eles e retornar predições, resumos de texto ou sentimentos como resultados de consulta. Com o Aurora ML, você pode realizar o processo de adição de novas incorporações ao banco de dados Aurora PostgreSQL com a extensão pgvector em tempo real via chamadas periódicas a um modelo do SageMaker ou do Amazon Bedrock, o que retorna as incorporações mais recentes e atualizadas.

Suporte à migração

As ferramentas padrão de importação e exportação do MySQL funcionam com o Aurora. Também é possível criar facilmente um novo banco de dados do Aurora a partir de um snapshot de banco de dados do Amazon RDS para MySQL. As operações de migração baseadas em snapshots de banco de dados normalmente são concluídas em menos de uma hora, mas variam com base na quantidade e no formato dos dados que estão sendo migrados.

Como alternativa, o AWS Database Migration Service (AWS DMS) oferece ferramentas nativas integradas de dentro do console do DMS para permitir uma migração perfeita. Sem instâncias de replicação para provisionar ou escalar, você pode iniciar uma migração de banco de dados com apenas alguns cliques e pagar somente por hora pelo tempo usado.

Também é possível configurar uma replicação baseada em log binário entre um banco de dados Aurora edição compatível com MySQL e um banco de dados MySQL externo executado dentro ou fora da AWS.

As ferramentas padrão de importação e exportação do PostgreSQL funcionam com o Aurora, incluindo pg_dump e pg_restore. O Aurora também oferece suporte à importação de snapshots do Amazon RDS para PostgreSQL e à replicação com o AWS Database Migration Service (AWS DMS).

O Aurora oferece um ambiente ideal para mover workloads de bancos de dados comerciais. O Aurora tem recursos funcionais que são semelhantes aos dos mecanismos de banco de dados comerciais e oferece o desempenho, a resiliência e a alta disponibilidade de nível empresarial exigidas pela maioria das workloads de banco de dados das empresas. O AWS Database Migration Service (AWS DMS) pode ajudar a acelerar as migrações de banco de dados para o Aurora com atributos gerenciados, como o DMS Schema Conversion e o DMS com tecnologia sem servidor. O DMS Schema Conversion avaliará e converterá automaticamente esquemas e objetos de origem para serem compatíveis com o cluster do Aurora de destino. Enquanto isso, o DMS com tecnologia sem servidor automatizará o provisionamento, o monitoramento e a escalabilidade dos recursos de migração.

O Babelfish para Aurora PostgreSQL é um novo recurso da edição do Aurora compatível com PostgreSQL que permite ao Aurora entender comandos de aplicações escritas para o Microsoft SQL Server. Agora, com o Babelfish, o Aurora PostgreSQL entende T-SQL, o dialeto SQL exclusivo do Microsoft SQL Server, e oferece suporte ao mesmo protocolo de comunicações. Assim, as aplicações escritas originalmente para o SQL Server funcionarão com o Aurora após poucas alterações no código. Dessa forma, o esforço necessário para modificar e migrar aplicações executadas no SQL Server 2005 ou em uma versão mais recente para o Aurora diminui, possibilitando migrações mais rápidas, menos arriscadas e mais econômicas. O Babelfish é um recurso integrado do Aurora e não exige nenhum custo adicional. É possível habilitar o Babelfish em seu cluster Aurora em apenas algumas etapas no console do RDS.

Produtividade do desenvolvedor

O Trusted Language Extensions (TLE) para PostgreSQL é um kit de desenvolvimento e um projeto de código aberto que permite criar rapidamente extensões de alta performance e executá-las com segurança no Amazon Aurora sem precisar que a AWS certifique códigos. Os desenvolvedores podem usar linguagens conhecidas, como JavaScript, PL/pgSQL, Perl e SQL, para escrever extensões com segurança. O TLE foi criado para impedir o acesso a recursos não seguros e limita os defeitos da extensão a uma única conexão de banco de dados. Os administradores de banco de dados têm controle detalhado e online sobre quem pode instalar as extensões e podem criar um modelo de permissões para executá-las. O TLE está disponível para clientes do Aurora sem custo adicional.

O Aurora oferece recursos de machine learning diretamente do banco de dados, permitindo adicionar previsões baseadas em ML às suas aplicações por meio da linguagem de programação SQL familiar. Com uma integração simples, otimizada e segura entre os serviços de machine learning do Aurora e da AWS, você tem acesso a uma ampla seleção de algoritmos de ML sem precisar criar integrações personalizadas ou mover dados. Saiba mais sobre o machine learning do Aurora.

O Aurora trabalha em conjunto com o Amazon RDS Proxy, um proxy de banco de dados totalmente gerenciado e altamente disponível que torna as aplicações mais escaláveis, resistentes a falhas do banco de dados e seguras. O RDS Proxy permite que as aplicações agrupem e compartilhem conexões estabelecidas com o banco de dados, melhorando a eficiência e a escalabilidade da aplicação. Reduz os períodos de failover, conectando-se automaticamente a uma nova instância de banco de dados, preservando as conexões de aplicativos. Aumenta a segurança por meio de integrações com o AWS IAM e o AWS Secrets Manager.

A API de dados é uma API HTTPS segura e fácil de usar para executar consultas SQL em bancos de dados Aurora, acelerando o desenvolvimento de aplicações modernas. A API de dados elimina as tarefas de configuração de rede e aplicações necessárias para se conectar com segurança a um banco de dados do Aurora, o que torna o acesso ao Aurora tão simples quanto fazer uma chamada de API. A API de dados elimina o uso de drivers de banco de dados e software de pool de conexões do lado do cliente. Ele também melhora a escalabilidade da aplicação ao agrupar e compartilhar automaticamente as conexões do banco de dados. A API de dados aumenta a segurança por meio de integrações com o AWS IAM e o AWS Secrets Manager.

Os desenvolvedores podem chamar a API de dados por meio de aplicações criadas com um SDK da AWS. A API de dados também fornece acesso aos bancos de dados Aurora para as APIs do GraphQL do AWS AppSync.