Precios de Amazon Bedrock

Información general sobre precios

Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de funcionalidades que necesita para crear aplicaciones de IA generativa con seguridad, privacidad e IA responsable.

Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puede elegir entre dos precios de planes a modo de inferencia: 1. Bajo demanda y por lotes: este modo le permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2. Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.

Modelos de precios

Bajo demanda y por lotes

Con el modo bajo demanda, solo paga por lo que utiliza, sin compromisos de plazo basados en el tiempo. En el caso de los modelos de generación de texto, se le cobra por cada token de entrada procesado y por cada token de salida generado. En el caso de los modelos de incrustación, se le cobra por cada token de entrada procesado. Un token está compuesto de unos pocos caracteres y se refiere a la unidad básica de texto que un modelo aprende para entender la entrada y el mensaje del usuario. En el caso de los modelos de generación de imágenes, se le cobra por cada imagen generada.

Inferencia entre regiones: el modo bajo demanda también admite la inferencia entre regiones para algunos modelos. Permite a los desarrolladores administrar sin problemas las ráfagas de tráfico mediante el uso informático en diferentes regiones de AWS y obtener límites de rendimiento más altos y una mayor resiliencia. El uso de la inferencia interregional no conlleva ningún costo adicional, y el precio se calcula en función de la región en la que se realizó la solicitud (región de origen).

Con el modo por lotes, puede proporcionar un conjunto de solicitudes como un único archivo de entrada y recibir respuestas como un único archivo de salida, lo que le permite obtener predicciones simultáneas a gran escala. Las respuestas se procesan y almacenan en su bucket de Amazon S3 para que pueda acceder a ellas más adelante. Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

Optimización para latencia (versión preliminar pública)

El uso de un inferencia optimizada para latencia con modelos básicos en Amazon Bedrock brinda tiempos de respuesta más rápidos para los modelos y mejora la capacidad de respuesta de sus aplicaciones de IA generativa. Puede utilizar la inferencia optimizada para la latencia para Amazon Nova Pro, el modelo Claude 3.5 Haiku de Anthropic y los modelos Llama 3.1 405B y 70B de Meta. Según lo verificado por Anthropic, con la inferencia optimizada para la latencia en Amazon Bedrock, Claude 3.5 Haiku se ejecuta más rápido en AWS que en cualquier otro lugar. Además, con la inferencia optimizada para la latencia en Bedrock, Llama 3.1 405B y 70B se ejecuta más rápido en AWS que en cualquier otro proveedor de nube relevante. Obtenga más información aquí.

Capacidad de rendimiento aprovisionada

Con el modo de rendimiento aprovisionado, puede comprar unidades de modelo para un modelo base o personalizado específico. El modo de rendimiento aprovisionado se ha diseñado principalmente para grandes cargas de trabajo de inferencia consistentes que necesitan un rendimiento garantizado. Solo se puede acceder a los modelos personalizados mediante el rendimiento aprovisionado. Una unidad de modelo proporciona un rendimiento determinado, que se mide por la cantidad máxima de tokens de entrada o salida procesados por minuto. Con el rendimiento aprovisionado, se le cobra por hora y tiene la flexibilidad de elegir entre plazos de compromiso de 1 o 6 meses.

Importación de modelos personalizados

Custom Model Import le permite aprovechar sus inversiones anteriores en personalización de modelos en Amazon Bedrock y consumirlas de la misma manera totalmente administrada que los modelos existentes de Bedrock. Puede importar pesos personalizados para las arquitecturas de modelos compatibles y servir el modelo personalizado mediante el modo bajo de demanda. La importación de un modelo personalizado a Bedrock es gratuita. Una vez que importe un modelo, podrá acceder a él bajo demanda sin necesidad de realizar ninguna acción en el plano de control. Solo se le cobra por la inferencia del modelo, en función del número de copias de su modelo personalizado necesarias para atender su volumen de inferencias y del tiempo que cada copia del modelo esté activa, facturado en intervalos de 5 minutos. Una copia del modelo es una instancia única de un modelo importado lista para atender las solicitudes de inferencia. El precio por copia del modelo por minuto depende de factores como la arquitectura, la longitud del contexto, la región de AWS y la versión de la unidad de procesamiento (generación de hardware) y se distribuye por niveles según el tamaño de la copia del modelo.

Modelos de Marketplace

Amazon Bedrock Marketplace le permite descubrir, probar y usar más de 100 modelos fundacionales populares, emergentes y especializados en Bedrock. Los modelos de Amazon Bedrock Marketplace se implementan en puntos de enlace donde usted puede seleccionar el número deseado de instancias y los tipos de instancias, así como configurar sus políticas de escalado automático para satisfacer las demandas de su carga de trabajo. En el caso de los modelos propietarios, se le cobra el precio del software establecido por el proveedor del modelo (por hora, facturable en incrementos por segundo o por solicitud) y un precio de infraestructura en función de la instancia que seleccione. Puede ver estos precios antes de suscribirse al modelo de proveedor y también en la lista de modelos de AWS Marketplace. En el caso de los modelos disponibles públicamente, solo se le cobra el precio de la infraestructura en función de la instancia que seleccione. Obtenga más información aquí.

Personalización y optimización

Personalización de modelos

Con Amazon Bedrock, puede personalizar los FM con sus datos para ofrecer respuestas personalizadas a tareas específicas y su contexto empresarial. Puede ajustar de forma precisa los modelos con datos etiquetados o utilizar un entrenamiento previo continuo con datos sin etiquetar. Para personalizar un modelo de generación de texto, se le cobra por el entrenamiento del modelo en función de la cantidad total de tokens procesados por el modelo (la cantidad de tokens en el corpus de datos de entrenamiento × por la cantidad de épocas) y el almacenamiento del modelo se cobra por mes por modelo. Una época es un ciclo completo a través de su conjunto de datos de entrenamiento durante el ajuste de precisión o el entrenamiento previo continuo. Las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que compre este plan. Una unidad de modelo se encuentra disponible sin plazo de compromiso para su inferencia en un modelo personalizado. Se le cobrará por la cantidad de horas que utilice en la primera unidad de modelo para la inferencia de modelos personalizados. Si desea aumentar su rendimiento más allá de una unidad de modelo, debe adquirir un plazo de compromiso de 1 o 6 meses.

Destilación de modelos

Con la destilación de modelos de Amazon Bedrock, usted paga por lo que usa. La generación de datos sintéticos se cobra al precio bajo demanda del modelo de profesor seleccionado. El refinamiento del modelo de estudiante se cobra según las tarifas de personalización del modelo. Dado que un modelo destilado es un modelo personalizado, las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que los clientes compren este plan.

Almacenamiento en caché de peticiones

Con el almacenamiento en caché de peticiones en Amazon Bedrock, puede almacenar en caché el contexto repetido en las llamadas a la API para reducir los costos y las latencias de respuesta. Las peticiones suelen incluir un contexto o prefijos comunes, como conversaciones largas de varios turnos, ejemplos de varias tomas e instrucciones detalladas que refinan el comportamiento del modelo. Con las API de Amazon Bedrock existentes, puede especificar los prefijos de petición que desea almacenar en caché durante cinco minutos en una caché específica de la cuenta de AWS. Durante ese tiempo, cualquier solicitud con prefijos coincidentes recibirá un descuento de hasta el 90 % en los tokens almacenados en caché y una mejora en la latencia de hasta un 85 %. Los precios y las mejoras de rendimiento varían según el modelo y la longitud de la petición, pero sus cachés siempre están aisladas en su cuenta de AWS.

Herramientas

Barreras de protección

Las barreras de protección de Amazon Bedrock lo ayudan a implementar barreras de seguridad personalizadas y políticas de IA responsable para sus aplicaciones de IA generativa. Proporciona protecciones de seguridad personalizables adicionales además de las protecciones nativas que ofrecen los FM. Es la única capacidad de IA responsable ofrecida por un proveedor de nube importante que ayuda a habilitar a los clientes a crear y personalizar protecciones de seguridad, privacidad y veracidad para las aplicaciones de IA generativa en una única solución. Son compatibles con todos los FM de Amazon Bedrock, así como con modelos refinados. Las barreras de protección de Bedrock también se pueden integrar en los agentes y las bases de conocimiento de Amazon Bedrock para crear aplicaciones de IA generativa alineadas con sus políticas de IA responsable. Además, ofrecen una API ApplyGuardrail para ayudar a evaluar las entradas de los usuarios y modelar las respuestas que genera cualquier modelo fundacional personalizado o externo por fuera de Bedrock.

Bases de conocimiento y automatización de datos

Las bases de conocimiento de Amazon Bedrock son flujos de trabajo de generación aumentada de recuperación (RAG) completamente administrados que permiten a los clientes crear aplicaciones de IA generativa de alta precisión, baja latencia, seguras y personalizadas mediante la incorporación de información contextual de sus propios orígenes de datos. Son compatibles con varios orígenes de datos, incluidos S3 y Confluence, Salesforce y SharePoint, en versión preliminar. También ofrecen la ingesta de documentos para la transmisión de datos. Las bases de conocimiento de Bedrock convierten los datos no estructurados en incrustaciones, los almacenan en bases de datos vectoriales y permiten la recuperación de diversos almacenes de datos. También se integran con Kendra para la recuperación administrada y admiten la recuperación de datos estructurados mediante lenguaje natural para SQL.

Amazon Bedrock Data Automation transforma el contenido no estructurado y multimodal en formatos de datos estructurados para casos de uso como el procesamiento inteligente de documentos, el análisis de video y la RAG. Bedrock Data Automation puede generar contenido de salida estándar mediante valores predeterminados definidos previamente que son específicos de cada modalidad, como descripciones de videos escena por escena, transcripciones de audio o análisis automatizado de documentos. Además, los clientes también pueden crear salidas personalizadas especificando sus requisitos de salida en los esquemas en función de su propio esquema de datos, que luego pueden cargar fácilmente en una base de datos o almacén de datos existente. Mediante una integración con las bases de conocimiento, Bedrock Data Automation también se puede utilizar para analizar el contenido de las aplicaciones RAG, lo que mejora la precisión y la relevancia de los resultados mediante la inclusión de información incrustada en imágenes y texto.

Agentes

Los agentes de Amazon Bedrock le ofrecen la posibilidad de crear y configurar agentes autónomos dentro de su aplicación. Estos agentes se conectan de manera segura a los orígenes de datos de su empresa y mejoran las solicitudes de los usuarios con la información correcta para generar respuestas precisas. En tan solo unos pasos rápidos, puede crear una aplicación de agente único o múltiple, así como acelerar el tiempo de creación de aplicaciones de IA generativa. Estos agentes admiten la interpretación de código para generar y ejecutar código de forma dinámica, así como para devolver el control, lo que permite definir un esquema de acción y recuperar el control cada vez que el agente invoca la acción. Además, los agentes de Amazon Bedrock pueden retener la memoria entre todas las interacciones, lo que ofrece experiencias de usuario más personalizadas y fluidas.

Flujos

Amazon Bedrock Flows es una característica de creación y ejecución de flujos de trabajo de Bedrock para aplicaciones de IA generativas. Acelera la creación, las pruebas y la implementación de flujos de trabajo de IA generativa definidos por el usuario a través de un generador visual intuitivo y un conjunto de API. Le permite vincular sin problemas los últimos modelos básicos, peticiones, agentes, base de conocimientos, barreras de protección, y servicios de AWS (como Amazon Lex, AWS Lambda y Amazon S3) con la lógica empresarial para crear flujos de trabajo de IA generativa. Puede probar y versionar fácilmente sus flujos de trabajo y ejecutarlos en un entorno seguro sin servidores a través de una interfaz visual o una API sin tener que instalar su propia infraestructura.

Evaluaciones

Evaluación del modelo: con la evaluación del modelo en Amazon Bedrock, paga por lo que usa, sin compromisos de volumen mínimos en cuanto al número de peticiones o respuestas. En el caso de la evaluación automática, solo pague por la inferencia del modelo que haya elegido en la evaluación. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. Durante la versión preliminar pública de la evaluación automática (modelo o LLM como juez), usted solo paga por la inferencia basada en el modelo de generador y el modelo de evaluador que elija. En un trabajo de evaluación del modelo de LLM como juez, las métricas integradas utilizan plantillas de peticiones de evaluación del sistema exclusivas para cada métrica y un modelo de evaluación disponible que se cobrará como parte del uso de los tokens, y las peticiones de las evaluaciones están disponibles en la documentación pública de AWS por motivos de transparencia. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada. Una tarea humana se define como la instancia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación; también es el mismo sin importar el número de métricas de la evaluación y los métodos de calificación que incluya. Los cargos por las tareas humanas aparecerán en la sección Amazon SageMaker de su factura de AWS y son los mismos para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted. En el caso de una evaluación administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Evaluación de bases de conocimiento de Amazon Bedrock (evaluación RAG): con la evaluación de bases de conocimiento de Amazon Bedrock (evaluación RAG), paga por lo que usa, sin compromisos de volumen mínimos en cuanto al número de solicitudes o respuestas. Durante la versión preliminar pública, solo pagará por la inferencia a partir del modelo de generador y el modelo de evaluador que elija (el trabajo de evaluación utiliza un LLM como juez), así como los cargos incurridos por el uso de la base de conocimientos en el trabajo de evaluación de acuerdo con los precios de Amazon Bedrock Knowledge Bases. En un trabajo de evaluación de la base de conocimientos (evaluación RAG), las métricas integradas utilizan plantillas de peticiones de evaluación del sistema exclusivas para cada métrica y un modelo de evaluación disponible que se cobrará como parte del uso de los tokens, y las peticiones de las evaluaciones están disponibles en la documentación pública de AWS por motivos de transparencia. Algunas métricas implican juzgar la inferencia del modelo a partir del contexto recuperado de su base de conocimientos o de sus respuestas básicas, además de la indicación de la solicitud, lo que afecta a los costes asociados a cada métrica. Puede encontrar más información sobre cada métrica en la documentación pública de AWS para las evaluaciones.

Información sobre precios

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.

AI21 Labs

AI21 Labs

Precios bajo demanda

Modelos de AI21 Labs	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
Jamba 1.5 Large	0,002 USD	0,008 USD
Jamba 1.5 Mini	0,0002 USD	0,0004 USD
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic-2 Ultra	0,0188 USD	0,0188 USD
Jamba-Instruct	0,0005 USD	0,0007 USD

Amazon
- Amazon Nova
- Amazon Titan
- Otro Amazon
- Amazon Nova
- Amazon Nova
  
  Precios para comprender los modelos
  
  Precios por modelos de generación de contenido creativo
- Amazon Titan
- Amazon Titan
- Otro Amazon
Anthropic

Anthropic

Precios bajo demanda y por lotes

Región: regiones de EE. UU.

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)	Precio por cada 1000 tokens de entrada (escritura en caché)	Precio por cada 1000 tokens de entrada (lectura de caché)
Claude 3.7 Sonnet***	0,003 USD	0,015 USD	N/D	N/D	0,00375 USD	0,0003 USD
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,0008 USD	0,004 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD	ND	ND
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD	ND	ND
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	ND	ND
Claude 2.1	0,008 USD	0,024 USD	ND	ND	ND	ND
Claude 2.0	0,008 USD	0,024 USD	ND	ND	ND	ND
Claude Instant	0,0008 USD	0,0024 USD	ND	ND	ND	ND
*Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón)
**Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región Oeste de EE. UU. (Oregón)
***El Claude 3.7 Sonnet también está disponible en la región Este de EE. UU. (Ohio)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)	Precio por cada 1000 tokens de entrada (escritura en caché)	Precio por cada 1000 tokens de entrada (lectura de caché)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,001 USD	0,005 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 2.0	0,008 USD	0,024 USD	N/D	N/D
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
*Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón)
**Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región del oeste de EE. UU. (Oregón)

Región: Europa (Londres)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Región: Europa (Zúrich)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Región: América del Sur (San Pablo)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Región: Canadá (centro)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Región: Asia-Pacífico (Bombay)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Región: Asia-Pacífico (Sídney)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)
Claude 3.5 Sonnet v2	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
Claude 2.0/2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD

Región: Asia-Pacífico (Singapur)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)
Claude Instant	0,0008 USD	0,0024 USD	0,0004 USD	0,0012 USD
Claude 2.0/2.1	0,008 USD	0,024 USD	0,004 USD	0,012 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	N/D	N/D

Región: Europa (París)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Región: Europa (Fráncfort)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por cada 1000 tokens de entrada (lote)	Precio por cada 1000 tokens de salida (lote)
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
Claude 2.0/2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Región: Asia-Pacífico (Seúl)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

N/D

Claude 3 Haiku

0,00025 USD

0,00125 USD

N/D

Región: Este de EE. UU. (Ohio)

Modelos de Anthropic

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por cada 1000 tokens de entrada (lote)

Precio por cada 1000 tokens de salida (lote)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

N/D

Claude 3 Haiku

0,00025 USD

0,00125 USD

N/D

Región: AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.)

Modelos de Anthropic	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
Claude 3.5 Sonnet	0,0036 USD	0,018 USD
Claude 3 Haiku	0,0003 USD	0,0015 USD

Inferencia optimizada para latencia

Región: Este de EE. UU. (Ohio)

	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
Claude 3.5 Haiku	0,001 USD	0,005 USD

Región: Este de EE.UU. (Norte de Virginia)

	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
Claude 3.5 Haiku	0,001 USD	0,005 USD

Región: Oeste de EE. UU. (Oregón)

	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
Claude 3.5 Haiku	0,001 USD	0,005 USD

Precios del rendimiento aprovisionado

Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Modelos de Anthropic	Precio por hora y modelo sin compromiso	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0 y 2.1	70,00 USD	63,00 USD	35,00 USD

Modelos de Anthropic	Precio por hora y modelo sin compromiso	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0 y 2.1	70,00 USD	63,00 USD	35,00 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Región: Europa (Fráncfort)

Modelos de Anthropic	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo.

Cohere

Cohere

Precios bajo demanda

Modelos de Cohere	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida	Precio por imagen
Comando	0,0015 USD	0,0020 USD	N/D
Command-Light	0,0003 USD	0,0006 USD	N/D
Comando R+	0,0030 USD	0,0150 USD	N/D
Comando R	0,0005 USD	0,0015 USD	N/D
Insertar 3 inglés	0,0001 USD	N/D	0,0001 USD
Insertar 3 multilingüe	0,0001 USD	N/D	0,0001 USD

Modelos de Cohere	Precio por cada 1000 consultas**
Rerank 3.5	2,00 USD
**Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 500 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos.

Precios por la personalización (ajuste preciso)

Modelos de Cohere	Precio por entrenar 1000 tokens	Precio por el almacenamiento mensual de cada modelo personalizado	Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Cohere Command-Light	0,001 USD	1,95 USD	8,56 USD

* El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

Precios del rendimiento aprovisionado

Modelos de Cohere	Precio por hora y modelo sin compromiso	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command: Light	8,56 USD	6,85 USD	4,11 USD
Insertar 3 inglés	7,12 USD	6,76 USD	6,41 USD
Insertar 3 multilingüe	7,12 USD	6,76 USD	6,41 USD

Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

DeepSeek

DeepSeek

Precios bajo demanda

Regiones: Este de EE. UU. (norte de Virginia), Este de EE. UU. (Ohio) y Oeste de EE. UU. (Oregón)

Modelos DeepSeek	Precio por cada 1000 tokens de entrada	Precio por cada 1000 tokens de salida
DeepSeek-R1	0,00135 USD	0,0054 USD

Luma AI

Precios bajo demanda

Modelos Luma AI	Resolución de video	Precio por segundo de video generado
Luma Ray 2	720p, 24 fps	1,50 USD
Luma Ray 2	540p, 24 fps	0,75 USD

Meta

Stability AI

Precios bajo demanda

Modelo de Stability AI	Precio por imagen generada
Stable Diffusion 3.5 Large	0,08 USD
Stable Image Core	0,04 USD
Stable Diffusion 3 Large	0,08 USD
Stable Image Ultra	0,14 USD

Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.

Modelo de Stability AI	Resolución de imagen	Precio por imagen generada de calidad estándar (<=50 pasos)	Precio por imagen generada de calidad premium (>50 pasos)
SDXL 1.0	Hasta 1024 x 1024	0,04 USD	0,08 USD

Precios del rendimiento aprovisionado

Modelo de Stability AI	Precio por hora por unidad de modelo con un compromiso de 1 mes*	Precio por hora por unidad de modelo con un compromiso de 6 mes*
SDXL 1.0	49,86 USD	46,18 USD

*Incluye inferencia para modelos básicos y personalizados

Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.

Importación de modelos personalizados

Importación de modelos personalizados

Llama
Llama multimodal
Mistral
Mixtral
Flan

Llama

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0785 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0981 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

*Facturado en intervalos de 5 minutos

Llama multimodal

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0785 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0981 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Mistral

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0785 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0981 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Mixtral

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0785 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0981 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Flan

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0785 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,0981 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

Herramientas de precios (detalles)

Flujos
Bases de conocimiento
Barreras de protección
Evaluación del modelo
Automatización de datos

Flujos
Amazon Bedrock Flows

Se le cobra en función de la cantidad de transiciones de nodo que se requieran para ejecutar su aplicación. Bedrock Flows cuenta una transición de nodo cada vez que se ejecuta un nodo en su flujo de trabajo. Se le cobra por la cantidad total de transiciones de nodo en todos sus flujos.

Todos los cargos se miden a diario y se facturan de forma mensual a partir del 1 de febrero de 2025.

Precio por cada 1000 transiciones de nodo

0,035 USD

Cargos adicionales

Puede incurrir en cargos adicionales si la ejecución del flujo de trabajo de su aplicación utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su flujo de trabajo invoca una política de barrera de protección de Amazon Bedrock, se le facturará por la cantidad de unidades de texto que procese la política.
Bases de conocimiento
Recuperación de datos estructurados (generación de SQL)

La recuperación de datos estructurados se cobra por cada solicitud para generar una consulta SQL. La consulta SQL generada se usa para recuperar los datos de los almacenes de datos estructurados.

Modelos de Rerank

Los modelos de Rerank están diseñados para mejorar la relevancia y precisión de las respuestas en las aplicaciones de generación aumentada por recuperación (RAG). Se cobran por consulta.

**Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 512 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Una consulta equivale a una unidad de búsqueda.
Barreras de protección

Precio por cada 1000 transiciones de nodo
0,035 USD

Barreras de protección de Amazon Bedrock

Política de barrera de protección*	Precio
Filtros de contenido (contenido de texto)	0,15 USD por 1000 unidades de texto
Filtros de contenido (contenido de imágenes)	0,00075 USD por imagen procesada
Temas denegados	0,15 USD por 1000 unidades de texto
Filtros de información confidencial	0,10 USD por 1000 unidades de texto
Filtros de información confidencial (expresión regular)	Gratis
Filtros de palabras	Gratis
Verificación de la base contextual	0,10 USD por 1000 unidades de texto

Precios bajo demanda

* Cada política de barreras de protección es opcional y se puede habilitar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de política utilizada en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estas dos políticas, pero no habrá cargos asociados a los filtros de información confidencial.

Note: Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.

La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.

Evaluación del modelo

Evaluación del modelo

La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.

Model

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por tarea humana

Modelo seleccionado para la evaluación

Basado en el modelo seleccionado

0,21 USD

Automatización de datos
Automatización de datos

Las bases de conocimiento de Amazon Bedrock ofrecen una integración de Bedrock Data Automation para proporcionar respuestas más relevantes y precisas para los datos multimodales. Al configurar una base de conocimientos, puede seleccionar Bedrock Data Automation como método de análisis para analizar y extraer información significativa de imágenes o documentos, que pueden incluir figuras, gráficos y diagramas. Durante el procesamiento, Bedrock Data Automation extrae información significativa de los documentos e imágenes ingeridos, que luego se utiliza en los pasos posteriores de la base de conocimientos para fragmentar, incrustar y almacenar. Cuando se integra con las bases de conocimiento, Bedrock Data Automation entrega y cobra por los resultados estandarizados.

Ejemplos de precios

AI21 Labs

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD
Agentes

Ejemplo 1: Agente de recuperación de preguntas frecuentes
Un desarrollador de aplicaciones crea un sencillo agente de recuperación de preguntas frecuentes para su sitio web minorista. Este agente se ocupa de las consultas habituales de los clientes, como los horarios de las tiendas y las políticas de devoluciones, y atiende 10 000 solicitudes de InvokeAgent al mes. Los agentes también pueden procesar archivos, como las etiquetas de embalaje, proporcionados por el usuario.

Las solicitudes de InvokeAgent para este agente se cobrarán como agente estándar a razón de 1 USD por cada 1000 solicitudes de InvokeAgent.

Costo total incurrido = 10 000 x (1,00 USD/1000) = 10,00 USD al mes

Ejemplo 2: Agente de asistencia integrado en el producto con memoria a largo plazo y orquestación de agentes personalizada
Un desarrollador de aplicaciones crea un agente de asistente de IA que utiliza la memoria a largo plazo para proporcionar respuestas contextualmente relevantes y una orquestación personalizada para un mayor control sobre la orquestación de los agentes. Este agente atiende 15 000 solicitudes de InvokeAgent al mes.

Las solicitudes de InvokeAgent para este agente que utilicen memoria a largo plazo y capacidad de orquestación personalizada se cobrarán como agente avanzado a razón de 3 USD por cada 1000 solicitudes de InvokeAgent.

Costo total incurrido = 15 000 x (3,00 USD/1000) = 45,00 USD al mes

Ejemplo 3: Sistema de soporte técnico con colaboración entre múltiples agentes
Una empresa de software implementa un sistema multiagente para el soporte técnico. El agente supervisor coordina a tres agentes especializados en la solución de problemas de hardware, software y red. El agente supervisor atiende 5000 solicitudes de InvokeAgent al mes y cada uno de los demás agentes gestiona 20 000 solicitudes al mes.

Las solicitudes de InvokeAgent para el agente supervisor se cobrarán como agente avanzado a razón de 3 USD por cada 1000 solicitudes de InvokeAgent, mientras que las solicitudes de otros tres agentes se cobrarán como agente estándar a 1 USD por cada 1000 solicitudes de InvokeAgent.

Costo del agente supervisor = 5000 * (3,00 USD/1000) = 15,00 USD al mes
Costo para agentes estándar = 3 * 20 000 * (1,00 USD/1000) = 60,00 USD al mes
Costo total incurrido = 15,00 USD + 60,00 USD = 75,00 USD al mes
Amazon

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD
Barreras de protección de Amazon Bedrock

Ejemplo 1: chatbot de atención al cliente
Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Ejemplo 2: resumen de la transcripción del centro de llamadas
Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD
Bases de conocimiento de Amazon Bedrock

Ejemplo de precios 1 (cambio de clasificación mediante el modelo Amazon Rerank 1.0)

En un mes determinado, realiza 2 millones de solicitudes a la API de Rerank con el modelo Amazon Rerank 1.0; 1 millón de solicitudes contienen menos de 100 documentos cada una y, por lo tanto, se cobrará una solicitud por cada una. El millón de solicitudes restantes contienen entre 120 y 150 documentos y, por lo tanto, a cada solicitud se le cobrarán 2 solicitudes.

Precio de una solicitud = 0,001 USD
Costo total = 1,000,000 USD × 0.001 + 1,000,000 USD × 2 = 0.001 USD = 3000 USD

Ejemplo de precios 2: (Recuperación de datos estructurados)

Un desarrollador de aplicaciones crea un chatbot de soporte que consulta los datos estructurados almacenados en Amazon Redshift. El desarrollador crea una base de conocimientos de Bedrock y se conecta a Amazon Redshift. El chatbot atiende 10000 consultas de usuarios por hora. Cada consulta de usuario costará 0,002 USD por API de GenerateQuery para generar SQL a partir de la consulta del usuario.

Costo total incurrido para generar SQL por hora = 0,002 USD*10000 = 20 USD.
Costo total incurrido en el mes = 20 USD*24 USD*30 USD = 1440 USD
Anthropic

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
Cohere

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

Precios de la personalización (ajuste preciso)

Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
Importación de modelos personalizados

Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.

La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un periodo de 5 minutos, el intervalo se considerará activa para la facturación. Si hay una invocación a las 8:03 a. m. y no hay más invocaciones después de las 8:07 a. m., la medición se detendrá a las 8:07 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 1 intervalo de cinco minutos = 0,785 USD.
Automatización de datos

Ejemplo de precios 1:
Supongamos que procesa un documento de 1000 páginas con BDA Custom Output. Las 1000 páginas se procesan mediante el esquema 1, que tiene 15 campos. El precio por página de cualquier esquema con 30 campos o menos es de 0,040 USD. El costo total sería de 40 USD.

Total de páginas procesadas = 1000
Precio por página para esquemas con menos de 30 campos = 0,040 USD
Costo total = 1000 × 0.040 USD = 40 USD

Ejemplo de precios 2:
Supongamos que procesa 2 documentos con BDA Custom Output. El documento 1 tiene 40 páginas y se procesa con el esquema 1, que tiene 20 campos. El documento 2 tiene 10 páginas y se procesa con el esquema 2, que tiene 40 campos. El precio por página del esquema 1 es de 0,040 USD, ya que contiene 30 campos o menos. El precio por página del esquema 2 es de 0,045 USD. El costo de procesamiento del documento 1 con el esquema 1 es de 1,60 USD. El costo de procesamiento del documento 2 con el esquema 2 es de 0,45 USD. El costo total de procesar ambos documentos sería de 2,05 USD.

Total de páginas procesadas = 50
Precio por página para el esquema 1 con menos de 30 campos = 0,040 USD
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (número de campos adicionales superiores a 30 *0,0005 USD por campo)
Número de campos adicionales por encima de 30 = 40 - 30 = 10
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (10 *0,0005 USD por campo) = 0,045 USD
Cargo por el documento 1 con el esquema 1 = 40 páginas x 0,040 USD por página = 1,6 USD
Cargo por el documento 2 con el esquema 2 = 10 páginas x 0,045 USD por página = 0,45 USD
Cargo total = cargo por el documento 1 + cargo por el documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

Ejemplo 3 de precios.
Supongamos que configura las bases de conocimiento de Bedrock para usar Bedrock Data Automation como analizador y, a continuación, ingiere un documento de 1000 páginas. Tenga en cuenta que las estructuras de costos difieren entre las opciones de análisis de las bases de conocimiento. BDA usa precios por página, mientras que los analizadores de Foundational Model cobran en función de los tokens de entrada y salida. Para dar contexto, el procesamiento de 1000 páginas, de las que el 30 % contiene tablas y el 30 % contiene figuras, normalmente requiere 2900 tokens de entrada y 750 tokens de salida. El consumo de tokens varía según el tipo de contenido, por lo que se recomienda a los clientes que prueben con sus propios datos para obtener estimaciones más precisas. La integración de las bases de conocimiento de Bedrock y Bedrock Data Automation utiliza una salida estándar, donde precio por página es 0,010 USD. El costo total sería de 10 USD.

Total de páginas procesadas = 1000
Precio por página para la salida estándar = 0,010 USD
Costo total = 1000 x 0,010 USD = 10 USD

Ejemplo de precios 4:
Supongamos que procesa un video de 60 minutos con la salida estándar BDA. El precio por minuto de la salida estándar de video es de 0,050 USD. El costo total sería de 3.00 USD.

Total de minutos procesados = 60
Precio por minuto para la salida estándar de video = 0,050 USD
Costo total = 60 × 0,050 USD = 3,00 USD

Ejemplo de precios 5:
Supongamos que procesa 2000 imágenes con BDA Custom Output. Las primeras 1000 imágenes se procesan con el esquema 1, que tiene 10 campos. Las últimas 1000 páginas se procesan con el esquema 2, que tiene 40 campos. El precio por imagen del esquema 1 es de 0,005 USD, ya que contiene 30 campos o menos. El precio por imagen del esquema 2 es de 0,01 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 1 es de 5,00 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 2 es de 10,00 USD. El costo total de procesar las 2000 imágenes sería de 15,00 USD

Costo de las primeras 1000 imágenes = 1000 imágenes* 0,005 USD por imagen = 5,00 USD
Costo de 1000 imágenes secundarias = 1000 imágenes * (0,005 USD + [número de campos adicionales superiores a 30 x 0,0005 USD por campo])
= 1000 x (0,005 USD + ([40-30] x 0,0005 USD))
= 1000 x (0,005 USD + [10 x 0,0005 USD]) = 10,00 USD
Costo total = 5,00 USD + 10,00 USD = 15,00 USD

Ejemplo de precios 6:
Supongamos que desea utilizar Bedrock Data Automation Standard Output para procesar 15 000 minutos de grabaciones de audio de reuniones en su organización. El costo total de procesar los 15 000 minutos de audio sería de 90 USD.

Total de minutos procesados = 15 000 minutos
Carga total = 15 000 minutos × 0,006 USD = 90 USD
DeepSeek

Precios bajo demanda

Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo DeepSeek-R1 para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens (incluidos los tokens de razonamiento):

Costo total por hora = 2000 tokens/1000 * 0,00135 USD + 1000 tokens/1000 * 0,0054 USD = 0,0081 USD
Flujos

Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo incluye un nodo de entrada que ocupa una ubicación de S3 y un nodo de recuperación de S3 que recupera 10 archivos que incluyen artículos de 10 de las principales agencias de noticias de S3 (transiciones de 2 nodos). A continuación, utiliza un nodo iterador para invocar un modelo con un nodo de petición para resumir cada archivo (+ 10 archivos x 2 transiciones de nodos). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.

La cantidad de transiciones de nodo por ejecución de flujo es: 2+1+10*2 + 3 = 25 transiciones de nodo/ejecución de flujo

La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.

La factura mensual total es: 25 * 960 * 0,035 USD/1000 = 0,84 USD

Cargos adicionales
La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición.
Meta

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

Precios de la personalización (ajuste preciso)

Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD
Mistral AI

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

Evaluación del modelo

Ejemplo 1 de evaluación del modelo:

El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

Elemento	Número de tokens de entrada	Precio por cada 1000 tokens de entrada	Costo de entrada	Número de tokens de salida	Precio por cada 1000 tokens de salida	Costo de salida	Número de tareas humanas	Precio por tarea humana	Costo de las tareas humanas	Total
Inferencia de Claude Instant	5000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Inferencia de Claude 2.1	5000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tareas humanas							50	0,21 USD	10,50 USD	10,50 USD
Total										11,06 USD

Ejemplo 2 de evaluación del modelo:

Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

Elemento	Número de tokens de entrada	Precio por cada 1000 tokens de entrada	Costo de entrada	Número de tokens de salida	Precio por cada 1000 tokens de salida	Costo de salida	Número de tareas humanas	Precio por tarea humana	Costo de las tareas humanas	Total
Inferencia de Claude Instant	5000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Inferencia de Claude 2.1	5000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tareas humanas							100	0,21 USD	21,00 USD	21,00 USD
Total										21,56 USD

Optimización de peticiones para Amazon Bedrock

Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea una petición para resumir las noticias para los operadores que usan Claude 3.5. La petición original incluye 429 tokens. La petición optimizada tiene 511 tokens e incluye instrucciones y ejemplos más específicos para que los modelos fundacionales generen respuestas más concisas. Usa la petición optimizada con 511 tokens como entrada para el optimizador de peticiones y crea 2 variantes nuevas para Claude 3.7 y Nova Pro con 582 y 579 tokens.

La cantidad total de tokens de entrada y salida para la optimización de peticiones es: 429 + 511 + 511 + 582 + 511 + 579 = 3123

La factura mensual total es: 3123 / 1000 * 0,03 USD = 0,09 USD
Stability AI

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD

Seleccione sus preferencias de cookies

Precios de Amazon Bedrock

Información general sobre precios

Modelos de precios

Bajo demanda y por lotes

Optimización para latencia (versión preliminar pública)

Capacidad de rendimiento aprovisionada

Importación de modelos personalizados

Modelos de Marketplace

Personalización y optimización

Personalización de modelos

Destilación de modelos

Almacenamiento en caché de peticiones

Herramientas

Barreras de protección

Bases de conocimiento y automatización de datos

Agentes

Flujos

Evaluaciones

Información sobre precios

AI21 Labs

Amazon Nova

Precios para comprender los modelos

Precios por modelos de generación de contenido creativo

Amazon Titan

Anthropic

Cohere

DeepSeek

Precios bajo demanda

Meta

Mistral AI

Stability AI

Importación de modelos personalizados

Herramientas de precios (detalles)

Amazon Bedrock Flows

Barreras de protección de Amazon Bedrock

Evaluación del modelo

Automatización de datos

Ejemplos de precios

AI21 Labs

Agentes

Amazon

Precios bajo demanda

Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

Precios del rendimiento aprovisionado

Barreras de protección de Amazon Bedrock

Bases de conocimiento de Amazon Bedrock

Anthropic

Precios bajo demanda

Precios del rendimiento aprovisionado

Cohere

Precios bajo demanda

Precios de la personalización (ajuste preciso)

Importación de modelos personalizados

Automatización de datos

DeepSeek

Flujos

Meta

Precios bajo demanda

Precios de la personalización (ajuste preciso)

Precios del rendimiento aprovisionado

Mistral AI

Precios bajo demanda

Evaluación del modelo

Ejemplo 1 de evaluación del modelo:

Ejemplo 2 de evaluación del modelo:

Optimización de peticiones para Amazon Bedrock

Stability AI

Precios bajo demanda

Precios del rendimiento aprovisionado

Finalización de la compatibilidad con Internet Explorer