¿Por qué elegir las instancias Trn1 de Amazon EC2?
Las instancias Trn1 de Amazon Elastic Compute Cloud (EC2), impulsadas por los chips de AWS Trainium, están diseñadas específicamente para el entrenamiento de modelos de IA generativa con aprendizaje profundo (DL) de alto rendimiento, incluidos los modelos de lenguaje de gran tamaño (LLM) y de difusión latente. Las instancias Trn1 ofrecen hasta un 50 % de ahorro en el costo del entrenamiento con respecto a otras instancias de Amazon EC2 comparables. Puede usar instancias Trn1 para entrenar más de 100 000 millones de modelos de DL de parámetros y de IA generativa en un amplio conjunto de aplicaciones, como resúmenes de texto, generación de códigos, respuesta a preguntas, generación de imágenes y videos, recomendaciones y detección de fraudes.
El SDK de AWS Neuron ayuda a los desarrolladores a entrenar modelos en AWS Trainium (e implementar modelos en los chips de AWS Inferentia). Se integra de forma nativa con marcos de trabajo, como PyTorch y TensorFlow, para que pueda seguir utilizando el código y los flujos de trabajo existentes para entrenar modelos en instancias Trn1. Para obtener información sobre el soporte de Neuron actual para marcos y bibliotecas de machine learning (ML), arquitecturas de modelos y optimizaciones de hardware, consulte la documentación de Neuron.
Introducción a las instancias Trn1 de Amazon EC2 impulsadas por AWS Trainium
Beneficios
Características
Testimonios de clientes y socios
Estos son algunos ejemplos de cómo los clientes y socios lograron sus objetivos empresariales con las instancias Trn1 de Amazon EC2.
-
Databricks
Más de 10 000 organizaciones de todo el mundo (incluidas Comcast, Condé Nast y más del 50 % de las empresas de la lista Fortune 500) confían en los Databricks para unificar sus datos, análisis e inteligencia artificial.
-
Stockmark Co., Ltd
Con la misión de “reinventar el mecanismo de creación de valor y hacer avanzar a la humanidad”, Stockmark ayuda a muchas empresas a crear y construir negocios innovadores al proporcionar tecnología de procesamiento del lenguaje natural de vanguardia.
-
RICOH
RICOH ofrece soluciones para el lugar de trabajo y servicios de transformación digital diseñados para gestionar y optimizar el flujo de información entre las empresas.
-
HeliXon
-
Money Forward, Inc.
Money Forward, Inc. brinda servicios a empresas e individuos con una plataforma financiera abierta y justa.
-
Magic
Magic es un producto integrado y una empresa de investigación que desarrolla IA que es como el colega ideal para hacer que el mundo sea más productivo.
-
Cactus Communications
CACTUS tiene un conjunto de productos y soluciones para investigadores y organizaciones que mejora el financiamiento, publicación, difusión y descubrimiento de la investigación.
-
Watashiha
Watashiha ofrece un servicio de chatbot de IA innovador e interactivo, OGIRI AI, que incorpora sentido del humor para ofrecer una respuesta divertida en el acto a una pregunta.
-
PyTorch
-
Hugging Face
-
Amazon
Introducción
Detalles del producto
Tamaño de la instancia | Chips de Trainium |
Acelerador Memoria (GB) |
CPU virtuales | Instancia Memoria (GiB) |
Local NVMe Almacenamiento (TB) |
Red Ancho de banda (Gbps) |
EFA y RDMA Soporte |
EBS Ancho de banda (Gbps) |
Bajo demanda Precio por hora |
1 año Reservadas Instancia Efectiva Por hora* |
3 años Reservadas Instancia Efectiva Por hora* |
trn1.2xlarge | 1 | 32 | 8 | 32 | 0,5 | Hasta 12,5 | No | Hasta 20 | 1,34 USD | 0,79 USD | 0,4744 USD |
trn1.32xlarge | 16 | 512 | 128 | 512 | 8 | 800 | Sí | 80 | 21,50 USD | 12,60 USD | 7,59 USD |
trn1n.32xlarge |
16 | 512 | 128 | 512 | 8 | 1600 | Sí | 80 | 24,78 USD | 14,52 USD | 8,59 USD |