Preguntas frecuentes sobre Amazon Textract

Aspectos generales

Amazon Textract es un servicio de análisis de documentos que detecta y extrae texto impreso, escritura manuscrita, datos estructurados (como campos de interés y sus valores) y tablas a partir de imágenes y escaneos de documentos. Los modelos de machine learning de Amazon Textract han sido entrenados en millones de documentos para que prácticamente cualquier tipo de documento que se cargue sea reconocido y procesado automáticamente para la extracción de texto. Cuando se extrae información a partir de los documentos, el servicio arroja una puntuación de confianza para cada elemento que identifica, de modo que sea posible tomar decisiones fundamentadas sobre el modo de utilizar los resultados. Por ejemplo, al extraer información de documentos fiscales, se pueden establecer reglas personalizadas para que cualquier información extraída con una puntuación de confianza inferior al 95 % sea marcada. Además, todos los datos extraídos se devuelven con las coordenadas del cuadro delimitador, que es un marco rectangular que abarca completamente cada dato identificado, de modo que sea posible identificar rápidamente dónde aparece una palabra o un número en un documento. Puede acceder a estas características con la API de Amazon Textract, en la Consola de administración de AWS o mediante la interfaz de línea de comandos (CLI) de AWS.

Los casos de uso más comunes para Amazon Textract incluyen:

  • Importar documentos y formularios a aplicaciones empresariales
  • Crear índices de búsqueda inteligente 
  • Construir flujos de trabajo automatizados para el procesamiento de documentos
  • Garantizar el cumplimiento de la normativa en el archivado de documentos
  • Extraer texto para el procesamiento de lenguaje natural (PLN)
  • Extraer texto para la clasificación de documentos

Amazon Textract puede detectar texto impreso y escritura manuscrita a partir del alfabeto inglés estándar y los símbolos ASCII. Amazon Textract puede extraer texto impreso, formularios y tablas en inglés, alemán, francés, español, italiano y portugués. Amazon Textract también extrae datos explícitamente etiquetados, datos implícitos y partidas de una lista desglosada de bienes o servicios a partir de casi cualquier factura o recibo en inglés sin necesidad de plantillas ni de configuración. Amazon Textract también puede extraer datos específicos o implícitos, como nombres y direcciones, a partir de documentos de identidad en inglés, como pasaportes y permisos de conducir estadounidenses, sin necesidad de plantillas ni de configuración. Por último, Amazon Textract puede extraer cualquier dato específico a partir de los documentos sin preocuparse de la estructura o las variaciones de los datos en el documento utilizando consultas en inglés.

Actualmente, Amazon Textract admite los formatos PNG, JPEG, TIFF y PDF. En el caso de las API sincrónicas, se pueden enviar las imágenes como un objeto de S3 o como una matriz de bytes. En el caso de las API asíncronas, se pueden enviar objetos de S3. Si el documento ya se encuentra en uno de los formatos de archivo compatibles con Amazon Textract (PDF, TIFF, JPG, PNG), no lo convierta ni lo comprima antes de cargarlo en Amazon Textract.

Para comenzar a utilizar Amazon Textract, puede hacer clic en el botón “Introducción a Amazon Textract” en la página de Amazon Textract. Debe tener una cuenta de Amazon Web Services; en caso de no tenerla, se le pedirá que la cree durante el proceso. Una vez que haya iniciado sesión en la cuenta de AWS, pruebe Amazon Textract con sus propias imágenes o documentos PDF mediante la Consola de administración de Amazon Textract. También puede descargar los SDK de Amazon Textract para comenzar a crear sus propias aplicaciones. Para obtener más información, consulte nuestra Guía de introducción paso a paso.

Amazon Textract lleva a cabo el reconocimiento óptico de caracteres mediante la API para detectar texto de un documento, pero va un paso más allá en el proceso de análisis de documentos y también realiza la detección de pares clave-valor para que las extracciones de texto permanezcan organizadas en su estructura prevista. La API para analizar documentos puede detectar texto impreso, escritura manuscrita, campos, valores, sus relaciones, tablas y otras entidades dentro de un documento junto con sus puntuaciones de confianza asociadas. Con la API para analizar documentos, los desarrolladores pueden capturar automáticamente datos estructurados a partir de una amplia variedad de documentos, como formularios fiscales, informes financieros, historiales médicos y solicitudes de préstamos. La API para analizar documentos también ofrece a los desarrolladores la flexibilidad de especificar los datos que necesitan extraer a partir de los documentos mediante Consultas, sin preocuparse por la estructura de los datos ni por las variaciones en la disposición de los datos en diferentes formatos y versiones del documento. Al utilizar consultas personalizadas, la función Consultas se puede personalizar para mejorar la precisión de la extracción en documentos específicos de la empresa. La API para analizar gastos puede encontrar el nombre del proveedor en un recibo incluso si este solo se indica dentro de un logotipo en la página sin una etiqueta explícita llamada “proveedor”. También puede encontrar y extraer el artículo, la cantidad y los precios que no están etiquetados con encabezados de columna para las partidas. Con la API para analizar gastos, los desarrolladores pueden utilizar nombres de clave y encabezados de columna normalizados al extraer datos a partir de facturas y recibos de modo que las aplicaciones posteriores tengan la posibilidad de comparar fácilmente los resultados de muchos documentos. La API para analizar los ID entiende el contexto de los documentos de identidad, como los pasaportes y los permisos de conducir de Estados Unidos, sin necesidad de plantillas ni de configuración. Con el análisis de documentos de identidad, las empresas que prestan servicios de verificación de la identidad y las que operan en los sectores de las finanzas, la salud y los seguros pueden automatizar fácilmente la creación de cuentas, la programación de citas, las solicitudes de empleo, etc., al permitir que los clientes presenten una fotografía o un escaneado del documento de identidad. Para obtener más información, consulte la referencia de la API de Amazon Textract.

La API Analyze Document tiene las siguientes características: formularios, tablas, consultas, consultas personalizadas, firmas y diseño. Puede utilizar estas características de forma independiente o utilizar cualquier combinación de estas. Utilice Formularios para extraer datos como pares clave-valor (por ejemplo, “Nombre” y el valor asociado “María González”). Utilice Tablas para extraer datos tabulares o de tabla organizados en columnas y filas. Utilice Consultas para especificar la información que necesita de un documento en forma de preguntas en lenguaje natural (por ejemplo, “¿Cuál es el nombre del cliente?”) y reciba la respuesta (por ejemplo, “María Pérez”) como parte de la respuesta. Utilice Consultas personalizadas para personalizar las funciones de consultas en documentos específicos de la empresa. Puede usar Firmas para detectar firmas en los documentos y usar el diseño para identificar los elementos del diseño en un documento.

Publicamos una guía detallada sobre las prácticas recomendadas para la elaboración de Consultas como parte de nuestra Documentación de la API en la página de Recursos de Textract. En general, los clientes deben intentar formular una pregunta en lenguaje natural con las palabras del documento para elaborar una consulta.

Las consultas se procesan por página y la información se puede extraer mediante consultas a través de operaciones sincrónicas o asíncronas. Para las operaciones sincrónicas, se admite un máximo de 15 consultas por página. En el caso de las operaciones asíncronas, se admite un máximo de 30 consultas por página.

Amazon Textract utiliza el machine learning para leer prácticamente cualquier tipo de documento con el fin de extraer el texto impreso, la escritura manuscrita y la información estructurada. Tenga en cuenta los siguientes consejos para obtener los mejores resultados:

  • Asegúrese de que el documento utiliza un idioma admitido por Amazon Textract (actualmente inglés, español, italiano, portugués, francés y alemán. La escritura manuscrita, las facturas y los recibos, los documentos de identidad y el procesamiento de las consultas son únicamente en inglés).
  • Proporcione una imagen de la mayor calidad posible, idealmente de al menos 150 DPI.
  • Si el documento ya está en uno de los formatos de archivo compatibles con Amazon Textract (PDF, JPG, PNG), no lo convierta ni lo comprima antes de cargarlo en Amazon Textract.
  • La característica de tablas de Amazon Textract funciona mejor cuando las tablas del documento están visualmente separadas de los elementos circundantes de la página (por ejemplo, no están superpuestas a una imagen o a un patrón complejo), y el texto dentro de la tabla está recto (por ejemplo, no está girado con respecto a otro texto de la página).

Puede comenzar a analizar documentos propios con Amazon Textract con tan solo unos clics en la Consola de administración de Amazon Textract. Si tiene problemas para lograr una precisión alta con los recibos, los documentos de identificación o los diagramas industriales, contáctenos a través de amazon-textract@amazon.com para obtener ayuda.

La puntuación de confianza es un número entre 0 y 100 que indica la probabilidad de que una determinada predicción sea correcta. Con Amazon Textract, todo el texto impreso, la escritura manuscrita y los datos estructurados extraídos se devuelven con coordenadas del cuadro delimitador, que es un marco rectangular que abarca completamente cada dato identificado. Esto permite identificar la puntuación de cada entidad extraída de modo que sea posible tomar decisiones fundamentadas sobre el modo de utilizar los resultados.

Amazon Textract actualmente se encuentra disponible en las regiones Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Oeste de EE. UU. (Norte de California), AWS GovCloud (Oeste de EE. UU.), AWS GovCloud (Este de EE. UU.), Canadá (centro), Europa (Irlanda), Europa (Londres), Europa (Fráncfort), Europa (París), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Bombay).

Sí. Amazon Textract admite el registro de las siguientes acciones como eventos de CloudTrail: DetectDocumentText, AnalyzeDocument, StartDocumentTextDetection, StartDocumentAnalysis, GetDocumentTextDetection y GetDocumentAnalysis. Para obtener más información, consulte Registro de llamadas a la API de Amazon Textract con AWS CloudTrail.

Puede ver y administrar sus cuotas de servicio de Amazon Textract (anteriormente denominadas límites de servicio) en la consola de AWS Service Quotas. También puede estimar los requisitos de cuota para su caso de uso utilizando la  calculadora de cuotas de servicio de Textract. Para crear una solicitud de aumento de cuota de servicio:

1. Inicie sesión en la consola de AWS, vaya a la consola de AWS Service Quotas y seleccione “Textract” en los servicios de AWS.
2. Seleccione la cuota deseada y haga clic en “Solicitar aumento de cuota” en la página siguiente.
3. Introduzca el valor de cuota deseado y haga clic en “Solicitar”.

Recomendamos el siguiente enfoque para mitigar la limitación:

1. Implemente la lógica de reintento. Siga las pautas de gestión de errores para configurar los reintentos en caso de errores de limitación.
2. Configure exponential backoff and jitter (Retroceso exponencial y fluctuación). La configuración del retroceso y la fluctuación exponenciales a medida que configura los reintentos le permite mejorar el rendimiento alcanzable. Consulte Reintentos de error y retrocesos exponenciales en AWS.
3. Suaviza tu flujo de tráfico. Los picos de tráfico afectan al rendimiento. Para obtener el máximo rendimiento de las transacciones asignadas por segundo (TPS), utilice una arquitectura sin servidor de colas u otro mecanismo para «suavizar» el tráfico de forma que sea más coherente.
4. Comience con ejemplos que apliquen las mejores prácticas.  Intente utilizar nuestras muestras de CDK de IDP con los componentes de CDK .
5. Utilice la calculadora Textract Service Quota para calcular los requisitos de cuota para su caso de uso y envíe una solicitud de aumento de cuota desde la consola de AWS Service Quotas.

Facturación

Una imagen (PNG, TIFF o JPEG) cuenta como una sola página. Para los PDF, cada página del documento se cuenta como una página procesada.

Consulte la página de precios de Amazon Textract para obtener más información sobre los precios.

Amazon Textract cobra en función del número de páginas e imágenes procesadas. Para obtener más información, visite la página de precios.

Sí. Como parte del nivel Gratuito de AWS, puede comenzar a usar Amazon Textract sin costo. El nivel gratuito dura tres meses, y los nuevos clientes de AWS pueden analizar hasta:

API para detectar texto de un documento: 1000 páginas al mes
API para analizar documentos:

  • 1000 páginas al mes solo con firmas
  • 100 páginas al mes cuando se utilizan formularios, tablas y funciones de diseño
  • 100 páginas al mes para consultas, formularios + consultas, tablas + consultas, formularios + tablas + consultas
  • No hay un nivel gratuito para consultas personalizadas

API para analizar gastos: 100 páginas al mes
API para analizar ID: 100 páginas al mes
API para analizar préstamos: 2000 páginas por mes

Para obtener más información sobre impuestos, consulte la Ayuda sobre impuestos de Amazon Web Services.

Privacidad de datos

Amazon Textract podrá almacenar y utilizar las entradas de documentos e imágenes procesadas por el servicio únicamente para proporcionar y mantener el servicio y para mejorar y desarrollar la calidad de Amazon Textract y otras tecnologías de machine learning e inteligencia artificial de Amazon. El uso de su contenido es necesario para la mejora continua de su experiencia como cliente de Amazon Textract, incluido el desarrollo y el entrenamiento de tecnologías relacionadas. No utilizamos información de identificación personal que pudiera estar incluida en el contenido para venderle a usted o a sus usuarios finales productos o servicios, ni para campañas de marketing. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte https://aws.amazon.com/compliance/data-privacy-faq/. Puede optar por evitar que sus entradas de documentos e imágenes se utilicen para mejorar o desarrollar la calidad de Amazon Textract y otras tecnologías de machine learning e inteligencia artificial de Amazon mediante una política de no participación de AWS Organizations. Para obtener más información sobre cómo optar por la exclusión, consulte Administración de la política de exclusión de los servicios de IA.

Todo el contenido que se procesa con Amazon Textract se cifra y almacena en reposo en la región de AWS en la que está usando Amazon Textract. A menos que opte por no participar, como se indica a continuación, es posible que una parte del contenido procesado por Amazon Textract se almacene en otra región de AWS únicamente en relación con la mejora y el desarrollo continuos de su experiencia como cliente de Amazon Textract y otras tecnologías de machine learning e inteligencia artificial de Amazon. Puede solicitar la eliminación de entradas de imagen y vídeo asociadas con su cuenta contactando con AWS Support. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte https://aws.amazon.com/compliance/data-privacy-faq/. Su contenido no se almacenará en otra región de AWS si desactiva el uso de su contenido para mejorar y desarrollar el nivel de calidad de Amazon Textract y de otras tecnologías de aprendizaje automático e inteligencia artificial de Amazon. Para obtener más información sobre cómo optar por la exclusión, consulte Administración de la política de exclusión de los servicios de IA.

Sí. Puede solicitar la eliminación de entradas de documentos e imágenes asociadas con su cuenta contactando con AWS Support. La eliminación de entradas de documentos e imágenes puede reducir la calidad de su experiencia con Amazon Textract.

Sí. Siempre conservará la titularidad del contenido, que se utilizará únicamente con su consentimiento.

Todo el contenido utilizado para generar adaptadores se procesa internamente en Amazon Textract durante la formación. El contenido se cifra en reposo y en tránsito. El contenido se almacena y procesa en la región de AWS en la que se está entrenando el adaptador y se elimina una vez finalizado el entrenamiento. Consulte https://docs.aws.amazon.com/textract/latest/dg/data-protection.html para obtener más información.

Sí, AWS amplió su programa de conformidad con HIPAA para incluir Amazon Textract como un servicio compatible con HIPAA. Si ha firmado un acuerdo de asociación empresarial (BAA) con AWS, puede utilizar Amazon Textract para extraer texto, incluida la información médica protegida (PHI), de las imágenes.

Obtenga más información sobre la conformidad con HIPAA

Textract cumple con los requisitos de la HIPAA y con las normas PCI, ISO y SOC. Para obtener más información, visite AWS Artifact en la Consola de Administración de AWS, o visite https://aws.amazon.com/compliance/services-in-scope/. Textract también es compatible con los puntos de enlace de Amazon Virtual Private Cloud (Amazon VPC) a través de AWS PrivateLink, lo que permite a los clientes iniciar de forma segura las llamadas a la API de Amazon Textract desde la VPC y evitar el uso de la Internet pública.