Зачем использовать AWS Glue?

Подготовка данных для получения качественных результатов является первым этапом в проектах аналитики или искусственного интеллекта. AWS Glue – бессерверный сервис, с помощью которого можно легко, быстро и экономично интегрировать данные. У вас есть возможность обнаруживать более 100 различных источников данных и подключаться к ним, управлять данными в централизованном каталоге, а также визуально создавать, запускать и отслеживать конвейеры данных для загрузки информации в озера, хранилища и хранилища озер данных. Благодаря встроенным возможностям генеративного искусственного интеллекта вы можете модернизировать задания Apache Spark и быстрее создавать их с помощью интеллектуальных средств разработки ETL и устранения неполадок в Spark.

Интегрируйте данные с помощью AWS Glue в Amazon SageMaker нового поколения

Благодаря AWS Glue в Amazon SageMaker нового поколения можно управлять рабочими нагрузками и создавать их в одном месте с помощью экономичной, бессерверной и масштабируемой интеграции данных.

image

Преимущества

AWS Glue предоставляет все необходимые средства для интеграции данных, чтобы вы могли быстро получать аналитические сведения и применять данные на практике. Кроме того, AWS Glue – это полностью управляемый бессерверный набор инструментов для проектирования и автоматизации современных конвейеров данных со встроенным ETL, обнаружением схем и интеграцией между различными сервисами.
AWS Glue автоматически масштабирует задачи по обработке данных – от гигабайт до петабайт – без необходимости управления инфраструктурой. Кроме того, вы платите только за использованные ресурсы.
AWS Glue исключает управление инфраструктурой, предоставляя бессерверные конвейеры данных со встроенными возможностями планирования и мониторинга, что позволяет командам сосредоточиться на создании рабочих процессов обработки данных, а не на обслуживании серверов.
Получайте помощь на основе искусственного интеллекта на протяжении всего процесса интеграции данных: от автоматической генерации кода ETL до модернизации заданий Spark. AWS Glue обеспечивает интеллектуальную генерацию кода, обновления Spark с помощью искусственного интеллекта и встроенные средства устранения неполадок Spark.
Интегрируйте данные, где бы они не находились, с помощью быстрого и простого подключения к источникам данных в Amazon SageMaker нового поколения. Создайте проект по обработке данных с помощью AWS Glue, Amazon Athena, Amazon EMR и MWAA (все это в Amazon SageMaker) и воспользуйтесь преимуществами единой среды для управления и мониторинга. Возможности обработки данных AWS Glue доступны в блокнотах Amazon SageMaker и визуальном ETL Amazon SageMaker.

Примеры использования

Упростите управление конвейером ETL

Избавьтесь от необходимости в управлении удаленной инфраструктурой благодаря автоматическому распределению и управлению работниками, используйте один сервис, который удовлетворит все ваши потребности по интеграции данных.

Поддержка различных платформ и рабочих нагрузок для обработки

Упростите обеспечение поддержки различных платформ обработки данных, таких как ETL и ELT, и различных рабочих нагрузок, включая пакеты, микропакеты и потоки.

Интерактивное изучение, экспериментирование и обработка данных

Используя интерактивные сеансы AWS Glue, специалисты по работе с данными могут в интерактивном режиме изучать и подготавливать данные с использованием интегрированной среды разработки (IDE) или выбранного блокнота.

Эффективное обнаружение данных

Быстро идентифицируйте данные в AWS, локальной среде или других облаках, а затем делайте их сразу же доступными для опроса и преобразования.

Что нового?

  • Date (Newest to Oldest)
Нет результатов
1

Подробнее об AWS