게시된 날짜: Nov 19, 2020
AWS Glue의 서버리스 기능인 AWS Glue 스키마 레지스트리를 통해 추가 요금 없이 등록된 Apache Avro 스키마를 사용하여 스트리밍 데이터의 발전을 검증하고 제어할 수 있습니다. Apache 라이선스 직렬화 및 역직렬화를 통해 스키마 레지스트리는 Apache Kafka/Amazon Managed Streaming for Apache Kafka (MSK), Amazon Kinesis Data Streams, Apache Flink/Amazon Kinesis Data Analytics for Apache Flink 및 AWS Lambda용으로 개발된 Java 애플리케이션과 통합됩니다.
스키마는 애플리케이션에서 생성한 데이터 레코드(이벤트라고도 함)의 구조 및 형식을 정의합니다. 예를 들어 스키마는 이벤트 타임스탬프, 고객 ID, 이메일 주소 및 웹페이지에서 수행된 조치에 대한 고유 식별자와 같은 필드 그룹에서 정의할 수 있습니다. 데이터 생산 애플리케이션이 스키마에서 필드를 추가하거나 제거하는 경우(예: 이메일 주소가 제거됨) 데이터 품질이 저하될 수 있으며 다운스트림 애플리케이션이 실패할 수 있습니다. 이러한 문제를 방지하기 위해 개발자는 종종 애플리케이션 내에 방어 코드를 작성하거나 유지 관리 창을 사용하여 업스트림과 다운스트림 팀 간에 스키마 변경 사항을 조정하거나 단일 기술하고만 사용할 수 있는 타사 스키마 레지스트리를 사용합니다.
스키마 레지스트리를 사용하여 방어 코딩 및 여러 팀 간에 조정을 제거하고, 데이터 품질을 개선하고, 다운스트림 애플리케이션 오류를 줄이고, 다중 AWS 서비스에서 통합된 레지스트리를 사용할 수 있습니다. 데이터 스트리밍 애플리케이션이 스키마 레지스트리와 통합되는 경우 데이터 생산에 사용되는 스키마는 중앙 레지스트리 내의 스키마에 대해 검증되므로 중앙에서 데이터 품질을 제어할 수 있습니다. 각 스키마는 호환성 모드의 가드레일 내에서 버전이 지정될 수 있어 개발자에게 스키마 발전을 제어하는 유연성을 제공합니다. 현재 Apache Kafka/Amazon MSK 및 Amazon Kinesis Data Streams에 대해 구축된 애플리케이션과 스키마 레지스트리를 사용하거나 API를 사용하여 자체 통합을 구축할 수 있습니다. 시간이 지남에 따라 AWS에서는 스키마 레지스트리를 다른 AWS 서비스 및 오픈 소스 프레임워크와 통합하고 Avro가 아닌 데이터 형식과 Java가 아닌 클라이언트에 대한 지원을 확장할 계획입니다.
스키마 레지스트리 사용 설명서를 확인하여 시작하고 자세히 알아보십시오.
스키마 레지스트리는 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), 캐나다(중부), 남아메리카(상파울루), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), EU(프랑크푸르트), EU(아일랜드), EU(런던), EU(파리), EU(스톡홀름) AWS 리전에서 제공됩니다.