Amazon DataZone: Otomatiskan Penemuan Data
Ikhtisar
Hapus waktu dari entri manual atribut data dalam katalog data, yang juga menimbulkan potensi kesalahan. Hasilkan konteks bisnis dan rekomendasikan analisis untuk set data, yang meningkatkan hasil penemuan data. Pahami asal data Anda, dan sumber yang akan terdampak oleh perubahan. Data yang lebih banyak dan lebih kaya dalam katalog data bisnis juga meningkatkan pengalaman pencarian. Kurangi waktu Anda dalam mencari dan menggunakan data dari berminggu-minggu menjadi beberapa hari.
Kasus penggunaan
Video
FAQ
Informasi apa yang terdapat dalam katalog data bisnis Amazon DataZone?
Dalam katalog data bisnis Amazon DataZone, metadata bisnis menyediakan informasi yang disusun atau digunakan oleh pebisnis dan memberikan konteks pada data organisasi. Hal ini dapat mencakup informasi berikut:
- Kepemilikan: Organisasi modern yang berpusat pada data menggunakan proses pengelolaan data terdistribusi tempat lini bisnis (LOB) bertanggung jawab untuk mengelola data mereka sendiri. Katalog melacak kepemilikan tersebut sehingga pihak yang tertarik dapat menemukan dan meminta akses ke data sebagai bagian dari tugas bisnis mereka.
- Klasifikasi: Penemuan data adalah tugas utama yang dapat didukung oleh metadata bisnis. Penemuan data menggunakan ontologi dan taksonomi perusahaan yang ditentukan secara terpusat untuk mengklasifikasikan sumber data serta memungkinkan Anda menemukan objek data yang relevan.
- Hubungan: Anda dapat menggunakan katalog data Amazone DataZone untuk menambahkan informasi hubungan sebagai metadata. Seperti skema set data teknis, katalog data bisnis menunjukkan hubungan antara objek dalam katalog, seperti hubungan antara basis data, set data, dan kolomnya.
- Skema: Rekomendasi AI untuk deskripsi dapat menggunakan skema teknis dan bisnis untuk menghasilkan deskripsi dan penggunaan data yang direkomendasikan.
- Asal dan konsumsi: Analisis dampak dan silsilah data, serta pemetaan kustom dari OpenLineage, ditautkan ke dalam katalog data bisnis.
Apa yang dapat saya katalogkan dengan Amazone DataZone?
Amazon DataZone mendukung aset data yang diterbitkan langsung dari Katalog Data AWS Glue dan Amazon Redshift. Kedua sumber ini dapat digunakan untuk membuat katalog data di lokasi berikut:
- Danau data Amazon Simple Storage Service (Amazon S3)
- Banyak basis data yang dibuat khusus AWS seperti Amazon Relational Database Service (Amazon RDS) melalui perayap AWS Glue
- Lebih dari 100 konektor Amazon AppFlow, untuk membawa data dari aplikasi pihak ketiga, seperti Snowflake, Salesforce, dan Google Analytics