Amazon DataZone: rilevamento automatico dei dati
Panoramica
Nessuna necessità di inserimento manuale degli attributi dei dati nel catalogo dati, riducendo così il rischio di errori. Generazione di un contesto aziendale e consigli di analisi per i set di dati, il che determina un miglioramento dei risultati della scoperta dei dati. Scopri da dove provengono i tuoi dati e quali origini saranno influenzate dalle modifiche. Inoltre, un aumento della ricchezza dei dati nel catalogo aziendale migliora anche l'esperienza di ricerca. Riduzione del tempo dedicato alla ricerca e all'utilizzo dei dati da alcune settimane a pochi giorni.
Casi d'uso
Video
Domande frequenti
Che tipo di informazioni si trovano nel catalogo di dati aziendali di Amazon DataZone?
Nel catalogo dei dati aziendali di Amazon DataZone, i metadati aziendali forniscono informazioni create o utilizzate dai membri dell’azienda e forniscono un contesto ai dati organizzativi. Ciò potrebbe includere le seguenti informazioni:
- Proprietà: le moderne organizzazioni incentrate sui dati utilizzano un processo di gestione dei dati distribuito in cui le linee di business (LOB) sono responsabili della gestione dei propri dati. Un catalogo tiene traccia di tale proprietà in modo che le parti interessate possano trovare e richiedere l'accesso ai dati nell'ambito delle loro attività aziendali.
- Classificazione: il rilevamento dei dati è un'attività chiave che i metadati aziendali possono supportare. Questo processo utilizza ontologie e tassonomie aziendali definite centralmente per classificare le origini dati e aiuta a trovare oggetti di dati pertinenti.
- Relazioni: puoi utilizzare il catalogo di dati aziendali di Amazon DataZone per aggiungere informazioni sulle relazioni come metadati. Come per uno schema di set di dati tecnici, il catalogo di dati aziendali mostra le relazioni tra gli oggetti del catalogo, ad esempio quelle tra database, set di dati e le relative colonne.
- Schema: i suggerimenti dell'IA per le descrizioni possono utilizzare lo schema tecnico e aziendale per generare descrizioni e utilizzi consigliati per i dati.
- Origine e consumo: la derivazione dei dati e l'analisi dell'impatto, nonché le mappature personalizzate di OpenLineage, sono collegate al catalogo dei dati aziendali.
Cosa posso catalogare con Amazon DataZone?
Amazon DataZone supporta le risorse di dati pubblicati direttamente dal Catalogo dati AWS Glue e Amazon Redshift. Queste due origini possono essere utilizzate per catalogare i dati nelle seguenti posizioni:
- Data lake Amazon Simple Storage Service (Amazon S3)
- Molti dei database AWS dedicati come Amazon Relational Database Service (Amazon RDS) tramite un crawler AWS Glue
- Oltre 100 connettori Amazon AppFlow, per importare dati da applicazioni di terze parti come Snowflake, Salesforce e Google Analytics