Senza un'adeguata supervisione, i data lake possono diventare paludi di dati. L'impostazione dei controlli della qualità dei dati è lunga, noiosa e soggetta a errori. È necessario creare manualmente regole di qualità dei dati e scrivere codice per monitorare le pipeline di dati e avvisare i consumatori di dati quando la qualità dei dati peggiora. La qualità dei dati di AWS Glue riduce questi sforzi manuali di qualità da giorni a ore. Calcola automaticamente le statistiche, consiglia regole di qualità, monitora e avvisa l'utente quando rileva problemi. Per problemi nascosti e difficili da trovare, la qualità dei dati di Glue utilizza algoritmi ML. La potenza combinata dell'approccio basato su regole e ML, insieme alla soluzione serverless, dimensionabile e aperta, consente di fornire dati di alta qualità per prendere decisioni aziendali sicure.