Panoramica
La soluzione per i dati in streaming per Amazon MSK consente di acquisire dati in streaming utilizzando Streaming gestito da Amazon per Apache Kafka (Amazon MSK), un servizio di archiviazione estremamente scalabile in grado di gestire elevati volumi di dati provenienti dai produttori di dati. Per producer si intendono migliaia di origini dati, ognuna delle quali genera continuamente dati in streaming, inviati, di solito, sotto forma di record di piccole dimensioni (kilobyte) in contemporanea.
I flussi di dati sono composti da svariati tipi di dati, ad esempio i file di log generati dai clienti che utilizzano applicazioni Web o su dispositivi mobili, acquisti effettuati su siti di e-commerce, eventi all'interno di videogiochi, informazioni provenienti da social network, dati di transazioni finanziarie, servizi di geolocalizzazione e di telemetria relativi a dispositivi connessi o strumentazioni in data center.
Questa soluzione AWS fornisce quattro modelli di AWS CloudFormation in cui i dati fluiscono attraverso producer, archiviazione di streaming, consumer e destinazioni. Analogamente alla soluzione di dati in streaming per Amazon Kinesis, i modelli vengono configurati per applicare le best practice alla funzionalità di monitoraggio e proteggere i dati tramite allarmi e pannelli di controllo.
Vantaggi
Dettagli tecnici
Questa architettura può essere implementata automaticamente consultando la Guida all'implementazione e il modello AWS CloudFormation allegato.
-
Opzione 1
-
Opzione 2
-
Opzione 3
-
Opzione 4
-
Opzione 1
-
Modello AWS CloudFormation con Streaming gestito da Amazon per Apache Kafka (Amazon MSK)
Fase 1
Questo modello AWS CloudFormation distribuisce implementa un cluster Amazon Managed Streaming per Apache Kafka (MSK).
Fase 2
Un pool di utenti di Amazon Cognito viene utilizzato per controllare chi può invocare i metodi della REST API.Informazioni su questa implementazioneData di pubblicazione- Data di pubblicazione
Opzioni di implementazioneTutto pronto per iniziare?Implementa questa soluzione avviandola nella tua Console AWS -
Opzione 2
-
Modello di AWS CloudFormation con Amazon MSK e AWS Lambda
Fase 1
Questo modello AWS CloudFormation implementa una funzione AWS Lambda la quale elabora i record in un argomento Apache Kafka. La funzione predefinita è un'applicazione Node.js che registra i messaggi ricevuti, ma che può essere personalizzata a seconda delle tue esigenze aziendali.Informazioni su questa implementazioneData di pubblicazione- Data di pubblicazione
Opzioni di implementazioneTutto pronto per iniziare?Implementa questa soluzione avviandola nella tua Console AWS -
Opzione 3
-
Modello di AWS CloudFormation con Amazon MSK, AWS Lambda e Amazon Kinesis Data Firehose
Fase 1
Una funzione Lambda che elabora i registri in un argomento di Apache Kafka.Fase 2
Un flusso di consegna Amazon Kinesis Data Firehose che esegue il buffering dei dati prima di consegnarli a destinazione.Fase 3
Un bucket Amazon Simple Storage Service (Amazon S3) che archivia tutti gli eventi originali dal cluster Amazon MSK.Informazioni su questa implementazioneData di pubblicazione- Data di pubblicazione
Opzioni di implementazioneTutto pronto per iniziare?Implementa questa soluzione avviandola nella tua Console AWS -
Opzione 4
-
Modello AWS CloudFormation con Amazon MSK, servizio gestito da Amazon per Apache Flink e Amazon S3
Fase 1
Un notebook del servizio gestito da Amazon per Apache Flink Studio che legge gli eventi da un argomento esistente in un cluster Amazon MSK.Fase 2
Un bucket S3 memorizza l'output.Informazioni su questa implementazioneData di pubblicazione- Data di pubblicazione
Opzioni di implementazioneTutto pronto per iniziare?Implementa questa soluzione avviandola nella tua Console AWS
Contenuto correlato
Questo post tratta i modelli e le soluzioni che possono essere utilizzati per supportare argomenti MSK in S3, che consente ai clienti di ridurre le impostazioni della retention dei dati a lungo termine in MSK. Alcuni clienti archiviano dati a lungo termine in MSK ai fini di analisi dei dati e dei carichi di lavoro del machine learning. Condividiamo un modello per semplificare questa architettura mediante la ripartizione dei dati degli argomenti in S3 e utilizziamo S3 per l'analisi o il ML.
In questo corso gestito dall'utente illustriamo il processo delle soluzioni di analisi dei dati di pianificazione e i vari processi di analisi dei dati interessati.