Domande generali
D: Che cos'è AWS DataSync?
R: AWS DataSync è un servizio di trasferimento e rilevamento di dati online che semplifica e accelera le migrazioni di dati verso AWS, nonché il trasferimento di dati tra archiviazione on-premise, posizioni edge, altri fornitori cloud e AWS Storage.
AWS DataSync Discovery semplifica la pianificazione della migrazione e accelera la migrazione dei dati verso AWS fornendo visibilità sulle prestazioni e l'utilizzo dell'archiviazione on-premise. Inoltre, offre consigli per la migrazione dei dati verso servizi di AWS Storage. DataSync Discovery permette di comprendere più a fondo le prestazioni e l'utilizzo della capacità dell'archiviazione on-premise attraverso funzioni automatizzate di raccolta e l'analisi dei dati. In tal modo, potrai identificare rapidamente i dati da migrare e utilizzare i suggerimenti generati per selezionare i servizi di AWS Storage conformi ai tuoi requisiti di prestazioni e capacità.
Per i trasferimenti di dati online, AWS DataSync semplifica, automatizza e accelera la copia di grandi quantità di dati tra archiviazione on-premise, posizioni edge o altri fornitori cloud e i servizi di AWS Storage. DataSync può copiare i dati tra condivisioni di Network File System (NFS), condivisioni di Server Message Block (SMB), file system distribuito Hadoop (HDFS), archiviazione di oggetti autogestiti, Google Cloud Storage, Azure Files, Azure Blob Storage tra cui Azure Data Lake Storage Gen2 (anteprima), Wasabi Cloud Storage, Oracle Cloud Storage, Cloudflare R2 Storage, DigitalOcean Spaces, Backblaze B2 Cloud Storage, AWS Snowcone, archiviazione compatibile con Amazon S3 su Snow, Amazon Simple Storage Service (Amazon S3), file system Amazon Elastic File System (Amazon EFS), file system Amazon FSx per Windows File Server, file system Amazon FSx per Lustre, file system Amazon FSx per OpenZFS e file system Amazon FSx per NetApp ONTAP.
D: Quali vantaggi offre AWS DataSync?
R: AWS DataSync permette di individuare e trasferire i dati in modo rapido e sicuro. Utilizzando DataSync Discovery, è possibile comprendere più a fondo l'utilizzo dell'archiviazione on-premise e ricevere consigli utili alle stime sui costi e ai piani per effettuare la migrazione in AWS. Per il trasferimento dei dati, puoi usare DataSync per copiare grandi set di dati con milioni di file senza dover creare soluzioni personalizzate con strumenti open source o acquistare licenze e gestire costosi software commerciali di accelerazione della rete. Puoi utilizzare DataSync per eseguire la migrazione di dati attivi verso AWS, archiviare i dati per liberare la capacità di archiviazione on-premise, replicare i dati in AWS per garantire la continuità aziendale o trasferire i dati al cloud per l'analisi e l'elaborazione.
D: Quali problemi risolve AWS DataSync Discovery?
R: AWS DataSync Discovery semplifica e accelera la migrazione dei dati verso AWS. Grazie a DataSync Discovery, è possibile raccogliere automaticamente dati sui sistemi di archiviazione on-premise e visualizzare i risultati aggregati nella console DataSync. DataSync Discovery analizza prestazioni, capacità e utilizzo in base ai dati raccolti e consigli i servizi di AWS Storage per la migrazione. Con DataSync Discovery è possibile comprendere più a fondo l'utilizzo dell'archiviazione on-premise, identificare rapidamente i dati da migrare e selezionare i servizi di AWS Storage adatti alle esigenze di prestazioni e a ottimizzare i costi di archiviazione.
D: Quali problemi risolve AWS DataSync?
R: AWS DataSync riduce la complessità e i costi del trasferimento di dati online, semplificando il trasferimento di set di dati tra sistemi di archiviazione on-premise, posizioni edge, altri fornitori cloud e servizi di AWS Storage. DataSync si connette ai sistemi di archiviazione e alle origini dati esistenti tramite protocolli di archiviazione standard (NFS, SMB) come un client HDFS, utilizzando l'API Amazon S3 o altre API di archiviazione cloud. Utilizza un protocollo di rete specifico e un'architettura scalabile per accelerare il trasferimento di dati tra i sistemi di archiviazione e i servizi AWS. DataSync ridimensiona e gestisce automaticamente le risorse spostando i file e gli oggetti, programmando i trasferimenti dei dati, monitorando l'avanzamento dei trasferimenti, la crittografia e la verifica dei trasferimenti di dati e avvisando l'utente di eventuali errori. I costi di DataSync sono calcolati solo in base al volume di dati copiati, senza tariffe minime o pagamenti anticipati.
Discovery
D: Quali sono i sistemi di archiviazione supportati da AWS DataSync Discovery?
Attualmente AWS DataSync Discovery supporta array di serie NetApp FAS e AFF che eseguono ONTAP 9.7 o versioni successive. Nel corso del tempo verrà implementato il supporto per ulteriori sistemi di archiviazione.
D: Quali informazioni raccoglie AWS DataSync Discovery sul mio sistema di archiviazione?
AWS DataSync Discovery utilizza la tua interfaccia API di gestione dell'archiviazione per raccogliere informazioni sul sistema di archiviazione insieme a parametri su prestazioni e utilizzo. Le informazioni sul sistema includono attributi quali capacità di archiviazione totale, configurazione del volume, nomi di esportazioni/condivisioni e altro ancora. I parametri del sistema di archiviazione includono prestazioni quali velocità di trasmissione effettiva e IOPS del volume, insieme a parametri di utilizzo quali capacità allocata e utilizzata. DataSync Discovery sfrutta le informazioni e i parametri sul sistema raccolti per generare suggerimenti per la migrazione verso AWS Storage.
D: In che modo AWS DataSync Discovery determina i suoi suggerimenti?
AWS DataSync Discovery analizza i dati raccolti dal sistema di archiviazione on-premise e li confronta con le funzionalità, la capacità e le caratteristiche prestazionali dei servizi di archiviazione AWS. Laddove appropriato, DataSync Discovery proporrà uno o più servizi di archiviazione AWS da valutare.
D: Posso usare AWS DataSync Discovery con i miei sistemi di produzione? Quale impatto avrà su utenti e applicazioni?
Se AWS DataSync Discovery viene usato con i sistemi di archiviazione on-premise, non vi sarà alcun impatto significativo su utenti e applicazioni.
D: AWS DataSync Discovery dove archivia i dati raccolti riguardanti i sistemi di archiviazione?
I dati raccolti saranno archiviati e gestiti dal servizio DataSync. I dati sono visibili nella console AWS DataSync o accessibili utilizzando AWS CLI o AWS Software Development Kit (SDK).
D: Per quanto tempo AWS DataSync Discovery archivia i dati raccolti attraverso un processo di individuazione?
I dati raccolti e i suggerimenti verranno mantenuti per 60 giorni dal termine del processo di individuazione.
Trasferimento dati
R: DataSync supporta i seguenti tipi di posizione di archiviazione: condivisioni di Network File System (NFS), condivisioni di Server Message Block (SMB), file system distribuiti Hadoop (HDFS), archiviazione di oggetti autogestiti, Google Cloud Storage, Azure Files, Azure Blob Storage compreso Azure Data Lake Storage Gen2, Wasabi Cloud Storage, Oracle Cloud Storage, Cloudflare R2 Storage, DigitalOcean Spaces, Backblaze B2 Cloud Storage, AWS Snowcone, archiviazione compatibile con Amazon S3 su Snow, Amazon Simple Storage Service (Amazon S3), file system Amazon Elastic File System (Amazon EFS), file system Amazon FSx per Windows File Server, file system Amazon FSx per Lustre, file system Amazon FSx per OpenZFS e file system Amazon FSx per NetApp ONTAP.
D: Come posso usare AWS DataSync per effettuare la migrazione dei dati su AWS?
R: AWS DataSync ti permette di migrare i tuoi dati on-premise, su edge o in altri cloud ad Amazon S3, Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS e Amazon FSx per NetApp ONTAP. Configura DataSync per effettuare una copia iniziale dell'intero set di dati e programmare il seguente trasferimento incrementale di dati di modifica fino al trasferimento finale da on-premise ad AWS. DataSync include la crittografia e la verifica di integrità dei dati, per accertare che vengano trasmessi in modo sicuro e completo e siano subito pronti all'uso. Per minimizzare l'impatto sui carichi di lavoro che necessitano della connessione di rete, puoi programmare l'esecuzione della migrazione durante le ore non lavorative o limitare il totale della larghezza di banda della rete utilizzata da DataSync configurando il throttling della larghezza di banda integrato. DataSync preserva i metadati tra sistemi di storage che hanno strutture di metadati simili, consentendo una transizione senza problemi di utenti finali e applicazioni all'utilizzo del tuo servizio di storage AWS di destinazione.
Consulta il blog sull'archiviazione "Migrazione dell'archiviazione con AWS DataSync" per ulteriori informazioni su best practices e suggerimenti sulla migrazione.
D: Come posso utilizzare AWS DataSync per archiviare i dati inattivi?
R: Puoi utilizzare AWS DataSync per spostare i dati inattivi da sistemi di archiviazione on-premise direttamente ad archiviazioni a lungo termine sicure e durevoli, ad esempio recupero flessibile Amazon S3 Glacier (precedentemente S3 Glacier) o Deep Archive Amazon S3 Glacier. Utilizza i filtri di esclusione di DataSync per escludere la copia di file e cartelle temporanei o utilizza i filtri di inclusione o i manifesti per copiare solo un sottoinsieme di file dalla posizione di origine. Puoi selezionare il servizio di archiviazione più economico secondo le tue necessità: trasferisci i dati a una classe di archiviazione S3 o utilizza DataSync con EFS Lifecycle Management per archiviare i dati nella classe di archiviazione ad accesso infrequente di Amazon EFS (EFS IA). Utilizza la funzionalità di programmazione delle attività integrata per archiviare regolarmente i dati che devono essere conservati per questioni di conformità o audit, come i log, i filmati grezzi o le cartelle cliniche elettroniche.
D: Come posso utilizzare AWS DataSync per replicare i dati in AWS per la continuità aziendale?
R: AWS DataSync ti permette di replicare i file periodicamente in tutte le classi di archiviazione di Amazon S3 o inviare i dati ad Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS o Amazon FSx per NetApp ONTAP per un file system in standby. Utilizza la funzionalità programmata delle attività integrate per assicurarti che le modifiche al set di dati vengano regolarmente copiate nella tua archiviazione di destinazione. Leggi questo articolo del blog sull’archiviazione AWS per scoprire di più sulla protezione dei dati con AWS DataSync.
D: Come posso utilizzare AWS DataSync per i trasferimenti ricorrenti tra sistemi locali e AWS per i flussi di lavoro continui?
R: Puoi utilizzare AWS DataSync per i trasferimenti continui da sistemi locali in AWS o all'esterno di AWS per l'elaborazione. DataSync può velocizzare i flussi di lavoro di storage nel cloud ibrido più critici in settori che devono spostare file attivi in AWS molto rapidamente. Alcuni esempi sono il machine learning nelle scienze biologiche, la produzione video nel settore multimediale e dell'intrattenimento, l'analisi dei Big Data per i servizi finanziari e la ricerca sismica nel settore Oil & Gas. DataSync fornisce un risultato rapido per evitare il ritardo dei processi interni. È possibile specificare filtri o manifesti di inclusione ed esclusione per specificare quali file o oggetti devono essere trasferiti ogni volta che viene eseguita l'attività.
D: Posso utilizzare AWS DataSync per copiare i dati da altri cloud su AWS?
R: Sì. Utilizzando AWS DataSync, puoi copiare dati da Google Cloud Storage utilizzando l'API Amazon S3, da Azure Files utilizzando il protocollo SMB o da Azure Blob Storage incluso Azure Data Lake Storage Gen 2. Puoi anche spostare i dati da Wasabi Cloud Storage, Oracle Cloud Storage, Cloudflare R2 Storage, DigitalOcean Spaces e Backblaze B2 Cloud Storage. Implementa l'agente DataSync nel tuo ambiente cloud o su Amazon EC2, crea le tue posizioni di origine e destinazione, quindi avvia l'attività per iniziare a copiare i dati. Scopri di più sulle soluzioni AWS per ambienti ibridi e multicloud.
D: Posso utilizzare AWS DataSync per creare il mio data lake?
R: Sì. Con AWS DataSync, puoi costruire facilmente il tuo data lake automatizzando il trasferimento di set di dati on-premise o dei dati in altri cloud su Amazon S3. DataSync abilita un trasferimento semplice e rapido dell'intero set di dati mediante protocolli di archiviazione standard (NFS, SMB) come un client HDFS, utilizzando l'API Amazon S3 o utilizzando l’API di archiviazione cloud. Dopo aver trasferito il set di dati iniziale, puoi pianificare i successivi trasferimenti di nuovi dati ad AWS. DataSync include la crittografia e la verifica di integrità dei dati, per accertare che vengano trasmessi in modo sicuro e completo e siano subito pronti all'uso. Per minimizzare l'impatto sui carichi di lavoro che necessitano della connessione di rete, puoi programmare l'esecuzione dei trasferimenti durante le ore non lavorative o limitare il totale della larghezza di banda della rete utilizzata da DataSync configurando il throttling della larghezza di banda integrato. Una volta che i tuoi dati sono giunti su Amazon S3, puoi utilizzare i servizi AWS nativi per eseguire analisi di Big Data, intelligenza artificiale (IA), machine learning (ML), high-performance computing (HPC) e applicazioni di elaborazione dei dati multimediali per ottenere informazioni dai tuoi set di dati non strutturati. Leggi la pagina web sull'archiviazione di data lake di AWS per saperne di più sulla costruzione e lo sfruttamento del tuo data lake.
D: Come posso utilizzare AWS DataSync per trasferire i dati tra i servizi di archiviazione AWS?
R: DataSync ti permette di trasferire file o oggetti tra Amazon S3, Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS o Amazon FSx per NetApp ONTAP all'interno dello stesso account AWS. Puoi trasferire i dati tra i servizi AWS nella stessa regione AWS, tra servizi in regioni commerciali AWS diverse (tranne la Cina) o tra regioni AWS GovCloud (Stati Uniti orientali e Stati Uniti occidentali). Per questo processo non è richiesto un agente DataSync e puoi effettuare la configurazione end to end utilizzando la console AWS DataSync, l'interfaccia a riga di comando (CLI) AWS o AWS Software Development Kit (SDK).
D: Posso utilizzare AWS DataSync per migrare ad Amazon WorkDocs?
R: Sì. AWS DataSync accelera le fasi necessarie per il servizio di migrazione Amazon WorkDocs automatizzando il caricamento dei file nel bucket di Amazon S3 utilizzato per la migrazione. DataSync semplifica e velocizza la migrazione di home directory e di condivisioni di dipartimenti su WorkDocs. Per ulteriori informazioni sull'utilizzo di DataSync per le migrazioni su WorkDocs, leggi il blog Migrating network file shares to Amazon WorkDocs using AWS DataSync.
Utilizzo
Q: Come si comincia a usare AWS DataSync Discovery?
Comincia a implementare un agente AWS DataSync nel tuo ambiente VM on-premise. Utilizzando la console DataSync, la CLI o l'SDK, configura DataSync Discovery affinché si colleghi alla tua archiviazione on-premise ed esegui processi di individuazione per raccogliere dati sul tuo sistema di archiviazione insieme a parametri su prestazioni, capacità e utilizzo. Durante l'esecuzione dei processi di individuazione, le informazioni sui sistemi di archiviazione sono visibili nei pannelli di controllo all'interno della console DataSync. Al termine di un processo di individuazione, i dati raccolti vengono analizzati per generare suggerimenti per la migrazione verso servizi di archiviazione AWS come Amazon EFS, Amazon FSx e Amazon S3. Tali suggerimenti possono agevolare la scelta dei servizi di AWS Storage ed è possibile utilizzare AWS DataSync per trasferire i dati.
D: Come si comincia a eseguire il trasferimento dei dati con AWS DataSync?
R: È possibile avviare un trasferimento di dati con AWS DataSync con pochi clic nella Console di gestione AWS oppure attraverso l'interfaccia a riga di comando di AWS (CLI). Per iniziare, segui questi 3 passaggi:
1. Per trasferire i dati tra i sistemi di archiviazione on-premise, edge o altri cloud e i servizi di archiviazione AWS, devi implementare un agente - Implementa un agente DataSync e associalo all'account AWS tramite la console di gestione o l'API. L'agente sarà utilizzato per accedere al server NFS, alla condivisione file SMB, al cluster Hadoop o all'archiviazione di oggetti autogestiti o cloud per leggere e scrivere dati. La distribuzione dell'agente non è obbligatoria per trasferire i dati tra servizi di storage AWS all'interno dello stesso account AWS.
2. Creazione di un'attività di trasferimento dati: crea un'attività specificando il percorso dell'origine e della destinazione dei dati ed eventuali opzioni di configurazione del trasferimento, ad esempio la pianificazione dell'attività e l’abilitazione dei report sulle attività.
3. Avvia il trasferimento: avvia l'attività, monitora il movimento dei dati nella console o con Amazon CloudWatch e controlla le attività di trasferimento audit utilizzando i report delle attività.
D: In che modo è possibile distribuire un agente AWS DataSync?
R: Puoi implementare un agente AWS DataSync verso un hypervisor on-premise, nell’ambiente cloud pubblico o su Amazon EC2. Per copiare i dati da o verso un file server on-premise o nello spazio di archiviazione compatibile con Amazon S3 su Snow, è necessario scaricare l'immagine della macchina virtuale dell'agente dalla console AWS e implementarla on-premise sull'hypervisor VMware ESXi, su macchine virtuali basate su kernel (KVM) di Linux o su Microsoft Hyper-V. L'agente deve essere implementato in modo che possa accedere al tuo server di file utilizzando il protocollo NFS, SMB, accedere a NameNodes e DataNodes nel tuo cluster Hadoop o accedere all'archiviazione di oggetti utilizzando l'API di Amazon S3. Per impostare i trasferimenti tra S3 sui bucket AWS Outposts e i bucket S3 nelle regioni AWS, implementa l'agente sul tuo Outpost. Per impostare i trasferimenti tra il dispositivo AWS Snowcone e l'archiviazione AWS, utilizza l'AMI dell’agente DataSync preinstallato sul dispositivo.
Quando copi i dati tra il tuo ambiente cloud pubblico e l’archiviazione AWS, puoi distribuire l'agente DataSync nel tuo ambiente cloud o su Amazon EC2. Poiché AWS DataSync comprime i dati in transito tra l'agente AWS DataSync e i servizi di archiviazione AWS, potresti essere in grado di ridurre le tariffe in uscita distribuendo l'agente AWS DataSync nel tuo ambiente cloud pubblico.
L'implementazione dell'agente non è obbligatoria per trasferire i dati tra servizi di archiviazione AWS all'interno dello stesso account AWS. Per copiare i dati da o su un file server in cloud gestito dal cliente o tra servizi di storage AWS in account AWS diversi, devi avviare un'istanza Amazon EC2 utilizzando l'AMI di un agente DataSync.
D: Quali sono i requisiti di utilizzo dell'agente AWS DataSync?
R: È possibile trovare qui le risorse minime richieste per eseguire l'agente.
D: Come si avvia un'attività di trasferimento dati AWS DataSync?
R: AWS DataSync avvia la copia dei dati quando viene eseguita un'attività tramite la Console di gestione AWS o l'interfaccia a riga di comando AWS (CLI). A ogni esecuzione dell'attività, ricerca eventuali modifiche nei file di origine e di destinazione ed esegue una copia delle differenze dei metadati tra l'origine e la destinazione. È possibile configurare quali caratteristiche dell'origine vengono utilizzate per determinare le variazioni, definire filtri di inclusione ed esclusione o manifesti per trasferire dati di file e oggi specifici e controllare se i file o gli oggetti nella destinazione debbano essere sovrascritti quando vengono modificati nell'origine o eliminati se non si trovano più all'origine.
D: In che modo AWS DataSync garantisce che i miei dati vengano copiati correttamente?
R: Mentre AWS DataSync trasferisce e archivia i dati, esegue i controlli di integrità per assicurarsi che i dati scritti nella destinazione corrispondano ai dati letti all'origine. Inoltre, può essere effettuato un ulteriore controllo di verifica per comparare l'origine e la destinazione alla fine del trasferimento. DataSync calcolerà e comparerà la checksum dei file completa dei dati archiviati nell'origine e nella destinazione. È possibile verificare sia il set di dati completo sia soltanto i file o gli oggetti trasferiti da DataSync.
D: In che modo è possibile monitorare lo stato dei dati durante il trasferimento con AWS DataSync?
R: È possibile utilizzare i report sulle attività per controllare i processi di trasferimento dei dati verificando le operazioni di trasferimento in tutte le esecuzioni delle attività. Utilizzando i report sulle attività, è possibile ottenere un rapporto di riepilogo insieme a report dettagliati per tutti i file trasferiti, ignorati, verificati ed eliminati, per ogni esecuzione di attività. I report sulle attività forniscono il numero totale di file e byte trasferiti e includono attributi di file come dimensione, percorso, timestamp, checksum dei file e ID delle versioni degli oggetti, ove applicabile. Puoi anche sfruttare AWS Glue, Amazon Athena e Amazon QuickSight per catalogare, interrogare e visualizzare automaticamente i report delle attività per ottenere informazioni critiche sui processi di trasferimento dei dati.
Durante il trasferimento dei dati, è possibile monitorare lo stato e l’avanzamento tramite la Console di gestione AWS o la CLI. Grazie ai parametri di Amazon CloudWatch è possibile visualizzare il numero di file e la quantità di dati già copiati. Puoi anche abilitare la registrazione di singoli file su CloudWatch Logs per identificare ciò che è stato trasferito in un determinato momento, nonché i risultati della verifica dell'integrità del contenuto eseguita da DataSync.
Queste soluzioni insieme semplificano il controllo, il monitoraggio, la reportistica e la risoluzione dei problemi e consentono di fornire aggiornamenti tempestivi alle parti interessate.
D: Posso filtrare i file e le cartelle trasferiti da AWS DataSync?
R: Sì. È possibile specificare un filtro di esclusione, un filtro di inclusione o entrambi per limitare quali file, cartelle o oggetti vengono trasferiti ogni volta che viene eseguito un processo. In alternativa, puoi utilizzare i manifesti per specificare un sottoinsieme di file o oggetti che devono essere trasferiti dalla posizione di origine.
I filtri di inclusione specificano i percorsi di file e cartelle o le chiavi degli oggetti da includere quando il processo viene eseguito e limitano l'ambito di ciò che viene analizzato da DataSync nell’origine e nella destinazione. I filtri di esclusione specificano i percorsi di file e cartelle o le chiavi degli oggetti da escludere dalla copia. Quando si crea o si aggiorna un processo, è possibile configurare sia i filtri di esclusione che di inclusione. Quando si avvia un processo, è possibile ignorare e aggiornare i filtri configurati sull’attività. Leggi questo articolo del blog di archiviazione AWS per scoprire di più sull'utilizzo dei filtri più comuni con DataSync.
Un manifesto è un file formattato in CSV che specifica i percorsi dei file o le chiavi degli oggetti da includere quando viene eseguita l’attività e limitano l'ambito di ciò che viene analizzato da DataSync nell’origine e nella destinazione. Quando si crea o si aggiorna un'attività, è possibile fornire un file manifesto con milioni di file o oggetti di origine e DataSync confronterà e trasferirà solo i file elencati nel manifesto. Quando si avvia un'operazione, è possibile sovrascrivere e aggiornare il file manifesto. Quando vengono copiati dati da Amazon S3, è anche possibile specificare un ID di versione S3 facoltativo di ciascun oggetto da trasferire. Per maggiori dettagli, leggi questo post del blog.
Tieni presente che i filtri e i manifesti non possono essere usati insieme.
D: In che modo l'utilizzo di un file manifesto è diverso dall'utilizzo dei filtri di inclusione?
R: Mentre un manifesto è un elenco esplicito di file o oggetti da trasferire dalla posizione di origine, un filtro include è una stringa che specifica i modelli di file e cartelle da trasferire dall'origine. Vengono copiati solo i file e le cartelle che corrispondono ai modelli del filtro. Un modello può essere un intero percorso di file o cartella o un prefisso che termina con un carattere jolly (*), a indicare che tutti i file o gli oggetti che corrispondono al prefisso devono essere copiati. I filtri di inclusione sono ideali per i clienti che desiderano copiare solo un piccolo set di file o oggetti o alcune cartelle specifiche. I clienti con set di dati noti, ad esempio quelli spostati nell'ambito di un flusso di lavoro automatizzato, possono utilizzare i manifesti per evitare di scansionare l'intero sistema di storage di file o oggetti per determinare le modifiche. Utilizzando un file manifesto, i clienti possono specificare milioni di file o oggetti di origine da trasferire e DataSync confronterà solo i file elencati nel manifesto. I clienti possono anche utilizzare i manifest per copiare versioni specifiche di oggetti dal loro bucket Amazon S3.
D: Posso configurare AWS DataSync per effettuare trasferimenti programmati?
R: Sì. Puoi programmare le tue attività utilizzando la console di AWS DataSync o l'interfaccia a riga di comando AWS (CLI) senza la necessità di scrivere o eseguire script per gestire i trasferimenti ripetuti. La pianificazione delle attività esegue automaticamente le attività secondo il programma configurato, con opzioni orarie, giornaliere o settimanali fornite direttamente nella console. Questo ti permette di assicurarti che le modifiche al tuo set di dati vengano automaticamente individuate e copiate nello storage di destinazione.
D: AWS DataSync preserva la struttura della directory di origine durante la copia dei file?
R: Sì. Durante il trasferimento dei file, AWS DataSync crea nella destinazione la stessa struttura della directory della posizione originale.
D: Cosa accade se un'attività di AWS DataSync viene interrotta?
R: Se un'attività viene interrotta, ad esempio se la connessione di rete viene persa o l'agente AWS DataSync viene riavviato, l'esecuzione successiva dell'attività proseguirà con il trasferimento dei file mancanti e, al termine, i dati saranno completi e coerenti. Ogni volta che un'attività viene avviata, eseguirà una copia incrementale, in cui vengono trasferiti solo i file modificati.
D: È possibile utilizzare AWS DataSync con AWS Direct Connect?
R: Puoi utilizzare AWS DataSync con il tuo collegamento Direct Connect per accedere a endpoint del servizio pubblico o endpoint VPC privati. Quando si utilizzano endpoint VPC, i dati trasferiti tra l'agente DataSync e il servizio AWS non attraversano la rete Internet pubblica né richiedono indirizzi IP pubblici, il che aumenta la sicurezza dei dati quando vengono copiati sulla rete. Al momento DataSync Discovery è supportato solo con gli endpoint del servizio pubblico.
D: AWS DataSync supporta endpoint VPC o AWS PrivateLink?
R: Sì, gli endpoint VPC sono supportati per i casi d'uso di trasferimento dati. È possibile utilizzare gli endpoint VPC per garantire che i dati trasferiti tra l'agente AWS DataSync, indifferentemente se implementati on-premise o nel cloud, non attraversino la rete Internet pubblica o non richiedano indirizzi IP pubblici. L'uso degli endpoint VPC aumenta la sicurezza dei dati mantenendo il traffico di rete all'interno del tuo Amazon Virtual Private Cloud (Amazon VPC). Gli endpoint VPC per DataSync si basano su AWS PrivateLink, una tecnologia scalabile altamente disponibile che consente di connettere privatamente il VPC ai servizi AWS supportati.
D: Come posso configurare AWS DataSync per utilizzare gli endpoint VPC?
R: Per utilizzare gli endpoint VPC con AWS DataSync, è necessario creare un endpoint VPC di interfaccia AWS PrivateLink per il servizio DataSync nel VPC prescelto, quindi scegliere questa interfaccia di rete elastica (ENI) dell'endpoint durante la creazione dell'agente DataSync. Per l'attivazione, l'agente si connetterà all'ENI scelta e successivamente tutti i dati trasferiti dall'agente rimarranno all'interno del VPC configurato. Per configurare gli endpoint VPC, puoi utilizzare la console AWS DataSync, l'interfaccia a riga di comando (CLI) di AWS o il kit SDK AWS. Per saperne di più, consulta Using AWS DataSync in a Virtual Private Cloud (Uso di AWS DataSync in un cloud privato virtuale).
Trasferimento da e verso AWS Storage
D: Quali sono i servizi di AWS Storage supportati da AWS DataSync?
AWS DataSync supporta il trasferimento da, verso o tra Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS e Amazon FSx per NetApp ONTAP.
Amazon S3
D: Posso copiare i miei dati nel recupero istantaneo Amazon S3 Glacier, recupero flessibile Amazon S3 Glacier (in precedenza S3 Glacier), in Deep Archive Amazon S3 Glacier o in altre classi di archiviazione S3?
R: Sì. Quando si configura un bucket S3 da utilizzare con AWS DataSync, è possibile selezionare la classe di storage S3 che DataSync utilizza per archiviare gli oggetti. DataSync supporta l'archiviazione di dati direttamente in S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), recupero istantaneo Amazon S3 Glacier, recupero flessibile Amazon S3 Glacier e Deep Archive Amazon S3 Glacier (Deep Archive S3 Glacier). Per ulteriori informazioni sulle classi di storage di Amazon S3, consulta la guida per gli sviluppatori di Amazon Simple Storage Service.
Gli oggetti di dimensioni inferiori alla capacità della tariffa minima per oggetto verranno archiviate in S3 Standard. Ad esempio, gli oggetti cartella, con dimensioni di zero byte e che contengono soltanto metadati, verranno archiviati in S3 Standard. Leggi le considerazioni relative all'utilizzo delle classi di archiviazione Amazon S3 nella nostra documentazione e alla valutazione dei costi delle richieste S3 quando usi DataSync. Per ulteriori informazioni sulle capacità di ricarica minime, consulta i prezzi di Amazon S3.
D: È possibile copiare i dati fuori dalle classi di archiviazione Standard-IA S3 e One Zone-IA S3?
R: Sì. Quando si utilizza S3 come posizione di origine per un'attività di AWS DataSync, il servizio recupera dal bucket tutti gli oggetti che devono essere copiati nella destinazione. Il recupero degli oggetti dallo storage Standard-IA S3 e One Zone-IA S3 è soggetto a un costo di recupero basato sulla dimensione degli oggetti. Consulta le considerazioni sull'utilizzo delle classi di archiviazione Amazon S3 nella nostra documentazione.
D: È possibile copiare dati dal recupero istantaneo Amazon S3 Glacier, recupero flessibile Amazon S3 Glacier (ex S3 Glacier) e Deep Archive Amazon S3 Glacier?
R: Quando si utilizza S3 come posizione di origine per un'attività di AWS DataSync, il servizio prova a recuperare dal bucket tutti gli oggetti che devono essere copiati nella destinazione. Il recupero di oggetti archiviati nella classe di archiviazione S3 Glacier Instant Retrieval comporterà costi di recupero più elevati in base alle dimensioni degli oggetti. Recuperare gli oggetti archiviati nella classe di storage S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive può comportare un errore. Eventuali errori nel recupero degli oggetti archiviati verranno registrati da DataSync e risulteranno nello stato di completamento dell'attività non riuscito. Leggi le considerazioni relative all'utilizzo delle classi di archiviazione Amazon S3 e alla valutazione dei costi delle richieste S3 quando usi DataSync nella nostra documentazione.
D: In che modo AWS DataSync accede al mio bucket Amazon S3?
R: AWS DataSync assume il ruolo IAM da te fornito. La policy che alleghi al ruolo determina le azioni che il ruolo può eseguire. Questo ruolo può essere auto-generato da DataSync per tuo conto oppure puoi configurare manualmente il ruolo nella titleDocumentazione AWStitle.
D: In che modo AWS DataSync converte file e cartelle da o verso oggetti in Amazon S3?
R: Quando i file o le cartelle vengono copiati su Amazon S3, esiste una relazione uno a uno tra un file o una cartella e un oggetto. I timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni, sono archiviati nei metadati utente S3. Per le condivisioni NFS, i metadati dei file archiviati nei metadati utente S3 sono completamente interoperativi con File Gateway e forniscono accesso basato su file On-Premise ai dati archiviati in Amazon S3 da AWS DataSync.
Quando DataSync copia gli oggetti che contengono questi metadati utente su un server NFS, i metadati del file vengono ripristinati. I link simbolici e i link fissi possono anche essere recuperati durante la copia da NFS a S3.
Quando si copia da una condivisione file SMB, le autorizzazioni POSIX predefinite vengono archiviate nei metadati utente S3. Quando si copia su una condivisione file SMB, la proprietà viene impostata in base all'utente configurato in DataSync per accedere a quella condivisione file, e vengono assegnate autorizzazioni di default.
Quando si esegue la copia da HDFS, timestamp di file e cartelle, la proprietà di utenti e gruppi e le autorizzazioni POSIX vengono archiviate nei metadati dell'utente S3. Quando si esegue la copia da Amazon S3 a HDFS, vengono ripristinati metadati di file e cartelle.
Scopri ulteriori informazioni su come DataSync archivia file e metadati nella nostra documentazione.
D: Quali metadati degli oggetti vengono preservati quando si trasferiscono oggetti tra lo spazio di archiviazione di oggetti gestito dal cliente o Azure Blob Storage e Amazon S3?
R: Quando si trasferiscono oggetti tra lo spazio di archiviazione di oggetti gestito dal cliente e Amazon S3, DataSync copia gli oggetti insieme ai relativi metadati e tag.
D: Quali metadati degli oggetti vengono preservati quando si trasferiscono oggetti tra i bucket Amazon S3?
R: Quando si trasferiscono oggetti tra bucket Amazon S3, DataSync copia gli oggetti insieme ai relativi metadati e tag. DataSync non copia le altre informazioni degli oggetti, come le liste di controllo degli accessi o le precedenti versioni degli oggetti.
D: Quali costi di richiesta e storage di Amazon S3 si applicano quando si utilizzano le classi di storage S3 con AWS DataSync?
R: Alcune classi di storage S3 hanno comportamenti che possono influenzare il costo, come il recupero dei dati, la capacità minima di storage e la durata minima dello storage. DataSync automatizza la gestione dei dati per risolvere questi fattori e fornisce le impostazioni per ridurre al minimo il recupero dei dati.
Per evitare costi relativi alla capacità minima per oggetto, AWS DataSync archivia automaticamente gli oggetti più piccoli in S3 Standard. Per minimizzare i costi del recupero dei dati, puoi configurare DataSync per verificare solo i file che sono stati trasferiti da un'attività specifica. Per evitare costi relativi alla durata minima dello storage, DataSync fornisce controlli per gli oggetti sovrascritti o eliminati. Leggi le considerazioni sui costi quando lavori con le classi di archiviazione di Amazon S3 nella nostra documentazione e valuta i costi delle richieste S3 quando usi DataSync.
D: Posso copiare i dati degli oggetti da e verso i bucket Amazon S3 su AWS Outposts?
R: Sì. Puoi copiare oggetti tra Amazon S3 su AWS Outposts e i bucket Amazon S3 nelle Regioni AWS. AWS DataSync copia gli oggetti insieme ai metadati e ai tag degli oggetti. Affinché DataSync possa accedere ad Amazon S3 sui bucket Outposts, distribuisci un agente DataSync EC2 nel tuo Outpost.
Quando utilizzi DataSync con Amazon S3 su Outposts, puoi trasferire dati da e verso i bucket Amazon S3 solo nelle Regioni AWS. Maggiori informazioni sulle origini e sulle destinazioni supportate per le attività DataSync sono disponibili nella nostra documentazione.
Amazon EFS
D: In che modo AWS DataSync accede al file system Amazon EFS?
R: AWS DataSync accede al file system Amazon EFS tramite il protocollo NFS. Per farlo, il servizio DataSync monta il file system internamente al cloud privato virtuale utilizzando interfacce di rete elastiche (ENI) gestite dal servizio stesso. DataSync, infatti, gestisce la creazione, l'utilizzo e l'eliminazione di queste interfacce in modo automatico. Puoi scegliere di montare il file system EFS utilizzando una destinazione di montaggio o un punto di accesso EFS .
D: Posso utilizzare AWS DataSync con tutte le classi di storage Amazon EFS?
R: Sì. Puoi utilizzare AWS DataSync per copiare i file in Amazon EFS e configurare la Gestione del ciclo di vita EFS per effettuare la migrazione dei file ai quali non è stato effettuato l'accesso per un dato periodo di tempo nella classe di storage di accesso infrequente (IA).
D: Come posso utilizzare AWS DataSync con le policy delle risorse del file system Amazon EFS?
R: Puoi utilizzare sia le policy di identità IAM che le policy delle risorse per controllare l'accesso del client alle risorse Amazon EFS in modo scalabile e ottimizzato per gli ambienti cloud. Quando crei un percorso DataSync per il file system EFS, puoi specificare un ruolo IAM che DataSync dovrà assumere durante l'accesso a EFS. In seguito puoi utilizzare le policy del file system EFS per configurare l'accesso per il ruolo IAM. Dal momento che DataSync monta i file system EFS come utente root, è necessario che la policy IAM consenta l'azione seguente: elasticfilesystem:ClientRootAccess.
D: Posso utilizzare AWS DataSync per replicare il mio file system Amazon EFS in una regione AWS diversa?
R: Sì. Oltre alla replica integrata fornita da Amazon EFS, puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon EFS in un secondo file system di Amazon EFS nello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
D: Quali metadati vengono preservati durante la copia dei dati tra una condivisione NFS e Amazon EFS o tra due file system di Amazon EFS?
R: AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati, fai riferimento alla nostra documentazione.
D: Quali metadati vengono conservati durante la copia dei dati tra HDFS e Amazon EFS?
R: AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX e applica valori di default per ID utenti e gruppi. Per avere maggiori informazioni e per consultare l'elenco completo dei metadati copiati, consulta la nostra documentazione.
Amazon FSx per Windows File Server
D: In che modo AWS DataSync accede al file system Amazon FSx per Windows File Server?
R: AWS DataSync accede a un file system Amazon FSx per Windows File Server tramite il protocollo SMB, effettuando l'autenticazione con il nome utente e la password configurati nella Console AWS o nell'interfaccia a linea d comando. Per farlo, il servizio DataSync monta il file system internamente al VPC utilizzando interfacce di rete elastiche (ENI) gestite dal servizio stesso. DataSync, infatti, gestisce la creazione, l'utilizzo e l'eliminazione di queste interfacce in modo automatico.
D: Quali metadati Windows vengono trasferiti durante la copia tra una condivisione SMB a un file system Amazon FSx for Windows File Server o tra due file system Amazon FSx?
R: AWS DataSync copia i metadati di Windows, inclusi i timestamp del file, il proprietario del file, gli attributi standard del file, la lista degli accessi discrezionali (DACL) di NTFS e le liste di controllo degli accessi al sistema NTFS (SACL). Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.
D: Posso utilizzare AWS DataSync per replicare il mio file system Amazon FSx for Windows File Server in una regione AWS diversa?
R: Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for Windows File Server in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per sia per le implementazioni all'interno della stessa regione sia per quelle tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
Amazon FSx per Lustre
D: In che modo AWS DataSync accede al file system Amazon FSx per Lustre?
R: Quando crei un processo DataSync per copiare da o verso il tuo file system FSx for Lustre, il servizio DataSync creerà delle interfacce di rete elastiche (ENI, Elastic Network Interfaces) nello stesso VPC e nella stessa sottorete dove si trova il tuo file system. DataSync usa queste ENI per accedere al tuo file system FSx for Lustre usando il protocollo Lustre come utente root. Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx for Lustre, puoi specificare fino a cinque gruppi di sicurezza da applicare alle ENI e configurare l'accesso in uscita dal servizio DataSync. I gruppi di sicurezza devono essere configurati per permettere il traffico in uscita sulle porte di rete della richieste da FSx for Lustre. I gruppi di sicurezza sul tuo file system FSx for Lustre dovrebbero essere configurati per permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx for Lustre.
D: Quali metadati vengono conservati quando si copiano dati tra una condivisione NFS o un file system Amazon EFS e Amazon FSx for Lustre, o tra due file system Amazon FSx for Lustre?
R: AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per ulteriori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione in .
D: Posso usare AWS DataSync per migrare i dati da un file system FSx for Lustre a un altro?
R: Sì. Puoi usare AWS DataSync per copiare dal tuo file system FSx for Lustre a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
D: Posso utilizzare AWS DataSync per replicare il mio file system Amazon FSx for Lustre in una regione AWS diversa?
R: Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for Lustre in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
D: DataSync copierà le impostazioni di striping o di layout durante la copia da un file system Amazon FSx for Lustre a un altro?
R: No. I file sono scritti usando la configurazione di layout e striping del file system della destinazione.
Amazon FSx per OpenZFS
D: In che modo AWS DataSync accede al file system Amazon FSx per OpenZFS?
R: Quando crei un'attività DataSync per copiare da o verso il tuo file system FSx for OpenZFS, il servizio DataSync creerà delle interfacce di rete elastiche (ENI, Elastic Network Interface) nello stesso VPC e nella stessa sottorete dove si trova il tuo file system. DataSync usa queste ENI per accedere al tuo file system FSx for OpenZFS usando il protocollo OpenZFS come utente root. Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx for OpenZFS, puoi specificare fino a cinque gruppi di sicurezza da applicare alle ENI e configurare l'accesso in uscita dal servizio DataSync. I gruppi di sicurezza devono essere configurati per permettere il traffico in uscita sulle porte di rete della richieste da FSx for OpenZFS. I gruppi di sicurezza sul tuo file system FSx for OpenZFS dovrebbero essere configurati per permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx for OpenZFS.
D: Quali metadati vengono conservati quando si copiano dati tra una condivisione NFS o un file system Amazon EFS e Amazon FSx for OpenZFS o tra due file system Amazon FSx for OpenZFS?
R: AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni. Per ulteriori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione nella .
D: Posso usare AWS DataSync per migrare i dati da un file system FSx for OpenZFS a un altro?
R: Sì. Puoi usare AWS DataSync per copiare dal tuo file system FSx for OpenZFS a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per distribuzioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
D: Posso utilizzare AWS DataSync per replicare il mio file system Amazon FSx for OpenZFS in una regione AWS diversa?
R: Sì. Puoi utilizzare AWS DataSync per pianificare repliche periodiche del tuo file system di Amazon FSx for OpenZFS in un secondo file system nello stesso account AWS. Questa funzionalità è disponibile per sia per le implementazioni all'interno della stessa regione sia per quelle tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
Amazon FSx per NetApp ONTAP
D: In che modo AWS DataSync accede al file system Amazon FSx per NetApp ONTAP?
R: Durante la creazione di un'attività, DataSync crea interfacce di rete elastiche (ENI) nella sottorete preferita dello stesso VPC in cui si trova il tuo file system Amazon FSx per NetApp ONTAP. La sottorete preferita è configurata quando crei il file system FSx per ONTAP, e DataSync utilizza le ENI che crea in quella sottorete per accedere al tuo file system FSx per ONTAP. Quando crei una risorsa di ubicazione DataSync per il tuo file system FSx per ONTAP, puoi specificare fino a 5 gruppi di sicurezza da applicare alle ENI per configurare l'accesso in uscita dal servizio DataSync. Dovresti configurare i gruppi di sicurezza sul tuo file system FSx per ONTAP in modo tale da permettere l'accesso in entrata dai gruppi di sicurezza che hai assegnato alla risorsa di ubicazione DataSync per il tuo file system FSx per ONTAP.
D: Quali versioni del protocollo possono essere utilizzate da AWS DataSync con Amazon FSx per NetApp ONTAP?
R: AWS DataSync supporta l'utilizzo di NFSv3, SMB 2.1 e SMB 3. Attualmente, DataSync non supporta l'utilizzo di NFSv4 o versione successiva con FSx per ONTAP.
D: AWS DataSync conserva i metadati del file system durante la copia dei dati da e verso il file system Amazon FSx per NetApp ONTAP?
R: Sì, AWS DataSync copia i timestamp dei file e delle cartelle e le autorizzazioni POSIX, inclusi ID utente, ID gruppo e autorizzazioni quando si utilizza il protocollo NFS. Quando si utilizza il protocollo SMB, DataSync copia i timestamp dei file e delle cartelle, proprietà e ACL. Per maggiori informazioni e per consultare l'elenco completo dei metadati copiati fai riferimento alla nostra documentazione.
D: Quale protocollo dovrei usare durante la migrazione dei dati ad Amazon FSx per NetApp ONTAP?
R: Durante la migrazione dai server Windows o dalle condivisioni NAS che servono gli utenti attraverso il protocollo SMB, utilizza una posizione di origine SMB DataSync e il protocollo SMB per la posizione FSx per ONTAP, assicurandoti che la sicurezza del tuo volume FSx per ONTAP sia configurata per NTFS. Durante la migrazione dai server Unix o Linux o dalle condivisioni NAS che servono gli utenti attraverso il protocollo NFS, utilizza una posizione di origine NFS DataSync e il protocollo NFS per la posizione FSx per ONTAP, assicurandoti che la sicurezza del tuo volume FSx per ONTAP sia configurata per Unix. Per le migrazioni multi-protocollo, consulta le best practice descritte nel blog Enabling multiprotocol workloads with Amazon FSx for NetApp ONTAP e utilizza il protocollo SMB per conservare i metadati del file system con l'accuratezza maggiore. Per ulteriori informazioni sulla configurazione della sicurezza per i volumi FSx per ONTAP, vedere la documentazione sulla gestione dei volumi FSx per ONTAP.
D: Posso usare AWS DataSync per accedere allo stesso file system Amazon FSx per NetApp ONTAP usando protocolli diversi?
R: Sì, tuttavia dovrai creare una posizione DataSync e una risorsa attività separate per ciascun protocollo (NFS o SMB). Per evitare problemi con la sovrascrittura e la verifica dei dati, consigliamo di non utilizzare contemporaneamente attività DataSync multiple per copiare lo stesso percorso del volume (indipendentemente dal fatto che tu stia utilizzando lo stesso protocollo o protocolli diversi).
D: Posso utilizzare AWS DataSync per trasferire dati da e verso LUN iSCSI Amazon FSx per NetApp ONTAP ?
R: No, DataSync supporta solo la copia di dati dei file da e verso volumi FSx per ONTAP con i protocolli NFS o SMB.
D: Posso usare AWS DataSync per copiare i dati da un file system Amazon FSx per NetApp ONTAP a un altro?
R: Sì. AWS DataSync ti permette di copiare dal tuo file system FSx per ONTAP a un secondo file system all'interno dello stesso account AWS. Questa funzionalità è disponibile per implementazioni all'interno della stessa regione o tra regioni diverse e non richiede l'utilizzo di un agente DataSync.
D: Posso utilizzare AWS DataSync per replicare il mio file system Amazon FSx per NetApp ONTAP in un diverso file system in un'altra regione AWS?
R: Puoi usare DataSync per la replica dei dati tra i tuoi file system, ma ti consigliamo di usare NetApp SnapMirror per la replica tra i tuoi file system FSx per ONTAP. SnapMirror ti permette di avere RPO ridotti, indipendentemente dal numero o dalla dimensione dei file nel file system.
D: Come posso configurare AWS DataSync affinché non copi le directory delle snapshot?
R: DataSync esclude automaticamente le cartelle ".snapshot". È anche possibile usare i filtri di esclusione per evitare di copiare file e cartelle che corrispondono a modelli specificati.
Spostamento da e verso i dispositivi della famiglia AWS Snow
D: Come si trasferiscono i dati tra AWS Snowcone e i servizi di archiviazione AWS?
R: L'agente DataSync è preinstallato sul tuo dispositivo Snowcone come AMI. Per trasferire dati online su AWS, collega il dispositivo AWS Snowcone alla rete esterna e utilizza AWS OpsHub o la CLI per avviare l'AMI dell'agente DataSync. Attiva l'agente utilizzando la Console di gestione AWS o la CLI e imposta l'attività di trasferimento dati online tra l'archivio NFS di AWS Snowcone e Amazon S3, Amazon EFS, Amazon FSx per Windows File Server, Amazon FSx per Lustre, Amazon FSx per OpenZFS o Amazon FSx per NetApp ONTAP.
D: Come faccio a spostare i dati tra uno spazio di archiviazione compatibile con Amazon S3 su Snow e AWS
?
R: Inizia implementando un agente DataSync nel tuo ambiente on-premise. Attiva l'agente utilizzando la Console di gestione AWS o la CLI e configura l'attività DataSync per spostare i dati tra un bucket nello spazio di archiviazione compatibile con Amazon S3 e Amazon S3, Amazon EFS o qualsiasi file system Amazon FSx.
Prestazioni
D: A quale velocità AWS DataSync è in grado di copiare un file system in AWS?
R: La velocità con cui AWS DataSync è in grado di copiare un determinato set di dati dipende dalla quantità di dati, dalla larghezza di banda I/O disponibile a livello di storage di origine e di destinazione, dalla larghezza di banda di rete disponibile e dalle condizioni di rete. Per il trasferimento dei dati tra servizi di storage locali o AWS, una sola attività DataSync può utilizzare totalmente un link di rete di 10 Gbps.
D: È possibile controllare la quantità di larghezza di banda di rete utilizzata da un'attività di AWS DataSync?
R: Sì. È possibile controllare la quantità di larghezza di banda di rete che AWS DataSync utilizzerà configurando il throttling della larghezza di banda incorporato. Puoi aumentare o diminuire questo limite durante l'esecuzione dell'attività di trasferimento dei dati. In questo modo è possibile ridurre al minimo l'impatto su altri utenti o applicazioni che operano sulla stessa connessione di rete.
D: Come si monitorano le prestazioni di AWS DataSync?
R: AWS DataSync genera parametri Amazon CloudWatch per fornire informazioni dettagliate all'interno del processo di trasferimento. Utilizzando questi parametri, è possibile visualizzare il numero di file e il totale dei dati copiati, ma anche i processi di scoperta e verifica dei file. Puoi vedere i grafici CloudWatch con questi parametri direttamente nella console di DataSync.
D: AWS DataSync può influenzare le prestazioni del file system di origine?
R: A seconda della capacità dell'archivio file locale e della quantità e dimensione dei file da trasferire, AWS DataSync può influire sui tempi di risposta di altri client quando accedono allo stesso datastore di origine, a causa delle sue operazioni di lettura e scrittura dal sistema di storage. Ti consigliamo di configurare una limitazione alla larghezza di banda per ridurre le operazioni di I/O sul sistema di storage.
Sicurezza e conformità
D: In che modo AWS DataSync Discovery accede al mio spazio di archiviazione on-premise?
AWS DataSync Discovery utilizza l'agente DataSync per accedere alle interfacce di gestione/API dei sistemi di archiviazione. Tutti gli accessi sono di sola lettura. Per maggiori informazioni sulle API usate per accedere allo spazio di archiviazione, consulta la documentazione su DataSync.
D: Quando si utilizza AWS DataSync Discovery, come si specificano le credenziali per i sistemi di archiviazione on-premise e come vengono protette?
Quando configuri AWS DataSync Discovery per rilevare il tuo sistema di archiviazione, fornisci un nome utente e una password per accedere all'interfaccia API dell’archiviazione. AWS DataSync Discovery creerà quindi automaticamente un segreto in AWS Secrets Manager per archiviare le credenziali. Quando esegue un processo di individuazione, DataSync Discovery recupera la password dal segreto, la crittografa nuovamente e invia la password crittografata all'agente impiegato per il processo. La password viene mantenuta in memoria sull'agente solo per la durata del processo e non viene mai conservata all'esterno della memoria.
D: Quando vengono trasferiti e memorizzati, i dati vengono anche crittografati?
R: Sì. Tutti i dati trasferiti tra origine e destinazione sono crittografati tramite Transport Layer Security (TLS), che sostituisce il protocollo SSL (Secure Socket Layer). I dati non vengono mai conservati in AWS DataSync. Il servizio supporta l'utilizzo della crittografia di default per i bucket S3, la crittografia di file system Amazon EFS dei dati inattivi e la crittografia dei dati a riposo e in transito di Amazon FSx.
D: In che modo AWS DataSync accede al mio server NFS o alla condivisione file SMB?
R: AWS DataSync impiega un agente da distribuire nell'ambiente IT o in Amazon EC2 per accedere ai file tramite il protocollo NFS o SMB. Questo agente si connette agli endpoint del servizio DataSync all'interno di AWS ed è gestito in modo sicuro dalla Console di gestione AWS o dall'interfaccia a riga di comando.
D: In che modo AWS DataSync esegue l'accesso a HDFS sul cluster Hadoop?
R: AWS DataSync impiega un agente da implementare nell'ambiente IT o in Amazon EC2 per accedere al cluster Hadoop. L'agente DataSync funge da client HDFS e comunica con NameNodes e DataNodes nei cluster. Quando avvii un processo, DataSync interroga il NameNode primario per determinare le posizioni di file e cartelle nel cluster. DataSync comunica quindi con i DataNode nel cluster per copiare file e cartelle su o da HDFS.
D: In che modo AWS DataSync accede al mio spazio di archiviazione di oggetti autogestito o nel cloud che supporta il protocollo Amazon S3?
R: AWS DataSync impiega un agente da implementare nel data center o nell'ambiente cloud pubblico o in Amazon EC2 per accedere agli oggetti utilizzando l'API Amazon S3. Tali agenti si connettono agli endpoint del servizio DataSync all'interno di AWS e possono essere gestiti in modo sicuro tramite la Console di gestione AWS o la CLI.
D: In che modo AWS DataSync accede ai miei container Azure Blob Storage?
R: AWS DataSync utilizza un agente che viene implementato nel tuo ambiente Azure o in Amazon EC2 per accedere agli oggetti nei tuoi container Azure Blob Storage. Tali agenti si connettono agli endpoint del servizio DataSync all'interno di AWS e possono essere gestiti in modo sicuro tramite la Console di gestione AWS o la CLI. L'agente esegue l'autenticazione nel container di Azure utilizzando un token SAS specificato durante la creazione di una posizione BLOB di Azure DataSync.
D: AWS DataSync richiede di impostare una VPN per connettersi allo storage di destinazione?
R: No. Quando i dati vengono copiati da o sul sistema locale, non c'è bisogno di impostare una VPN/tunnel o consentire le connessioni in entrata. Il tuo agente AWS DataSync può essere configurato per effettuare il routing attraverso un firewall utilizzando porte di rete standard. È finalmente possibile distribuire DataSync nel tuo Amazon Virtual Private Cloud (Amazon VPC) utilizzando gli endpoint VPC. Quando si utilizzano gli endpoint VPC, i dati trasferiti tra l'agente DataSync e il servizio AWS non devono attraversare la rete Internet pubblica né richiedono indirizzi IP pubblici.
D: Come si collegano in modo affidabile ad AWS gli agenti AWS DataSync?
R: Il tuo agente AWS DataSync si connette agli endpoint del servizio DataSync nella regione AWS prescelta. Puoi scegliere di avere un agente che si colleghi a endpoint rivolti verso una rete Internet pubblica, endpoint convalidati FIPS (Federal Information Processing Standards) o a endpoint in uno dei tuoi VPC. Durante l'attivazione, il tuo agente viene associato in modo sicuro al tuo account AWS. Per saperne di più, consulta Scegli un endpoint del servizio e Attiva il tuo agente.
D: Come vengono applicate le patch al mio agente AWS DataSync e come viene aggiornato?
R: Gli aggiornamenti alla macchina virtuale agente, tra cui il sistema operativo sottostante e i pacchetti software AWS DataSync, sono applicati automaticamente da AWS una volta attivato l'agente. Gli aggiornamenti vengono applicati in modo non invadente quando l'agente è a riposo e non sta eseguendo alcuna attività di trasferimento dati.
D: Quali programmi di conformità supporta AWS DataSync?
R: AWS ha il programma di conformità più longevo del cloud. AWS si impegna ad aiutare i clienti soddisfacendo i loro requisiti. AWS DataSync è stato sottoposto a valutazioni che certificano la sua conformità agli standard di sicurezza globali e di settore. DataSync è conforme agli standard PCI DSS, ISO 9001, 27001, 27017, 27018 e SOC 1, 2 e 3 ed è idoneo ai fini HIPAA. DataSync è inoltre conforme al programma FedRAMP Moderate nelle regioni AWS Stati Uniti orientali e occidentali e al programma FedRamp High nelle regioni AWS GovCloud (Stati Uniti). In questo modo è più semplice verificare la nostra sicurezza e soddisfare i tuoi obblighi normativi. Per ulteriori informazioni e risorse, consulta le pagine sulla conformità. Puoi anche visionare i Servizi AWS coperti dal programma di conformità per consultare un elenco completo di servizi e certificazioni.
D: AWS DataSync è conforme allo standard PCI?
R: Sì. AWS DataSync è conforme allo standard PCI-DSS e può pertanto essere utilizzato per il trasferimento di informazioni di pagamento. Per informazioni su come ottenere la conformità PCI su AWS, scarica il pacchetto di conformità PCI in AWS Artifact.
D: AWS DataSync è idoneo ai fini HIPAA?
R: Sì. AWS DataSync è idoneo ai fini HIPAA, perciò se disponi di un BAA HIPAA con AWS potrai impiegare DataSync per trasferire informazioni sanitarie protette.
D: AWS DataSync ha l'autorizzazione provvisoria JAB FedRAMP di livello Moderate nelle regioni degli Stati Uniti occidentali e orientali?
R: Sì. AWS DataSync ha ottenuto un'autorizzazione P-ATO (Provisional Authority to Operate) dal Joint Authorization Board (JAB) in virtù della baseline Moderate del Federal Risk and Authorization Management Program (FedRAMP) per le regioni degli Stati Uniti occidentali e orientali. Se sei un cliente federale o commerciale, puoi usare AWS DataSync nel confine di autorizzazione delle regioni AWS Stati Uniti orientali e occidentali per i dati fino a un livello di impatto moderato.
D: AWS DataSync ha l'autorizzazione provvisoria JAB FedRAMP di livello High nelle regioni AWS GovCloud (Stati Uniti)?
R: Sì. AWS DataSync ha ottenuto un'autorizzazione P-ATO (Provisional Authority to Operate) dal Joint Authorization Board (JAB) in virtù della baseline High del Federal Risk and Authorization Management Program (FedRAMP) per la regione GovCloud (Stati Uniti). Se sei un cliente federale o commerciale, puoi usare AWS DataSync nel confine di autorizzazione delle regioni AWS GovCloud (Stati Uniti) per i dati fino a un livello di impatto elevato.
Quando scegliere AWS DataSync
D: In quale modo AWS DataSync differisce rispetto all'utilizzo di strumenti a linea di comando quali rsync o l'interfaccia a riga di comando Amazon S3?
R: AWS DataSync automatizza e accelera completamente lo spostamento di grandi set di dati attivi in AWS. È da sempre integrato con Amazon S3, Amazon EFS, Amazon FSx, Amazon CloudWatch e AWS CloudTrail, che fornisce un accesso continuo e sicuro ai tuoi servizi di archiviazione e un monitoraggio dettagliato del trasferimento.
DataSync utilizza un protocollo di rete specifico e un'architettura scalabile per trasferire i dati. Per il trasferimento dei dati tra servizi di storage locali o AWS, una sola attività DataSync può utilizzare totalmente un link di rete di 10 Gbps.
DataSync automatizza completamente il processo di trasferimento dei dati. Il servizio è fornito con meccanismi incorporati per effettuare più tentativi e garantire la resilienza della rete, ottimizzazioni di rete, pianificazione delle attività integrata, controllo tramite i report sulle attività, monitoraggio tramite l'API e la console di DataSync e parametri, eventi e log di CloudWatch che forniscono una visibilità granulare sul processo di trasferimento. DataSync verifica l'integrità dei dati sia durante il trasferimento che al termine dello stesso.
DataSync fornisce sicurezza end-to-end e si integra direttamente con i servizi di archiviazione AWS. Tutti i dati trasferiti tra l'origine e la destinazione sono crittografati utilizzando TLS ed è possibile accedere allo spazio di archiviazione AWS attraverso meccanismi di sicurezza AWS integrati quali i ruoli IAM. L'abilitazione degli endpoint VPC su DataSync assicura che i dati trasferiti tra l'organizzazione e AWS non attraversino la rete Internet pubblica, il che aumenta la sicurezza dei dati quando vengono copiati sulla rete.
D: Per trasferire gli oggetti tra i miei bucket, quando devo utilizzare AWS DataSync, quando le repliche di S3 e quando S3 Batch Operations?
R: AWS fornisce vari strumenti per copiare gli oggetti tra i bucket.
Utilizza AWS DataSync per la distribuzione di dati continua, le pipeline di dati e l'acquisizione di data lake, ma anche per il consolidamento e la suddivisione dei dati tra più bucket.
Utilizza la replica di S3 per le repliche continue dei dati in un bucket di destinazione specifico.
Utilizza invece S3 Batch Operations per le operazioni in batch su larga scala sugli oggetti S3, ad esempio per copiare gli oggetti, impostare i tag degli oggetti o le liste di controllo accessi (ACL), attivare il ripristino degli oggetti da Amazon S3 Glacier Flexible Retrieval (ex S3 Glacier), richiamare una funzione AWS Lambda per effettuare operazioni personalizzate con i tuoi oggetti, gestire la conservazione a fini legali di S3 Object Lock o gestire le date di conservazione di S3 Object Lock.
D: Quando devo utilizzare AWS DataSync piuttosto che AWS Snowball Edge?
R: AWS DataSync è ideale per i trasferimenti di dati online. Puoi utilizzare DataSync per migrare i dati attivi in AWS, trasferire i dati al cloud per l'analisi e l'elaborazione, archiviare i dati per liberare la capacità di storage locale o replicare i dati in AWS per la business continuity.
AWS Snowball Edge è ideale per i trasferimenti di dati offline, per i clienti che hanno problemi di limitazione di banda o per quelli che devono trasferire dati da ambienti remoti, privi di connessione o proibitivi.
D: Quando devo utilizzare AWS DataSync piuttosto che AWS Storage Gateway?
R: Utilizza AWS DataSync per migrare i dati esistenti in Amazon S3 e poi utilizza la configurazione di File Gateway di AWS Storage Gateway per ritenere l'accesso ai dati migrati e per gli aggiornamenti continui dalle tue applicazioni basate su file in locale.
Puoi utilizzare una combinazione di DataSync e File Gateway per minimizzare la tua infrastruttura in locale durante la connessione continua delle applicazioni locali al tuo storage in cloud. AWS DataSync ti permette di automatizzare e accelerare il trasferimento di dati online nei servizi di storage di AWS. Dopo la fase iniziale di trasferimento dei dati con AWS DataSync, File Gateway fornisce alle tue applicazioni in locale un accesso a bassa latenza ai dati migrati. Quando utilizzi DataSync con le condivisioni NFS, i metadati POSIX del tuo storage in locale di origine vengono conservati e vengono applicate le autorizzazioni dello storage di origine durante l'accesso ai file con File Gateway.
D: Quando devo utilizzare AWS DataSync piuttosto che Amazon S3 Transfer Acceleration?
R: Se le applicazioni sono già integrate con l'API Amazon S3 e desideri una velocità di trasmissione effettiva maggiore per il trasferimento di file di grandi dimensioni in S3, puoi utilizzare S3 Transfer Acceleration. Se vuoi trasferire dati da sistemi di archiviazione esistenti (ad esempio Network Attached Storage) oppure da strumenti non modificabili (ad esempio sequenziatori di DNA e videocamere) o se invece desideri più destinazioni, ti consigliamo di utilizzare AWS DataSync. DataSync inoltre automatizza e semplifica il trasferimento dei dati offrendo funzionalità aggiuntive come meccanismi incorporati per effettuare più tentativi e garantire la resilienza della rete, verifiche per l'integrità dei dati e configurazione flessibile per rispondere alle tue necessità specifiche, inclusa la limitazione della larghezza di banda della rete e così via.
D: Quando devo utilizzare AWS DataSync piuttosto che AWS Transfer Family?
R: Se al momento utilizzi SFTP per scambiare dati con parti terze, AWS Transfer Family fornisce un trasferimento SFTP, FTPS, FTP e AS2 completamente gestito direttamente da e verso Amazon S3, riducendo così il tuo carico operativo.
Se è necessario un trasferimento di dati accelerato e automatizzato tra server NFS, condivisioni di file SMB, cluster Hadoop, archiviazione di oggetti autogestito o archiviazione di oggetti nel cloud, AWS Snowcone, Amazon S3, Amazon EFS e Amazon FSx, consigliamo l'utilizzo di AWS DataSync. DataSync è ideale per i clienti che necessitano di migrazioni online per set di dati attivi, trasferimenti tempestivi di dati in costante generazione e replica per mantenere la continuità aziendale.
Le tariffe di AWS DataSync sono semplici, prevedibili e basate sull'utilizzo; vengono addebitati solo i costi relativi ai dati copiati.
Ottieni l'accesso immediato al piano gratuito di AWS.