Domande generali
D: Cos'è Amazon Rekognition?
Amazon Rekognition è un servizio che facilita l'aggiunta di efficaci analisi visive alle applicazioni. Rekognition Image consente di creare facilmente potenti applicazioni per cercare, verificare e organizzare milioni di immagini. Rekognition Video consente di estrarre il contesto dai video salvati o dai flussi in diretta in base al movimento, aiutandoti ad analizzarli.
Rekognition Image è un servizio di riconoscimento delle immagini che rileva oggetti, scene, attività, punti di riferimento, volti, colori dominanti e qualità dell'immagine. Rekognition Image estrae anche il testo, riconosce le celebrità e identifica i contenuti inappropriati nelle immagini. Consente anche di ricercare e confrontare i volti.
Rekognition Video è un servizio di riconoscimento video che rileva le attività, interpreta i movimenti delle persone in un filmato e riconosce oggetti, personaggi famosi e contenuti inappropriati nei video archiviati in Amazon S3 e nei flussi in diretta. Rekognition Video rileva le persone e le segue nel video anche quando i loro volti non sono visibili e quando la persona esce o entra nell'inquadratura. Ad esempio, può essere utile in un'applicazione che invia notifiche in tempo reale quando qualcuno consegna un pacco alla porta. Rekognition Video consente anche di indicizzare i metadati, come oggetti, attività, scene, punti di riferimento, personaggi famosi e volti, agevolando la ricerca nel video.
D: Cos'è il deep learning?
Il deep learning è un sottocampo del machine learning e una significativa branca dell'intelligenza artificiale. Ha lo scopo di dedurre astrazioni ad alti livelli da dati non elaborati utilizzando un grafico profondo con più livelli di elaborazione composto di più trasformazioni lineari e non lineari. L'apprendimento profondo si basa vagamente sui modelli di elaborazione e comunicazione delle informazioni del cervello. L'apprendimento profondo sostituisce caratteristiche ottenute manualmente con quelle apprese da grandi quantità di dati annotati. L'apprendimento si verifica attraverso la valutazione iterativa di centinaia di migliaia di parametri nel grafico profondo con algoritmi efficienti.
Diverse architetture di apprendimento profondo come le reti neurali profonde convoluzionali (CNN, Convolutional Neural Network) e le reti neurali ricorsive sono state applicate a visione artificiale, riconoscimento vocale, elaborazione del linguaggio naturale e riconoscimento audio per ottenere risultati innovativi su varie attività.
Amazon Rekognition fa parte della famiglia di servizi Amazon AI. I servizi Amazon AI utilizzano l'apprendimento profondo per comprendere immagini, trasformare testi in linguaggio parlato e creare interfacce vocali e di testo conversazionale intuitive.
D: Devo avere esperienza nell'apprendimento profondo per utilizzare Amazon Rekognition?
No. Con Amazon Rekognition non occorre creare, gestire o aggiornare pipeline di apprendimento profondo.
Per ottenere risultati accurati su complesse attività di visione artificiale come il rilevamento di oggetti e scene, l'analisi dei volti e il riconoscimento facciale, i sistemi di apprendimento profondo devono essere accuratamente calibrati e programmati con enormi quantità di dati acquisiti sul campo. L'approvvigionamento, la pulizia e l'etichettatura accurate dei dati sono attività costose e molto lunghe. Inoltre, formare una rete neurale profonda è un'operazione costosa dal punto di vista computazionale e spesso richiede hardware personalizzato realizzato utilizzando unità di elaborazione grafica (GPU).
Amazon Rekognition è interamente gestito e viene fornito già programmato per attività di riconoscimento delle immagini, affinché non sia necessario investire tempo e risorse nella creazione di una pipeline di apprendimento profondo. Amazon Rekognition continua a migliorare l'accuratezza dei propri modelli basando la propria attività su nuovi dati di apprendimento relativi a ricerca e approvvigionamento. Questo ti permette di concentrarti su progettazione e sviluppo di applicazioni di alto valore.
D: Quali sono gli utilizzi più comuni di Amazon Rekognition?
Tra gli utilizzi più comuni di Rekognition Image ti segnaliamo:
- Liberia di immagini disponibile per la ricerca
- Verifica utente basata sul volto
- Analisi delle emozioni
- Riconoscimento facciale
- Moderazione di immagini
Tra gli utilizzi più comuni per Rekognition Video:
- Ricerca di indici per gli archivi video
- Facile filtraggio dei video per rilevare contenuti espliciti e osceni
D: Come si inizia a usare Amazon Rekognition?
Se non sei già registrato ad Amazon Rekognition, puoi fare clic sul pulsante "Prova Amazon Rekognition" nella pagina Amazon Rekognition e completare la procedura di registrazione. Devi disporre di un account Amazon Web Services; qualora non lo avessi già, ti sarà richiesto di crearlo durante il processo di registrazione. Dopo che ti sarai registrato, prova Amazon Rekognition con le tue immagini e i tuoi video utilizzando la Console di gestione Amazon Rekognition o scarica gli SDK Amazon Rekognition per iniziare a creare le tue applicazioni. Per ulteriori informazioni, consulta la nostra Getting Started Guide dettagliata.
D: Quali formati di immagini e video supporta Amazon Rekognition?
Attualmente Amazon Rekognition Image supporta i formati JPEG e PNG. Puoi inviare immagini anche come oggetto di S3 o come una matrice di byte. Amazon Rekognition Video consente di analizzare i video memorizzati nei bucket Amazon S3. Il video deve essere codificato con il codec H.264. I formati supportati sono MPEG-4 e MOV. Un codec è software o un hardware che comprime i dati per velocizzare il trasferimento, quindi decomprime i dati ricevuti riportandoli al formato originale. Il codec H.264 è diffusamente usato per la registrazione, la compressione e la distribuzione dei contenuti video. Un formato di file video può contenere uno o più codec. Se il tuo file video MOV o MPEG-4 non funziona con Rekognition Video, controlla che sia stato codificato con il codec H.264.
D: Quali sono la dimensioni dei file immagine utilizzabili con Amazon Rekognition?
Amazon Rekognition Image supporta file immagine fino a 15 MB se vengono inviati come oggetti di S3 e fino a 5 MB se sono inviati come array di byte. Amazon Rekognition Video supporta file fino a 10 GB e fino a 6 ore di video se si tratta di file di S3.
D: In che modo la risoluzione delle immagini influisce sulla qualità dei risultati delle API di Rekognition Image?
Amazon Rekognition può essere utilizzato su un'ampia gamma di risoluzioni immagine. Per risultati migliori, ti consigliamo di utilizzare VGA (640 x 480) o una risoluzione superiore. Una risoluzione inferiore a QVGA (320 x 240) può aumentare le possibilità che volti, oggetti o contenuti inappropriati non vengano rilevati, anche se le dimensioni minime delle immagini controllate da Amazon Rekognition sono 80 x 80 pixel.
D: Qual è la grandezza minima di un oggetto perché possa essere rilevato e analizzato da Amazon Rekognition Image?
Come regola generale, assicurati che l'oggetto o il volto più piccolo presente nell'immagine sia almeno il 5% delle dimensioni (in pixel) della dimensione più piccola dell'immagine. Se ad esempio lavori con un'immagine di 1600 x 900, ogni dimensione del volto o dell'oggetto più piccolo deve essere di almeno 45 pixel.
D: Come posso implementare la revisione umana delle previsioni di Amazon Rekognition?
Amazon Rekognition è integrato direttamente con Amazon Augmented AI (Amazon A2I), perciò è possibile instradare agevolmente le previsioni con bassa affidabilità da Amazon Rekognition Image ai revisori umani. Utilizzando l'API Amazon Rekognition per la moderazione dei contenuti o la console di Amazon A2I, è possibile indicare le condizioni in presenza delle quali Amazon A2I instrada le previsioni ai revisori, specificando una soglia di affidabilità o una percentuale di campionamento casuale. Se specifichi una soglia di affidabilità, Amazon A2I instrada solamente le predizioni che rientrano nella soglia relativa alla revisione umana. Puoi adeguare tali soglie in qualsiasi momento per raggiungere l'equilibrio giusto tra accuratezza ed efficienza dei costi. In alternativa, se specifichi una percentuale a campione, Amazon A2I instrada un campione casuale delle predizioni per la revisione umana. Questo può aiutarti a implementare audit che consentano di monitorare l'accuratezza delle previsioni su base regolare. Amazon A2I fornisce inoltre ai revisori un'interfaccia Web con tutte le istruzioni e gli strumenti necessari a portare a termine le attività. Per ulteriori informazioni su come implementare la revisione umana con Amazon Rekognition, consulta la pagina Web di Amazon A2I.
D: In che modo la risoluzione del video influisce sulla qualità dei risultati delle API di Rekognition Video?
Il sistema è programmato per riconoscere volti più grandi di 32 pixel (per la dimensione minore), che corrispondono a una dimensione minima del volto da riconoscere compresa tra circa 1/7 dello schermo più piccolo con risoluzione QVGA fino a 1/30 con risoluzione HD a 1080p. Ad esempio, con risoluzione VGA, si possono prevedere prestazioni inferiori per i volti più piccoli di 1/10 della dimensione minore dello schermo.
D: Quali altri fattori possono influire sulla qualità delle API di Rekognition Video?
Oltre alla risoluzione del video, anche le immagini sfocate, le persone in rapido movimento, le condizioni di luminosità e la posa possono influire sulla qualità delle API.
D: Quali sono i contenuti video più adatti alle API di Rekognition Video?
Questa API funziona nel modo migliore con video realizzati da privati e professionisti con campo visivo frontale in normali condizioni di luminosità e colore. Questa API non è testata per i video in bianco e nero, per i video a IR o per le condizioni di luminosità estreme. Con applicazioni sensibili ai falsi allarmi è consigliabile ignorare i dati in uscita con punteggio di affidabilità inferiore a un valore selezionato (specifico per le singole applicazioni).
D: In quali regioni AWS è disponibile Amazon Rekognition?
Per l'elenco delle regioni in cui Amazon Rekognition è disponibile consulta la tabella delle regioni AWS.
Rilevamento delle etichette
D: Che cos'è un'etichetta?
Un'etichetta è un oggetto, una scena o un concetto rilevato in un'immagine in base ai relativi contenuti. Ad esempio, la foto di alcune persone su una spiaggia tropicale può contenere etichette come "Persona", "Acqua", "Sabbia", "Palma" e "Costume" (oggetti), "Spiaggia" (scena) e "Esterno" (concetto).
D: Cos'è un punteggio di affidabilità e come si usa?
Il punteggio di affidabilità è un numero compreso tra 0 e 100 che indica la probabilità che una data previsione sia corretta. Ad esempio, se nella spiaggia tropicale il processo di rilevamento di oggetti e scene restituisce un punteggio di affidabilità di 99 per l'etichetta "Acqua" e di 35 per l'etichetta "Palma", è più probabile che l'immagine contenga acqua piuttosto che una palma.
Le applicazioni molto sensibili al rilevamento di errori (falsi positivi) devono ignorare risultati associati a punteggi di affidabilità inferiori a una determinata soglia. La soglia ottimale dipende dall'applicazione. In molti casi otterrai la migliore esperienza utente impostando valori di affidabilità minimi più alti rispetto al valore predefinito.
D: Cosa si intende per rilevamento di oggetti e scene?
Per rilevamento di oggetti e scene si intende il processo di analisi di un'immagine o di un video per l'assegnazione di etichette in base al contenuto visivo. Amazon Rekognition Image esegue questo processo attraverso l'API DetectLabels. Questa API ti consente di identificare automaticamente migliaia di oggetti, scene e concetti e restituisce un punteggio di affidabilità per ogni etichetta. DetectLabels utilizza una soglia di sicurezza predefinita di 50. Il rilevamento di oggetti e scene è ideale per i clienti che desiderano cercare e organizzare grandi raccolte di immagini, incluse applicazioni per i consumatori e lo stile di vita che dipendono da contenuto generato dall'utente e da aziende di tecnologia pubblicitaria che desiderano migliorare i propri algoritmi di targeting.
D: Amazon Rekognition è in grado di individuare le posizioni degli oggetti e restituire cornici?
Sì, Amazon Rekognition può rilevare la posizione di molti oggetti comuni quali "Persona", "Automobile" o "Cane" sia in immagini che in video. È possibile ricevere le coordinate del riquadro per ogni istanza dell'oggetto trovato, così come un punteggio di affidabilità. Per maggiori informazioni sulla struttura della risposta API per le cornici di oggetti, consulta la documentazione.
D: Amazon Rekognition fornisce informazioni sulla relazione tra le etichette individuate?
Sì, per ogni etichetta trovata, Amazon Rekognition restituisce il suo genitore, l'alias e la categoria, se esistono. I genitori sono riportati nel campo "genitori" in ordine gerarchico. La prima etichetta del genitore è il genitore immediato, mentre le etichette successive sono i genitori dei genitori. Ad esempio, quando viene identificata un'"Automobile", Amazon Rekognition restituisce due etichette genitore: "Veicolo" (padre) e "Trasporto" (padre del padre). Gli alias sono etichette che hanno lo stesso significato delle etichette primarie e vengono restituite nel campo "alias". Ad esempio, poiché "Telefono cellulare" è un alias di "Telefono cellulare", Amazon Rekognition restituisce "Telefono cellulare" nel campo "alias" di un'etichetta "Telefono cellulare". Le categorie raggruppano le etichette in base a temi comuni e vengono riportate nel campo "categorie". Ad esempio, poiché "Cane" è un'etichetta della categoria "Animali e animali domestici", Amazon Rekognition restituisce "Animali e animali domestici" nel campo "categorie" dell'etichetta "Cane". Per maggiori dettagli sull'elenco completo delle etichette supportate e sulla loro tassonomia, visita la documentazione il rilevamento delle etichette di Amazon Rekognition.
D: Quali tipi di etichette supporta Amazon Rekognition?
Rekognition supporta migliaia di etichette appartenenti a categorie comuni incluse, senza alcuna limitazione:
- Persone ed eventi: "Matrimonio", "Sposa", "Bimbo", "Torta di compleanno", "Chitarrista", ecc.
- Alimenti e bevande: "Mela", "Panino", "Vino", "Dolce", "Pizza", ecc.
- Natura e aria aperta: "Spiaggia", "Montagne", "Lago", "Tramonto", "Arcobaleno", ecc.
- Animali selvatici e domestici: "Cane", "Gatto", "Cavallo", "Tigre", "Tartaruga", ecc.
- Casa e giardino: "Letto", "Tavolo", "Cortile", "Candeliere", "Camera da letto", ecc.
- Sport e divertimenti: "Golf", "Basket", "Hockey", "Tennis", "Escursionismo", ecc.
- Piante e fiori: "Rosa", "Tulipano", "Palma", "Foresta", "Bambù", ecc.
- Arte e intrattenimento: "Scultura", "Pittura", "Chitarra", "Balletto", "Mosaico", ecc.
- Trasporti e veicoli: "Aeroplano", "Automobile", "Bicicletta", "Motocicletta", "Camion", ecc.
- Elettronica: "Computer", "Telefono cellulare", "Videocamera", "TV", "Auricolari", ecc.
- Punti di riferimento: 'Ponte di Brooklyn', 'Colosseo', 'Torre Eiffel', 'Machu Picchu', 'Taj Mahal', ecc.
D: In che modo il rilevamento di oggetti e scene differisce nel caso dell'analisi dei video?
Rekognition Video consente di individuare automaticamente migliaia di oggetti (come veicoli o animali domestici) e di attività (come i festeggiamenti o le danze). Fornisce anche le indicazioni di data/ora e un punteggio di affidabilità per ciascuna etichetta. Inoltre si basa sul movimento e sul contesto temporale del video per individuare con precisione attività complesse, come "soffiare su un candela" o "spegnere un incendio".
D: Non trovo l'etichetta di cui ho bisogno. Come posso richiedere una nuova etichetta?
Inviaci le tue richieste di etichette attraverso la Console Amazon Rekognition digitando il nome dell'etichetta nel campo di inserimento della sezione "Cerca tutte le etichette" e clicca su "Richiedi a Rekognition di rilevare" l'etichetta richiesta. Il catalogo di etichette di Amazon Rekognition è in continua espansione grazie ai suggerimenti dei clienti.
D: Che cos'è Image Properties?
Image Properties è una funzione di Amazon Rekognition Image per rilevare i colori dominanti e la qualità dell'immagine. Image Properties rileva i colori dominanti dell'intera immagine, del primo piano dell'immagine, dello sfondo dell'immagine e degli oggetti con riquadri di delimitazione localizzati. Image Properties misura anche la qualità dell'immagine attraverso i punteggi di luminosità, nitidezza e contrasto. Image Properties può essere richiamata attraverso l'API DetectLabels (rileva etichette) utilizzando IMAGE_PROPERTIES come parametro di ingresso, con o senza il parametro di ingresso GENERAL_LABEL per il rilevamento delle etichette. Visita la documentazione per il rilevamento delle etichette di Amazon Rekognition per saperne di più.
D: Come si determinano i colori dominanti?
Image Properties restituisce i colori dominanti in quattro formati: RGB, hexcode, colori CSS e colori semplificati. Amazon Rekognition identifica innanzitutto i colori dominanti in base alla percentuale di pixel, quindi mappa questi colori nella tavolozza di 140 colori CSS, RGB, codice esadecimale e 12 colori semplificati (ad esempio, 'verde', 'rosa', 'nero', 'rosso', 'giallo', 'ciano', 'marrone', 'arancione', 'bianco', 'viola', 'blu', 'grigio'). Per impostazione predefinita, Image Properties restituisce dieci (10) colori dominanti, a meno che i clienti non specifichino il numero di colori da restituire. Il numero massimo di colori dominanti che l'API può restituire è di 12.
D: Come si interpretano i punteggi di luminosità, nitidezza e contrasto?
Image Properties fornisce un valore da 0 a 100 per ogni punteggio di luminosità, nitidezza e contrasto. Ad esempio, un'immagine sottoesposta restituirà un punteggio di luminosità basso, mentre un'immagine molto illuminata restituirà un punteggio di luminosità alto.
D: Come è possibile controllare se Amazon Rekognition dispone di modelli aggiornati?
Amazon Rekognition restituisce un parametro EtichettaModelloVersione che ti consente di sapere se il modello è stato aggiornato. I modelli di rilevamento di oggetti e scene sono frequentemente aggiornati sulla base dei feedback dei clienti.
Amazon Rekognition Custom Labels
D: Posso utilizzare Custom Labels per analizzare volti o rilevare testo personalizzato?
No. Custom Labels serve per individuare oggetti e scene nelle immagini. Non permette di analizzare volti o rilevare testo personalizzato. Per questo tipo di attività è necessario utilizzare altre API di Rekognition. Per l'analisi dei volti e la rilevazione di testi, consulta la documentazione.
D: Posso utilizzare Custom Labels per individuare immagini dal contenuto non sicuro?
Sì. Custom Labels serve per individuare oggetti e scene nelle immagini. Se addestrato, Custom Labels può rilevare immagini dal contenuto non sicuro specifiche del tuo caso d'uso. Per l'utilizzo dell'API Moderation per rilevare immagini dal contenuto non sicuro generiche, consulta anche la documentazione.
D: Quante immagini servono per addestrare un modello personalizzato?
Il numero di immagini necessarie per addestrare un modello personalizzato dipende dalla variabilità delle etichette personalizzate che dovrà prevedere e dalla qualità dei dati di addestramento. Un logo nitido sovrapposto a un'immagine, ad esempio, può essere rilevato con 1-2 immagini di addestramento, mentre per riconoscere un logo meno definito in più variazioni (scala, punto di vista, deformazioni) possono essere necessarie decine o centinaia di esempi con annotazioni di alta qualità. Se è già disponibile un numero elevato di immagini dotate di etichette, è consigliabile addestrare il modello con tutte le immagini disponibili. Per i limiti massimi delle dimensioni del dataset di addestramento, consulta la documentazione.
Per addestrare un modello personalizzato con grande accuratezza possono essere necessarie centinaia di immagini, tuttavia con Custom Labels è possibile addestrare prima un modello con decine di immagini per ogni etichetta, verificare i risultati di test per individuare i risultati non soddisfacenti e aggiungere successivamente nuove immagini ripetendo l'addestramento in modo iterativo per migliorare il modello.
D: Quante risorse di elaborazione inferenziale devo prevedere per il mio modello personalizzato?
Il numero delle risorse di elaborazione inferenziale parallele dipende da quante immagini devi elaborare in un determinato momento. Il throughput di un'unica risorsa dipende da fattori quali le dimensioni delle immagini, la loro complessità (cioè quanti oggetti rilevati sono visibili) e la complessità del modello personalizzato. Per ottimizzare il provisioning del modello personalizzato è consigliabile monitorare la frequenza con la quale è necessario eseguire il provisioning e il numero di immagini da elaborare in un determinato momento.
Se pensi di elaborare periodicamente le immagini (ad esempio, una volta al giorno o alla settimana oppure in orari del giorno predefiniti), inizia impostando il provisioning del modello personalizzato a orari predefiniti, elaborando tutte le immagini e quindi interrompendo il provisioning. Se non interrompi il provisioning, ti verrà addebitato il costo anche se non viene elaborata alcuna immagine.
D: Il mio addestramento non è riuscito. Mi verranno addebitati dei costi?
No. Se l'addestramento non riesce, non dovrai pagare per le risorse di elaborazione.
Moderazione dei contenuti
D: Cos'è la moderazione dei contenuti?
L'API di moderazione dei contenuti di Amazon Rekognition utilizza il deep learning per rilevare contenuti per adulti espliciti o allusivi, contenuti violenti o relativi alle armi, contenuti visivamente disturbanti e contenuti relativi a droghe, alcol, tabacco, simboli d'odio, gioco d'azzardo e gesti osceni in immagini e video. Oltre a contrassegnare le immagini o i video in base alla presenza di contenuti inappropriati e offensivi, Amazon Rekognition restituisce un elenco di etichette suddiviso in gerarchie con un punteggio di affidabilità. Queste etichette indicano sottocategorie specifiche dei contenuti rilevati, fornendo pertanto ulteriore controllo agli sviluppatori sul filtraggio e il controllo di grandi volumi di contenuti generati dagli utenti. Questa API può essere impiegata in flussi di lavoro di moderazione per applicazioni quali social network, app di incontri, piattaforme di condivisione di immagini, blog, forum, applicazioni per bambini, siti di e-commerce, servizi di intrattenimento e piattaforme di inserzioni online.
D: Che tipo di contenuti inappropriati, offensivi e inaccettabili rileva Amazon Rekognition?
Puoi trovare una lista completa di categorie di contenuti rilevate da Amazon Rekognition qui.
Amazon Rekognition restituisce una gerarchia di etichette e un punteggio di affidabilità per ciascuna etichetta. Ad esempio, data una specifica immagine inappropriata, Rekognition restituirà un messaggio di "nudità esplicita" con un punteggio di affidabilità di livello più alto. Gli sviluppatori possono utilizzare questi metadati per contrassegnare i contenuti di alto livello, ad esempio quando tutti i tipi di contenuti espliciti per adulti devono essere contrassegnati. Nella stessa sessione, Rekognition può anche restituire un secondo livello di granularità fornendo ulteriore contesto, ad esempio indicando che la presenza di contenuti sessuali espliciti maschili con relativo punteggio di affidabilità. Queste informazioni possono essere utili agli sviluppatori per creare una logica di filtraggio più complessa in base a diverse aree geografiche e segmenti demografici.
L'API di moderazione dei contenuti, tuttavia, non costituisce un'autorità affidabile né si pone come filtro esauriente in relazione a contenuti inappropriati e offensivi. Inoltre non è in grado di rilevare la presenza nelle immagini di eventuali contenuti illegali (ad esempio pedopornografia) o contenuti per adulti non naturali.
In caso di necessità, ad esempio se occorre il rilevamento di altri tipi di contenuti inappropriati, contattaci utilizzando la procedura illustrata più avanti.
D: In che modo è possibile sapere quale versione del modello è attualmente in uso?
Apportiamo regolarmente migliorie ai modelli di Amazon Rekognition. Per visualizzare la versione del modello, utilizza il campo "ModerationModelVersion" nella risposta API.
D: In che modo è possibile assicurarsi che Amazon Rekognition soddisfi gli obiettivi di precisione per il mio caso d'uso di moderazione di immagini o video?
I modelli di moderazione dei contenuti di Amazon Rekognition sono stati ampiamente ottimizzati e testati, ma il nostro consiglio è comunque di sperimentare l'accuratezza del servizio con i propri set di dati.
È possibile utilizzare il parametro "MinConfidence" nelle richieste all'API per equilibrare il rilevamento dei contenuti (recupero) con l'affidabilità del rilevamento (precisione). Riducendo il valore del parametro "MinConfidence", sarà più facile rilevare la maggior parte dei contenuti inappropriati, ma sarà anche più probabile che vengano contrassegnati anche contenuti che non sono osceni né espliciti. Aumentando il valore del parametro "MinConfidence" si riducono i falsi positivi ma alcune immagini con contenuti espliciti e osceni potrebbero essere ignorate.
D: In che modo è possibile fornire feedback su Rekognition per migliorarne le API di moderazione dei contenuti?
Invia le tue richieste tramite il servizio clienti di AWS. Grazie ai feedback dei clienti, Amazon Rekognition espande costantemente i tipi di contenuti inappropriati rilevati. I contenuti illegali (ad esempio la pedopornografia) non saranno accettati ai fini della procedura.
Analisi facciale
D: Cos'è l'analisi facciale?
L'analisi facciale consiste nel rilevamento di un volto all'interno di un'immagine e nell'estrazione dei relativi attributi. Amazon Rekognition Image restituisce la cornice per ogni volto rilevato in un'immagine, insieme ad attributi come sesso, presenza di occhiali da sole e punti di riferimento del volto. Rekognition Video restituirà i volti rilevati in un video con le indicazioni di data/ora e per ciascun volto rilevato indicherà la posizione e la cornice insieme ai punti di riferimento del volto.
D: Quali attributi facciali posso ottenere da Amazon Rekognition?
Oltre a una cornice e a un punteggio di affidabilità per ogni attributo, Amazon Rekognition restituisce i seguenti attributi facciali per ogni volto rilevato:
- Sesso
- Sorriso
- Emozioni
- Occhiali da vista
- Occhiali da sole
- Occhi aperti
- Bocca aperta
- Baffi
- Barba
- Posa
- Qualità
- Punti di riferimento
D: Che cos'è la posa del volto?
Per posa del volto si intende la rotazione di un volto rilevato sugli assi di beccheggio, rollio e imbardata. Ognuno di questi parametri viene restituito come un angolo compreso tra -180° e 180°. La posa del volto può essere utilizzata per trovare l'orientamento del poligono che circonda il viso (in opposizione alla cornice rettangolare), per misurare la deformazione, per tenere traccia dei visi in modo accurato e altro ancora.
D: Cosa si intende per qualità del volto?
La qualità del volto descrive la qualità dell'immagine del volto rilevato utilizzando due parametri: nitidezza e luminosità. Entrambi i parametri vengono restituiti come valori compresi tra 0 e 1. A questi parametri può essere applicata una soglia per filtrare volti nitidi e bene illuminati. È utile per le applicazioni che funzionano meglio con immagini di volti di alta qualità, come nel caso del confronto facciale e del riconoscimento facciale.
D: Cosa sono i punti di riferimento del volto?
I punti di riferimento del volto sono un insieme di punti salienti, generalmente posizionati agli angoli, alle estremità e al centro dei principali componenti facciali come gli occhi, il naso e la bocca. L'API DetectFaces di Amazon Rekognition restituisce un insieme di punti di riferimento facciali che è possibile utilizzare per ritagliare volti, eseguire il morphing per trasformare un viso in un altro, sovrapporre maschere personalizzate per creare filtri specifici e altro ancora.
D: Quanti volti è possibile rilevare in un'immagine?
Amazon Rekognition permette di rilevare fino a 100 volti in un'immagine.
D: In che modo l'analisi facciale differisce nel caso dell'analisi dei video?
Rekognition Video consente di individuare i volti in un video e analizzarne le caratteristiche, ad esempio se stanno sorridendo, se gli occhi sono aperti o se mostrano emozioni. Rekognition Video restituirà i volti rilevati con le indicazioni di data/ora e per ciascun volto rilevato indicherà la posizione e fornirà la cornice, insieme a punti di riferimento come occhio sinistro, occhio destro, naso, angolo sinistro della bocca e angolo destro della bocca. Queste informazioni sulla posizione e sulla data/ora si possono utilizzare per seguire facilmente le sensazioni degli utenti nel tempo e aggiungere ulteriori funzionalità come riquadri automatici, evidenziazioni o ritaglio. La ricerca utente non è supportata per l'analisi dei video.
D: Oltre alla risoluzione del video, quali altri fattori possono influire sulla qualità delle API di Rekognition Video?
Oltre alla risoluzione del video, anche la qualità e i volti significativi, insieme alla parte di raccolta in cui si esegue la ricerca, hanno un impatto notevole. Utilizzando più istanze del volto di una stessa persona con varianti come barba, occhiali, pose diverse (di profilo e frontale) si miglioreranno significativamente i risultati. Generalmente le persone che si muovono molto velocemente possono ridurre la qualità del riconoscimento. Inoltre, i video sfocati potrebbero presentare una qualità inferiore.
Confronto facciale
D: Che cos'è il confronto facciale?
Il confronto facciale è il processo che consente di confrontare un volto con uno o più altri volti per valutarne la somiglianza. Utilizzando l'API CompareFaces, Amazon Rekognition Image consente di misurare la probabilità che i volti presenti in due immagini diverse appartengano alla stessa persona. L'API confronta un volto individuato nell'immagine originale con ogni volto rilevato nell'immagine di destinazione e restituisce un punteggio di somiglianza per ogni confronto. Per ogni faccia rilevata si avranno anche una cornice e un punteggio di affidabilità. Il confronto facciale può essere utilizzato anche per verificare l'identità di una persona confrontandola con foto presenti in archivio quasi in tempo reale.
D: Posso utilizzare un'immagine di origine contenente più di un volto?
Sì. Se l'immagine di origine contiene più visi, CompareFaces rileva il viso più grande e lo utilizza per confrontarlo con ogni viso rilevato nell'immagine di destinazione.
D: Quanti volti posso confrontare?
Puoi confrontare un volto nell'immagine originale con un massimo di 15 volti rilevati nell'immagine di destinazione.
Ricerca facciale
D: Cos'è Face Search?
Face Search è il processo di utilizzo di un volto di input per cercare corrispondenze simili in una raccolta di volti memorizzati. Attraverso il riconoscimento facciale, puoi creare facilmente applicazioni come l'autenticazione a più fattori per i pagamenti bancari, l'ingresso automatizzato agli edifici per i dipendenti e altro ancora.
D: Cos'è una raccolta di volti e come posso crearne una?
Una raccolta di volti è l'indice ricercabile dei vettori di volti, che sono una rappresentazione matematica dei volti. Rekognition non memorizza immagini di volti nella tua collezione. Mediante l'utilizzo dell'API CreateCollection puoi facilmente creare una raccolta in una regione AWS supportata e tornare a un Amazon Resource Name (ARN). Ogni raccolta di volti dispone di un CollectionId univoco associato.
D: Come faccio ad aggiungere volti a una raccolta per la ricerca?
Per aggiungere un volto a una raccolta esistente, utilizza l'API IndexFaces. Questa API accetta un'immagine sotto forma di oggetto di S3 o matrice di byte immagine e aggiunge una rappresentazione dei vettori dei volti rilevati alla raccolta. IndexFaces restituisce inoltre un FaceId univoco e una cornice per ogni volto aggiunto.
È possibile aggregare più vettori di volti della stessa persona per creare e archiviare vettori utente utilizzando le API CreateUser e AssociateFaces. I vettori utente sono rappresentazioni più robuste dei vettori a faccia singola perché contengono più vettori di volti con diversi gradi di illuminazione, nitidezza, pose, differenze di aspetto, ecc. La ricerca di volti con vettori utente può migliorare significativamente la precisione rispetto alla ricerca di volti con vettori a volto singolo. I vettori utente sono memorizzati nella stessa raccolta dei vettori di volti associati.
D: Come si eliminano i volti da una raccolta?
Per eliminare un volto da una raccolta esistente, utilizza l'API DeleteFaces. Questa API agisce sulla raccolta di volti fornita (utilizzando un CollectionId) e rimuove le voci corrispondenti all'elenco di FaceId. Se il FaceID è associato a un vettore utente, dovrai prima utilizzare la chiamata API DisassociateFaces per rimuoverlo dal vettore utente. In alternativa, puoi eliminare il vettore utente dalla raccolta utilizzando l'API DeleteUser.
Per ulteriori informazioni sull'aggiunta e l'eliminazione di volti, consulta il nostro esempio di Gestione delle raccolte.
D: Come posso cercare un utente nella raccolta di volti?
Dopo aver creato gli utenti e i FaceID associati, puoi eseguire la ricerca utilizzando un'immagine (SearchUsersByImage), un ID utente (searchUsers) o un FaceID (SearchUsers). Queste API acquisiscono un volto iniziale e restituiscono una serie di utenti corrispondenti ordinati in base al punteggio di somiglianza. Per ulteriori dettagli, consulta il nostro esempio di Ricerca dei volti.
D: Come posso cercare un volto nella raccolta?
Una volta che avrai creato una raccolta indicizzata di volti, potrai cercare un viso utilizzando un'immagine (SearchFaceByImage) o un FaceId (SearchFaces). Queste API acquisiscono un volto iniziale e restituiscono una serie di volti corrispondenti ordinati in base al punteggio di somiglianza, con al primo posto il volto che ha ottenuto il punteggio più alto. Per ulteriori dettagli, consulta il nostro esempio di Ricerca dei volti.
D: In che modo Face Search è diverso per l'analisi dei video?
Rekognition Video consente di eseguire ricerche dei volti in tempo reale in raccolte contenenti decine di milioni di volti. Innanzitutto si crea una raccolta di volti nella quale si possono memorizzare volti costituiti da rappresentazioni vettoriali dei tratti somatici. Rekognition esegue quindi la ricerca nella raccolta dei volti per individuare volti visivamente simili in tutto il video. Per ciascun volto presente nel video, Rekognition restituirà un punteggio di affidabilità, consentendo di visualizzare le possibili corrispondenze direttamente nell'applicazione. La ricerca utente non è supportata per l'analisi dei video.
D: Oltre alla risoluzione del video, quali altri fattori possono influire sulla qualità delle API Video?
Oltre alla risoluzione del video, anche la qualità e i volti significativi, insieme alla parte di raccolta in cui si esegue la ricerca, hanno un impatto notevole. Utilizzando più istanze del volto di una stessa persona con varianti come barba, occhiali, pose diverse (di profilo e frontale) si miglioreranno significativamente i risultati. Generalmente le persone che si muovono molto velocemente possono ridurre la qualità del riconoscimento. Inoltre, i video sfocati potrebbero presentare una qualità inferiore.
Riconoscimento di volti celebri
D: Che cos'è il riconoscimento di volti celebri?
Il riconoscimento di volti celebri di Amazon Rekognition è una nuova funzionalità basata su algoritmi di apprendimento approfondito con cui puoi individuare, mediante un'API molto intuitiva, volti di celebrità e personaggi famosi o noti nel loro campo. L'API RecognizeCelebrities può essere usata su vasta scala e riconosce le celebrità in diverse categorie, tra cui politica, sport, affari, intrattenimento e media. Questa funzionalità risulta particolarmente utile ai clienti a cui occorrono librerie di immagini digitali indicizzabili e ricercabili in base ai personaggi celebri di loro interesse.
D: A chi è rivolta l'API di riconoscimento di volti celebri?
Amazon Rekognition è in grado di identificare solo le celebrità per cui il modello di apprendimento approfondito è stato addestrato. L'API RecognizeCelebrities non costituisce un'autorità, né intende esserlo, per la creazione di elenchi di celebrità. Si tratta di una caratteristica creata per includere il maggior numero di celebrità possibili, in base alle esigenze e ai feedback dei clienti. Vengono aggiunti costantemente nuovi nomi, ma il fatto che questa funzionalità non riconosca individui che potrebbero essere considerati noti secondo altri gruppi o clienti non riflette le nostre opinioni su chi debba o non debba essere considerato una celebrità. Se desideri che l'API di riconoscimento di volti celebri sia in grado di identificare nuove celebrità, inviaci un feedback.
D: È possibile richiedere di rimuovere una celebrità dall'elenco di personaggi riconosciuti dall'API di Amazon Rekognition?
Sì. Se una celebrità desidera essere rimossa da questa funzionalità, può farne richiesta tramite e-mail al servizio clienti di AWS.
D: Quali riferimenti sono supportati per fornire informazioni aggiuntive su una celebrità?
L'API supporta un elenco opzionale di fonti da includere nella risposta informazioni sulla celebrità. Al momento è possibile indicare un URL dal sito IMDB, se disponibile. In futuro potranno essere aggiunte altre fonti.
D: In che modo il riconoscimento di volti celebri differisce nel caso dell'analisi dei video?
Rekognition Video consente di individuare e riconoscere quando e dove appaiono persone famose in un video. I dati di uscita con codifica temporale includono il nome e un identificativo univoco della persona, le coordinate della cornice, un punteggio di affidabilità e gli URL dei contenuti correlati, ad esempio il collegamento alla pagina del personaggio su IMDB. La persona viene rilevata anche se a volte il suo volto non è visibile, nel video. Questa funzione consente di indicizzare e ricercare librerie di video digitali per utilizzi legati a esigenze specifiche di marketing e dei media.
D: Oltre alla risoluzione del video, quali altri fattori possono influire sulla qualità delle API di Rekognition Video?
Le celebrità che si muovono molto velocemente e i video sfocati possono influire sulla qualità delle API di Rekognition Video. Inoltre, anche eventuale trucco pesante o camuffamento, comuni per gli attori e le attrici, possono influire sulla qualità.
Rilevamento del testo
D: Che cos'è Text Detection?
Text Detection è una caratteristica di Amazon Rekognition che permette di rilevare e riconoscere contenuti di testo all'interno di immagini o video, ad esempio nomi di strade, didascalie, nomi di prodotti, grafiche in sovrimpressione, sottotitoli video e targhe di mezzi motorizzati. La funzione Text Detection è stata creata per il rilevamento di testo da immagini e video reali anziché da immagini di documenti. L'API DetectText di Amazon Rekognition si applica alle immagini e restituisce etichette di testo e cornici per ogni stringa di caratteri rilevata, con un punteggio di affidabilità. Nelle applicazioni di condivisione di immagini e di social networking, ad esempio, è possibile abilitare la ricerca visiva basata su un indice di immagini che contiene le stesse etichette di testo. Nelle applicazioni di sicurezza, il servizio permette di identificare i veicoli in base ai numeri di targa dalle immagini scattate tramite body cam. Analogamente, per i video, utilizzando le API StartTextDetection e GetTextDetection è possibile rilevare testo e ottenere punteggi di affidabilità e timestamp per ogni rilevamento. Nelle applicazioni per media e intrattenimento, invece, è possibile creare metadati di testo che supportano la ricerca per i contenuti rilevanti, ad esempio notizie, punteggi sportivi, pubblicità e didascalie. Puoi anche verificare se nel testo rilevato sono presenti violazioni di policy o conformità, per esempio un indirizzo e-mail o un numero di telefono sovrapposti dagli spammer.
D: Quali tipi di testo supporta la funzione Text Detection di Amazon Rekognition?
La funzione Text Detection è stata creata appositamente per lavorare su immagini e video reali anziché su immagini di documenti. Supporta i numeri e la maggior parte dei caratteri latini strutturati secondo un'ampia varietà di layout, font e stili diversi e sovrapposti agli oggetti sullo sfondo, con diversi livelli di orientamento; ad esempio può rilevare le scritte in striscioni e poster. Text Detection è in grado di riconoscere fino a 50 sequenze di caratteri per immagine, elencandoli come parole e righe. Text Detection è in grado di riconoscere il testo ruotato da -90 a +90 gradi rispetto all'asse orizzontale.
D: Posso limitare il rilevamento di testo a regioni specifiche in un'immagine o un frame video?
Sì, puoi utilizzare le opzioni di filtro del rilevamento di testo per specificare un massimo di 10 regioni di interesse (ROI) nella richiesta API. Amazon Rekognition restituirà esclusivamente il testo che rientra in queste regioni.
D: Posso filtrare i rilevamenti di testo per affidabilità della parola o dimensione della cornice?
Sì, nella richiesta API puoi utilizzare le opzioni di filtro del rilevamento di testo per specificare le soglie minime di punteggio di affidabilità o di dimensione della cornice.
D: Come posso dare un feedback su Rekognition per migliorarne le funzionalità di riconoscimento del testo?
Invia le tue richieste tramite il supporto clienti di AWS. Grazie ai feedback dei clienti, Amazon Rekognition espande costantemente i tipi di testi riconosciuti.
Rilevamento del dispositivo di protezione individuale
D: Quale dispositivo di protezione individuale è in grado di rilevare Amazon Rekognition?
La funzione "DetectProtectiveEquipment" di Amazon Rekognition è in grado di rilevare tipi comuni di protezioni per viso, mani e testa. Per ulteriori informazioni, consulta la documentazione sulla funzione. Puoi anche utilizzare le etichette personalizzate di Amazon Rekognition per rilevare dispositivi di protezione individuale come gilè catarifrangenti, occhiali di sicurezza e altri dispositivi speciali per la tua attività. Per informazioni sull'utilizzo delle etichette personalizzate di Amazon Rekognition per il rilevamento di dispositivi di protezione individuali personalizzati, consulta questo repository di Github.
D: Amazon Rekognition è in grado di individuare le posizioni del dispositivo di protezione e restituire cornici?
Sì, l'API "DetectProtectiveEquipment" di Amazon Rekognition è in grado di rilevare la posizione del dispositivo di protezione come protezioni per viso, mani e testa su persone in immagini. Si possono ricevere le coordinate della cornice per ogni elemento del dispositivo di protezione individuato, così come un punteggio di affidabilità. Per ulteriori informazioni sulla reattività dell'API, consulta la documentazione.
D: Il servizio è in grado di rilevare se la maschera è indossata correttamente?
Il rilevamento dell'API "DetectProtectiveEquipment" di Amazon Rekognition fornisce un valore "CoversBodyPart" (vero/falso) e un valore di affidabilità per il valore booleano di ciascun elemento individuato del dispositivo di protezione. In questo modo si ottengono informazioni circa il posizionamento del dispositivo di protezione sulla parte del corpo corrispondente della personale. La previsione sulla presenza del dispositivo di protezione sulla parte del corpo corrispondente aiuta a escludere i casi in cui il dispositivo è presente nell'immagine ma non sulla persona. Tuttavia, non indica né stabilisce se la persona è adeguatamente protetta dal dispositivo di protezione o se le protezioni sono indossate in maniera corretta.
D: Il rilevamento del dispositivo di protezione individuale di Amazon Rekognition è in grado di identificare le persone rilevate?
No, il rilevamento del dispositivo di protezione individuale di Amazon Rekognition non esegue il riconoscimento facciale o il confronto facciale, quindi non è in grado di identificare le persone rilevate.
D: Dove è possibile trovare ulteriori informazioni sui limiti e sulla latenza dell'API?
Per aggiornamenti sui dettagli dei limiti e della latenza dell'API, consulta la documentazione sul rilevamento del dispositivo di protezione individuale di Amazon Rekognition.
D: Come si inviano le immagini dalle fotocamere del posto di lavoro ad Amazon Rekognition?
Esistono diverse opzioni per acquisire immagini dalle fotocamere presenti sul posto di lavoro. Per ulteriori informazioni, consulta il blog sul rilevamento del dispositivo di protezione individuale di Amazon Rekognition.
Quali sono i prezzi per il rilevamento del dispositivo di protezione individuale?
Il rilevamento del dispositivo di protezione individuale di Amazon Rekognition è addebitato in maniera analoga ad altre API per immagini di Amazon Rekognition su base unitaria. Per ulteriori informazioni, visita la pagina dei prezzi di Amazon Rekognition.
Amazon Rekognition Streaming Video Events
D: Cosa sono gli Amazon Rekognition Streaming Video Events?
Amazon Rekognition Streaming Video Events utilizza il machine learning per rilevare oggetti dalla videocamera collegata per fornire avvisi attuabili in tempo reale. Amazon Rekognition Streaming Video Events funziona con i tuoi Kinesis Video Streams nuovi ed esistenti per elaborare flussi video (fino a 120 secondi per evento di movimento) e avvisarti non appena viene rilevato un oggetto di interesse desiderato. Puoi utilizzare queste notifiche per:
- Inviare avvisi intelligenti agli utenti finali, come ad esempio "è stato rilevato un pacco alla porta d'ingresso".
- Fornire funzionalità di automazione domotica, come ad esempio "accendi la luce del garage quando viene rilevata una persona".
- Integrare gli smart assistant, come i dispositivi Echo, per fornire annunci Alexa quando viene rilevato un oggetto.
- Fornire funzionalità di ricerca intelligente, come la ricerca in tutte le clip video in cui è stato rilevato un pacchetto.
D: Come funziona Amazon Rekognition Streaming Video Events?
Puoi utilizzare i Kinesis Video Streams nuovi o esistenti per iniziare a utilizzare Amazon Rekognition Streaming Video Events. Quando configuri le impostazioni del tuo stream processor per Amazon Rekognition, puoi scegliere le etichette desiderate (persona, animale domestico o pacco) che desideri rilevare, la durata del video (fino a 120 secondi per evento di movimento) che Rekognition deve elaborare per ogni evento e/o l'area di interesse del frame che si desidera elaborare tramite Rekognition. Le API di Rekognition Streaming Video Events elaborano il video solo se invii una notifica a Rekognition per avviare l'elaborazione del flusso video.
Quando viene rilevato un movimento su una videocamera collegata, invii una notifica a Rekognition per avviare l'elaborazione del flusso video. Rekognition elabora il Kinesis Video Stream corrispondente, post rilevamento, per cercare gli oggetti desiderati da te specificati. Non appena viene rilevato un oggetto desiderato, Amazon Rekognition ti invierà una notifica. Questa notifica include l'oggetto rilevato, il riquadro di delimitazione, l'immagine ingrandita dell'oggetto e l'orario.
D: Quali etichette sono supportate da Amazon Rekognition Streaming Video Events?
Amazon Rekognition Streaming Video Events può supportare persone, animali domestici e pacchi.
D: Quali animali domestici e tipi di pacchetto vengono rilevati dalle API di Amazon Rekognition Streaming Video Event?
Le API di Amazon Rekognition Streaming Video Event supportano il rilevamento di cani e gatti. L'API è in grado di rilevare scatole di cartone di medie e grandi dimensioni con elevata precisione. L'API rileva anche scatole più piccole, buste a bolle e raccoglitori, ma occasionalmente potrebbe mancare alcuni di questi oggetti.
D: Le etichette rilevate mi saranno addebitate separatamente? Posso scegliere quali etichette attivare?
No, le etichette rilevate non saranno addebitate separatamente. Ti verrà addebitata la durata del video in streaming elaborato da Rekognition. Puoi attivare etichette specifiche (animale domestico, pacchetto) o scegliere di aderire a tutte e tre le etichette (persone, animale domestico, pacchetto) durante la configurazione delle impostazioni di elaborazione del flusso.
D: Devo trasmettere video in streaming continuamente su Amazon Rekognition?
No, non è necessario eseguire lo streaming di video continuamente su Amazon Rekognition.
D: Devo creare nuovi Kinesis Video Streams (KVS) per utilizzare Streaming Video Events?
Amazon Rekognition Streaming Video Events funziona sia con Kinesis Video Streams nuovi che con quelli esistenti. Integra semplicemente i flussi KVS pertinenti con l'API di Amazon Rekognition Streaming Video Events per iniziare con l'analisi video sui flussi KVS.
D: Quando mi verrà inviata la notifica da Amazon Rekognition?
Amazon Rekognition avvia l'elaborazione del flusso video dopo il rilevamento del movimento. Puoi configurare la durata dell'elaborazione di questo flusso video (fino a 120 secondi per evento). Non appena Amazon Rekognition rileva l'oggetto di interesse nel flusso video, Rekognition ti invierà una notifica. Questa notifica include l'oggetto rilevato, il riquadro di delimitazione, l'immagine ingrandita dell'oggetto e l'orario.
D: Quali valori di risoluzione e fps sono supportati per il rilevamento delle etichette?
Per mantenere bassi i costi e la latenza, Amazon Rekognition Streaming Video Events supporta flussi video a risoluzione 1080p o inferiore. Rekognition elabora il flusso video a 5 fps.
D: Quali codec e formato di file sono supportati per lo streaming di video?
Amazon Rekognition Video supporta file H.264 in formato MPEG-4 (.mp4) o MOV.
D: Qual è la durata massima del video elaborato per evento?
Puoi elaborare fino a 120 secondi di video per evento.
D: Posso scegliere una particolare area del fotogramma da elaborare per il mio flusso video?
Sì, come parte della configurazione del tuo StreamProcessor puoi scegliere la regione di interesse che vuoi elaborare sul tuo frame. Amazon Rekognition elaborerà solo quella particolare area del frame.
D: Quanti flussi video simultanei posso elaborare con Amazon Rekognition?
Amazon Rekognition Streaming Video Events può supportare 600 sessioni simultanee per cliente AWS. Contatta il tuo account manager se devi aumentare questo limite.
Analisi dei video archiviati di Amazon Rekognition
D: Quali tipi di entità è in grado di rilevare Video Amazon Rekognition?
Video Amazon Rekognition è in grado di rilevare oggetti, scene, punti di riferimento, volti, celebrità, testi e contenuti inappropriati nei video. Puoi inoltre ricercare i volti che compaiono in un video utilizzare un repository o una raccolta di immagini di volti personalizzati.
D: Quali tipi di formati e codici supporta Amazon Rekognition Video?
Amazon Rekognition Video supporta file H.264 in formato MPEG-4 (.mp4) o MOV. Se i tuoi file video utilizzano un codec diverso, puoi transcodificarli in H.264 utilizzando AWS Elemental MediaConvert.
D: Come funzionano le API asincrone di Amazon Rekognition Video?
Amazon Rekognition Video può elaborare video archiviati in un bucket Amazon S3. Puoi utilizzare una serie di operazioni asincrone: per avviare l'analisi del video richiamerai un'operazione Start come StartLabelDetection per il rilevamento di oggetti e scene. Lo stato di completamento della richiesta viene pubblicato su un argomento di Amazon Simple Notification Service (SNS). Per conoscere lo stato di completamento dall'argomento Amazon SNS puoi utilizzare una coda Amazon Simple Queue Service (SQS) o una funzione AWS Lambda. Una volta ottenuto lo stato di completamento, richiamerai un'operazione Get come GetLabelDetection per accedere ai risultati della richiesta. Per un elenco di API Amazon Rekognition Video disponibili, consulta questa pagina.
D: Come posso trovare la cronologia di ogni rilevamento in un video?
Video Amazon Rekognition restituisce i risultati delle etichette in base a timestamp o segmenti video. Puoi scegliere come organizzare questi risultati utilizzando il parametro di input AggregateBy nell'API GetLabelDetection.
- Quando i risultati delle etichette sono organizzati per timestamp, ciascuna etichetta viene restituita ogni volta che Video Amazon Rekognition rileva tale etichetta nella cronologia del video. Ad esempio, se viene rilevato "Cane" a 2000 ms e 4000 ms, Video Amazon Rekognition restituisce 2 voci di etichetta per "Cane", una con 2000 ms e un'altra con 4000 ms.
- Quando i risultati delle etichette sono organizzati per segmenti video, Video Amazon Rekognition restituisce il segmento video per quando viene rilevata un'etichetta su più fotogrammi consecutivi. Un segmento video viene definito da un timestamp di inizio, un timestamp di fine e una durata. Ad esempio, se "Cane" viene rilevato in 2 frame consecutivi a 2000 ms e 4000 ms, Video Amazon Rekognition restituirà 1 voce di etichetta per "Cane" con timestamp di inizio 2000 ms, timestamp di fine 4000 ms e durata di 2000 ms.
Per saperne di più su timestamp e segmenti e per vedere una risposta API di esempio, visita Rilevamento di etichette in un video.
D: Quante attività di analisi video posso eseguire contemporaneamente con Video Amazon Rekognition?
Con Amazon Rekognition Video puoi elaborare fino a 20 attività contemporaneamente. Per ulteriori informazioni sui limiti, consulta la nostra pagina corrispondente.
Q: Quale risoluzione video devo utilizzare?
Amazon Rekognition Video gestisce automaticamente un'ampia gamma di risoluzioni e qualità video. Per risultati ottimali, si consiglia di utilizzare da 720p (1280×720 pixel) a 1080p (1920x1080 pixel) o risoluzioni equivalenti. Video con risoluzioni molto basse (ad esempio, QVGA o 240p) possono avere un impatto negativo sulla qualità dei risultati.
D: Che cos'è il rilevamento dei movimenti delle persone?
Con Rekognition Video puoi trovare il percorso di ogni persona nella sequenza temporale del video. Rekognition Video rileva le persone anche quando la telecamera è in movimento e, per ciascuna persona, restituisce la cornice insieme alle caratteristiche del volto e alle indicazioni di data/ora. Nelle attività commerciali consente di ottenere informazioni anonime sui clienti, rilevando ad esempio come si muovono lungo i corridoi di un centro commerciale o per quanto tempo rimangono in fila alle casse.
Analisi multimediale con Amazon Rekognition Video
D: Quali tipi di analisi multimediale è in grado di eseguire Amazon Rekognition Video?
Amazon Rekognition Video è in grado di rilevare i seguenti tipi di segmenti o entità per analisi multimediale:
- Fotogrammi neri: I video spesso contengono una breve durata di fotogrammi neri vuoti privi di audio che vengono utilizzati come segnali per inserire pubblicità o per delimitare la fine di un segmento di programma, come una scena o i titoli di testa. Con Amazon Rekognition Video, è possibile rilevare tali sequenze di fotogrammi neri per automatizzare l'inserimento di annunci pubblicitari, impacchettare contenuti per VOD e delimitare vari segmenti o scene di programma. I fotogrammi neri con audio (come dissolvenze o voci fuori campo) sono considerati come contenuti e non vengono restituiti.
- Titoli di coda: Amazon Rekognition Video aiuta a identificare automaticamente i fotogrammi esatti in cui iniziano e finiscono i titoli di testa e di coda di un film o di un programma televisivo. Con questa informazione, è possibile generare 'binge marker' o prompt visualizzatori interattivi come 'Prossimo episodio' o 'Salta l'intro' in applicazioni VOD. Amazon Rekognition Video è addestrato per gestire un'ampia gamma di stili di titoli di testa e di coda, che vanno dai titoli semplici a rotazione a quelli più impegnativi accanto ai contenuti, titoli sulle scene o titoli stilizzati in contenuti anime.
- Fotogrammi: Un fotogramma è costituito da una serie di immagini consecutive collegate tra loro, scattate in modo contiguo da un'unica telecamera e che rappresentano un'azione continua nel tempo e nello spazio. Con Amazon Rekognition Video puoi rilevare l'inizio, la fine e la durata di ciascun fotogramma e tenere conto di tutti i fotogrammi di una parte di contenuto. I metadati dei fotogrammi possono essere utilizzati per applicazioni come la creazione di video promozionali utilizzando fotogrammi selezionati, la generazione una serie di miniature di anteprima che evitano contenuti di transizione tra i fotogrammi e l'inserimento di annunci pubblicitari in spot che non disturbano l'esperienza dello spettatore, ad esempio la metà di un fotogramma quando qualcuno sta parlando.
- Barre di colore: Amazon Rekognition Video consente di rilevare sezioni di video con barre colore SMPTE o EBU, che sono un insieme di colori visualizzati in modelli specifici per garantire che il colore sia calibrato correttamente su monitor, programmi e telecamere. Per ulteriori informazioni sulle barre di colore SMPTE, consulta barra di colore SMPTE. Questi metadati sono utili per preparare contenuti di applicazioni VOD rimuovendo i segmenti di barre di colore o per rilevare problemi come la perdita dei segnali di trasmissione quando le barre di colore compaiono continuamente come segnale predefinito al posto dei contenuti.
- Lavagnette: Le lavagnette sono sezioni, tipicamente all'inizio di un video, che contengono metadati testuali su episodio, studio, formato video, canali audio e altro. Amazon Rekognition è in grado di identificare l'inizio e la fine di queste lavagnette, rendendo facile per gli operatori l'utilizzo di metadati testuali o per rimuovere facilmente la lavagnetta per preparare un contenuto per la visione finale.
- Loghi di studio: I loghi di studio sono sequenze che mostrano i loghi o i marchi dello studio di produzione del programma. Amazon Rekognition è in grado di identificare queste sequenze, rendendo facile per gli operatori la loro revisione per identificare gli studi.
- Contenuto: Il contenuto si riferisce alle porzioni del programma televisivo o del film che contengono il programma o i relativi elementi. Fotogrammi neri, titoli di testa e di coda, barre di colore, lavagnette e loghi di studio non sono considerati contenuti. Amazon Rekognition Video consente di rilevare l'inizio e la fine di ogni segmento di contenuto nel video, permettendo molteplici utilizzi, come per esempio la ricerca dei tempi di esecuzione del programma o la ricerca di determinati segmenti che servono per scopi specifici. Per esempio, un rapido riepilogo dell'episodio precedente all'inizio del video è un tipo di contenuto. Analogamente, dopo la fine dei titoli di coda, può apparire un contenuto bonus. Inoltre, alcuni video possono avere contenuti 'privi di testo' alla fine del video, che sono un insieme di tutti i contenuti del programma che contengono testo sovrapposto, ma con quel testo rimosso per permetterne l'internazionalizzazione in un'altra lingua. Una volta che tutti i segmenti di contenuto sono stati rilevati con Amazon Rekognition Video, è possibile applicare una specifica conoscenza di dominio come 'i miei video cominciano sempre con un riepilogo' per categorizzare ulteriormente ogni segmento o per sottoporli a revisione umana.
Amazon Rekognition Video fornisce inizio, fine, durata e timecode per ogni entità rilevata, nonché timestamp (millisecondi), codice del formato SMPTE e opzioni del numero di fotogrammi per ognuno.
D: Come inizio l'analisi multimediale con Amazon Rekognition Video?
Le caratteristiche dell'analisi multimediale sono disponibili tramite l'API di rilevamento dei segmenti di Amazon Rekognition Video. Questa è un'API asincrona costituita da due operazioni: StartSegmentDetection per iniziare l'analisi, e GetSegmentDetection per ottenere i risultati dell'analisi. Per iniziare, consulta la documentazione.
Se desideri visualizzare i risultati dell'analisi multimediale o provare altri servizi di intelligenza artificiale di Amazon come Amazon Transcribe con i tuoi video, utilizza l'applicazione Media Insights, un'applicazione demo e framework serverless per generare facilmente informazioni e sviluppare applicazioni per le tue risorse video, audio, di testo e immagini, mediante l'uso di servizi AWS Machine Learning e multimediali. Puoi facilmente avviare la tua applicazione demo utilizzando il modello AWS CloudFormation fornito, per provare i tuoi video e visualizzare i risultati dell'analisi.
D: Che cos'è un timecode accurato del fotogramma?
I timecode accurati dei fotogrammi forniscono il numero esatto di fotogrammi per un segmento di video o entità pertinente. Di norma le aziende multimediali elaborano i timecode utilizzando il formato SMPTE (Society of Motion Picture and Television Engineers) ore:minuti:secondi:numero di fotogrammi, ad esempio, 00:24:53:22.
D: Il fotogramma del rilevamento dei segmenti di Amazon Rekognition Video è accurato?
Sì, l'API per il rilevamento dei segmenti di Amazon Rekognition Video fornisce timecode SMPTE accurati dei fotogrammi, nonché timestamp in millisecondi per l'inizio e la fine di ogni rilevamento.
D: Quali tipi di formati per la frequenza dei fotogrammi può gestire il rilevamento dei segmenti di Amazon Rekognition Video?
Il rilevamento dei segmenti di Amazon Rekognition Video gestisce automaticamente standard di numeri interi, frazioni e drop frame per frequenze comprese tra 15 e 60 fps. Ad esempio, sono supportate frequenze di fotogrammi come 23,976 fps, 25 fps, 29,97 fps e 30 fps. Le informazioni sulla frequenza dei fotogrammi vengono utilizzate in ogni caso per fornire timecode accurati dei fotogrammi.
D: Quale opzione di filtro è possibile applicare?
È possibile specificare l'affidabilità minima per ogni tipo di segmento mentre si effettua la richiesta API. Per esempio, è possibile escludere qualsiasi segmento con punteggio di affidabilità inferiore al 70%. Per il rilevamento dei fotogrammi neri, è anche possibile controllare la luminosità massima dei pixel considerati come pixel neri, come ad esempio un valore di 40 per una gamma cromatica da 0 a 255. Inoltre, è anche possibile controllare quale percentuale di pixel in un fotogramma deve soddisfare questo criterio di luminosità dei pixel neri per poter classificare il fotogramma come fotogramma nero, per esempio il 99%. Questi filtri consentono di rendere conto di qualità e formato video variati quando si rilevano fotogrammi neri. Per esempio, video recuperati da archiviazione a nastro possono essere rumorosi e avere un diverso livello di nero rispetto a un video digitale moderno. Per ulteriori dettagli, consulta questa pagina.
Fatturazione
D: In che modo Amazon Rekognition conteggia le immagini elaborate?
Per le API che accettano immagini come input, Amazon Rekognition fa coincidere il numero delle immagini analizzate con il numero delle immagini elaborate. DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage e Image Properties appartengono a questa categoria. Per l'API CompareFaces, in cui due immagini vengono inviate come input, solo l'immagine di origine viene conteggiata come unità di immagini elaborate.
Per le chiamate API che non richiedono un'immagine come parametro di input, Amazon Rekognition conteggia ogni chiamata API come un'immagine elaborata. SearchFaces appartiene a questa categoria.
Le restanti API di Amazon Rekognition - ListFaces, DeleteFaces, CreateCollection, DeleteCollection e ListCollections - non concorrono a calcolare il numero delle immagini elaborate.
D: In che modo Amazon Rekognition conta i minuti dei video elaborati?
Per i video archiviati, Amazon Rekognition conta i minuti di video elaborati correttamente dall'API e li somma per la fatturazione. Per i flussi video in tempo reale ti verranno addebitati i blocchi di cinque secondi di video elaborati correttamente.
D: Per quali API Amazon Rekognition applica tariffe?
Amazon Rekognition Image addebita i costi relativi all'uso delle seguenti API: DetectLabels, DetectModerationLabels, DetectText, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces e Image Properties. Amazon Rekognition Video addebita i costi in base alle durate (in minuti) dei video elaborati correttamente dalle API StartLabelDetection, StartFaceDetection, StartFaceDetection, StartTextDetection, StartContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSearch e StartStreamProcessor.
D: Quanto costa Amazon Rekognition?
Per informazioni sui prezzi correnti, consulta la pagina dei prezzi di Amazon Rekognition.
D: Mi verranno addebitati i vettori caratteristici archiviati nelle mie raccolte di volti?
Sì. Amazon Rekognition addebita 0,01 USD per 1.000 vettori caratteristici dei volti al mese. Per ulteriori dettagli, consulta la pagina dei prezzi.
D: Amazon Rekognition partecipa al piano gratuito di AWS?
Sì. Poiché hai accesso al piano di utilizzo gratuito di AWS, puoi iniziare a utilizzare Amazon Rekognition gratuitamente. Dopo l'iscrizione, i nuovi clienti Amazon Rekognition possono analizzare fino a 5.000 immagini gratuitamente ogni mese per i primi 12 mesi. Eccetto Image Properties, puoi utilizzare tutte le API di Amazon Rekognition con questo piano gratuito e perfino archiviare fino a 1.000 volti senza ulteriori addebiti. Inoltre, i clienti di Amazon Rekognition Video possono analizzare gratuitamente 1.000 minuti di video al mese per il primo anno.
D: I prezzi includono le tasse?
Per informazioni dettagliate sulle imposte, consulta la guida alle imposte di Amazon Web Services.
Integrazione con AWS
D: Amazon Rekognition Video funziona con le immagini archiviate in Amazon S3?
Sì. Puoi iniziare ad analizzare immagini archiviate in Amazon S3 semplicemente indirizzando l'API di Amazon Rekognition al tuo bucket di S3. Non è necessario che sposti i dati. Per ulteriori dettagli su come utilizzare oggetti di S3 con le chiamate API di Amazon Rekognition, vedi il nostro esercizio sul rilevamento delle etichette.
D: È possibile utilizzare Amazon Rekognition con immagini memorizzate in un bucket di Amazon S3 in un'altra regione?
No. Verifica che il bucket di Amazon S3 che desideri utilizzare si trovi nella stessa regione degli endpoint per l'API di Amazon Rekognition.
D: Come posso elaborare più file di immagini in un batch utilizzando Amazon Rekognition?
Puoi elaborare le immagini di Amazon S3 in blocco seguendo le fasi descritte nel nostro esempio di elaborazione di batch in Amazon Rekognition su GitHub.
D: Come posso utilizzare AWS Lambda con Amazon Rekognition?
Amazon Rekognition consente di accedere facilmente ad AWS Lambda e ti permette di portare analisi di immagini basate sui trigger nei data store di AWS come Amazon S3 e Amazon DynamoDB. Per utilizzare Amazon Rekognition con AWS Lambda, segui la procedura riportata qui e seleziona il progetto di Amazon Rekognition.
D: È possibile utilizzare Amazon Rekognition con AWS CloudTrail?
Sì. Amazon Rekognition supporta la registrazione, sotto forma di file di log di evento in CloudTrail, delle seguenti operazioni: CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors e ListCollections. Per ulteriori informazioni sulle chiamate API di Amazon Rekognition che si integrano con AWS CloudTrail, consulta il documento Logging Amazon Rekognition API Calls with AWS CloudTrail.
Privacy dei dati
D: Le immagini e i video da me inviati ed elaborati da Amazon Rekognition vengono archiviati? E come vengono utilizzati da AWS?
Amazon Rekognition può archiviare e utilizzare le immagini e i video elaborati dal servizio esclusivamente per fornire e mantenere il servizio e, a meno che tu scelga di non farlo come specificato di seguito, anche per migliorare e sviluppare la qualità di Amazon Rekognition e di altre tecnologie di apprendimento automatico e intelligenza artificiale di Amazon. L'utilizzo dei tuoi contenuti è importante per migliorare continuamente la tua esperienza come cliente di Amazon Rekognition, anche grazie allo sviluppo e al perfezionamento delle tecnologie correlate. Non usiamo alcun dato di identificazione personale eventualmente presente nei tuoi contenuti per proporre prodotti, servizi o attività marketing a te o ai tuoi utenti finali. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli adeguati e sofisticati, a livello tecnico e fisico, tra cui la crittografia sia in condizioni statiche che durante i trasferimenti, per impedire gli accessi non autorizzati e la divulgazione dei contenuti e per garantire che l'utilizzo da parte nostra sia conforme ai nostri impegni nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/. Puoi scegliere di non utilizzare i contenuti immagini e video per migliorare o sviluppare la qualità di Amazon Rekognition e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon, utilizzando una policy di esclusione di AWS Organizations. Per ulteriori informazioni su come rifiutare, consulta Gestione della policy di esclusione dei servizi di AI.
D: Posso eliminare gli input di immagini e video che sono stati archiviati da Amazon Rekognition?
Sì. Puoi richiedere l'eliminazione dei contenuti audio e video associati al tuo account contattando AWS Support. L'eliminazione delle immagini e dei video che hai inviato potrebbe compromettere la tua esperienza con Amazon Rekognition.
D: Chi ha accesso ai miei contenuti elaborati e archiviati da Amazon Rekognition?
Solo i dipendenti autorizzati avranno accesso ai tuoi contenuti elaborati da Amazon Rekognition. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli adeguati e sofisticati, a livello tecnico e fisico, tra cui la crittografia sia in condizioni statiche che durante i trasferimenti, per impedire gli accessi non autorizzati e la divulgazione dei contenuti e per garantire che l'utilizzo da parte nostra sia conforme ai nostri impegni nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/.
D: I miei contenuti elaborati e archiviati da Amazon Rekognition rimangono di mia proprietà?
Conservi sempre la proprietà dei tuoi contenuti. Li utilizzeremo solo con il tuo consenso.
D: I contenuti elaborati da Amazon Rekognition vengono trasferiti fuori dall'area AWS in cui utilizzo Amazon Rekognition?
Tutti i contenuti elaborati da Amazon Rekognition sono crittografati e memorizzati in condizioni statiche nella regione AWS in cui utilizzi Amazon Rekognition. A meno che tu decida di non farlo, come specificato di seguito, i contenuti elaborati da Amazon Rekognition possono essere parzialmente archiviati in un'altra regione AWS esclusivamente per finalità di costante miglioramento e sviluppo della tua esperienza di cliente Amazon Rekognition e di altre tecnologie di apprendimento automatico e intelligenza artificiale di Amazon. Puoi richiedere l'eliminazione dei contenuti audio e video associati al tuo account contattando AWS Support. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli adeguati e sofisticati, a livello tecnico e fisico, tra cui la crittografia sia in condizioni statiche che durante i trasferimenti, per impedire gli accessi non autorizzati e la divulgazione dei contenuti e per garantire che l'utilizzo da parte nostra sia conforme ai nostri impegni nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/. I tuoi contenuti non verranno archiviati in un'altra regione AWS se scegli di non utilizzarli al fine di migliorare e sviluppare la qualità di Amazon Rekognition e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon. Per ulteriori informazioni su come rifiutare, consulta Gestione della policy di esclusione dei servizi di AI.
D: Posso usare Amazon Rekognition collegato a siti Web, programmi o altre applicazioni rivolte o destinate a minori di 13 anni e soggette alle norme previste dal Children's Online Privacy Protection Act (COPPA)?
Sì. Ai sensi dei Termini di servizio di Amazon Rekognition, adempiuto l'obbligo di fornire il necessario preavviso e ottenuto il consenso dei genitori secondo quanto prescritto dal COPPA, è possibile utilizzare Amazon Rekognition in connessione con siti Web, programmi o altre applicazioni rivolte o destinate, del tutto o in parte, a minori di 13 anni.
D: in che modo è possibile determinare se un sito Web, un programma o un'applicazione sono soggetti al COPPA?
Per ottenere informazioni sui requisiti del COPPA e linee guida su come determinare se un sito Web, programma o applicazione è soggetta al COPPA, consulta direttamente le risorse fornite dalla United States Federal Trade Commission. Il sito offre informazioni su come determinare se un servizio è rivolto o destinato, del tutto o in parte, ai minori di 13 anni.
D: Amazon Rekognition è idoneo ai fini HIPAA?
Amazon Rekognition è un servizio idoneo ai fini HIPAA coperto dal BAA (Business Associate Addendum) di AWS. Se disponi di un BAA con AWS, Amazon Rekognition tratterà, divulgherà e conserverà le informazioni sanitarie protette solo se stabilito nei termini del contratto.
Controllo degli accessi
D: Come posso controllare l'accesso degli utenti ad Amazon Rekognition?
Amazon Rekognition è stato integrato con AWS Identity and Access Management (IAM). Le policy di AWS IAM possono essere utilizzate per garantire che solo gli utenti autorizzati abbiano accesso alle API di Amazon Rekognition. Per ulteriori dettagli, consulta la pagina del controllo degli accessi e dell'autenticazione di Amazon Rekognition.
Segnalare un uso illecito
D: In che modo posso riportare un potenziale uso illecito di Amazon Rekognition?
Se hai ragione di credere che Amazon Rekognition sia utilizzato in maniera illecita o illegale oppure infrange i tuoi diritti, nonché quelli di altre persone, puoi effettuare una segnalazione e AWS investigherà sulla questione.
Ulteriori informazioni sui prezzi di Amazon Rekognition