Prova Amazon CloudSearch gratis
Inizia la prova gratuita di CloudSearchUlteriori informazioni
Otterrai 750 ore gratuite di search instance interamente funzionali per 30 giorni. Per iniziare:
Accedi al tuo account AWS e avvia la Console CloudSearch
Crea e configura un search domain con pochi clic
Carica i dati e invia le richieste di ricerca/aggiornamento tramite la console, i kit SDK AWS o l’interfaccia CLI
D: Cos'è Amazon CloudSearch?
Amazon CloudSearch è un servizio totalmente gestito nel cloud AWS che agevola la configurazione, la gestione e il dimensionamento delle soluzioni di ricerca per un sito Web o un'applicazione.
D: Quali vantaggi offre l’uso di un servizio di ricerca gestito come Amazon CloudSearch rispetto a quello di un mio servizio di ricerca su EC2?
Amazon CloudSearch offre diversi vantaggi rispetto all’uso di un servizio di ricerca gestito in proprio, fra cui facilità di configurazione, Auto Scaling in funzione dei dati e del traffico, tolleranza ai guasti dei cluster ed elevata disponibilità con Multi-AZ. Con pochi semplici clic nella Console di gestione AWS puoi creare un search domain e caricare i dati che desideri rendere disponibili per la ricerca, quindi Amazon CloudSearch effettua automaticamente il provisioning delle risorse richieste e distribuisce un search index altamente ottimizzato.
D: Cos’è un motore di ricerca?
Un motore di ricerca permette di effettuare ricerche all’interno di vaste raccolte di dati (detti documenti) prevalentemente in formato testo, individuando rapidamente i risultati che presentano la massima corrispondenza. Le search request consistono solitamente in poche parole di testo non strutturato, come “film matt damon". I risultati sono di solito elencati in ordine di corrispondenza decrescente, con i più rilevanti (quelli più “rispondenti" ai termini utilizzati per la ricerca) all’inizio dell’elenco.
I documenti possono essere totalmente privi di struttura o contenere più campi che è possibile interrogare individualmente in via opzionale. Un servizio di ricerca dei film può ad esempio avere documenti con campi per titolo, regista, attore, descrizione e recensioni. I risultati forniti da un motore di ricerca sono di solito proxy per i documenti sottostanti, ad esempio URL che rinviano a specifiche pagine Web. Il servizio di ricerca è tuttavia in grado di fornire anche i contenuti effettivi di singoli campi.
D: Quali vantaggi offre Amazon CloudSearch?
Amazon CloudSearch è un servizio di ricerca totalmente gestito che esegue automaticamente il dimensionamento in funzione del volume di dati e della complessità delle search request in modo da fornire risultati rapidi e precisi. Amazon CloudSearch permette ai clienti di aggiungere capacità di ricerca senza dover gestire host, dimensionamento del traffico e dei dati, ridondanza o pacchetti software. Le tariffe orarie sono ridotte e si pagano soltanto le risorse utilizzate. Amazon CloudSearch è in grado di offrire un costo totale di proprietà nettamente inferiore rispetto all’adozione e alla gestione di un proprio ambiente di ricerca.
D: È possibile utilizzare Amazon CloudSearch con un servizio di storage?
I servizi di ricerca e di storage sono complementari. Un servizio di ricerca richiede che i documenti siano già archiviati da qualche parte, che si tratti di file di un file system, di dati in Amazon S3 o di record in un’istanza Amazon DynamoDB o Amazon RDS. Il servizio di ricerca è un sistema di reperimento rapido che rende tali elementi disponibili per le ricerche, con latenze inferiori al secondo, tramite un processo detto indicizzazione.
D: È possibile utilizzare Amazon CloudSearch con un database?
I motori di ricerca e i database non si escludono a vicenda; in realtà, essi vengono spesso utilizzati insieme. Se disponi già di un database che contiene dati strutturati, puoi servirti di un motore di ricerca per filtrare e classificare in modo intelligente il contenuto di tale database utilizzando le parole chiave di ricerca come criteri di rilevanza.
È possibile utilizzare un servizio di ricerca per indicizzare dati sia strutturati, sia non, e per effettuare ricerche al loro interno. Le fonti di provenienza del contenuto possono essere molteplici, e possono includere campi di database, file in vari formati, pagine Web e così via. Un servizio di ricerca è in grado di supportare una classificazione personalizzabile dei risultati, oltre a funzioni speciali di ricerca, come l’uso di facet per il filtraggio, non disponibili nei database.
D: In quali regioni è disponibile Amazon CloudSearch?
Amazon CloudSearch è disponibile nelle seguenti regioni AWS: Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Stati Uniti occidentali (California settentrionale), UE (Irlanda), UE (Francoforte), Sudamerica (San Paolo) e Asia Pacifico (Singapore, Sydney, Tokyo e Seul).
D: Quali nuove funzioni supporta Amazon CloudSearch?
Questa ultima release di Amazon CloudSearch supporta una serie di nuove funzioni di ricerca e amministrazione. Fra le nuove funzioni chiave figurano:
- Supporto delle lingue:
- 34 lingue, più una “multipla" per gestire i campi con una combinazione di lingue
- Configurazione della lingua campo per campo
- Analisi dei testi specifica per una data lingua
- Disponibilità di più livelli di stemming con algoritmi per numerose lingue, compresa “nessuna"
- Avanzate funzioni di ricerca:
- Suggerimenti
- Evidenziazioni
- Ricerca geospaziale
- Nuovi tipi di dati: data, doppi, interi con segno a 64 bit, latlon
- Ricerca di frasi imprecise
- Assegnazione di priorità ai termini
- Avanzata ricerca di intervalli per tutti i tipi di campi
- Supporto per più parser di query: semplice, strutturato, lucene e dismax
- Opzioni di configurazione dei parser di query
- Funzioni di amministrazione:
- Opzione di elevata disponibilità
- Integrazione con IAM
- Dimensionamento configurabile dall’utente
- Opzione di elevata disponibilità
- Disponibilità in ulteriori regioni AWS: Asia Pacifico (Tokyo), Asia Pacifico (Singapore), Asia Pacifico (Sydney), Asia Pacifico (Seul) e Sud America (San Paolo)
D: Amazon CloudSearch supporta ancora lo stemming con dizionari?
Sì. Oltre allo stemming con algoritmi, la nuova versione di Amazon CloudSearch supporta lo stemming con dizionari.
D: La nuova versione di Amazon CloudSearch utilizza Apache Solr?
Sì. L’ultima versione di Amazon CloudSearch è stata modificata in modo da utilizzare Apache Solr come motore di ricerca dei testi sottostanti. Oltre all’esperienza del servizio di ricerca gestito che agevola la configurazione, l’uso e il dimensionamento dei search domain, Amazon CloudSearch fornisce ora varie funzioni dei motori di ricerca di successo disponibili con Apache Solr.
D: Posso accedere alla nuova versione di Amazon CloudSearch tramite la console?
Sì. Puoi accedere alla nuova versione di Amazon CloudSearch tramite la console. Se sei già cliente di Amazon CloudSearch e hai già dei search domain, quando crei nuovi search domain puoi scegliere la versione di Amazon CloudSearch che desideri utilizzare. I nuovi clienti utilizzeranno di default la nuova versione di Amazon CloudSearch, e non avranno accesso alla versione 2011-01-01.
D: Quali tipi di dati supporta la nuova versione di Amazon CloudSearch?
Amazon CloudSearch supporta due tipi di campi di testo, vale a dire testo e letterale. L’elaborazione dei campi di testo viene eseguita secondo la lingua configurata per essi, in modo da individuare singole parole in grado da fungere da corrispondenze per le query. I campi letterali non vengono sottoposti ad alcuna elaborazione e devono presentare una corrispondenza esatta, maiuscole e minuscole comprese. CloudSearch supporta inoltre quattro tipi di numeri: int, doppi, data e latlon. I campi Int contengono valori interi con segno a 64 bit. I campi doppi contengono valori a virgola mobile a doppia lunghezza. I campi data contengono date specificate in base al fuso UTC (Coordinated Universal Time, tempo coordinato universale) a norma IETF RFC3339: aaaa-mm-ggT00:00:00Z. I campi latlon contengono dati di posizione salvati come coppie di valori di latitudine e longitudine.
D: I search domain esistenti creati con la versione 2011-02-01 di Amazon CloudSearch continuano a funzionare?
Sì. I search domain esistenti creati con la versione 2011-02-01 di Amazon CloudSearch continuano a funzionare.
D: Posso utilizzare le nuove funzioni sui miei search domain esistenti creati con la versione 2011-01-01 di Amazon CloudSearch?
No. I search domain esistenti creati con la versione 2011-01-01 di Amazon CloudSearch non hanno accesso alle funzioni disponibili con la nuova versione. Per accedere alle nuove funzioni, devi creare un nuovo search domain utilizzando la versione 2013-01-01 di Amazon CloudSearch.
D: Come si fa a migrare alla nuova versione di Amazon CloudSearch le applicazioni create con la sua versione 2011-01-01?
Per utilizzare la nuova versione di Amazon CloudSearch occorre ricreare con essa i domini esistenti e ricaricarvi i dati. Per ulteriori informazioni, consulta la voce Migrazione all’API 2013-01-01 della Guida per gli sviluppatori di Amazon CloudSearch.
D: AWS continuerà a supportare la versione 2011-02-01 di Amazon CloudSearch?
Sì. AWS continuerà a supportare la versione 2011-02-01 di Amazon CloudSearch.
D: Posso creare nuovi search domain utilizzando la versione 2011-02-01 di Amazon CloudSearch?
Gli attuali clienti di Amazon CloudSearch con domini 2011-02-01 già esistenti possono scegliere se utilizzare l’API 2011-02-01 o la nuova API 2013-01-01 per i loro nuovi domini. Nel caso dei nuovi clienti i search domain vengono creati automaticamente con l’API 2013-01-01.
D: Posso usufruire dell’offerta di prova gratuita con la nuova versione di Amazon CloudSearch?
I nuovi clienti possono ancora usufruire dell’offerta di prova gratuita disponibile con Amazon CloudSearch. Per informazioni dettagliate, consulta la pagina relativa alla Prova gratuita di Amazon CloudSearch.
D: Come si inizia a usare Amazon CloudSearch?
Per registrarti ad Amazon CloudSearch, fai clic sul pulsante Crea un account gratuito nella pagina dei dettagli di Amazon CloudFront e completa la procedura di registrazione. Per accedere al servizio è necessario un account Amazon Web Services. Se non ne possiedi uno, all'inizio della procedura di registrazione ad Amazon CloudSearch ti viene chiesto di creare un account AWS.
Una volta eseguita la registrazione, seleziona Amazon CloudSearch nella Console di gestione AWS. La console di Amazon CloudSearch ti permette di creare rapidamente un search domain, di configurare i campi di ricerca, di caricare dati di esempio e di inviare query di ricerca al tuo search domain. Per eseguire tali operazioni puoi inoltre utilizzare i kit SDK e l’interfaccia CLI di AWS.
Per ulteriori informazioni, consulta il tutorial Nozioni di base nella Guida per gli sviluppatori di Amazon CloudSearch.
D: I kit SDK AWS supportano Amazon CloudSearch?
Sì, i kit SDK AWS per Java, Ruby, Python, .Net, PHP e Node.js forniscono un supporto per CloudSearch. I kit SDK AWS ti permettono di creare rapidamente un search domain, di configurare i campi di ricerca, di caricare dati e di inviare query di ricerca al tuo search domain.
D: L’interfaccia CLI AWS supporta Amazon CloudSearch?
Sì, l’interfaccia CLI AWS fornisce un supporto per CloudSearch. L’interfaccia CLI AWS ti permette di creare rapidamente un search domain, di configurare i campi di ricerca, di caricare dati e di inviare query di ricerca al tuo search domain.
D: Posso ancora utilizzare gli strumenti CLT di Amazon CloudSearch?
Sì, gli strumenti CLT di Amazon CloudSearch rimangono operativi.
D: Cos’è e come si crea un search domain?
Un search domain è formato da un contenitore di dati e da un insieme di servizi che tendono tali dati disponibili per le ricerche. Tali servizi includono:
- Un servizio documenti che ti permette di caricare i dati nel tuo dominio per l’indicizzazione.
- Un servizio di ricerca che ti permette di eseguire search request a fronte dei tuoi dati indicizzati.
- Un servizio di configurazione per il controllo del comportamento del tuo dominio (inclusa la classificazione per pertinenza).
Puoi creare, gestire ed eliminare i search domain utilizzando la Console di gestione AWS, i kit SDK AWS o l’interfaccia CLI AWS.
D: Come si caricano i documenti in un search domain?
Puoi caricare i documenti nel tuo dominio utilizzando la Console di gestione AWS, i kit SDK AWS o l’interfaccia CLI AWS.
D: I documenti devono essere in un formato specifico?
Per renderli disponibili per le ricerche, i tuoi dati devono essere nel formato JSON o XML.Ogni voce che vuoi poter ricevere come search result è rappresentata come un documento. Ogni documento ha un ID univoco e uno o più campi che contengono i dati che si desidera cercare e ricevere nei risultati. A partire dai dati dei tuoi documenti, Amazon CloudSearch genera un search index conforme ai campi dell’indice configurati per il dominio. Quando i tuoi dati cambiano, devi inviare aggiornamenti che aggiungano o eliminino i documenti dall’indice.
D: Come si creano i batch di documenti formattati per Amazon CloudSearch?
Per creare i batch di documenti che descrivono i tuoi dati devi creare file di testo JSON o XML che specifichino:
- Il tipo di operazione: aggiungi o elimina
- Un identificatore univoco
- I campi effettivi e i loro dati
L’esempio riportato di seguito mostra un singolo batch di documenti in formato JSON:
[
{
"fields" : {
"directors" : [
"Francis Lawrence"
],
"release_date" : "2013-11-11T00:00:00Z",
"genres" : [
"Action",
"Adventure",
"Sci-Fi",
"Thriller"
],
"image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
"plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
"title" : "The Hunger Games: Catching Fire",
"rank" : 4,
"running_time_secs" : 8760,
"actors" : [
"Jennifer Lawrence",
"Josh Hutcherson",
"Liam Hemsworth"
],
"year" : 2013
},
"id" : "tt1951264",
"type" : "add"
}
]
Nota che i valori numerici, come l’anno, non sono fra virgolette, e che i valori dei campi a più valori, come i generi, sono elencati in un array JSON.
Per mettere tali dati a disposizione di Amazon CloudSearch, puoi salvarli in un file e caricarli utilizzando la Console di gestione AWS, i kit SDK AWS o l’interfaccia CLI AWS.
D: Come vengono indicizzati i documenti?
I documenti vengono indicizzati automaticamente quando li carichi nel tuo search domain. Quando modifichi la configurazione puoi inoltre re-indicizzare esplicitamente i tuoi documenti inviando una richiesta di IndexDocuments.
D: In quali casi occorre re-indicizzare un dominio?
Alcune opzioni di configurazione, come l’aggiunta di un nuovo campo dell’indice o l’aggiornamento dei dizionari di stemming o stopword, non sono disponibili fino a quando un dominio non viene re-indicizzato. Quando vengono introdotte modifiche che richiedono un’indicizzazione, lo stato del dominio indica che occorre indicizzarlo. Puoi avviare l’indicizzazione dalla Console di gestione AWS, dai kit SDK AWS o dall’interfaccia CLI AWS.
D: Come si fa a inviare una search request a un search domain?
Ogni search domain è dotato di un servizio di ricerca basato su REST, con un URL univoco (search endpoint) che accetta le search request per il rispettivo insieme di documenti. Puoi avviare le search request dalla Console di gestione AWS, dai kit SDK AWS o dall’interfaccia CLI AWS.
D: Un search domain può estendersi su più zone di disponibilità?
Sì. Se abiliti l’opzione Multi-AZ, Amazon CloudSearch distribuisce ulteriori istanze in una seconda zona di disponibilità della stessa regione. Per ulteriori informazioni, consulta la voce Configurazione delle opzioni di disponibilità della Guida per gli sviluppatori di Amazon CloudSearch.
D: È possibile spostare un search domain da una regione a un'altra?
Al momento non vi è modo di migrare automaticamente un search domain da una regione a un’altra. A tale scopo devi creare e configurare un nuovo dominio nella regione di destinazione, caricarvi i dati ed eliminare il dominio originale.
D: Come si eliminano i search domain?
Per eliminare un search domain, fai clic sul pulsante Elimina dominio della console di Amazon CloudSearch. Puoi eliminare i domini anche tramite i kit SDK AWS o l’interfaccia CLI AWS.
D: Come si eliminano i documenti dai search domain?
Per eliminare i documenti devi specificare un’operazione di eliminazione nel caricamento di batch che contiene l’ID del documento che desideri rimuovere.
Puoi inviare aggiornamenti dei dati tramite la Console di gestione AWS, i kit SDK AWS o l’interfaccia CLI AWS.
D: Come si svuotano i search domain?
Se desideri mantenere gli endpoint del tuo dominio, puoi inviare un comando di eliminazione per ciascun documento presente nel dominio stesso.
D: Perché il mio dominio si trova nello stato di "Elaborazione"?
Un dominio può trovarsi in uno dei seguenti tre stati distinti, vale a dire “elaborazione”, “attivo” o “re-indicizzazione”. Un dominio si trova solitamente nello stato “attivo”, che indica che non sono in corso variazioni, che è possibile interrogare e aggiornare il dominio e che tutte le modifiche precedenti sono al momento visibili nei search result.
Quando occorre re-indicizzare un dominio, Amazon CloudSearch deve ricostruire completamente l’indice. Il dominio non passa tuttavia allo stato di “elaborazione” fino a quando non avvii la re-indicizzazione. In tale fase è ancora possibile interrogare e aggiornare il dominio, ma le variazioni della configurazione non sono visibili nei search result fino al completamento dell’indicizzazione, quando il dominio ritorna nello stato “attivo”.
Puoi inoltre continuare a caricare nel tuo dominio batch di documenti. Se invii un grande volume di aggiornamenti mentre il tuo dominio si trova nello stato di “elaborazione”, tuttavia, il tempo necessario per l’applicazione degli aggiornamenti al tuo search index può aumentare. Se tale aspetto diventa un problema, riduci la cadenza degli aggiornamenti fino a quando il dominio non ritorna nello stato “attivo”.
D: Quali sono le best practice per il processo di bootstrap dei dati in CloudSearch?
Una volta lanciato il tuo dominio, il passo successivo consiste nel caricare i tuoi dati in Amazon CloudSearch. È probabile che ti occorra caricare un singolo set di dati di grandi dimensioni, quindi introdurre aggiornamenti o aggiunte di minore entità mano a mano che vengono ricevuti nuovi dati. Le linee guida riportate di seguito aiutano a rendere rapido e agevole il processo di bootstrap dei tuoi dati iniziali in CloudSearch.
1. Utilizza lo strumento a riga di comando curl-v quando prepari il tuo script
Durante il caricamento di un set di dati, lo script che hai preparato legge i tuoi dati e li utilizza per creare documenti JSON o XML. Ti consigliamo di preparare lo script in anticipo, e di utilizzare curl o un altro strumento a riga di comando semplice per capire se riesci a caricare i documenti creati dallo script. L’opzione “-v” dello strumento curl fornisce spesso informazioni più dettagliate sui problemi di sintassi rispetto ai kit SDK di AWS o a Boto, che sopprimono gli errori per scopi di produzione. Curl visualizza messaggi di errore più dettagliati, aiutandoti a identificare l’origine degli eventuali problemi.
2. Usa il codice caratteri UTF-8
Prima di effettuare il caricamento in CloudSearch, accertati che tutti i dati siano formattati con il codice caratteri UTF-8, e che tutti gli eventuali caratteri Unicode non validi siano stati rimossi. I caratteri illegali impediscono il caricamento dei documenti.
3. Crea il batch dei documenti
La creazione dei batch di documenti è forse l’operazione più importante nel processo di bootstrap dei dati. Oltre a essere inefficiente, l’invio di singoli documenti a CloudSearch dà luogo a errori che è possibile evitare.
Un batch di documenti è semplicemente una raccolta di operazioni di aggiunta ed eliminazione che rappresentano i documenti che desideri aggiungere, aggiornare o eliminare da un tuo dominio. I batch sono descritti in JSON o XML; quando li carichi in un dominio, i dati vengono indicizzati automaticamente in base alle sue opzioni di indicizzazione. Poiché viene fatturato il numero totale di batch di documenti caricati in un search domain, dal punto di vista economico è più conveniente caricare i dati in batch da 5 MB, il volume massimo consentito per carico. Per ridurre il tempo necessario per caricare i tuoi dati, puoi inoltre caricare i batch in parallelo.
4. Esegui un pre-dimensionamento
È inoltre importante dimensionare i dati prima di caricarli in CloudSearch. Il pre-dimensionamento comporta la selezione del tipo di istanza appropriato per la quantità di dati che desideri caricare.
La scelta di un’istanza con una capacità sufficiente per gestire le dimensioni del tuo carico può contribuire a prevenire errori e conteggi delle repliche elevati. Anche se può contribuire a ridurre il tempo di risposta alle ricerche, la creazione di repliche non aumenta le dimensioni del canale dati e non risolve i problemi centrali dei caricamenti di dati.
Mano a mano che il volume di dati inviato aumenta, CloudSearch provvede automaticamente al dimensionamento, passando a istanze più grandi. La scelta preventiva del tipo di istanza appropriato permette tuttavia di risparmiare tempo in un momento successivo del processo di bootstrap, in quanto la transizione da un’istanza a un’altra è tendenzialmente un processo più lento. Viene riportato di seguito un esempio di script di pre-dimensionamento del dominio per il processo di bootstrap e per il ripristino del tipo di istanza una volta caricati i dati.
Pre-dimensionamento prima del processo di bootstrap:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge
aws cloudsearch index-documents --domain-name foo
Ripristino dopo il caricamento dei dati:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small
aws cloudsearch index-documents --domain-name foo
D: Quali sono i modi per evitare gli errori 504?
Se osservi la comparsa di errori 504 oppure conteggi delle repliche elevati, prova a passare a un tipo di istanza più grande. Se hai problemi con il tipo m3.large, passa al tipo m3.xlarge. Se continui a ricevere errori 504 anche dopo il pre-dimensionamento, inizia a creare batch di dati e aumenta il ritardo fra i tentativi di ripetizione.
D: Quali sono le best practice per accelerare la configurazione e la re-indicizzazione dei domini?
Quando modifichi le opzioni di configurazione del tuo search domain, devi ricostruire il search index affinché tali modifiche abbiano effetto sui search result. La ricostruzione dell’indice può richiedere da 30 a 60 minuti, a prescindere dal fatto che tu introduca le modifiche della configurazione una alla volta o in un’unica operazione. Anche se un dominio contiene soltanto un numero limitato di documenti, la re-indicizzazione richiede il tempo indicato per via dell’elaborazione e del provisioning necessari per creare e distribuire l’indice. Occorre pertanto pianificare in anticipo le modifiche della configurazione, effettuarle tutte in un’unica operazione e infine re-indicizzare il dominio. Lo stesso vale quando si configura un nuovo dominio: occorre pianificare la configurazione prima di eseguirla, in modo da poter effettuare l’indicizzazione una sola volta ed essere operativi nel più breve tempo possibile.
Alcune modifiche dei domini richiedono una re-indicizzazione, mentre per altre occorre soltanto distribuire nuovamente l’indice esistente. La ridistribuzione di un dominio richiede da 10 a 15 minuti, a fronte dei 30 – 60 necessari per la re-indicizzazione. Durante una ridistribuzione, CloudSearch crea nuovi nodi, distribuisce loro l’indice e chiude i vecchi nodi. Durante la ridistribuzione, lo stato del dominio diventa “elaborazione”. Quando occorre una re-indicizzazione lo stato del dominio diventa “Occorre indicizzazione”, quindi “Elaborazione” una volta avviata l’indicizzazione. Una volta creato il nuovo indice, il dominio viene nuovamente distribuito. La tabella riportata di seguito riassume le modifiche che richiedono una re-indicizzazione seguita da una ridistribuzione, e quelle che necessitano soltanto di una ridistribuzione. Tali indicazioni aiutano a pianificare meglio le modifiche della configurazione.
Modifica |
Occorre una re-indicizzazione |
Occorre una ridistribuzione |
Multi-AZ | No |
Sì |
Campi dell’indice |
Sì |
Sì |
Opzioni dei campi dell’indice |
Sì | Sì |
Tipo di istanza |
Sì | Sì |
Conteggio delle partizioni |
Sì | Sì |
Conteggio delle repliche |
No | Sì |
Suggeritori |
Sì | Sì |
Espressioni |
No | Sì |
Schemi di analisi |
Sì | Sì |
D: Quali funzionalità di ricerca fornisce Amazon CloudSearch?
Amazon CloudSearch fornisce funzionalità di indicizzazione e ricerca sia di dati strutturati, sia di testi normali, comprese le funzioni di ricerca con facet, ricerca a testo libero, ricerca con espressioni booleane, classificazione per pertinenza personalizzabile, espressioni di classificazione per tempo di query, ponderazione di campo, ricerca e ordinamento dei risultati utilizzando qualunque campo e opzioni di elaborazione dei tasti fra cui tokenizzazione, stopword, stemming e sinonimi. Per gli aggiornamenti dei documenti viene inoltre fornita l’indicizzazione quasi in tempo reale. Le nuove funzioni includono:
- Suggerimenti di completamento automatico
- Evidenziazioni
- Ricerca geospaziale
- Nuovi tipi di dati: data, doppi, interi con segno a 64 bit, LatLon
- Campi dinamici
- Statistiche dei campi dell’indice
- Ricerca di frasi imprecise
- Assegnazione di priorità ai termini
- Avanzata ricerca di intervalli per tutti i tipi di campi
- Filtri di ricerca che non influiscono negativamente sulla pertinenza
- Supporto per più parser di query: semplice, strutturato, lucene e dismax
- Opzioni di configurazione dei parser di query
D: Cos’è il faceting?
Il faceting ti permette di categorizzare i search result in affinamenti sui quali l’utente può eseguire ulteriori ricerche. Un utente può ad esempio effettuare una ricerca con il termine “ombrelli", e i facet ti permettono di raggruppare i risultati in base al prezzo, ad esempio 0-10 euro, 10-20 euro, 20-40 euro e così via. Amazon CloudSearch consente inoltre di includere nei facet i conteggi dei risultati, in modo che ciascun affinamento abbia un conteggio del numero di documenti presenti nel gruppo in questione. Un esempio può essere costituito da: 0-10 euro (4 voci), 10-20 euro (123 voci), 20-40 (57 voci) e così via.
D: Quali lingue supporta Amazon CloudSearch?
Amazon CloudSearch supporta attualmente 34 lingue, vale a dire arabo (ar), armeno (hy), basco (eu), bulgaro (bg), catalano (ca), cinese semplificato (zh-Simp), cinese tradizionale (zh-Trad), ceco (cs), danese (da), olandese (nl), inglese (en), finlandese (fi), francese (fr), galiziano (gl), tedesco (de), greco (el), ebraico (he), hindi (hi), ungherese (hu), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), coreano (ko), lettone (la), norvegese (no), persiano (fa), portoghese (pt), rumeno (ro), russo (ru), spagnolo (es), svedese (sv), thai (th) e turco (tr). Amazon CloudSearch supporta inoltre un’opzione multipla (mul) per campi che contengono una combinazione di lingue.
D: Amazon CloudSearch supporta la ricerca geospaziale?
Sì, Amazon CloudSearch dispone di un tipo nativo a supporto di latitudine e longitudine (latlon), consentendoti di implementare facilmente operazioni di ricerca e ordinamento su base geografica. Per ulteriori informazioni, consulta la voce Ricerca e classificazione dei risultati per posizione geografica della Guida per gli sviluppatori di Amazon CloudSearch.
D: Quanto tempo occorre affinché i documenti caricati diventino disponibili per le ricerche?
I documenti caricati in un search domain diventano tipicamente disponibili per le ricerche in un tempo compreso fra qualche secondo e alcuni minuti.
D: Quante search request posso inviare al mio search domain?
Non vi è alcun limite intrinseco al numero di search request che è possibile inviare a un search domain.
D: Quali fattori influiscono negativamente sulla latenza delle search request?
Le search request vengono solitamente elaborate entro qualche centinaio di millisecondi, e spesso molto più velocemente. La latenza risente di numerosi fattori, fra cui il tempo necessario per lo scambio della richiesta e delle risposte fra l’applicazione e il search domain, la complessità delle search request e l’intensità con cui il search domain viene utilizzato.
D: Cosa rende una search request more più complessa di un’altra?
Amazon CloudSearch è progettato per elaborare in modo efficiente e con grande rapidità una vasta gamma di search request. La complessità delle search request varia a seconda delle espressioni che definiscono i documenti che presentano una corrispondenza e degli ulteriori criteri che determinano il grado di corrispondenza di ciascun documento. Le search request che corrispondono a un grande numero di documenti richiedono un tempo di elaborazione maggiore di quelle che corrispondono a pochissimi documenti. Le search request che elaborano espressioni complesse richiedono tempi di elaborazione rispetto a quelle che effettuano una classificazione utilizzando un criterio semplice come un singolo campo. Per aiutarti a comprendere la differenza di complessità fra le search request, nella risposta a una richiesta viene indicato il tempo impiegato per elaborarla.
D: Dove è opportuno eseguire un’applicazione di ricerca per ridurre al minimo i tempi di comunicazione con il search domain?
I tempi di comunicazioni sono minimi per le applicazioni il cui hosting avviene nella stessa regione AWS del search domain.
D: Cos’è una search instance?
Una search instance è un singolo motore di ricerca nel cloud che indicizza i documenti e risponde alle search request. Tale istanza dispone di una quantità limitata di risorse di RAM e CPU per l'indicizzazione dei dati e l'elaborazione delle richieste.
D: Cos’è una partizione di ricerca?
Una partizione di ricerca è una porzione di dati che rientra in una singola search instance. In un search domain possono essere presenti una o più partizioni di ricerca, e il loro numero può variare mentre i documenti vengono indicizzati.
D: In che modo il mio search domain effettua il dimensionamento per soddisfare le esigenze della mia applicazione?
Il search domain effettua il dimensionamento in due dimensioni, vale a dire dati e traffico. Al crescere del tuo volume di dati, il numero (o le dimensioni) delle search instance necessarie per contenere i tuoi dati indicizzati aumenta, e il tuo indice viene partizionato fra tali search instance. Al crescere del volume o della complessità delle tue richieste, ciascuna partizione di ricerca deve essere replicata per assicurarle più CPU. Se i tuoi dati richiedono tre partizioni di ricerca, ad esempio, nel tuo search domain sono presenti 3 search instance. Quando il tuo traffico supera la capacità di una singola search instance, ciascuna partizione viene replicata per fornire ulteriori risorse di CPU, e al tuo search domain vengono aggiunte altre tre search instance. Eventuali ulteriori aumenti del traffico danno luogo a ulteriori repliche, fino a un massimo di 5, per ciascuna partizione di ricerca.
D: Quanti dati posso caricare nel mio search domain?
Il numero di partizioni necessarie dipende dai dati e dalla configurazione, quindi la massima quantità di dati che puoi caricare corrisponde al set di dati che dà origine a 10 partizioni di ricerca quando viene applicata la tua configurazione di ricerca. Se superi il limite delle partizioni di ricerca, il tuo dominio non ti permette più di caricare dati fino a quando non elimini dei documenti e non lo re-indicizzi. Se ti occorrono più di 10 partizioni di ricerca, contattaci.
D: Devo selezionare il numero e il tipo di search instance per il mio search domain?
CloudSearch è un servizio di ricerca totalmente gestito che dimensiona automaticamente il tuo search domain e seleziona il numero e il tipo delle search instance. Tutte le search instance di un dato search domain sono dello stesso tipo, che può cambiare nel tempo al crescere dei dati o del traffico.
Puoi inoltre configurare le opzioni di dimensionamento per un dominio di Amazon CloudSearch allo scopo di:
- Aumentare la capacità di carico
- Accelerare le search request
- Aumentare la capacità di ricerca
- Migliorare la tolleranza ai guasti
D: Quali tipi di istanze supporta Amazon CloudSearch?
Amazon CloudSearch supporta i seguenti tipi di istanze:
- Search instance di tipo Small
- Search Instance Large
- Search Instance Extra Large
- Search Instance Double Extra Large
D: Come faccio a scoprire il numero e il tipo delle search instance presenti nel mio search domain?
Scoprire il numero e il tipo delle search instance presenti nel tuo search domain utilizzando la Console di gestione AWS, i kit SDK AWS o l’interfaccia CLI AWS. Il numero e il tipo di search instance cambiano nel tempo e dimensionano automaticamente le capacità, aumentandole o riducendole in funzione dei dati indicizzabili e del traffico di ricerca.
D: Quanto tempo impiegano i search domain ad adeguare le proprie capacità alle variazioni dei dati e del traffico?
I search domain reagiscono solitamente entro pochi minuti agli aumenti del traffico. L’adeguamento alle variazioni del volume dei dati o le riduzioni del traffico può richiedere più tempo, ma è possibile accelerare tale processo invocando un’operazione di IndexDocuments. Se stai per caricare una grande quantità di dati o prevedi un brusco aumento del traffico di query, puoi pre-dimensionare il tuo dominio impostando il tipo di istanza e il conteggio delle repliche desiderati. Per ulteriori informazioni, consulta la voce Configurazione delle opzioni di dimensionamento della Guida per gli sviluppatori di Amazon CloudSearch.
D: Amazon CloudSearch supporta le implementazioni Multi-AZ?
Sì. Amazon CloudSearch supporta le implementazioni Multi-AZ. Quando abiliti l’opzione Multi-AZ, Amazon CloudSearch effettua il provisioning di istanze aggiuntive per il tuo search domain in una seconda zona di disponibilità, e le mantiene in modo da garantire un'elevata disponibilità. Gli aggiornamenti vengono applicati automaticamente alle istanze in entrambe le zone di disponibilità. Il traffico di ricerca viene distribuito fra tutte le istanze, e le istanze di ciascuna zona sono in grado di gestire l'intero carico in caso di guasto.
D: Come funziona la nuova opzione Multi-AZ? In caso di guasto il sistema è soggetto a tempi di inattività?
Quando è abilitata l’opzione Multi-AZ, le istanze Amazon CloudSearch di ciascuna zona sono in grado di gestire l'intero carico in caso di guasto. In caso di interruzione del servizio o di deterioramento delle istanze di una zona, Amazon CloudSearch instrada tutto il traffico verso l’altra zona di disponibilità. La ridondanza delle istanze viene ripristinata in una zona di disponibilità separata, senza alcun intervento amministrativo o interruzione del servizio.
È possibile che alcune query in corso non vadano a buon fine e debbano essere riproposte. Gli aggiornamenti inviati al search domain vengono archiviati in modo durevole e non vanno perduti in caso di guasto.
D: È possibile distribuire un search domain su più di 2 zone di disponibilità?
No. È possibile distribuire un dominio su un massimo di due zone di disponibilità.
D: Posso modificare la configurazione Multi-AZ dei miei search domain?
Sì. Puoi attivare e disattivare la configurazione Multi-AZ dei tuoi search domain. Il servizio non subisce interruzioni quando si modifica tale impostazione.
D: È possibile scegliere le zone di disponibilità su cui è distribuito un search domain?
No. Al momento Amazon CloudSearch sceglie automaticamente una zona di disponibilità alternativa nella stessa regione.
D: Posso scegliere il tipo di istanza utilizzata dal mio dominio?
Sì. L’ultima release di Amazon CloudSearch ti permette di specificare il tipo di istanza desiderato per il tuo dominio. Se necessario, Amazon CloudSearch adegua il dimensionamento del tuo dominio adottando un tipo di istanza più grande, ma non ne seleziona mai uno più piccolo.
D: Qual è il modo più rapido per introdurre i dati in CloudSearch?
Per impostazione predefinita, tutti i domini iniziano con una search instance piccola. Se devi caricare una grande quantità di dati, ti conviene pre-dimensionare il tuo dominio adottando un tipo di istanza più grande. Per ulteriori informazioni, consulta la voce Caricamenti di massa della Guida per gli sviluppatori di Amazon CloudSearch.
D: Come faccio a sapere quale tipo di istanza scegliere per la mia configurazione iniziale?
Per set di dati di dimensioni inferiori a 1 GB o con meno di un milione di documenti da 1 kB, inizia con le impostazioni di default di una singola search instance del tipo Small. Per data set di maggiori dimensioni, valuta un “preriscaldamento” del dominio impostando il tipo di istanza desiderato. Per set di dati fino a 8 GB, inizia con una search instance del tipo Large. Per set di dati da 8 a 16 GB, inizia con una search instance del tipo Extra Large. Per set di dati da 16 a 32 GB, inizia con una search instance del tipo Double Extra Large. Contattaci se ti occorre una capacità di carico superiore o se indicizzare più di 500 GB di dati.
D: Quali funzioni di sicurezza supplementari sono disponibili con la nuova versione di Amazon CloudSearch?
L’ultima release di Amazon CloudSearch fornisce ora l’integrazione IAM per il servizio di configurazione e per tutti i servizi dei search domain. Puoi controllare l’accesso a specifiche operazioni di Amazon CloudSearch e richiedere l’autenticazione per tutte le richieste. Le richieste vengono autenticate utilizzando la versione 4 del protocollo di firma.
D: Come faccio a caricare i miei dati in Amazon CloudSearch in modo sicuro?
Ci invii i tuoi dati tramite una connessione SSL sicura e crittografata utilizzando HTTPS anziché HTTP quando ti colleghi ad Amazon CloudSearch.
D: I miei dati sono già crittografati. Posso semplicemente inviarvi i dati crittografati e la chiave crittografica?
Non supportiamo chiavi crittografiche generate dagli utenti. Devi quindi decrittografare i dati e caricarli utilizzando HTTPS.
D: Supportate search result crittografati?
Sì. Supportiamo HTTPS per tutte le richieste di Amazon CloudSearch.
D: Come faccio a impedire a utenti specifici di accedere al mio search domain?
Amazon CloudSearch supporta l’integrazione IAM per il servizio di configurazione e per tutti i servizi dei search domain. Puoi concedere agli utenti un accesso completo ad Amazon CloudSearch, limitare il loro accesso a domini specifici e consentire o rifiutare l’accesso a operazioni specifiche.
D: Come mi viene addebitato e fatturato l’uso di Amazon CloudSearch?
L’uso del servizio non comporta impegni a lungo termine né costi di configurazione. Dopo la fine del mese, viene addebitato automaticamente sulla tua carta di credito il costo delle risorse utilizzate in quel mese. Sul sito Web di AWS puoi prendere visione in qualunque momento degli addebiti per il periodo di fatturazione in corso accedendo al tuo account Amazon Web Services e facendo clic su Attività account in Il tuo account Web Services.
D: Quanto costa utilizzare Amazon CloudSearch?
Al momento non vi sono variazioni della struttura dei prezzi per Amazon CloudSearch. Per informazioni dettagliate sui prezzi, consulta la voce Prezzi di Amazon CloudSearch.
D: È disponibile una prova gratuita di Amazon CloudSearch?
Sì, per i nuovi clienti di CloudSearch è disponibile una prova gratuita. Per maggiori informazioni, consulta la voce Amazon CloudSearch – Prova gratuita di 30 giorni.
D: Quanto costa utilizzare la nuova versione di Amazon CloudSearch?
Al momento non vi sono variazioni della struttura dei prezzi per Amazon CloudSearch. Per maggiori informazioni, consulta la pagina Prezzi.
D: L’uso della nuova versione di Amazon CloudSearch offre riduzioni dei costi?
L’ultima versione di Amazon CloudSearch offre una compressione avanzata degli indici e supporta indici più grandi su ciascun tipo di istanza. La nuova versione di Amazon CloudSearch è pertanto più efficiente di quella precedente e può dare luogo a notevoli riduzioni dei costi.
D: I prezzi includono le tasse?
Salvo diversamente specificato, i prezzi sono al netto di eventuali tasse e imposte doganali, inclusa l'IVA ed eventuali imposte di vendita. Per i clienti con indirizzo di fatturazione in Giappone, l'utilizzo dei servizi AWS è soggetto all'imposta sul consumo giapponese. Ulteriori informazioni.