무료로 Amazon CloudSearch 사용해 보기
CloudSearch 무료 평가판 시작자세히 알아보기
모든 기능을 갖춘 검색 인스턴스를 30일 750시간 동안 무료로 사용하십시오. 시작하려면 다음을 수행합니다.
AWS 계정에 로그인하고 CloudSearch Console을 시작합니다.
몇 번의 클릭으로 검색 도메인을 생성하고 구성합니다.
콘솔, AWS SDK 또는 CLI를 통해 데이터를 업로드하고 검색/업데이트 요청을 전송합니다.
Q: Amazon CloudSearch란 무엇입니까?
Amazon CloudSearch는 AWS 클라우드의 완전 관리형 서비스로, 이를 이용해 웹 사이트 또는 애플리케이션을 위한 검색 솔루션을 쉽게 설치, 관리 및 확장할 수 있습니다.
Q: EC2에서 자체 검색 서비스를 실행하는 것보다 Amazon CloudSearch와 같은 관리형 검색 서비스를 실행하는 것이 더 나은 이유는 무엇입니까?
Amazon CloudSearch는 자체적인 자가 관리형 검색 서비스를 실행하는 것에 비해 여러 가지 이점을 제공합니다. 예를 들면 손쉬운 구성, 데이터 및 트래픽 자동 조정, 자체 문제 해결 클러스터, 다중 AZ을 이용한 고가용성 등입니다. AWS Management Console에서 몇 번의 클릭만으로 검색 도메인을 생성하고 검색 가능한 데이터를 업로드할 수 있습니다. 그 후 Amazon CloudSearch가 자동으로 필요한 리소스를 프로비저닝하고 사용이 간편하게 조정된 검색 인덱스를 배포합니다.
Q: 검색 엔진은 무엇입니까?
검색 엔진이 있으면 주로 텍스트 형식인 대규모 데이터 항목(즉, 문서)을 검색해 검색 기준에 가장 부합하는 결과를 신속하게 찾을 수 있습니다. 검색 요청은 대개 "장동건 영화"처럼 구조화되어 있지 않은 몇 개 단어로 구성됩니다. 반환되는 결과에는 대개 순위가 매겨지는데, 가장 일치하거나 관련성이 가장 높은 항목(검색 단어와 가장 "가까운" 항목)이 목록 맨 앞에 옵니다.
문서는 완전히 구조화되어 있지 않은 상태일 수도 있고, 각각 따로 검색할 수 있는 여러 필드를 포함하고 있기도 합니다. 예를 들어, 영화 검색 서비스에는 영화 제목, 감독, 배우, 줄거리, 감상평 등의 여러 필드가 포함된 문서들이 업로드되어 있을 것입니다. 대개 검색 엔진이 반환하는 결과는 특정 웹 페이지 URL 같은 검색 대상 문서의 대체 항목입니다. 하지만 각 필드의 실제 콘텐츠를 반환할 수도 있습니다.
Q: Amazon CloudSearch의 장점은 무엇입니까?
Amazon CloudSearch는 완벽한 관리형 검색 서비스입니다. 데이터 용량과 검색 요청의 복잡도에 따라 자동으로 확장하기 때문에 빠르고 정확한 검색 결과를 얻을 수 있습니다. Amazon CloudSearch를 통해 고객은 호스팅, 트래픽 및 데이터 용량 증대, 중복성, 소프트웨어 패키지를 직접 관리할 필요 없이 검색 기능을 손에 넣을 수 있습니다. 리소스 사용 요금은 저렴한 시간당 요금입니다. 따라서 Amazon CloudSearch를 사용하면 검색 환경을 직접 운영하고 관리할 때와 비교해 총 소유 비용을 크게 절감할 수 있습니다.
Q: Amazon CloudSearch는 스토리지 서비스가 있어야 사용할 수 있습니까?
검색 서비스와 스토리지 서비스는 상호 보완적입니다. 검색 서비스를 이용하려면 문서가 파일 시스템의 파일, Amazon S3의 데이터, Amazon DynamoDB 또는 Amazon RDS 인스턴스의 레코드 등 어딘가에 미리 저장되어 있어야 합니다. 그러면 신속한 검색 시스템인 검색 서비스가 인덱싱이라는 프로세스를 통해 단 몇 초만에 저장된 항목들을 검색 가능한 상태로 만들어줍니다.
Q: Amazon CloudSearch는 데이터베이스가 있어야 사용할 수 있습니까?
검색 엔진과 데이터베이스는 상호 배타적이지 않습니다. 사실 함께 사용하는 경우가 많습니다. 구조화된 데이터가 저장된 데이터베이스가 이미 있다면 검색 엔진을 사용하여 검색 키워드를 관련성 기준으로 삼아 데이터베이스 내용을 지능적으로 필터링하고 순위를 매길 수 있습니다.
검색 엔진은 구조화된 데이터와 구조화되지 않은 데이터 모두를 인덱싱하여 검색하는 데 사용할 수 있습니다. 콘텐츠는 그 소스가 여러 곳일 수 있고, 다양한 형식으로 된 파일과 웹 페이지 등이 연결된 데이터베이스 필드들을 포함하고 있을 수 있는데, 결과 순위를 맞춤 설정하고, 데이터베이스에서는 사용할 수 없는 필터링용 패싯(facet) 같은 특수한 검색 기능을 이용할 수 있다는 것도 검색 서비스의 장점입니다.
Q: 어떤 AWS 리전에서 Amazon CloudSearch를 사용할 수 있습니까?
현재 Amazon CloudSearch를 사용할 수 있는 AWS 리전은 미국 동부(버지니아 북부), 미국 서부(오리건), 미국 서부(캘리포니아 북부), EU(아일랜드), EU(프랑크푸르트), 남아메리카(상파울루) 및 아시아 태평양(싱가포르, 도쿄, 시드니, 서울)입니다.
Q: Amazon CloudSearch에서 지원하는 새로운 기능에는 어떤 것이 있습니까?
이번 최신 릴리스에서 Amazon CloudSearch는 여러 가지 새로운 검색 및 관리 기능을 지원합니다. 새로운 주요 기능은 다음과 같습니다.
- 언어 지원:
- 34개 언어 및 혼합된 언어 필드를 처리할 수 있는 '다중' 기능
- 필드당 언어 구성
- 언어별 텍스트 분석
- 여러 언어에 "없음"을 비롯하여 알고리즘 스테밍(stemming)의 여러 수준을 사용할 수 있음
- 향상된 검색 기능:
- 제안
- 강조 표시
- 지형 정보 검색
- 새로운 데이터 유형: date, double, 부호 있는 64비트 int, latlon
- 불완전한 문구 검색
- 용어 부스팅
- 모든 필드 유형에 대해 범위 검색 향상
- 다중 쿼리 파서 지원: 간단한 쿼리, 구조화된 쿼리, lucene, dismax
- 쿼리 파서 구성 옵션
- 관리 기능:
- 고가용성 옵션
- IAM 통합
- 사용자 구성이 가능한 조정
- 고가용성 옵션
- 추가 AWS 리전에서 사용 가능: 아시아 태평양(도쿄), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(서울) 및 남아메리카(상파울루)
Q: Amazon CloudSearch에서도 계속해서 사전 스테밍(stemming)을 지원합니까?
예. 새 Amazon CloudSearch 버전에서는 알고리즘 스테밍(stemming) 이외에도 사전 스테밍(stemming)을 지원합니다.
Q: 새 Amazon CloudSearch 버전에서 Apache Solr을 사용합니까?
예. Amazon CloudSearch 최신 버전은 Apache Solr를 기본 텍스트 검색 엔진으로 사용하도록 수정되었습니다. 이제 Amazon CloudSearch에서는 검색 도메인을 쉽게 설정, 운영 및 규모 조정할 수 있는 관리형 검색 서비스 환경 이외에도 Apache Solr에서 사용할 수 있는 여러 가지 인기 있는 검색 엔진 기능을 제공합니다.
Q: 콘솔을 통해 새 Amazon CloudSearch 버전에 액세스할 수 있습니까?
예. 콘솔을 통해 새 Amazon CloudSearch 버전에 액세스할 수 있습니다. 현재, 기존 검색 도메인이 있는 Amazon CloudSearch 고객은 새 검색 도메인을 만들 때 사용하려는 Amazon CloudSearch 버전을 선택할 수 있습니다. 새 고객은 기본적으로 새 Amazon CloudSearch 버전을 사용하게 되며 2011-01-01 버전에는 액세스할 수 없습니다.
Q: 새 Amazon CloudSearch 버전에서 지원하는 데이터 유형은 무엇입니까?
Amazon CloudSearch는 text 및 literal이라는 두 가지 텍스트 필드를 지원합니다. text 필드는 해당 필드에 대해 구성된 언어에 따라 처리되어 각 단어가 쿼리에 일치하는지 결정합니다. literal 필드는 처리되지 않으며 대소문자를 비롯해 정확하게 일치해야 합니다. CloudSearch에서는 int, double, date, latlon이라는 네 가지 숫자 유형도 지원합니다. Int 필드에는 부호 있는 64비트 정수 값을 저장할 수 있습니다. Double 필드에는 길이가 두 배인 부동 소수점 값을 저장할 수 있습니다. Date 필드에는 UTC(협정 세계시)로 지정된 날짜를 IETF RFC3339:yyyy-mm-ddT00:00:00Z에 따라 을 저장할 수 있습니다. Latlon 필드에는 위치를 위도 및 경도 값 페어로 저장할 수 있습니다.
Q: Amazon CloudSearch의 2011-02-01 버전을 사용하여 만든 기존 검색 도메인이 계속해서 작동합니까?
예. Amazon CloudSearch의 2011-02-01 버전을 사용하여 만든 기존 검색 도메인은 계속해서 작동합니다.
Q: Amazon CloudSearch 2011-01-01 버전으로 생성한 기존 검색 도메인에서 새 기능을 사용할 수 있습니까?
아니요. Amazon CloudSearch 2011-01-01 버전으로 생성한 기존 검색 도메인은 새 버전에서 사용 가능한 기능에 액세스할 수 없습니다. 새 기능에 액세스하려면 Amazon CloudSearch 2013-01-01 버전을 사용하여 새 검색 도메인을 생성해야 합니다.
Q: Amazon CloudSearch 2011-01-01 버전을 사용하여 구축한 애플리케이션을 새 Amazon CloudSearch로 마이그레이션하려면 어떻게 해야 합니까?
새 Amazon CloudSearch 버전을 사용하려면 새 Amazon CloudSearch 버전을 사용하여 기존 도메인을 다시 생성하고 데이터를 다시 업로드해야 합니다. 자세한 내용은 Amazon CloudSearch 개발자 안내서의 Migrating to the 2013-01-01 API를 참조하십시오.
Q: AWS에서는 Amazon CloudSearch의 2011-02-01 버전을 계속해서 지원합니까?
예. AWS에서는 Amazon CloudSearch 2011-02-01 버전을 계속해서 지원합니다.
Q: Amazon CloudSearch 2011-02-01 버전을 사용하여 새 검색 도메인을 생성할 수 있습니까?
현재 기존 2011-02-01 도메인을 보유한 Amazon CloudSearch 고객은 새 도메인에서 2011-02-01 API를 사용할지, 아니면 새 2013-01-01 API를 사용할지 선택할 수 있습니다. 새 고객이 만든 검색 도메인은 자동으로 2013-01-01 API를 사용하여 생성됩니다.
Q: 새 Amazon CloudSearch 버전의 무료 평가 오퍼를 사용할 수 있습니까?
새 고객은 Amazon CloudSearch과 함께 제공되는 무료 평가 오퍼를 활용할 수 있습니다. 자세한 내용은 Amazon CloudSearch 무료 평가 프로그램 페이지를 참조하십시오.
Q: Amazon CloudSearch는 어떻게 시작합니까?
Amazon CloudSearch에 가입하려면 Amazon CloudSearch 세부 정보 페이지에서 무료 계정 만들기 버튼을 누르고 가입 절차대로 진행하면 됩니다. Amazon Web Services 계정은 있어야 합니다. 아직 계정이 없으면 Amazon CloudSearch 가입 절차를 시작할 때 AWS 계정을 만들라는 메시지가 나타납니다.
가입하고 나면 AWS Management Console에서 Amazon CloudSearch를 선택하십시오. Amazon CloudSearch 콘솔을 사용하면 검색 도메인을 신속하게 생성하고, 검색 필드를 구성하고, 샘플 데이터를 업로드하고, 검색 도메인으로 검색 쿼리를 전송할 수 있습니다. 또한, AWS SDK 및 CLI를 사용하여 이러한 작업을 수행할 수도 있습니다.
자세한 내용은 Amazon CloudSearch Developer Guide의 시작하기 자습서를 참조하십시오.
Q: AWS SDK는 Amazon CloudSearch를 지원합니까?
예. Java, Ruby, Python, .Net, PHP 및 Node.js용 AWS SDK는 CloudSearch에 대한 지원을 제공합니다. AWS SDK를 사용하면 검색 도메인을 신속하게 생성하고, 검색 필드를 구성하고, 데이터를 업로드하고, 검색 도메인으로 검색 쿼리를 전송할 수 있습니다.
Q: AWS CLI는 Amazon CloudSearch를 지원합니까?
예. AWS CLI는 CloudSearch에 대한 지원을 제공합니다. AWS CLI를 사용하면 검색 도메인을 신속하게 생성하고, 검색 필드를 구성하고, 데이터를 업로드하고, 검색 도메인으로 검색 쿼리를 전송할 수 있습니다.
Q: Amazon CloudSearch CLT를 계속 사용할 수 있습니까?
예. Amazon CloudSearch CLT는 계속해서 작동하게 됩니다.
Q: 검색 도메인이란 무엇이며, 어떻게 생성합니까?
검색 도메인은 데이터 컨테이너이자 데이터를 검색 가능하게 만들어 주는 서비스 집합입니다. 해당 서비스는 다음과 같습니다.
- 도메인에 데이터를 업로드해 인덱싱할 수 있게 해주는 문서 서비스.
- 인덱싱된 데이터를 대상으로 검색 요청을 수행할 수 있게 해주는 검색 서비스.
- 관련성 순위 매기기 같은 도메인 활동을 제어하기 위한 구성 서비스.
AWS Management Console, AWS SDK 또는 AWS CLI를 사용하여 검색 도메인을 생성, 관리 및 삭제할 수 있습니다.
Q: 검색 도메인에 문서를 어떻게 업로드합니까?
AWS Management Console, AWS SDK 또는 AWS CLI를 사용하면 문서를 도메인에 업로드할 수 있습니다.
Q: 문서 형식이 따로 정해져 있습니까?
데이터를 검색 가능하도록 만들기 위해 데이터의 형식을 JSON 또는 XML로 지정해야 합니다. 검색 결과로 받을 수 있도록 만들려는 각 항목은 문서로 표현됩니다. 모든 문서에는 고유한 문서 ID 및 검색하여 결과로 반환할 데이터가 포함된 하나 이상의 필드가 있습니다. Amazon CloudSearch는 도메인에 구성되어 있는 인덱스 필드에 따라 문서 데이터에서 검색 인덱스를 생성합니다. 데이터가 변경되면 업데이트를 제출해 문서를 인덱스에 추가하거나 인덱스에서 삭제할 수 있습니다.
Q: Amazon CloudSearch에서 사용할 수 있도록 형식이 지정된 문서 배치는 어떻게 만들 수 있습니까?
데이터를 설명하는 문서 배치를 만들려면 다음을 지정하는 JSON 또는 XML 텍스트 파일을 만들어야 합니다.
- 작업 유형: 추가 또는 삭제
- 고유한 식별자
- 실제 필드 및 해당 데이터
다음 예는 JSON으로 형식이 지정된 단일 문서 배치를 보여줍니다.
[
{
"fields" : {
"directors" : [
"Francis Lawrence"
],
"release_date" : "2013-11-11T00:00:00Z",
"genres" : [
"Action",
"Adventure",
"Sci-Fi",
"Thriller"
],
"image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
"plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
"title" : "The Hunger Games: Catching Fire",
"rank" : 4,
"running_time_secs" : 8760,
"actors" : [
"Jennifer Lawrence",
"Josh Hutcherson",
"Liam Hemsworth"
],
"year": 2013
},
"id" : "tt1951264",
"type": "add"
}
]
연도(year) 같은 숫자 값은 따옴표로 묶지 않으며, 장르(genres) 같은 다중값 필드의 값은 JSON 배열에 나열됩니다.
이 데이터를 Amazon CloudSearch에 제공하려면 파일에 저장하고 AWS Management Console, AWS SDK 또는 AWS CLI를 사용하여 업로드하십시오.
Q: 문서를 어떻게 인덱싱합니까?
문서는 검색 도메인에 업로드할 때 자동으로 인덱싱됩니다. 구성을 변경할 때 IndexDocuments 요청을 전송해 문서를 명시적으로 재인덱싱할 수도 있습니다.
Q: 도메인 인덱싱을 다시 해야 하는 경우는 언제입니까?
새 인덱스 필드 추가, 스테밍(stemming) 또는 스톱워드 사전 업데이트 등의 특정 구성 옵션은 도메인 재인덱싱 이후에야 사용할 수 있습니다. 인덱싱이 필요한 변경 작업을 하고 나면 도메인에 인덱싱이 필요하다는 상태가 표시됩니다. AWS Management Console, AWS SDK 또는 AWS CLI에서 인덱싱을 시작할 수 있습니다.
Q: 검색 요청을 검색 도메인으로 어떻게 전송합니까?
모든 검색 도메인에는 문서 집합에 대한 검색 요청을 수용하는 고유한 URL(검색 끝점)을 가진 REST 기반 검색 서비스가 있습니다. AWS Management Console, AWS SDK 또는 AWS CLI에서 검색 요청을 전송할 수 있습니다.
Q: 여러 가용 영역으로 검색 도메인을 확장할 수 있습니까?
예. 다중 AZ 옵션을 활성화하면 Amazon CloudSearch에서는 동일한 리전의 보조 가용 영역에서 추가 인스턴스를 배포합니다. 자세한 내용은 Amazon CloudSearch 개발자 안내서의 가용성 옵션 구성을 참조하십시오.
Q: 한 지역에서 다른 지역으로 검색 도메인을 옮길 수 있습니까?
현재로서는 자동으로 검색 도메인을 한 지역에서 다른 지역으로 마이그레이션할 수 있는 방법은 없습니다. 대상 지역에서 새 도메인을 만들고 도메인을 구성하고 데이터를 업로드한 다음 원본 도메인을 삭제해야 합니다.
Q: 검색 도메인을 어떻게 삭제합니까?
검색 도메인을 삭제하려면 Amazon CloudSearch 콘솔에서 Delete Domain 버튼을 클릭하십시오. AWS SDK 또는 AWS CLI를 통해 도메인을 삭제할 수도 있습니다.
Q: 검색 도메인에서 문서를 어떻게 삭제합니까?
문서를 삭제하려면 제거하려는 문서의 ID가 포함된 배치 업로드에서 삭제 작업을 지정해야 합니다.
AWS Management Console, AWS SDK 또는 AWS CLI를 통해 데이터 업데이트를 제출할 수 있습니다.
Q: 검색 도메인을 어떻게 비웁니까?
도메인의 끝점을 유지하려면 도메인에 있는 각각의 문서에 DELETE를 전송합니다.
Q: 내 도메인이 'Processing' 상태에 있는 이유는 무엇입니까?
도메인은 'processing', 'active' 또는 'reindexing'이라는 세 가지 상태 중 하나일 수 있습니다. 일반적으로 도메인은 'active' 상태에 있습니다. 이는 현재 어떠한 변경 사항도 없으며, 도메인이 쿼리 및 업데이트될 수 있고, 모든 이전 변경 사항은 검색 결과에 표시됨을 나타냅니다.
도메인을 다시 인덱싱해야 하는 경우 Amazon CloudSearch는 인덱스를 전체적으로 다시 구축해야 합니다. 그러나 해당 도메인은 인덱싱을 다시 시작하기 전까지는 'processing' 상태가 되지 않습니다. 이 단계에서 도메인은 여전히 쿼리 및 업데이트될 수 있으나 인덱싱이 완료되기 전까지는 검색 결과에 구성 변경 사항이 보이지 않으며 도메인의 상태가 다시 'active'로 변경됩니다.
또한 도메인에 문서 배치 업로드를 계속할 수 있습니다. 그러나 도메인이 'processing' 상태에 있는 동안 대용량의 업데이트를 제출하면 검색 인덱스에 업데이트가 적용되기까지 소요되는 시간이 길어집니다. 문제가 되는 경우 도메인이 'active' 상태가 될 때까지 업데이트 속도를 낮추십시오.
Q: CloudSearch에 데이터를 부트스트랩하는 모범 사례는 무엇입니까?
도메인을 시작한 다음에는 Amazon CloudSearch에 데이터를 로드해야 합니다. 단일 대규모 데이터 세트를 업로드한 다음 새로운 데이터가 제공됨에 따라 약간씩 업데이트하거나 추가해야 할 수 있습니다. 다음 지침은 CloudSearch로 데이터를 쉽고 빠르게 처음으로 부트스트랩하는 방법을 알려줍니다.
1. 스크립트 준비 시 curl-v 명령줄 도구 사용
데이터 세트를 업로드하는 동안, 사용자가 작성한 스크립트는 데이터를 읽고 사용하여 JSON 또는 XML 문서를 생성합니다. 이 스크립트를 미리 준비하고 curl 또는 다른 단순한 명령줄 도구를 사용하여 스크립트가 생성한 문서를 업로드할 수 있는지 알아보는 것이 좋습니다. curl의 '-v' 옵션은 프로덕션 목적으로 오류를 숨기는 AWS SDK 또는 Boto보다 구문 문제에 대한 자세한 정보를 제공하는 경우가 많습니다. Curl은 더 자세한 오류 메시지를 표시하므로 문제의 근원을 식별하는 데 도움이 됩니다.
2. UTF-8 문자 코드 사용
모든 데이터가 UTF-8 문자 코드 형식으로 포맷되어 있는지 확인하고 CloudSearch로 업로드하기 전 불량 Unicode 문자를 모두 제거하십시오. 허용되지 않는 문자로 인해 문서가 업로드되지 않을 수 있습니다.
3. 문서 배치
문서 배치는 데이터 부트스트랩 중 가장 중요한 단계일 수 있습니다. 문서를 개별적으로 CloudSearch에 제출하는 것은 비효율적일 뿐만 아니라, 예방 가능한 오류로 이어질 수 있습니다.
문서 배치란 간단히 말해 추가 및 삭제 작업 모음을 의미하며, 도메인에서 추가하거나 업데이트하거나 삭제할 문서를 나타냅니다. 배치는 JSON 또는 XML로 설명되며 도메인에 이를 업로드하는 경우 도메인의 인덱싱 옵션에 따라 데이터가 자동으로 인덱싱됩니다. 검색 도메인에 업로드한 문서 배치의 총 수에 따라 비용이 청구되므로 업로드당 허용된 최대 용량인 5MB에 맞춰 데이터 배치를 만들어 업로드하는 것이 비용 면에서 효율적입니다. 데이터 업로드에 소요되는 시간을 줄이기 위해 병렬로 배치를 업로드할 수도 있습니다.
4. 사전 조정
CloudSearch에 데이터를 업로드하기 전 사전 조정하는 것도 중요합니다. 사전 조정에는 업로드할 데이터 용량에 맞는 적절한 인스턴스 유형을 선택하는 것이 포함됩니다.
업로드할 데이터의 크기를 처리하기에 충분한 용량의 인스턴스를 선택하면 오류 및 많은 복제 수를 방지하는 데 도움이 됩니다. 복제는 검색 응답 시간을 단축하긴 하지만, 데이터 파이프의 크기를 늘리거나 데이터 업로드 시 핵심적인 문제를 해결하지는 않습니다.
CloudSearch는 더 많은 데이터를 전송할 경우 자동으로 더 규모가 큰 인스턴스로 확장합니다. 그렇지만 다른 인스턴스로 조정하는 경우 프로세스가 느려지는 경향이 있기 때문에 적절한 인스턴스 유형을 사전 선택하면 이후의 부트스트랩 프로세스에서 시간을 절감할 수 있습니다. 다음은 부트스트랩에 대한 도메인을 사전 조정하고 데이터가 로드된 후 인스턴스 유형을 복원하는 샘플 스크립트입니다.
부트스트랩 전 사전 조정:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge
aws cloudsearch index-documents --domain-name foo
데이터 로드 후 복원:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small
aws cloudsearch index-documents --domain-name foo
Q: 504 오류를 피할 수 있는 방법에는 어떤 것이 있습니까?
504 오류가 발생하거나 복제 수가 많은 경우 더 규모가 큰 인스턴스 유형으로 이동하십시오. 예를 들어 m3.large를 사용할 때 문제가 발생한 경우 m3.xlarge로 이동하십시오. 사전 조정 후에도 504 오류가 발생하는 경우 데이터 배치를 시작하고 재시도 간 지연 시간을 늘립니다.
Q: 도메인 구성 및 재인덱싱을 가속화하는 모범 사례는 무엇입니까?
검색 도메인에 대한 구성 옵션을 변경하는 경우 해당 변경 사항이 검색 결과에 반영되도록 하려면 검색 인덱스를 다시 구축해야 합니다. 한번에 하나씩 구성을 변경했든, 한꺼번에 여러 개의 구성을 변경했든 상관없이 인덱스 재구축에는 30분~60분이 소요됩니다. 도메인에 문서가 별로 없더라도 인덱스를 구축하고 배포하기 위해 필요한 프로세싱과 프로비저닝으로 인해 이 정도의 시간이 소요됩니다. 그러므로 그전에 구성 변경 사항을 계획하여 한꺼번에 모두 변경한 다음 도메인을 재인덱싱해야 합니다. 이는 새로운 도메인을 설정할 때도 동일하게 적용됩니다. 한번에 인덱싱해서 가능한 한 빠르게 실행할 수 있도록 도메인을 설정하기 전에 구성을 계획하십시오.
일부 도메인 변경 사항에는 재인덱싱이 필요한 반면, 기존 인덱스를 재배포하기만 하면 되는 경우도 있습니다. 재인덱싱에 소요되는 30~60분에 비해 도메인 재배포에는 10~15분 정도가 소요됩니다. 재배포하는 동안 CloudSearch는 새 노드를 생성하여 해당 노드에 인덱스를 배포하고 오래된 노드를 종료합니다. 재배포하는 동안 도메인 상태는 'Processing'으로 변경됩니다. 재인덱싱이 필요한 경우 도메인 상태는 'Needs Indexing'으로 변경되며 인덱싱을 시작하면 'Processing'으로 변경됩니다. 새 인덱스가 생성되면 도메인이 재배포됩니다. 다음 표에는 재인덱싱 후 재배포가 필요한 변경 사항 및 재배포만 필요한 변경 사항이 요약되어 있습니다. 이 정보는 구성 변경 사항을 계획하는 데 도움이 됩니다.
변경 사항 |
재인덱싱 필요 |
재배포 필요 |
다중 AZ | 아니요 |
예 |
인덱스 필드 |
예 |
예 |
인덱스 필드 옵션 |
예 | 예 |
인스턴스 유형 |
예 | 예 |
파티션 수 |
예 | 예 |
복제 수 |
아니요 | 예 |
제안자 |
예 | 예 |
표현식 |
아니요 | 예 |
분석 스키마 |
예 | 예 |
Q: Amazon CloudSearch의 검색 기능에는 어떤 것이 있습니까?
Amazon CloudSearch는 구조화된 데이터와 일반 텍스트 모두를 인덱싱하고 검색할 수 있는 다양한 기능을 갖고 있습니다. 패싯 검색, 자유 텍스트 검색, 부울(Boolean) 검색 식, 사용자 정의 가능한 관련성 순위, 쿼리 시간 순위 식, 필드 가중치, 임의의 필드를 기준으로 검색 결과 정렬 등의 기능이 있고, 토큰화, 스톱워드, 스테밍, 동의어 등의 텍스트 처리 옵션도 있습니다. 문서 업데이트 시 거의 실시간으로 이루어지는 인덱싱 기능도 갖고 있습니다. 새로운 기능은 다음과 같습니다.
- 자동 완성 제안 기능
- 강조 표시
- 지형 정보 검색
- 새로운 데이터 유형: date, double, 부호 있는 64비트 int, LatLon
- 다이내믹 필드
- 인덱스 필드 통계
- 불완전한 문구 검색
- 용어 부스팅
- 모든 필드 유형에 대해 범위 검색 향상
- 관련성에 영향을 미치지 않는 검색 필터
- 다중 쿼리 파서 지원: 간단한 쿼리, 구조화된 쿼리, lucene, dismax
- 쿼리 파서 구성 옵션
Q: 패시팅(faceting)이란 무엇입니까?
패시팅은 좀 더 정확하게 다시 검색할 수 있도록 검색 결과를 정제해 주는 기능입니다. 예를 들어, ''우산''을 검색한 후에 패시팅을 통해 검색 결과를 0-10 USD, 10-20 USD, 20-40 USD 등의 가격 그룹으로 정리할 수 있습니다. Amazon CloudSearch에서는 결과 개수도 패시팅할 수 있습니다. 그러면 정제된 각 그룹의 문서 개수가 표시됩니다. 예를 들면, 0-10 USD(4개), 10-20 USD(123개), 20-40 USD(57개) 등으로 표시됩니다.
Q: Amazon CloudSearch는 어떤 언어를 지원합니까?
Amazon CloudSearch는 현재 아랍어(ar), 아르메니아어(hy), 바스크어(eu), 불가리아어(bg), 카탈로니아어(ca), 중국어 간체(zh-Simp), 중국어 번체(zh-Trad), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 핀란드어(fi), 프랑스어(fr), 갈리시아어(gl), 독일어(de), 그리스어(el), 히브리어(he), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 아일랜드어(ga), 이탈리아어(it), 일본어(ja), 한국어(ko), 라트비아어(la), 노르웨이어(no), 이란어(fa), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 스페인어(es), 스웨덴어(sv), 태국어(th), 터키어(tr) 등 34개 언어를 지원합니다. 또한 Amazon CloudSearch에서는 혼합 언어가 포함된 필드를 위해 다중(mul) 옵션을 지원합니다.
Q: Amazon CloudSearch는 지형 정보 검색을 지원합니까?
예. Amazon CloudSearch에는 위도 및 경도를 지원하는 기본 유형(latlon)이 있으므로 지형 정보를 기반으로 한 검색 및 정렬을 간편하게 구현할 수 있습니다. 자세한 내용은 Amazon CloudSearch 개발자 안내서의 Searching and Ranking Results by Geographic Location을 참조하십시오.
Q: 업로드한 문서는 얼마나 빨리 검색할 수 있게 됩니까?
검색 도메인에 업로드한 문서는 몇 초, 늦어도 몇 분이면 검색할 수 있습니다.
Q: 검색 도메인으로 얼마나 많은 검색 요청을 전송할 수 있습니까?
검색 도메인으로 전송할 수 있는 검색 요청 수에는 따로 정해진 한도가 없습니다.
Q: 검색 요청의 지연 시간에 영향을 주는 요인은 무엇입니까?
검색 요청은 대개 수백 밀리초 안에 처리되며, 훨씬 빨리 처리되는 경우도 많습니다. 이런 지연 시간에 영향을 주는 요인은 다양합니다. 애플리케이션과 검색 도메인 간에 요청과 응답이 오고 가는 시간, 검색 요청의 복잡도, 검색 도메인 용량 등이 주요인입니다.
Q: 검색 요청의 복잡도를 결정하는 요인은 무엇입니까?
Amazon CloudSearch는 광범위한 검색 요청을 매우 신속하고 효율적으로 처리하도록 설계되어 있습니다. 검색 요청의 복잡도는 일치 문서를 결정짓는 식과 각 문서의 일치도를 결정짓는 추가 기준에 따라 달라집니다. 수많은 문서와 일치하는 검색 요청은 몇 개 문서하고만 일치하는 검색 요청보다 처리 시간이 훨씬 오래 걸리고, 복잡한 표현식을 계산하는 검색 요청이 단일 필드 같은 간단한 기준을 사용하여 순위를 매기는 표현식보다 처리 시간이 훨씬 오래 걸립니다. 요청에 대한 응답에는 요청을 처리하는 데 걸리는 시간이 함께 반환되기 때문에 검색 요청 간의 복잡도가 얼마나 차이 나는지 쉽게 이해할 수 있습니다.
Q: 검색 도메인과의 통신 시간을 최소화하려면 검색 애플리케이션을 어디에서 실행해야 합니까?
검색 도메인과 동일한 AWS 지역에 호스팅된 애플리케이션의 통신 속도가 가장 빠릅니다.
Q: 검색 인스턴스란 무엇입니까?
검색 인스턴스는 문서를 인덱싱하고 검색 요청에 응답하는 클라우드상의 단일 검색 엔진입니다. 이 인스턴스는 정해진 양의 RAM 및 CPU 리소스를 이용해 데이터 인덱싱과 요청 처리 작업을 수행합니다.
Q: 검색 파티션이란 무엇입니까?
검색 파티션은 단일 검색 인스턴스에 맞게 설정된 데이터 구역입니다. 검색 도메인 하나에 검색 파티션이 하나 이상 있을 수 있고, 검색 파티션 수는 문서 인덱싱 과정에서 바뀔 수 있습니다.
Q: 애플리케이션 요구에 부응해 검색 도메인은 어떻게 확장됩니까?
검색 도메인은 데이터와 트래픽이라는 두 가지 차원에서 확장됩니다. 데이터 용량이 커지면 인덱싱된 데이터를 포함할 더 많은 또는 더 큰 검색 인스턴스가 필요해지고, 인덱스는 검색 인스턴스 전체에 고루 파티션됩니다. 요청 용량이나 요청 복잡도가 증가하면 검색 파티션에 추가 CPU를 할당하기 위해 각 검색 파티션이 복제됩니다. 예를 들어, 데이터에 3개의 검색 파티션이 필요하면 검색 도메인에 3개의 검색 인스턴스를 구성할 것입니다. 그러다가 트래픽이 단일 검색 인스턴스 용량 이상으로 증가하면 각 파티션이 복제되어 추가 CPU 용량을 할당하고, 검색 도메인에 3개의 검색 인스턴스가 추가됩니다. 트래픽이 더욱 증가하면 각 검색 파티션마다 최대 5개까지 추가로 복제됩니다.
Q: 검색 도메인에 얼마나 많은 데이터를 업로드할 수 있습니까?
필요한 파티션의 수는 데이터와 구성에 따라 달라지지만 업로드할 수 있는 최대 데이터는 검색 구성이 적용될 때 검색 파티션이 10개 생성될 만큼의 데이터 세트입니다. 검색 파티션 한도를 초과하면 일부 문서를 삭제하고 도메인 인덱싱을 다시 실행하기 전까지 도메인에서 업로드 수용을 중단합니다. 검색 파티션이 10개 이상 필요하면 당사로 문의 바랍니다.
Q: 검색 도메인에 사용할 검색 인스턴스의 수와 유형을 직접 선택해야 합니까?
CloudSearch는 완벽한 관리형 검색 서비스로서 검색 도메인을 자동으로 확장해주고, 검색 인스턴스의 수와 유형도 자동으로 선택해줍니다. 일정 검색 도메인에 속한 모든 검색 인스턴스는 그 유형이 모두 같고, 이 유형은 데이터나 트래픽이 증가하면서 바뀔 수 있습니다.
또한 Amazon CloudSearch 도메인의 조정 옵션을 구성하여 다음을 수행할 수도 있습니다.
- 업로드 용량 증가
- 검색 요청 속도 증가
- 검색 용량 증가
- 내결함성 향상
Q: Amazon CloudSearch가 지원하는 인스턴스 유형은 무엇입니까?
Amazon CloudSearch는 다음 인스턴스 유형을 지원합니다.
- 스몰 검색 인스턴스
- 라지 검색 인스턴스
- 엑스트라 라지 검색 인스턴스
- 더블 엑스트라 라지 검색 인스턴스
Q: 검색 도메인의 검색 인스턴스 수와 유형을 어떻게 확인합니까?
AWS Management Console, AWS SDK 또는 AWS CLI를 사용하여 검색 도메인 내 검색 인스턴스의 수와 유형을 확인할 수 있습니다. 검색 인스턴스의 수와 유형은 시간이 지나면서 바뀌고, 인덱싱 가능한 데이터 양과 검색 트래픽에 따라 자동으로 확장 또는 축소됩니다.
Q: 데이터와 트래픽 변화량에 맞춰 검색 도메인을 얼마나 빨리 확장할 수 있습니까?
대개 검색 도메인이 트래픽 변화량 증가에 대응하는 시간은 몇 분밖에 안 됩니다. 데이터 용량 변화나 트래픽 감소 시에는 좀 더 오래 걸릴 수 있지만 IndexDocuments 작업을 호출하여 처리를 가속화할 수 있습니다. 대용량 데이터를 업로드하려거나 갑작스러운 쿼리 트래픽 상승이 예상되는 경우 원하는 인스턴스 유형 및 복제 수를 설정하여 도메인의 크기를 사전에 조정할 수 있습니다. 자세한 내용은 Amazon CloudSearch 개발자 안내서의 조정 옵션 구성을 참조하십시오.
Q: Amazon CloudSearch는 다중 AZ 배포를 지원합니까?
예. Amazon CloudSearch는 다중 AZ 배포를 지원합니다. 다중 AZ 옵션을 활성화하면 Amazon CloudSearch에서는 고가용성을 보장하기 위해 보조 가용 영역에서 검색 도메인의 추가 인스턴스를 프로비저닝 및 유지 관리합니다. 두 가용 영역의 인스턴스는 자동으로 업데이트됩니다. 검색 트래픽이 인스턴스 전체로 분산되므로 장애 발생 시에도 두 영역 중 하나의 인스턴스가 전체 로드를 처리할 수 있습니다.
Q: 새로운 다중 AZ 기능은 어떻게 작동합니까? 장애 발생 시 내 시스템 환경의 가동이 중지됩니까?
다중 AZ 옵션이 활성화되어 있으면 장애 발생 시 가용 영역 두 개 중 하나의 Amazon CloudSearch 인스턴스가 전체 로드를 처리할 수 있습니다. 서비스가 중단되거나 가용 영역 하나에서 인스턴스의 성능이 저하되면 Amazon CloudSearch에서는 모든 트래픽을 다른 가용 영역으로 라우팅합니다. 관리자의 개입 또는 서비스 중단 없이 별도의 가용 영역에서 중복 인스턴스가 복원됩니다.
일부 Inflight 쿼리에 실패할 수 있으며 이 경우 다시 시도해야 합니다. 검색 도메인으로 전송된 업데이트는 내구성 있게 저장되며 장애 발생 시에도 유실되지 않습니다.
Q: 검색 도메인을 3개 이상의 가용 영역에 배포할 수 있습니까?
아니요. 도메인을 배포할 수 있는 최대 가용 영역 수는 2개입니다.
Q: 검색 도메인에 대한 다중 AZ 구성을 수정할 수 있습니까?
예. 검색 도메인에 대한 다중 AZ 구성을 켜거나 끌 수 있습니다. 이 설정이 변경되어도 서비스는 중단되지 않습니다.
Q: 내 검색 도메인을 배포할 가용 영역을 선택할 수 있습니까?
아니요. Amazon CloudSearch에서는 동일한 리전에 있는 대체 가용 영역을 자동으로 선택합니다.
Q: 내 도메인에서 사용할 인스턴스 유형을 선택할 수 있습니까?
예. 최신 릴리즈에서는 Amazon CloudSearch를 사용하여 도메인에 원하는 인스턴스 유형을 지정할 수 있습니다. 필요한 경우 Amazon CloudSearch에서는 더 큰 인스턴스 유형에 맞춰 도메인을 확장하지만 더 작은 인스턴스 유형으로 다시 축소하지는 않습니다.
Q: CloudSearch로 데이터를 가져오는 가장 빠른 방법은 무엇입니까?
기본적으로 모든 도메인은 스몰 검색 인스턴스에서 시작합니다. 많은 양의 데이터를 업로드해야 하는 경우 더 큰 인스턴스 유형으로 도메인의 크기를 사전에 조정해야 합니다. 자세한 내용은 Amazon CloudSearch 개발자 안내서의 Bulk Uploads를 참조하십시오.
Q: 초기 설정에 선택해야 하는 인스턴스 유형은 어떻게 알 수 있습니까?
1GB 미만의 데이터 또는 1KB 크기의 문서 100만 개 미만으로 구성된 데이터 세트인 경우 단일 스몰 검색 인스턴스의 기본 설정을 사용하여 시작합니다. 더 큰 데이터 세트인 경우에는 원하는 인스턴스 크기를 설정하여 도메인을 미리 준비하는 것이 좋습니다. 최대 8GB의 데이터 세트인 경우 라지 검색 인스턴스로 시작합니다. 8GB~16GB의 데이터 세트인 경우에는 엑스트라 라지 검색 인스턴스로 시작합니다. 16GB~32GB의 데이터 세트인 경우에는 더블 엑스트라 라지 검색 인스턴스로 시작합니다. 더 많은 업로드 용량이 필요하거나 인덱싱할 용량이 500GB 이상인 경우 AWS에 문의하십시오.
Q: 새 Amazon CloudSearch 버전에서 사용 가능한 추가 보안 기능은 무엇입니까?
최신 릴리스를 통해 이제 Amazon CloudSearch는 구성 서비스 및 모든 검색 도메인 서비스에 대한 IAM 통합을 제공합니다. 특정 Amazon CloudSearch 작업에 대한 액세스를 제어할 수 있으며 모든 요청에 대한 요청 인증이 필요합니다. 요청은 서명 버전 4 서명을 사용하여 인증됩니다.
Q: 데이터를 Amazon CloudSearch에 얼마나 안전하게 업로드할 수 있습니까?
Amazon CloudSearch에 접속할 때 HTTP 대신 HTTPS를 사용함으로써 안전하게 암호화된 SSL 연결을 통해 데이터를 전송합니다.
Q: 데이터가 이미 암호화되어 있습니다. 암호화된 데이터와 암호화 키만 전송하면 됩니까?
사용자가 생성한 암호화 키는 지원하지 않습니다. 데이터 암호를 푼 다음 HTTPS를 이용해 업로드해야 합니다.
Q: 검색 결과 암호화를 지원합니까?
예. 모든 Amazon CloudSearch 요청에 HTTPS를 지원합니다.
Q: 특정 사용자가 검색 도메인에 액세스하지 못하게 제한할 수 있습니까?
Amazon CloudSearch는 구성 서비스 및 모든 검색 도메인 서비스에 대한 IAM 통합을 제공합니다. 사용자에게 Amazon CloudSearch에 대한 전체 액세스 권한을 부여하거나, 특정 도메인으로 사용자의 액세스를 제한하거나, 특정 작업에 대한 액세스를 허용 또는 거부할 수 있습니다.
Q: Amazon CloudSearch 사용료는 어떻게 과금 및 청구됩니까?
서비스를 시작하는 데 드는 설치 수수료나 확약금이 없습니다. 월말에 사용자의 신용카드로 월 사용료가 자동 청구됩니다. AWS 웹 사이트에서 Amazon Web Services 계정에 로그인한 다음 “Your Web Services Account” 아래의 Account Activity를 클릭하여 언제든지 현재 결제 기간의 청구액을 확인할 수 있습니다.
Q: Amazon CloudSearch 사용료는 얼마나 됩니까?
Amazon CloudSearch의 요금 구조에는 변함이 없습니다. 자세한 요금 정보는 Amazon CloudFront 요금을 참조하십시오.
Q: Amazon CloudSearch 무료 평가 프로그램을 사용할 수 있습니까?
예, 새로운 CloudSearch 고객은 무료 평가 프로그램을 사용할 수 있습니다. 자세한 내용은 Amazon CloudSearch 30일 무료 평가 프로그램을 참조하십시오.
Q: 새 Amazon CloudSearch 버전을 사용하는 비용은 얼마입니까?
Amazon CloudSearch의 요금 구조에는 변함이 없습니다. 자세한 내용은 요금 페이지를 참조하십시오.
Q: 새 Amazon CloudSearch 버전을 사용하면 비용이 절감됩니까?
최신 Amazon CloudSearch 버전에는 고급 인덱스 압축 기능이 있으며 각 인스턴스 유형에 대해 더 큰 인덱스를 지원합니다. 따라서 새 Amazon CloudSearch 버전은 이전 버전보다 효율성이 뛰어나며 상당한 비용 절감 효과를 얻을 수 있습니다.
Q: 요금에 세금이 포함되어 있습니까?
별도의 언급이 없는 한, 요금에는 VAT 및 해당 판매세를 비롯한 관련 조세 공과가 포함되지 않습니다. 청구지 주소가 일본으로 되어 있는 고객의 경우 AWS 서비스 사용 시 일본 소비세의 적용을 받게 됩니다. 자세히 알아보기.