Yelp での導入事例

2014 年

Yelp は 2004 年に設立されました。その主な目標は、人々が地元の優良企業とつながりを持てるようサポートすることです。Yelp は、さまざまな分野の地元企業に関する詳細なレビューと洞察を共有できるコミュニティとしてよく知られ、10 年間でその事業規模を 1 都市(サンフランシスコ)から、世界 29 か国、約 120 市場にまで広げてきました。2014 年 6 月現在、Yelp の月間平均訪問者数は 1 億 3800 万人で、6100 万件以上の地元のレビューが Yelper たちによって書かれています。

Python のチュートリアルを開始する
kr_quotemark

AWS によって、当社の開発者は、今までできなかったことをできるようになりました。これで我が社のシステムチームは他の課題に集中できます」

Dave Marin
検索およびデータマイニングエンジニア

課題

Yelp は、やらせや疑わしいコンテンツからユーザーを守ることに真摯に向き合うため、ロイヤルカスタマーをフォローするシステムを設立しました。Yelp は、自動レビューフィルタを使用して疑わしいコンテンツを特定し、それが消費者に公開される可能性を最小限に抑えます。また、サイトには、新しいビジネス(リスト、優待販売、イベントなど)を発掘したり、お互いにコミュニケーションを取り合ったりするための機能も幅広く用意されています。さらに、企業のオーナーやマネージャーは、優遇販売の投稿、写真のアップロード、顧客へのメッセージ送信を行うための無料アカウントを設定できます。

同社はモバイルアプリの開発にも力を入れており、つい最近 iTunes アプリの殿堂に選ばれました。Yelp のアプリは、Android、Blackberry、Windows 7、Palm Pre、および WAP でも利用できます。

地元の検索広告は、Yelp の収入源の大半を占めています。検索広告は明るいオレンジ色で、「Sponsored Results」というラベルで分かりやすく表示されます。 広告主にお金を払って、レビューを変更したり順位を変更したりすることはできません。

アマゾン ウェブ サービスが選ばれた理由

Yelp は元々は巨大な RAID を使用して、ログや、Hadoop のシングルローカルインスタンスを格納していました。Amazon Elastic MapReduce (Amazon EMR) への移行時に、RAID を Amazon Simple Storage Service (Amazon S3) に置き換えて、すべての Hadoop ジョブを直ちに Amazon Elastic MapReduce に移しました。

「Hadoop クラスターのハードディスクドライブのスペースと容量は不足していました。」Yelp の検索およびデータマイニングエンジニア Dave Marin 氏は言います。

Yelp は Amazon S3 を使用してログと写真を毎日格納しており、1 日におよそ 1.2TB のログが生成されます。また、Amazon EMR を使って、約 20 個のバッチスクリプトを個別に実行します。このスクリプトのほとんどが、生成されたログを処理します。Amazon Elastic MapReduce の機能を次に示します。

  • これを見た人はこちらも確認しています
  • レビューのハイライト
  • 検索テキストの自動入力
  • 検索テキストの修正候補
  • 検索語のトップ
  • 広告

これらのジョブは Python のみに書き込まれます。一方、Yelp は独自のオープンソースライブラリ mrjob を使用して、Hadoop ストリーミングジョブを Amazon EMR で実行します。Python では boto を使用して Amazon S3 と通信します。また、Yelp はモニタリングのために s3cmd と Ruby Elastic MapReduce ユーティリティも使用します。
 
Yelp 開発者は、AWS で作業する場合、Amazon Elastic MapReduce ジョブフローを最大限に利用できるように、boto API と mrjob の両方を使用するよう勧めています。Yelp は 1 日に約 250 件の Amazon Elastic MapReduce ジョブを実行し、30 TB のデータを処理します。また、Hadoop アプリケーション開発に力を貸してくれた AWS サポートに感謝しています。

利点

Amazon Elastic MapReduce を使用することで、Yelp はハードウェアに対する先行投資を 55,000 USD 節約できただけではありません。数か月ではなく、わずか数日のうちに立ち上げて、稼働させることができました。ただし、Yelp にとって最も重要なのは機会費用です。「AWS によって、当社の開発者は、今までできなかったことをできるようになりました。」Marin 氏は言います。「これで我が社のシステムチームは他の課題に集中できます。」


Yelp について

Yelp は 2004 年に設立されました。その主な目標は、人々が地元の優良企業とつながりを持てるようサポートすることです。Yelp は、さまざまな分野の地元企業に関する詳細なレビューと洞察を共有できるコミュニティとしてよく知られ、

AWS の利点

  • ハードウェアコストを 50,000 USD 以上節約
  • 数か月ではなく数日で新しいシステムを稼働
  • ストレージ容量が増加

使用されている AWS のサービス

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。 

詳細 »

Amazon Elastic MapReduce

Amazon EMR は、業界をリードするクラウドネイティブなビッグデータプラットフォームです。大規模環境で大量のデータを迅速かつコスト効率よく処理できます。

詳細 »

AWS サポート

AWS サポートは、顧客へのこだわりを保つ Amazon の伝統を B2B テクノロジーの世界にもたらします。私たちは、ビジネスを成功させるために必要な成果を達成できるように支援することに重点を置いています。

詳細 »


開始方法

すべての業界のあらゆる規模の企業が、AWS を使用してビジネスを毎日変革しています。AWS のエキスパートにお問い合わせのうえ、今すぐ AWS クラウドジャーニーを開始しましょう。