Amazon Elastic MapReduceの使い方─Hadoopより手軽にはじめる大規模計算

第2回 Web ConsoleからElastice MapReduceを起動させる

この記事を読むのに必要な時間:およそ 2 分

前回は,Amazon Elastic MapReduce(EMR)を使うまでに必要なことを説明しました。今回からは実際の使い方を紹介していきます。

Web Consoleに接続する

まずはWebブラウザでAWSのWeb Consoleに接続します。AWSの推奨ブラウザはFirefoxです。接続したら,⁠AWS Management Consoleを利用する」をクリックし,Web Consoleのログイン画面に進みます図1)⁠

図1

図1

次に,登録に使用したE-mailアドレスとパスワードを使ってWeb Consoleにログインします図2)⁠

図2

図2

ログインしたら,タプの中からAmazon Elastic MapReduceを選択します図3)⁠

図3

図3

新しいJob Flowを作成する

次に,Create New Job Flowを選択し,新規にMapReduceのJobを作成します図4)⁠リージョンに関しては自分が使用する適切なリージョンを選択してください。Create New Job Flowをクリックすると図5の画面が起動します。

図4

図4

図5

図5

ここではまず,Job Flow NameにMapReduceのJob名を入力してください。Job Flow Nameは入力が必須の項目です。Create a Job Flowのところで起動するJobを選択します。以下のように目的に応じて選択してください。

自分で作成したアプリケーションを使用する場合
→Run your own application
ためしになにかしらのJobを起動してみたい場合
→Run a sample applicationを選択します。

サンプルには下記のものがあります。

  • Contextual Advertising(Hive Script)
  • Word Count(Streaming)
  • CloudBurst(Custom Jar)
  • CloudFront HTTP LogAnalyzer(Custom Jar)
  • Apache Log Reports(Pig Script)

今回は自分で作成したCustome Jar(Word Count)を使用して実行してみるため,Run your own applicationを選択します。

最後にJobのタイプを指定します。使用できるJobのタイプには以下のものがあります。

  • Hive ProgramHiveを使ったアプリケーション)
  • Custome Jar(Javaで書いたネイティブなアプリケーション)
  • Streaming(ストリーミングを使ったアプリケーション)
  • Pig ProgramPigを使ったアプリケーション)

continueをクリックすると次の画面が表示されます図6)⁠

著者プロフィール

小林隆(こばやしりゅう)

クラウド,Hadoopを使ったMapReduce,NoSQL(主にCassandra)を使った開発を行っている。CassndraのGUIをオープンソースで公開。

bloghttp://beter-max.blogspot.com/

URLhttp://twitter.com/ryu_kobayashi/

コメント

コメントの記入