Stormはtwitterが公開しているリアルタイム分散処理フレームワークです。
以前のエントリを参照ください。

twitterが発表したリアルタイム分散処理フレームワークStorm | tjun memo

今回は、その開発環境を作るメモ。

0. 準備

EclipseとJavaは入れて、Javaのpathは通してください。

$ echo $JAVA_HOME
/System/Library/Java/JavaVirtualMachines/1.6.0.jdk/Contents/Home

1. stormのダウンロード

https://github.com/nathanmarz/storm/downloads から最新のstormをダウンロードして、zipを解凍してください。(2011/2/3の安定verは0.6.2)

そして、storm/binにpathを通します。

$ wget https://github.com/downloads/nathanmarz/storm/storm-0.6.2.zip --no-check-certificate
$ unzip storm-0.6.2.zip
$ sudo cp -R storm-0.6.2 /usr/local/
$ sudo ln -s /usr/local/storm-0.6.2 /usr/local/storm
$ export STORM_HOME=/usr/local/storm
$ export PATH=$PATH:$STORM_HOME/bin

2. twitter4jのダウンロード

Storm-starterのtwitter関連のサンプルを実行する場合は、Twitter4j(2.2.5+)をダウンロードします。他のサンプルもあるので、とりあえず飛ばしても大丈夫です。
http://twitter4j.org/en/index.html
これも解凍してください。

twitter4j/lib以下のJARファイルをstormから利用するため、JARをstormのlibディレクトリに置きます。

$ sudo cp twitter4j/lib/*.jar /usr/local/storm-0.5.4/lib/

3. Eclipseでプロジェクトの作成

stormのプログラムのために、設定を行います。

  • 3-1. 新規のJava projectを作成
  • 3-2. Project Libraryの"Add External JARsに、先程ダウンロードしたstorm以下にあるJARを入れます。 必要なのは storm/storm-*.*.*.jarstorm/lib/以下の全てのJAR になります。
  • 3-3. twitter関連のサンプルを実行する場合、同じくJARをlibraryに追加します。 先ほどダウンロードして解凍した twitter4j/lib/以下の twitter4j-core-2.2.5.jartwitter4j-stream-2.2.5.jar を追加。

準備は以上です。

次回はstormのサンプルを実行する部分を説明します。

参考