Yahooが作って公開しているSAMOAというやつを今日知った。

SAMOA is a platform for mining on big data streams. It is a distributed streaming machine learning (ML) framework that contains a programing abstraction for distributed streaming ML algorithms.

とある。

StormかS4と合わせて使うらしい。HadoopにおけるMahoutのような位置づけのフレームワークなのかな。
YahooはS4をまだ使い続けていたのか。
Storm-YARNとかもそうだけど、yahooはこのあたりのコントリビューションが結構多い

ググると情報が出てくるけど、いくつか載せておく