impalaでmrubyを動かす

hadoop
http://impala.apache.org
この記事は約1分で読めます。

以前impalaのudfについて調べていて、何か書いてみたいなと思っていた。最近、mysqlでmrubyを動かしている例があると知り、ちょうどmrubyも触ってみたいと思っていたので、今回はimpala udfとmrubyをテーマに、impalaのudfでmrubyが実行できるimpala-udf-mrb_evalを書いてみた。

c++、mruby、どちらも経験が浅いのでコードは稚拙ですが、一応こんな感じで動作します。大規模なデータセットで試してはないですが大きなデータセットで試すと現状だと十分なパフォーマンスがでない。。ですが、表現が広がっていい感じです。

参考リンク

コメント

Translate »
タイトルとURLをコピーしました