hadoop コミュニティ開発メモ

注: 必要があってこの記事を書いているのであって、決して万人向けに書いているわけではありません。

用意するもの(Mac)

多分最低この5つのツールがあればなんとかなる。

pb が必要なのは、pb がないと 0.23 以降(正確に言うと yarn)をコンパイルできないため。

事前準備

  • ASF JIRA にユーザ登録する
    • してください。
  • apache/hadoop-common を git clone する
    • common, hdfs, mapreduce 全部入り。マスターブランチは master ではなく trunk であることに注意。
    • 朝起きたら git checkout trunk; git fetch; git rebase origin/trunk 。習慣づけよう
  • mvn eclipse:eclipse -DskipTests の実行
  • eclipse へのインポート
    • eclipse のメニュー(ファイルか編集)にインポートとあるのでそれを選択し、既存のフォルダを選択→hadoop-common を選択、として入っているパッケージを全部インポートする。

諸注意とか

エラー出まくるけど大体は無視していい。特に Avro。

JIRA

まずは newbie タグを探すこと。
現在の hadoop コミュニティでは、簡単なチケットには newbie タグをつけるように要請が出ている。
これを探し、自分のできそうなチケットを探すこと。

パッチを書くまでの流れ

  • Assign to me を選択してそのチケットの Assignee になる
  • パッチを書く
  • チケットに添付し、コミッタのレビューを受ける
  • パッチを準備状態にし、Jenkins の自動ビルド結果を待つ
  • コミッターにコミットをお願いする


詳細は別途書く。