オープンソース勉強会#7 lt kettle-cookbookについて

8
kettle-cookbookについて 2014/06/17 オープンソース勉強会#7 Saegusa Akiko (@nepoporon)

Upload: akiko-aoki

Post on 19-Jul-2015

691 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: オープンソース勉強会#7 LT kettle-cookbookについて

kettle-cookbookについて2014/06/17 オープンソース勉強会#7

Saegusa Akiko (@nepoporon)

Page 2: オープンソース勉強会#7 LT kettle-cookbookについて

普段

ビッグデータ分析関連サービス/製品の提案

pentaho歴 =ETL歴

PDI 4.x系、5.0.1 8ヶ月

レポーティングは少々

本日は

ではない方のcookbookのお話です

Page 3: オープンソース勉強会#7 LT kettle-cookbookについて

問題

1ファイルに全処理を詰め込むと可読性が低くなる

できるだけ汎用的な部品を作って再利用したい

結果、ファイルが増えたループなどETLで実現しようとするとややこしくなる処理もある

(行取得→行送信+変数設定→変数受信)

• 呼出し関係がわかりにくい

• いちいちSpoonでプロパティを開かないと、

引数、変数の確認ができない …少々煩わしい

Page 4: オープンソース勉強会#7 LT kettle-cookbookについて

kettle-cookbookJavadoc風のドキュメントを自動生成するツール

Google codeからファイルをダウンロード→INとOUTを指定→mainから実行

→すぐにcookbookが作れます

Page 5: オープンソース勉強会#7 LT kettle-cookbookについて

document-all.kjbをSpoonで開く→「編集」→「設定」→「ジョブプロパティ」を開く

INPUT_DIRドキュメント化したい対象ファイルの格納元フォルダを指定

OUTPUT_DIRcookbookの格納先フォルダを指定

※「参照」ボタンがないので、パスの指定ミスに注意

Page 6: オープンソース勉強会#7 LT kettle-cookbookについて

process-files.ktrをSpoonで開く→「編集」→「設定」→「ジョブプロパティ」を開く

INPUT_DIRcookbook作成用の資材3ファイルを格納したフォルダを指定

OUTPUT_DIRcookbookの格納先フォルダを指定

※処理が終わったらindex.htmlをブラウザで開いて確認します

Page 7: オープンソース勉強会#7 LT kettle-cookbookについて

• 登場人物が見渡せる

• 特別な記述や設定をしなくても自動的に作られる

• 定期実行を仕込めば、ドキュメント生成漏れも防げる

• フォルダの階層形式ではなくて、呼出し関係を階層形式で表示してくれる方がよかった(”Hierarchical”がそうであってほしかった…)

• 地の文を日本語化できるとよい

良い点 惜しい点

Page 8: オープンソース勉強会#7 LT kettle-cookbookについて

詳細情報

■kettle-cookbook ダウンロード

https://code.google.com/p/kettle-cookbook/

■使い方(CUIでの実行方法も)

https://code.google.com/p/kettle-cookbook/wiki/CookBookInstructions

■cookbookの見本(ご参考)

http://www.it4biz.com.br/cursos/kettle-cookbook/Samples/