Pentahoは複数のツールで構成されていますが、今回はDataIntegration(Spoon)に関して。
1.まずは、インストールモジュールをダウンロード!
http://sourceforge.net/projects/pentaho/files/Data%20Integration/からダウンロードする。
なるべく最新版が良いかと思います。
なるべく最新版が良いかと思います。
2.ダウンロードしたものを解凍する。
3.「data-integration」というフォルダで展開されるので、その中のSpoon.batを実行して起動する。
これだけで主なインストールは完了! すごく簡単です。
4.使いやすくするための設定をします。
Spoon起動後、以下のフォルダに「.kettle」というフォルダが作成されていると思うので、環境変数を定義します。
通常だと下記にSpoon用の環境変数の作成されるはず。
C:\Users\[ユーザ名]\.kettle
環境変数を設定すると良いこと。
ジョブ、データ変換を追加するたびにDB接続先などを毎回、追加していると大変なので
kettle.propertiesというファイルにあらかじめ定義しておくと便利。
追記例(DB関連):
ORA_DB_HOSTNAME=127.0.0.1
ORA_DB_NAME=ORCL
ORA_PASS=TEST
ORA_USER=TEST
※注意:kettle.propertiesを更新したら、Spoon.batを再起動しないと反映されません。
5.環境変数の使い方は以下のような感じです。
${ORA_DB_HOSTNAME}というように指定して、使います。
例えば、ジョブを追加してジョブの左側の「ビュー」の中に"データベース接続"があるので、
右クリックから「新規追加」を選択する。そして下記をそれぞれ入力する。
「接続名」・・・適当な名前
「接続タイプ」・・・Oracle
「アクセス」・・・Native(JDBC) ※デフォルトのまま
「ホスト名」・・・${ORA_DB_HOSTNAME}を追加
「データベース名」・・・${ORA_DB_NAME}を追加
「ユーザ名」・・・${ORA_USER}を追加
「パスワード」・・・${ORA_PASS}を追加
※${}の指定で環境変数の値が参照されます。
これで、DBの接続先が変更になってもkettle.propertiesを更新すれば、全て一括で変更できる!
以上っす。
0 件のコメント:
コメントを投稿