2014年10月14日火曜日

Pentahoのインストールメモ

自分への備忘録も兼ねてPentahoのインストールの流れを残します。
Pentahoは複数のツールで構成されていますが、今回はDataIntegration(Spoon)に関して。

1.まずは、インストールモジュールをダウンロード!
http://sourceforge.net/projects/pentaho/files/Data%20Integration/からダウンロードする。
 なるべく最新版が良いかと思います。
2.ダウンロードしたものを解凍する。

3.「data-integration」というフォルダで展開されるので、その中のSpoon.batを実行して起動する。
 これだけで主なインストールは完了! すごく簡単です。

4.使いやすくするための設定をします。
 Spoon起動後、以下のフォルダに「.kettle」というフォルダが作成されていると思うので、環境変数を定義します。
 通常だと下記にSpoon用の環境変数の作成されるはず。
 C:\Users\[ユーザ名]\.kettle
 環境変数を設定すると良いこと。
 ジョブ、データ変換を追加するたびにDB接続先などを毎回、追加していると大変なので
 kettle.propertiesというファイルにあらかじめ定義しておくと便利。
  追記例(DB関連):
  ORA_DB_HOSTNAME=127.0.0.1
  ORA_DB_NAME=ORCL
  ORA_PASS=TEST
  ORA_USER=TEST
 ※注意:kettle.propertiesを更新したら、Spoon.batを再起動しないと反映されません。

5.環境変数の使い方は以下のような感じです。
 ${ORA_DB_HOSTNAME}というように指定して、使います。
 例えば、ジョブを追加してジョブの左側の「ビュー」の中に"データベース接続"があるので、
 右クリックから「新規追加」を選択する。そして下記をそれぞれ入力する。
  「接続名」・・・適当な名前
  「接続タイプ」・・・Oracle
  「アクセス」・・・Native(JDBC) ※デフォルトのまま
  「ホスト名」・・・${ORA_DB_HOSTNAME}を追加
  「データベース名」・・・${ORA_DB_NAME}を追加
  「ユーザ名」・・・${ORA_USER}を追加
  「パスワード」・・・${ORA_PASS}を追加
  ※${}の指定で環境変数の値が参照されます。
 これで、DBの接続先が変更になってもkettle.propertiesを更新すれば、全て一括で変更できる!

以上っす。

0 件のコメント:

コメントを投稿