2014年10月14日火曜日

Pentahoのインストールメモ

自分への備忘録も兼ねてPentahoのインストールの流れを残します。
Pentahoは複数のツールで構成されていますが、今回はDataIntegration(Spoon)に関して。

1.まずは、インストールモジュールをダウンロード!
http://sourceforge.net/projects/pentaho/files/Data%20Integration/からダウンロードする。
 なるべく最新版が良いかと思います。
2.ダウンロードしたものを解凍する。

3.「data-integration」というフォルダで展開されるので、その中のSpoon.batを実行して起動する。
 これだけで主なインストールは完了! すごく簡単です。

4.使いやすくするための設定をします。
 Spoon起動後、以下のフォルダに「.kettle」というフォルダが作成されていると思うので、環境変数を定義します。
 通常だと下記にSpoon用の環境変数の作成されるはず。
 C:\Users\[ユーザ名]\.kettle
 環境変数を設定すると良いこと。
 ジョブ、データ変換を追加するたびにDB接続先などを毎回、追加していると大変なので
 kettle.propertiesというファイルにあらかじめ定義しておくと便利。
  追記例(DB関連):
  ORA_DB_HOSTNAME=127.0.0.1
  ORA_DB_NAME=ORCL
  ORA_PASS=TEST
  ORA_USER=TEST
 ※注意:kettle.propertiesを更新したら、Spoon.batを再起動しないと反映されません。

5.環境変数の使い方は以下のような感じです。
 ${ORA_DB_HOSTNAME}というように指定して、使います。
 例えば、ジョブを追加してジョブの左側の「ビュー」の中に"データベース接続"があるので、
 右クリックから「新規追加」を選択する。そして下記をそれぞれ入力する。
  「接続名」・・・適当な名前
  「接続タイプ」・・・Oracle
  「アクセス」・・・Native(JDBC) ※デフォルトのまま
  「ホスト名」・・・${ORA_DB_HOSTNAME}を追加
  「データベース名」・・・${ORA_DB_NAME}を追加
  「ユーザ名」・・・${ORA_USER}を追加
  「パスワード」・・・${ORA_PASS}を追加
  ※${}の指定で環境変数の値が参照されます。
 これで、DBの接続先が変更になってもkettle.propertiesを更新すれば、全て一括で変更できる!

以上っす。

2014年10月8日水曜日

books.googleの存在

books.googleをみてしまうと、もう書籍を自腹で買う気がしなくなってきました。

さすがにコアな専門書、最新の本はないが、一般的な本はWEBでプレビューで
見れてしまうのには時代の流れを感じる。
図書館に通うことすらしなくなる時代がくるのかも。
図書館もそのうち電子公開ですかね。

もはや知っているだけの知識は何の意味も持たない時代に移った感がしますね。

2014年10月1日水曜日

JDKインストール


下記からjavaをダウンロード
http://www.oracle.com/technetwork/java/javase/downloads/index.html

過去のバージョンは下記のリンクをクリックしてバージョンを探す

Previous Releases - Java Archive


# chmod +x jdk-6u30-linux-x64-rpm.bin
# ./jdk-6u30-linux-x64-rpm.bin
# java -version

# vi /etc/profile
※下記を追加
export JAVA_HOME=/usr/java/jdk1.6.0_30
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar

# source /etc/profile
# env | grep java