Recent Posts

RSS Feeds

HADBノードの再起動と状態確認方法



さて本日は、HADBノードの再起動と状態確認方法について説明します。

1. HADBを構成するノードの再起動方法について

前回の説明で、HADBを構成するノード(appserver01,appserver02)を
再起動する際は、両ノード同時にリブートする事は避けて頂きたいと説明しました。
そこで、今回まずは片ノードづつリブートした際における、HADBの状態変化について
説明したいと思います。
片ノードをリブートした際にHADBの状態としてどのように変化するか
下記より確認してみましょう。

正常時のステータス

appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1
Please enter the password for the admin system user:[***********]
Database Status
app-cluster1 FaultTolerant

正常時に"hadbm status"を実行するとDatabaseのステータスとして、
"HAFaultTolerant"(スペアノード付き)もしくは"FaultTolerant"
(スペアノード無し)が表示されます。

この状態で、片ノードに何らかの障害が発生したとします。
するとHADBは単一ノードでしかサービスを提供していませんので、
ステータスは下記のように"Operational"にかわります。

片ノードで起動している時のステータス
appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1
Please enter the password for the admin system user:***********
Database Status
app-cluster1 Operational

実際に、ステータスが変更するかを実際に確認してみましょう。

手順;
1. 初めに片ノード(appserver02)をリブートします。
2. リブートが完了した後、appserver02にログインします。
3. HADBの管理エージェントプロセス(ma)を起動します。
4. 状態の変更を確認します。

appserver2 > sync
appserver2 > reboot

上記の状態で、起動しているノード(appserver01)で
HADBのステータスを確認してみて下さい。
すると下記のようにステータスが変更されている事を確認できます。

appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1
Please enter the password for the admin system user:***********
Database Status
app-cluster1 Operational

次に、システムのリブートが完了した後、システムにログインし、
HADBの管理エージェントプロセス(ma)を起動して下さい。

> ssh -l root 192.168.0.2
パスワード: [********]
Last login: Wed Sep 12 11:17:51 2007 from 192.168.0.10
Sun Microsystems Inc. SunOS 5.10 Generic January 2005
You have new mail.
# tcsh
appserver2 > /sun/SUNWappserver91/hadb/4/bin/ma-initd start
appserver2 > Management Agent version 4.4.3.6 [V4-4-3-6 2007-06-21 17:59:42 pakker@astra07] (SunOS_5.9_sparc) starting
Logging to /sun/SUNWappserver91/hadb/4.4.3-6/log/ma.log
2007-09-12 14:03:43.938 INFO Management Agent version 4.4.3.6 [V4-4-3-6 2007-06-21 17:59:42 pakker@astra07] (SunOS_5.9_sparc) starting
2007-09-12 14:03:43.956 INFO Using property: ma.server.type=jmxmp
2007-09-12 14:03:43.960 INFO Using property: ma.server.mainternal.interfaces=192.168.0.2
2007-09-12 14:03:43.962 INFO Using property: ma.server.dbhistorypath=/sun/SUNWappserver91/hadb/4.4.3-6/history
2007-09-12 14:03:43.966 INFO Using property: ma.server.dbconfigpath=/sun/SUNWappserver91/config/hadb
2007-09-12 14:03:43.968 INFO Using property: console.loglevel=INFO
2007-09-12 14:03:43.969 INFO Using property: logfile.name=/sun/SUNWappserver91/hadb/4.4.3-6/log/ma.log
2007-09-12 14:03:43.971 INFO Using property: ma.server.jmxmp.port=1862
2007-09-12 14:03:43.972 INFO Using property: logfile.loglevel=INFO
2007-09-12 14:03:43.974 INFO Using property: ma.server.dbdevicepath=/sun/SUNWappserver91/hadb/4.4.3-6/device
2007-09-12 14:03:43.975 INFO Using property: repository.dr.path=/sun/SUNWappserver91/hadb/4.4.3-6/rep
2007-09-12 14:03:45.108 INFO Listening for client connections on port 1862
2007-09-12 14:03:45.398 INFO Repository REP:-54e808d5_114ee5e4be0_-8000: Multicast address=228.8.8.8, Port=1862, Bind address=192.168.0.2, Path=/sun/SUNWappserver91/hadb/4.4.3-6/rep
2007-09-12 14:05:14.959 INFO Starting node app-cluster1:1 at level auto, config version 3
2007-09-12 14:05:15.520 INFO n:1 NSUP INF 2007-09-12 14:05:15.518 p:606 Legal realtime priorities are 0 (lowest) to 59 (highest) set it to:29

HADBの管理エージェントプロセスが起動すると、上記のように
メッセージが表示されます。ここで、注意して頂きたいのは
上記のメッセージが表示された直後はまだ、HADBとして
正常な状態には戻っていないという事です。
上記メッセージが出力された直後にステータスを確認してください。
すると、まだ"Operational"の状態になっている事を確認できます。
理由は、前回「High Availability Session Store(HADB)の概要
でも説明致しましたが、appserver01のテーブルの内容と同期を取る
作業等を行っているためです。
そこで、作業完了までしばらく待った後、再度コマンドを実行して下さい。
すると、ステータスが"HAFaultTolerant"/"FaultTolerant"に変わる事が
確認できるかと思います。

appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1
Please enter the password for the admin system user:***********
Database Status
app-cluster1 Operational

.....しばらく時間を経過した後(テーブルの同期が完了した後)

appserver1 > /sun/SUNWappserver91/hadb/4/bin/hadbm status app-cluster1
Please enter the password for the admin system user:***********
Database Status
app-cluster1 FaultTolerant

このように、HADBノードを再起動する際は、片ノードづつ実行して頂き、
片ノードが完全に立ち上がって、HADBのステータスが
"HAFaultTolerant"/"FaultTolerant"の状態に戻った事を確認した後
もう一台のHADBノードを再起動するようにして下さい。

Permalink     No Comments
Track Back :




Post a Comment:
Comments are closed for this entry.