フェールオーバーと回復のプロセス

高可用性グループを構成する概念は、プライマリ サーバーのハードウェアまたはソフトウェアの障害が発生した場合にデータへのサービスをできる限り中断しないようにすることです。フェールオーバー プロセスにより、グループ内のスタンバイ サーバーがプライマリ サーバーの役割を担い、データへのアクセスを引き続き提供することが保証されます。

フェールオーバー プロセスの発生には、自動と手動があります。手動フェールオーバーが必要となるのは、グループのサーバーの数がグループのアクティブな 3 台のサーバー (つまり、1 台のプライマリ サーバーと 2 台のスタンバイ サーバー) よりも少ない場合だけです。

自動フェールオーバーの発生時にプライマリ サーバーに昇格されるサーバーは、最新のスタンバイ サーバー、サーバーの平均応答時間、ES_HA_VSAM 環境変数でサーバーがリストされている順序など、いくつかの内部的なメトリックスに基づいて決定されます。新しいプライマリが確立されると、実行中のトランザクションはロールバックされ、次のメッセージが生成されます。

9/130 file status (connection to Fileshare re-established)

高可用性グループから削除されたプライマリ サーバーまたはスタンバイ サーバーは、再起動して十分に回復してから再度追加できます。回復プロセスは 2 段階で実行されます。最初に、トランザクション ログ ファイルのデータを使用してロールバック回復が実行され、実行中のトランザクションが実行中の状態に復元されます。その後、グループから削除された後に発生したすべてのトランザクションを受信するようにプライマリ サーバーに要求が行われます。それらのトランザクションの受信が完了し、トランザクション ログに適用されると、スタンバイ サーバーとしてグループに再度追加できるようになります。

このプロセスは、iFileshare 出口プロシージャを使用して構成できます。詳細については、「IFSEXITPROC - The iFileshare Exit Procedure」を参照してください。

サーバーの削除によって、そのグループに最小限の数のサーバーがないままになっている場合、ファイル複製はその後もそのグループ内で起こりますが、自動フェールオーバー プロセスは、そのグループが少なくとも最小限の数のサーバーを含んだ状態で再起動されるまで使用できません。

回復プロセスが完了したときにクライアント アプリケーションが処理を継続できるようにするには、Fileshare クライアントを、接続が失われたら自動的に再接続するよう構成する必要があります。この機能は、Fileshare クライアント構成ファイル (fhredir.cfg) に次の行がある場合にのみ使用可能です。

/um
/ra <number-of-attempts>
/rd <delay-between-attempts>

新しいプライマリ サーバーがリモート マシン上にある場合には、新しいマシンで iFileshare を特定するように mf-client.dat 構成ファイルを設定しておく必要もあります。「高可用性グループのリモート サーバーの構成」を参照してください。