Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bugfix/forget cluster node #35

Open
wants to merge 1 commit into
base: main
Choose a base branch
from
Open

Conversation

khattori
Copy link
Collaborator

#34 の修正です。
single/basicとcluster/swarm の双方で、初期構築ができこと、
また、cluster/swarm でノードリブート時の rabbitmq クラスタの再構成ができることを確認しています。

@khattori khattori requested a review from tichi73 July 30, 2024 23:51
@khattori khattori closed this Jul 30, 2024
@khattori khattori reopened this Jul 30, 2024
@khattori khattori changed the base branch from main to develop July 31, 2024 00:00
@tichi73
Copy link
Contributor

tichi73 commented Jul 31, 2024

3台構成で1もしくは2台を poweroff して、それぞれ poweron 後に rabbitmq がクラスタに復帰できることは確認できましたが、
3台構成で3台とも poweroff した場合のその後の挙動について、確認しておきたいです。

  • 最初の1台を poweron しても、そもそも swarm が leader 選出できずにクラスタが開始しない?
  • 2台目を poweron すると、swarm のノード一覧が表示されて、コンテナの起動が開始するように見受けられる?
  • 1台目と2台目のコンテナはほぼ同時に起動が開始されるが、他ノードの rabbitmq が開始していないので、それぞれのノードでの forget_cluster_node に時間がかかっているように見受けられる?(しばらくすると起動はする)

また、以下については本PRとは直接関係ないのですが、合わせて確認しておきたいです。

  • pgpool を自動起動設定にしていても、1台目 poweron ではバックエンドの postgresql が自動起動するわけではない?
  • そのため、kengine がDBに接続できずに、起動リトライを繰り返している?

@khattori
Copy link
Collaborator Author

3台構成で1もしくは2台を poweroff して、それぞれ poweron 後に rabbitmq がクラスタに復帰できることは確認できましたが、 3台構成で3台とも poweroff した場合のその後の挙動について、確認しておきたいです。

  • 最初の1台を poweron しても、そもそも swarm が leader 選出できずにクラスタが開始しない?

→ マネージャノードが過半数に達していないので、そうなります。

  • 2台目を poweron すると、swarm のノード一覧が表示されて、コンテナの起動が開始するように見受けられる?

→ マネージャノードが過半数となり、リーダーが選出されて、コンテナが起動するのかと思います。

  • 1台目と2台目のコンテナはほぼ同時に起動が開始されるが、他ノードの rabbitmq が開始していないので、それぞれのノードでの forget_cluster_node に時間がかかっているように見受けられる?(しばらくすると起動はする)

→ forget_cluster_node のタイムアウトを待っていて時間がかかっているのかと思います。

また、以下については本PRとは直接関係ないのですが、合わせて確認しておきたいです。

  • pgpool を自動起動設定にしていても、1台目 poweron ではバックエンドの postgresql が自動起動するわけではない?
  • そのため、kengine がDBに接続できずに、起動リトライを繰り返している?

→ pgpool と postgresql は基本連動していないので、pgpool が起動しても postgresql は自動起動はしません。エンジンはDBに接続できるまで待つか、リトライすると思います。

Base automatically changed from develop to main August 1, 2024 13:06
@khattori
Copy link
Collaborator Author

khattori commented Aug 1, 2024

全てのRabbitMQコンテナを同時に再起動(あるいは、全ノードをシャットダウンして再開)する場合、RabbitMQに後から追加したユーザーアカウント等がリセットされない対策が必要である。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants