自宅にはAMD Ryzen 5 PRO 2400GEを搭載したThink Center M715qがあります。導入当初はProxmox7系でクラスターに組み込んでいたのですが、組み込んで暫くするとクラスター間通信ができなくなりました。
クラスターを離脱させ個別運用をしていてもある程度時間が立つとWebコンソールに入れない状態になりました。今回はこれを解決する方法を知ったのでメモ書きしたいと思います。
原因
Ryzenに搭載されてるCore Performance Boostが悪さをするようです。CPBは発熱などに余裕があれば定格周波数を超えて動作をさせシングルスレッドの性能を向上させる機能です。
有効にするとCinebench R23で14%ほどスコアを上昇させる能力があるのですが、一部ソフトとは相性が悪くクラッシュの原因になるそうです。
CPU電圧を上げると安定するという情報もありますが、そもそも今回はProxmoxのサーバー用のためクロックアップさせることは避けたいと思います。(どうせCPUはBuildとかしてる時以外遊んでますし……
設定
設定はBIOSで行います。AdvanceタブのCPU Setup → CPU ConfigurationでCPM Modeの設定があるのでDisabledにします。
世の中の記事を読みとC6 ModeもDisabledにしておくと安定するとの情報も見たのでこちらもDisabledにしておきました。
C6 Modeは省電力系の機能でCPU電圧を最小限まで下げて電力消費を抑える機能です。C6 Modeに入ったCPUは再稼働まで若干時間がかかるのでそのタイミングでトラブルが起きやすいとのことです。
自宅に仮想化基盤を構築するような人は無効にしちゃって良いでしょう。
その後
上記BIOS設定を設定しProxmox8を再インストールしたところ健全に動作するようになりました。現在は他のクラスターもProxmox8にアップデートし3台のクラスタ構成を組んで運用しています。
Think Center M715qはNICが1G 1本しかないため追加で1GのUSB-NICを追加し、クラスタ間通信とサービス通信を分けて運用するようにしました。このあたりはいずれMinisforum MS-01などにリプレースを行い10G 2本にアップデートしたいところですが、予算の都合が果たしていつつくことになるのやらといった感じです。
参考
下記文献を参考にしました。大変助かりました。ありがとうございます!