【解決】Precision 5820でTesla P100を使うと起動しない(Boot Loop)時の対処法

トラブル解決
※本記事はAIを活用しつつ、実際の環境構築経験をもとに作成しています。

「高性能なTesla P100をPrecision 5820 Towerに載せた瞬間、パソコンが起動しなくなった(Boot Loop)……」

もしあなたが今、目の前のPCが何度も再起動を繰り返す絶望の中にいるなら、安心してください。それは故障ではなく、「グラフィックボードのデータの使い方が、マザーボードの限界を超えてしまった」ことによる、設定の不一致が原因です。

この記事では、特殊な手順(別のPCを使った書き換え)を使って、この問題を根本的に解決する方法を解説します。

結論

Tesla P100の「データの通り道のサイズ(BARサイズ)」を、16GBから256MBへと小さく書き換えることで解決します。

これにより、ReBAR(Resizable BAR)に対応していないマザーボードでも、正常に起動できるようになります。

原因:なぜ起動しない(Boot Loop)のか?

原因は、Tesla P10GBが持つ「Large BAR」という機能にあります。

  • Tesla P100の特性: 動作時に「16GB」という非常に巨大なデータの通り道を一度に確保しようとします。
  • Precision 5820の限界: このマザーボードは、その巨大なサイズを一度に扱う機能(ReBAR)を持っていないため、データの受け渡しに失敗し、起動プロセス(POST)の途中でエラーを起こして、再起動を繰り返してしまうのです。

解決方法:GPUのモードを切り替える手順

この作業は、問題が起きているPrecision 5820単体では不可能です。「Tesla P100を付けた状態でBIOS画面まで起動できる、別のパソコン(今回はOptiPlex 3020)」を用意して、グラフィックボードの中身を書き換える必要があります。

準備するもの

  • Tesla P100が認識できる別のPC: (例:OptiPlex 3020など)
  • LinuxのLive USB: Lubuntuなどの起動用USBメモリ
  • nvflash(Linux版): グラフィックボードを書き換えるためのツール
  • 2つ目のUSBメモリ: nvflashを入れる&バックアップデータを保存するためのもの

ステップ1:別のPC(OptiPlex)でGPUを認識させる

まずは、作業用のPCでGPUを「見える状態」にします。

  1. LubuntuのLive USBから起動します。
  2. 起動直後のメニュー(GRUB画面)で、linux /casper/vmlinuz ... で始まる行を見つけます。
  3. キーボードの矢印キーを使い、splash--- の間に pci=realloc と入力して追加します。
    • 変更後:... splash pci=realloc ---
  4. Ctrl + X を押して起動します。これで、一時的にGPUのメモリ割り当てを調整して起動できるようになります。
  5. ターミナルを開き、lspci | grep -i nvidia と入力して、GPUが認識されているか確認してください。

ステップ2:書き換えツール(nvflash)の準備

  1. Windows PCでTechPowerUpからnvflashをダウンロードし、USBメモリにコピーします。
  2. 作業用PC(OptiPlex)にそのUSBを刺し、ターミナルで以下の操作をしてツールを使える状態にします。
    • ls /media/ でUSBの場所を確認
    • cp /media/lubuntu/[USB]/nvflash ~/ で作業場所にコピー
    • chmod +x nvflash で実行権限を与える

ステップ3:GPUのモードを書き換える(最重要)

いよいよ、GPUの設定を「巨大な通信」から「標準的な通信」へ書き換えます。

  1. バックアップを取る
    sudo ~/nvflash --save ~/backup.rom (現在の設定を保存)
    cp ~/backup.rom /media/lubuntu/[USB名]/ (バックアップをUSBにコピー)
  2. モードを切り替える
    以下のコマンドを実行します。
    sudo ~/nvflash –gpumode graphic
    途中「press “y” to …」と実行するかの確認が出たら「y」と入力
    ※ 成功すると、グラフィックスモードへの切り替えが完了します。
    「Successfully updated GPU mode to “physical_display_enabled_256MB_bar1” (Mode 1).
    A reboot is required for the update to take effect.」が出ました。

ステップ4:元のPC(Precision 5820 Tower)に戻す

  1. 設定が終わったら、GPUを元のPC(Precision)に刺し直します。
  2. 注意点: Tesla P100を付ける前にPrecision側のBIOS設定で、必ず「Above 4G Decoding」を有効にしてください。

まとめ

この作業は非常に高度ですが、成功すればPrecision 5820 TowerでもNvidia Tesla P100が使えるようになります。

ポイントの振り返り:

  • 原因は、GPUが要求するメモリサイズにマザーボードが対応できていないこと。
  • 解決策は、nvflash を使って、GPUの通信モードを書き換えること。
  • 作業後は、マザーボード側のBIOS設定(Above 4G Decoding)を忘れずに。

これで、あなたのPrecision 5820 Towerが起動できるはずです!

コメント

タイトルとURLをコピーしました