Температура NVIDIA GPU

Получение температуры видеокарты NVIDIA GPU.

Операционная система: Linux.

Необходимые программы/пакеты на стороне агента: nvidia-smi

Тип возвращаемого значения: числовое значение.

1. Команда получения имени параметра:

nvidia-smi -q -i 0
для нескольких устройств
nvidia-smi -q -i #[0,1,2,]

Пример ответа:


==============NVSMI LOG==============

Timestamp                                 : Sun Jan 21 11:55:16 2024
Driver Version                            : 525.147.05
CUDA Version                              : 12.0

Attached GPUs                             : 1
GPU 00000000:01:00.0
    Product Name                          : NVIDIA GeForce RTX 3070 Ti
    Product Brand                         : GeForce
    Product Architecture                  : Ampere
    Display Mode                          : Disabled
    Display Active                        : Disabled
    Persistence Mode                      : Disabled
    MIG Mode
        Current                           : N/A
        Pending                           : N/A
    Accounting Mode                       : Disabled
    Accounting Mode Buffer Size           : 4000
    Driver Model
        Current                           : N/A
        Pending                           : N/A
    Serial Number                         : N/A
    GPU UUID                              : GPU-1bbe7197-d9d9-f512-819d-1816e11ebedf
    Minor Number                          : 0
    VBIOS Version                         : 94.04.5A.00.90
    MultiGPU Board                        : No
    Board ID                              : 0x100
    Board Part Number                     : N/A
...

Регулярное выражение для получения имени параметра из ответа:

\s*[P,p]roduct\s*[N,n]ame\s*:*\s*(?P<result>.*)\n

2. Команда получения значения параметра:

nvidia-smi -q -i 0
для нескольких устройств
nvidia-smi -q -i #[0,1,2,]

Пример ответа:

==============NVSMI LOG==============

Timestamp                                 : Sun Jan 21 11:55:16 2024
Driver Version                            : 525.147.05
CUDA Version                              : 12.0

. . .

    Temperature
        GPU Current Temp                  : 56 C
        GPU T.Limit Temp                  : N/A
        GPU Shutdown Temp                 : 98 C
        GPU Slowdown Temp                 : 95 C
        GPU Max Operating Temp            : 93 C
        GPU Target Temperature            : 83 C
        Memory Current Temp               : N/A
        Memory Max Operating Temp         : N/A
. . .

Регулярное выражение для получения значения параметра из ответа:

\s*GPU [C,c]urrent [T,t]emp\s*:*\s*(?P<result>\d+)

см. также:

Краткая справка по регулярным выражениям

Выражение RegEx для получения имени/значения параметра

Оставьте комментарий