九游平台/ ai开发平台modelarts/ api参考/ / 查询训练作业指定任务的运行指标
更新时间:2025-02-11 gmt 08:00

查询训练作业指定任务的运行指标-九游平台

功能介绍

查询训练作业指定任务的运行指标。

调试

您可以在中调试该接口,支持自动认证鉴权。api explorer可以自动生成sdk代码示例,并提供sdk代码示例调试功能。

uri

get /v2/{project_id}/training-jobs/{training_job_id}/metrics/{task_id}

表1 路径参数

参数

是否必选

参数类型

描述

project_id

string

用户项目id。获取方法请参见获取项目id和名称

training_job_id

string

训练作业id。获取方法请参见。

task_id

string

训练作业的任务名称。可从训练作业详情中的status.tasks字段中获取。

project_id

string

用户项目id。获取方法请参见获取项目id和名称

training_job_id

string

训练作业id。获取方法请参见。

task_id

string

训练作业的任务名称。可从训练作业详情中的status.tasks字段中获取。

请求参数

响应参数

状态码:200

表2 响应body参数

参数

参数类型

描述

metrics

array of metricobject objects

运行指标。

表3 metricobject

参数

参数类型

描述

metric

string

运行指标,可选值如下:

  • cpuusage:cpu使用率

  • memusage:物理内存使用率

  • gpuutil:gpu使用率

  • gpumemusage:显存使用率

  • npuutil:npu使用率

  • npumemusage:npu显存使用率

value

array of doubles

运行指标对应数值,1min统计一个平均值。

请求示例

如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0运行指标为例

get https://endpoint/v2/{project_id}/training-jobs/2cd88daa-31a4-40a8-a58f-d186b0e93e4f/metrics/worker-0

响应示例

状态码:200

ok

{
  "metrics" : [ {
    "metric" : "cpuusage",
    "value" : [ -1, -1, 2.43, 4.524, 6.714, 12.422, 9.214, 5.36, 7.5, 10.088, 8.975, 11.423, 11.548, 14.563, 16.833 ]
  }, {
    "metric" : "memusage",
    "value" : [ -1, -1, 0.04, 0.521, 1.652, 4.252, 6.433, 7.384, 7.982, 8.718, 9.365, 9.881, 10.192, 9.994, 9.005 ]
  }, {
    "metric" : "gpuutil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "gpumemusage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuutil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npumemusage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  } ]
}

状态码

状态码

描述

200

ok

错误码

请参见。

相关文档

网站地图