ATB场景精度比对

简介

msProbe工具提供ATB场景的精度比对功能,帮助定位精度问题发生点。

基本概念

  • 余弦相似度:两个非零向量之间夹角的余弦值。可以用于评估两个Tensor间的相似程度。

  • 欧式距离:在多维空间中两个点之间的绝对距离。可以用于评估两个Tensor间的相似程度。

使用前准备

环境准备

安装msProbe工具,详情请参见《msProbe安装指南》。

数据准备

ATB模型dump数据。dump数据获取方式请参见ATB场景精度数据采集

约束

仅支持基于CANN 8.5.0以上版本采集到的ATB模型精度数据的比对。

快速入门

以下通过一个简单的示例,展示如何使用msProbe工具进行ATB模型的精度数据比对。

先预采集ATB模型的标杆精度数据与待比对精度数据(有精度问题的数据),采集方式请参见ATB场景精度数据采集。然后执行以下比对命令进行精度比对。

# 请传入实际精度数据路径
msprobe compare -m atb -gp golden_data/atb_dump_data/data/0_39943/0/ -tp target_data/atb_dump_data/data/0_276107/0/

命令行参数介绍请参见参数说明章节。

ATB精度数据比对功能介绍

功能说明

ATB精度数据比对功能用于ATB dump数据的精度比对,包括真实数据比对与统计量数据比对,比对结果最终保存在Excel表格中。

注意事项

  • 采集ATB模型精度数据时,若"task"配置参数为"tensor"或"all",则dump数据中都包含算子输入输出Tensor的真实数据,因此在比对时,均进行真实数据比对;若"task"配置参数为"statistics",则dump数据中仅包含算子输入输出Tensor的统计量数据,因此在比对时,进行统计量数据比对。

  • 比对的标杆数据与待比对数据必须同时为真实数据或同时为统计量数据。

  • 真实数据比对当前仅支持bool、int8、int32、int64、bfloat16、float16、float32类型的Tensor数据。

命令格式

msprobe compare -m atb -gp <goldenDataPath> -tp <targetDataPath> [-o <outputPath>]

参数说明

参数

可选/必选

说明

-m或–mode

必选

指定比对场景,必须为atb。

-gp或–golden_path

必选

指定标杆数据路径,必须指定到执行轮次级目录。ATB dump数据的目录结构介绍请参见《ATB场景精度数据采集》中的"输出说明"。

-tp或–target_path

必选

指定待比对数据路径,必须指定到执行轮次级目录。ATB dump数据的目录结构介绍请参见《ATB场景精度数据采集》中的"输出说明"。

-o或–output_path

可选

指定比对结果输出路径,默认为当前工作目录下的output目录(工具会自动创建)。

使用示例

  1. 准备标杆精度数据与待比对精度数据。

    ATB模型的精度数据采集方式请参见ATB场景精度数据采集。假设采集到的精度数据分别保存在golden_data/atb_dump_data、target_data/atb_dump_data目录下。

  2. 执行比对命令。比对命令如下:

    # 请传入实际精度数据路径
    msprobe compare -m atb -gp golden_data/atb_dump_data/data/0_39943/0/ -tp target_data/atb_dump_data/data/0_276107/0/
    

输出说明

ATB精度数据比对输出件为Excel表格文件。

真实数据比对输出件介绍

真实数据精度比对得到的Excel表格文件的各列含义介绍如下:

列名

含义

Target Data Name

待比对数据名称,由op 名称、op ID、IO类型、索引组成。例如0_WordEmbedding/input.1。

Golden Data Name

标杆数据名称,由op 名称、op ID、IO类型、索引组成。例如0_WordEmbedding/input.1。

Target Device and PID

采集待比对数据时的device ID和进程号。

Golden Device and PID

采集待标杆数据时的device ID和进程号。

Target Execution Count

采集待比对数据时的op执行轮次。

Golden Execution Count

采集标杆数据时的op执行轮次。

Target Data Type

待比对数据的数据类型。

Golden Data Type

标杆数据的数据类型。

Target Data Shape

待比对数据的数据形状。

Golden Data Shape

标杆数据的数据形状。

Cosine

余弦相似度。

Euc Distance

欧式距离。

Max Absolute Err

最大绝对误差。

Max Relative Err

最大相对误差。

One Thousandth Err Ratio

相对误差小于千分之一的比例。

Five Thousandth Err Ratio

相对误差小于千分之五的比例。

Target Max

待比对数据的所有元素的最大值。

Golden Max

标杆数据的所有元素的最大值。

Target Min

待比对数据的所有元素的最小值。

Golden Min

标杆数据的所有元素的最小值。

Target Mean

待比对数据的所有元素的平均值。

Golden Mean

标杆数据的所有元素的平均值。

Target Norm

待比对数据的所有元素的Norm值。

Golden Norm

标杆数据的所有元素的Norm值。

统计量数据比对输出件介绍

统计量精度比对得到的Excel表格文件的各列含义介绍如下:

列名

含义

Target Data Name

待比对数据名称,由op 名称、op ID、IO类型、索引组成。例如0_WordEmbedding/input.1。

Golden Data Name

标杆数据名称,由op 名称、op ID、IO类型、索引组成。例如0_WordEmbedding/input.1。

Target Device and PID

采集待比对数据时的device ID和进程号。

Golden Device and PID

采集待标杆数据时的device ID和进程号。

Target Execution Count

采集待比对数据时的op执行轮次。

Golden Execution Count

采集标杆数据时的op执行轮次。

Target Data Type

待比对数据的数据类型。

Golden Data Type

标杆数据的数据类型。

Target Data Shape

待比对数据的数据形状。

Golden Data Shape

标杆数据的数据形状。

Max Diff

最大值绝对误差。

Min Diff

最小值绝对误差。

Mean Diff

平均值绝对误差。

Norm Diff

Norm值绝对误差。

Relative Err of Max(%)

最大值相对误差。

Relative Err of Min(%)

最小值相对误差。

Relative Err of Mean(%)

平均值相对误差。

Relative Err of Norm(%)

Norm值相对误差。

Target Max

待比对数据的所有元素的最大值。

Golden Max

标杆数据的所有元素的最大值。

Target Min

待比对数据的所有元素的最小值。

Golden Min

标杆数据的所有元素的最小值。

Target Mean

待比对数据的所有元素的平均值。

Golden Mean

标杆数据的所有元素的平均值。

Target Norm

待比对数据的所有元素的Norm值。

Golden Norm

标杆数据的所有元素的Norm值。