下载
中文
注册

vec_min

功能说明

按element求最小值:

函数原型

vec_min(mask, dst, src0, src1, repeat_times, dst_rep_stride, src0_rep_stride, src1_rep_stride)

参数说明

请参见参数说明

dst/src0/src1的数据类型需要保持一致。

Atlas 200/300/500 推理产品,dst/src0/src1支持的数据类型为:Tensor(float16/float32/int32)

Atlas 训练系列产品,dst/src0/src1支持的数据类型为:Tensor(float16/float32/int32)

Atlas推理系列产品AI Core,dst/src0/src1支持的数据类型为:Tensor(float16/int16/float32/int32)

Atlas推理系列产品Vector Core,dst/src0/src1支持的数据类型为:Tensor(float16/int16/float32/int32)

Atlas A2训练系列产品/Atlas 800I A2推理产品,dst/src0/src1支持的数据类型为:Tensor(float16/int16/float32/int32)

Atlas 200/500 A2推理产品,dst/src0/src1支持的数据类型为:Tensor(float16/int16/float32/int32)

AS31XM1X AI处理器,dst/src0/src1支持的数据类型为:Tensor(float16/int16/float32/int32)

返回值

支持的型号

Atlas 200/300/500 推理产品

Atlas 训练系列产品

Atlas推理系列产品AI Core

Atlas推理系列产品Vector Core

Atlas A2训练系列产品/Atlas 800I A2推理产品

Atlas 200/500 A2推理产品

注意事项

请参考注意事项

调用示例

此样例是针对数据量较小、一次搬运就可以完成的场景,目的是让大家了解接口的功能,更复杂的数据量较大的样例可参见调用示例

from tbe import tik
tik_instance = tik.Tik()
src0_gm = tik_instance.Tensor("float16", (128,), name="src0_gm", scope=tik.scope_gm)
src1_gm = tik_instance.Tensor("float16", (128,), name="src1_gm", scope=tik.scope_gm)
dst_gm = tik_instance.Tensor("float16", (128,), name="dst_gm", scope=tik.scope_gm)
src0_ub = tik_instance.Tensor("float16", (128,), name="src0_ub", scope=tik.scope_ubuf)
src1_ub = tik_instance.Tensor("float16", (128,), name="src1_ub", scope=tik.scope_ubuf)
dst_ub = tik_instance.Tensor("float16", (128,), name="dst_ub", scope=tik.scope_ubuf)
# 将用户输入数据从gm搬运到ub
tik_instance.data_move(src0_ub, src0_gm, 0, 1, 8, 0, 0)
tik_instance.data_move(src1_ub, src1_gm, 0, 1, 8, 0, 0)
tik_instance.vec_min(128, dst_ub, src0_ub, src1_ub, 1, 8, 8, 8)
# 将计算结果从ub搬运到目标gm
tik_instance.data_move(dst_gm, dst_ub, 0, 1, 8, 0, 0)

tik_instance.BuildCCE(kernel_name="vec_min", inputs=[src0_gm, src1_gm], outputs=[dst_gm])

结果示例:

输入数据(src0_gm):
[-8.65    2.775  -5.363   0.685  -9.6    -6.293   8.79   -4.703   1.873
 -0.2876  6.41   -3.666   0.545  -6.875   4.71   -0.782  -9.65   -3.754
  8.266  -8.25   -2.72    1.035   8.61   -8.984   5.457  -5.83   -3.342
  9.61    7.473  -4.465   7.47   -0.1758  6.242   4.707  -4.125   6.94
  1.235  -6.75    3.79    6.15   -0.973   4.4    -3.844  -0.2705  3.445
 -0.2488 -1.875  -1.352   0.3252 -2.902  -1.5625 -0.8     6.57   -7.152
  0.9126 -0.931   2.746  -3.283  -0.1501  8.35    7.137   0.3123 -9.016
 -0.9824 -4.984  -2.531  -1.956  -9.97   -1.166   8.28    8.38   -2.121
 -8.83   -7.625  -3.797   9.65   -9.35    8.555   6.785  -8.555   9.26
 -1.356  -5.75    6.996   5.496  -0.543  -8.234  -4.94    9.68   -3.809
 -1.959   7.742  -4.54   -7.184  -4.45   -7.355  -8.85   -0.571  -7.777
 -9.555   2.889   7.76    7.777   8.86   -1.925  -9.555  -0.4324  0.9155
 -3.264  -5.273   3.969   7.04    4.363  -1.981   0.3008 -3.105   6.26
 -9.445   7.723   1.264  -7.227  -8.766  -4.29   -4.76    1.376  -6.71
  6.47    4.88  ]

输入数据(src1_gm):
[ 1.786  -5.094   6.543   8.58    4.4    -1.73   -9.11    8.516  -4.99
  7.15   -6.047  -0.3647 -4.156   5.94   -7.668   6.297  -5.04    7.562
  9.195   7.773  -8.36    3.416  -6.383   0.2181 -2.43    3.207  -2.26
  9.95   -9.766  -3.594   8.2     2.768  -2.156   8.93    2.62   -9.92
  7.34    8.32    8.05    9.62    9.03    4.11    9.09   -7.254  -2.656
  9.234  -3.178   3.15   -5.438   3.432  -4.17    2.531   9.29   -6.72
 -8.734  -5.574  -2.357   4.88   -4.69   -4.977   1.379   7.086  -9.13
 -0.8184  6.098  -6.883  -0.8174  5.36    4.41   -7.727  -9.22    1.741
 -2.105  -6.47   -4.08   -0.166   4.133  -9.82    7.133  -3.396   4.77
  0.4062  4.39    4.844  -8.805  -1.934  -9.64   -2.09   -6.74    6.965
 -4.906  -6.836   1.167  -4.812   5.117   7.44    9.984  -9.71   -9.17
 -5.766   8.086   3.336   8.234  -7.35    1.631  -9.65    7.992  -9.68
 -3.363   6.98    7.6     1.144   6.965   4.113  -9.25    6.19    8.875
 -2.016   3.502  -4.844  -0.608   6.438  -1.733  -3.59   -9.26   -8.73
  5.55   -9.09  ]

输出数据(dst_gm):
[-8.65   -5.094  -5.363   0.685  -9.6    -6.293  -9.11   -4.703  -4.99
 -0.2876 -6.047  -3.666  -4.156  -6.875  -7.668  -0.782  -9.65   -3.754
  8.266  -8.25   -8.36    1.035  -6.383  -8.984  -2.43   -5.83   -3.342
  9.61   -9.766  -4.465   7.47   -0.1758 -2.156   4.707  -4.125  -9.92
  1.235  -6.75    3.79    6.15   -0.973   4.11   -3.844  -7.254  -2.656
 -0.2488 -3.178  -1.352  -5.438  -2.902  -4.17   -0.8     6.57   -7.152
 -8.734  -5.574  -2.357  -3.283  -4.69   -4.977   1.379   0.3123 -9.13
 -0.9824 -4.984  -6.883  -1.956  -9.97   -1.166  -7.727  -9.22   -2.121
 -8.83   -7.625  -4.08   -0.166  -9.35   -9.82    6.785  -8.555   4.77
 -1.356  -5.75    4.844  -8.805  -1.934  -9.64   -4.94   -6.74   -3.809
 -4.906  -6.836  -4.54   -7.184  -4.45   -7.355  -8.85   -9.71   -9.17
 -9.555   2.889   3.336   7.777  -7.35   -1.925  -9.65   -0.4324 -9.68
 -3.363  -5.273   3.969   1.144   4.363  -1.981  -9.25   -3.105   6.26
 -9.445   3.502  -4.844  -7.227  -8.766  -4.29   -4.76   -9.26   -8.73
  5.55   -9.09  ]