CANN/tensorflow Reduce算子API文档
reduce【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow功能说明集合通信算子Reduce的操作接口将所有rank的数据相加或其他归约操作后再把结果发送到root节点的指定位置上。函数原型def reduce(tensor, reduction, root_rank, fusion0, fusion_id-1, grouphccl_world_group)参数说明参数名输入/输出描述tensor输入TensorFlow的tensor类型。针对Ascend 950PR/Ascend 950DT支持数据类型int8、int16、int32、int64、uint64、float16、float32、float64、bfp16。针对int64、uint64、float64当前仅支持节点内通信。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持数据类型int8、int16、int32、int64、float16、float32、bfp16。需要注意针对int64数据类型性能会有一定的劣化。针对Atlas 训练系列产品支持数据类型int8、int32、int64、float16、float32。reduction输入归约操作类型String类型。针对Ascend 950PR/Ascend 950DT支持的操作类型为sum、max、min。针对Atlas A3 训练系列产品/Atlas A3 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。针对Atlas A2 训练系列产品/Atlas A2 推理系列产品支持的操作类型为sum、max、min、prod当前版本“prod”操作不支持int16、bfp16数据类型。root_rank输入作为root节点的rank_id该id是group内的rank idint类型。fusion输入reduce算子融合标识int类型支持以下取值- 0不融合该reduce算子不和其他reduce算子融合。- 2按照相同fusion_id进行融合。fusion_id输入reduce算子的融合idint类型。当“fusion”取值为“2”时网络编译时会对相同fusion_id的reduce算子进行融合。group输入String类型最大长度为128字节含结束符。group名称可以为用户自定义group或者hccl_world_group。返回值对输入tensor执行完reduce操作之后的结果tensor。约束说明调用该接口的rank必须在当前接口入参group定义的范围内不在此范围内的rank调用该接口会失败。该接口要求输入tensor的数据量不超过8GB。reduce算子融合场景只支持reduction操作类型sum。调用示例from npu_bridge.hccl import hccl_ops tensor tf.random_uniform((1, 3), minval1, maxval10, dtypetf.float32) result hccl_ops.reduce(tensor, sum, 0)【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考