set_iteration_per_loop

功能说明

设置sess.run模式下小循环次数，即每次sess.run()在Device侧执行训练迭代的次数，可以减少Host与Device间的交互次数，缩短训练时长。

函数原型

def set_iteration_per_loop(sess, train_op, iterations_per_loop=1)

参数说明

参数名	输入/输出	描述
sess	输入	已经创建的TensorFlow会话。
train_op	输入	更新梯度的操作。
iterations_per_loop	输入	每次sess.run()，在Device侧执行训练迭代的次数，默认为1，且训练迭代总次数必须为iterations_per_loop的整数倍。混合计算模式（mix_compile_mode为True）时，iterations_per_loop必须为1。

参数名

输入/输出

描述

sess

输入

已经创建的TensorFlow会话。

train_op

输入

更新梯度的操作。

iterations_per_loop

输入

每次sess.run()，在Device侧执行训练迭代的次数，默认为1，且训练迭代总次数必须为iterations_per_loop的整数倍。

混合计算模式（mix_compile_mode为True）时，iterations_per_loop必须为1。

返回值

返回一个算子，供用户通过sess.run(op)调用。

约束说明

由于该接口中有改图的操作，如果图无法修改（例如冻结了图或者使用tf.train.Supervisor创建session等），则无法使用set_iteration_per_loop接口设置大小循环。此种情况下请使用create_iteration_per_loop_var和load_iteration_per_loop_var。

调用示例

from npu_bridge.npu_init import *

config = tf.ConfigProto(allow_soft_placement=True)
custom_op =  config.graph_options.rewrite_options.custom_optimizers.add()
custom_op.name =  "NpuOptimizer"
custom_op.parameter_map["enable_data_pre_proc"].b = True # 若网络中存在getnext算子，需要设置getnext算子下沉，getnext算子下沉是迭代循环下沉的必要条件
custom_op.parameter_map["iterations_per_loop"].i = 10 # 此处设置的值和set_iteration_per_loop设置的iterations_per_loop值保持一致，用于判断是否进行训练迭代下沉
config = npu_config_proto(config_proto=config)

# 训练模型
with tf.Session(config=config) as sess:
    sess.run(init)
    # sess.run模式下设置小循环次数为10
    train_op = util.set_iteration_per_loop(sess, optimizer, 10)  # 其中sess为TensorFlow会话，optimizer为更新梯度的操作,10为设置的在Device侧进行训练迭代的次数
 
    for epoch in range(training_epochs):
        avg_cost = 0
        total_batch = int(mnist.train.num_examples / batch_size)
 
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            _, c = sess.run([train_op, cost], feed_dict={x: batch_xs, y: batch_ys})
 
            avg_cost += c / total_batch

父主题： npu_bridge.estimator.npu.util