下载
中文
注册

set_iteration_per_loop

功能说明

设置sess.run模式下小循环次数,即每次sess.run()在Device侧执行训练迭代的次数,可以减少Host与Device间的交互次数,缩短训练时长。

函数原型

def set_iteration_per_loop(sess, train_op, iterations_per_loop=1)

参数说明

参数名

输入/输出

描述

sess

输入

已经创建的TensorFlow会话。

train_op

输入

更新梯度的操作。

iterations_per_loop

输入

每次sess.run(),在Device侧执行训练迭代的次数,默认为1,且训练迭代总次数必须为iterations_per_loop的整数倍。

混合计算模式(mix_compile_mode为True)时,iterations_per_loop必须为1。

返回值

返回一个算子,供用户通过sess.run(op)调用。

约束说明

由于该接口中有改图的操作,如果图无法修改(例如冻结了图或者使用tf.train.Supervisor创建session等),则无法使用set_iteration_per_loop接口设置大小循环。此种情况下请使用create_iteration_per_loop_varload_iteration_per_loop_var

调用示例

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
from npu_bridge.npu_init import *

config = tf.ConfigProto(allow_soft_placement=True)
custom_op =  config.graph_options.rewrite_options.custom_optimizers.add()
custom_op.name =  "NpuOptimizer"
custom_op.parameter_map["enable_data_pre_proc"].b = True # 若网络中存在getnext算子,需要设置getnext算子下沉,getnext算子下沉是迭代循环下沉的必要条件
custom_op.parameter_map["iterations_per_loop"].i = 10 # 此处设置的值和set_iteration_per_loop设置的iterations_per_loop值保持一致,用于判断是否进行训练迭代下沉
config = npu_config_proto(config_proto=config)

# 训练模型
with tf.Session(config=config) as sess:
    sess.run(init)
    # sess.run模式下设置小循环次数为10
    train_op = util.set_iteration_per_loop(sess, optimizer, 10)  # 其中sess为TensorFlow会话,optimizer为更新梯度的操作,10为设置的在Device侧进行训练迭代的次数
 
    for epoch in range(training_epochs):
        avg_cost = 0
        total_batch = int(mnist.train.num_examples / batch_size)
 
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            _, c = sess.run([train_op, cost], feed_dict={x: batch_xs, y: batch_ys})
 
            avg_cost += c / total_batch