set_iteration_per_loop
功能说明
设置sess.run模式下小循环次数,即每次sess.run()在Device侧执行训练迭代的次数,可以减少Host与Device间的交互次数,缩短训练时长。
函数原型
def set_iteration_per_loop(sess, train_op, iterations_per_loop=1)
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
sess |
输入 |
已经创建的TensorFlow会话。 |
train_op |
输入 |
更新梯度的操作。 |
iterations_per_loop |
输入 |
每次sess.run(),在Device侧执行训练迭代的次数,默认为1,且训练迭代总次数必须为iterations_per_loop的整数倍。 混合计算模式(mix_compile_mode为True)时,iterations_per_loop必须为1。 |
返回值
返回一个算子,供用户通过sess.run(op)调用。
约束说明
由于该接口中有改图的操作,如果图无法修改(例如冻结了图或者使用tf.train.Supervisor创建session等),则无法使用set_iteration_per_loop接口设置大小循环。此种情况下请使用create_iteration_per_loop_var和load_iteration_per_loop_var。
调用示例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
from npu_bridge.npu_init import * config = tf.ConfigProto(allow_soft_placement=True) custom_op = config.graph_options.rewrite_options.custom_optimizers.add() custom_op.name = "NpuOptimizer" custom_op.parameter_map["enable_data_pre_proc"].b = True # 若网络中存在getnext算子,需要设置getnext算子下沉,getnext算子下沉是迭代循环下沉的必要条件 custom_op.parameter_map["iterations_per_loop"].i = 10 # 此处设置的值和set_iteration_per_loop设置的iterations_per_loop值保持一致,用于判断是否进行训练迭代下沉 config = npu_config_proto(config_proto=config) # 训练模型 with tf.Session(config=config) as sess: sess.run(init) # sess.run模式下设置小循环次数为10 train_op = util.set_iteration_per_loop(sess, optimizer, 10) # 其中sess为TensorFlow会话,optimizer为更新梯度的操作,10为设置的在Device侧进行训练迭代的次数 for epoch in range(training_epochs): avg_cost = 0 total_batch = int(mnist.train.num_examples / batch_size) for i in range(total_batch): batch_xs, batch_ys = mnist.train.next_batch(batch_size) _, c = sess.run([train_op, cost], feed_dict={x: batch_xs, y: batch_ys}) avg_cost += c / total_batch |