tensorflow中的梯度求解及梯度裁剪操作-巨人网络通讯

主页 > 知识库 > tensorflow中的梯度求解及梯度裁剪操作

tensorflow中的梯度求解及梯度裁剪操作

1. tensorflow中梯度求解的几种方式

1.1 tf.gradients

tf.gradients(
    ys,
    xs,
    grad_ys=None,
    name='gradients',
    colocate_gradients_with_ops=False,
    gate_gradients=False,
    aggregation_method=None,
    stop_gradients=None,
    unconnected_gradients=tf.UnconnectedGradients.NONE
)

计算ys关于xs的梯度，tf.gradients返回的结果是一个长度为len(xs)的tensor列表list，例如

tf.gradients(y, [x1, x2, x3]返回[dy/dx1, dy/dx2, dy/dx3]

当y与x无关时，即graph无x到y的路径，则求y关于x的梯度时返回[None]；参数stop_gradients指定的变量对当前梯度求解而言，梯度求解将止于这些变量。

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b], stop_gradients=[a, b]) #梯度计算不再追溯a,b之前的变量

输出：

In: sess.run(g)

out:[1.0, 1.0]

如果不设置stop_gradients参数则反向传播梯度计算将追溯到最开始的值a,输出结果为：

In : sess.run(g)

Out: [3.0, 1.0]

1.2 optimizer.compute_gradients

compute_gradients(
    loss,
    var_list=None,
    gate_gradients=GATE_OP,
    aggregation_method=None,
    colocate_gradients_with_ops=False,
    grad_loss=None
)

optimizer.compute_gradients是tf.gradients的封装，作用相同，但是tfgradients只返回梯度，compute_gradients返回梯度和可导的变量；tf.compute_gradients是optimizer.minimize()的第一步，optimizer.compute_gradients返回一个[(gradient, variable),…]的元组列表，其中gradient是tensor。

直观上，optimizer.compute_gradients只比tf.gradients多了一个variable输出。

optimizer = tf.train.GradientDescentOptimizer(learning_rate = 1.0)
self.train_op = optimizer.minimize(self.cost)
sess.run([train_op], feed_dict={x:data, y:labels})

在这个过程中，调用minimize方法的时候，底层进行的工作包括：

(1) 使用tf.optimizer.compute_gradients计算trainable_variables 集合中所有参数的梯度

(2) 用optimizer.apply_gradients来更新计算得到的梯度对应的变量

上面代码等价于下面代码

optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1)
grads_and_vars = optimizer.compute_gradients(loss)
train_op = optimizer.apply_gradients(grads_and_vars)

1.3 tf.stop_gradient

tf.stop_gradient(
    input,
    name=None
)

tf.stop_gradient阻止input的变量参与梯度计算，即在梯度计算的过程中屏蔽input之前的graph。

返回：关于input的梯度

2. 梯度裁剪

如果我们希望对梯度进行截断，那么就要自己计算出梯度，然后进行clip，最后应用到变量上，代码如下所示，接下来我们一一介绍其中的主要步骤

#return a list of trainable variable in you model
params = tf.trainable_variables()

#create an optimizer
opt = tf.train.GradientDescentOptimizer(self.learning_rate)

#compute gradients for params
gradients = tf.gradients(loss, params)

#process gradients
clipped_gradients, norm = tf.clip_by_global_norm(gradients,max_gradient_norm)

train_op = opt.apply_gradients(zip(clipped_gradients, params)))

2.1 tf.clip_by_global_norm介绍

tf.clip_by_global_norm(t_list, clip_norm, use_norm=None, name=None)

t_list 表示梯度张量

clip_norm是截取的比率

在应用这个函数之后，t_list[i]的更新公示变为：

global_norm = sqrt(sum(l2norm(t)**2 for t in t_list))
t_list[i] = t_list[i] * clip_norm / max(global_norm, clip_norm)

也就是分为两步：

(1) 计算所有梯度的平方和global_norm

(2) 如果梯度平方和 global_norm 超过我们指定的clip_norm，那么就对梯度进行缩放；否则就按照原本的计算结果

梯度裁剪实例2

loss = w*x*x
optimizer = tf.train.GradientDescentOptimizer(0.1)
grads_and_vars = optimizer.compute_gradients(loss,[w,x])
grads = tf.gradients(loss,[w,x])
# 修正梯度
for i,(gradient,var) in enumerate(grads_and_vars):
    if gradient is not None:
        grads_and_vars[i] = (tf.clip_by_norm(gradient,5),var)
train_op = optimizer.apply_gradients(grads_and_vars)
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(grads_and_vars))
     # 梯度修正前[(9.0, 2.0), (12.0, 3.0)]；梯度修正后 ，[(5.0, 2.0), (5.0, 3.0)]
    print(sess.run(grads))  #[9.0, 12.0]，
    print(train_op)

补充：tensorflow框架中几种计算梯度的方式

1. tf.gradients

tf.gradients(
    ys,
    xs,
    grad_ys=None,
    name='gradients',
    colocate_gradients_with_ops=False,
    gate_gradients=False,
    aggregation_method=None,
    stop_gradients=None,
    unconnected_gradients=tf.UnconnectedGradients.NONE
)

计算ys关于xs的梯度，tf.gradients返回的结果是一个长度为len(xs)的Tensor列表list，每个张量为sum(dy/dx)，即ys关于xs的导数。

例子：

tf.gradients(y, [x1, x2, x3]返回[dy/dx1, dy/dx2, dy/dx3]

当y与x无关时，即graph无x到y的路径，则求y关于x的梯度时返回[None]

参数stop_gradients指定的变量对当前梯度求解而言，梯度求解将止于这些变量。

实例：

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b], stop_gradients=[a, b]) #梯度计算不再追溯a,b之前的变量

输出：

In: sess.run(g)

out:[1.0, 1.0]

如果不设置stop_gradients参数则反向传播梯度计算将追溯到最开始的值a,输出结果为：

In : sess.run(g)

Out: [3.0, 1.0]

2. optimizer.compute_gradients

compute_gradients(
    loss,
    var_list=None,
    gate_gradients=GATE_OP,
    aggregation_method=None,
    colocate_gradients_with_ops=False,
    grad_loss=None
)

optimizer.compute_gradients是tf.gradients的封装1.

是optimizer.minimize()的第一步，返回(gradient, variable)的列表，其中gradient是tensor。

直观上，optimizer.compute_gradients只比tf.gradients多了一个variable输出。

3. tf.stop_gradient

tf.stop_gradient(
    input,
    name=None
)

tf.stop_gradient阻止input的变量参与梯度计算，即在梯度计算的过程中屏蔽input之前的graph。

返回：关于input的梯度

应用：

1、EM算法，其中M步骤不应涉及通过E步骤的输出的反向传播。

2、Boltzmann机器的对比散度训练，在区分能量函数时，训练不得反向传播通过模型生成样本的图形。

3、对抗性训练，通过对抗性示例生成过程不会发生反向训练。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

使用tensorflow 实现反向传播求导
TensorFlow的自动求导原理分析
Tensorflow 如何从checkpoint文件中加载变量名和变量值
Python3安装tensorflow及配置过程
解决tensorflow 与keras 混用之坑
tensorflow中的数据类型dtype用法说明

标签：宿迁驻马店山东常州江苏成都六盘水兰州

巨人网络通讯声明：本文标题《tensorflow中的梯度求解及梯度裁剪操作》，本文关键词 tensorflow,中的,梯度,求解,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《tensorflow中的梯度求解及梯度裁剪操作》相关的同类信息！

tensorflow中的梯度求解及梯度裁剪操作

1. tensorflow中梯度求解的几种方式 1.1 tf.gradients tf.gradients( ys, xs, grad_ys=None, name='gradients', colocate_gradients_with_ops=False, gate_gradients=False, aggregation_method=None, stop_gradients=None, unconnected_gradients=...

10-18

ai外呼电话机器人（ai外呼机器人费用）

本文目录一览： 1、这个猎星AI智能外呼机器人好用吗？2、ai智能电话机器人有什么作用？3、AI语音机器人有哪些好处4、智...

11-27

浅谈400电话企业客服的有力工具

现在各行各业的发展都离不开互联网，企业更是如此，现在越来越多的企业开始了网络营销的征程，都想让自己的业务在互联...

12-22

银川智能外呼系统价格（外呼系统收费）

本文目录一览： 1、外呼体系装置须要哪些用度？ 2、召唤焦点或外呼体系哪种又廉价又好的啊 3、智能外呼体系几何钱？ 4、...

11-26

联通116114为广交会客商提供无忧服务

第109届广交会期间，广东联通整合了116114业务的酒店机票预订、交通顾问等服务，为广交会客商提供无忧服务。据悉，1161...

10-19

AI电话机器人是骗局吗（ai电话智能机器人）

本文目录一览：1、ai电话诈骗是怎么回事儿?2、如何预防利用AI电话诈骗的骗局?3、ai电话诈骗,是真的吗?4、江苏镇江一骗子用...

06-20

消费级物联网专用卡14103怎么激活（电信物联卡14104激活）

141号段是电信物联卡号段，作为目前物联网市场上最大的物联卡运营商，电信物联卡其卡片的稳定性和质量得到的一致好评。...

11-07

10-23

西安5G电话线路详情-专业服务

西安5G电话线路详情因此，对于从事电销业的企业，或对某些从事电话销售的企业来说，智能电销机器人是一个好的选择。目...

01-15

廊坊电销卡好用吗

廊坊电销卡好用吗 "本公司是一家专业做电销卡的通讯公司！十年行业经验为为您保驾护航！卡种多，归属地齐全。满足不同...

12-15

电话智能机器人怎么样，到底有没有效果

人工客服收到工作时间、效率以及工作量的限制，已经无法完全适应部分企业的呼叫业务。通过AI智能软件系统的协助，完成...

07-12

客服中心服务量话量预测入门

服务预测与排班是大部分服务行业有效管理的关键环节，尤其是客服中心，对服务预测准确度要求高，对排班的舒适性和效率...

10-22

有准确率很高的空号检测软件吗？

怎么解决手机空号这一麻烦事呢，用手机空号检测就能解决，现在手机空号检测的软件在网上一搜出来的太多，一时之间不知...

12-03

电销行业大革命，电销机器人到底带来了什么

电销领域革命，电销机器人究竟带给了哪些在2017年电销领域早已进入了一个乏力的环节：大家抵触电销的电話，只需已接...

01-15

上半年重庆市服务外包执行额达4.7亿美元增长169%

重庆频道消息 6月30日,记者从"2013重庆市服务贸易工作会"上获悉,今年上半年我市服务外包执行额达4.7亿美元,同比增长169%。此...

10-22

精确定位店位置多少钱？精确定位位置？

北京现代4s店装gps定位多少钱？如果需要可以去汽配城和GPS公司安装，记着要软件客户端、账号和密码。你可以货比三家，一...

11-26

手机坐席与PC端云呼叫中心有哪些区别

疫情期间坐席受制于网络条件或者没带电脑，手机坐席是坐席居家办公的一种新方式，适合没有电脑或者更愿意使用手机的坐...

12-07

重庆高院终审判决假冒“简单搜索”网站赔偿百度80万元

来源：中国知识产权资讯网一个域名为“baidu”的搜索网站，却被法院判决赔偿百度公司80万元。这究竟是为何？ “百度推...

10-23

viewport.exe进程是什么意思

进程文件： viewport or viewport.exe 进程名称： ATI/Appian HydraVision Desktop Manager 进程类别：存在安全风险的进程英文描述： viewpo...

10-19

干洗商标该如何选择合适的类别呢？

所谓三百六十五行行行出状元，现在社会工种也是特别多，只要想的出到，都是有市场的，很多人买的衣服都是品牌，自己又...

10-23

电销卡公司封号咋办

对于电话销售人员来说，他们每天都要使用手机卡拨打电销电话，可以说呼出频率是非常高的，如果使用三大运营商发行的手...

12-16

windows2000下C盘权限设置

1.选取整个硬盘： system：完全控制 administrator：完全控制 (允许将来自父系的可继承性权限传播给对象) 2/programfiles/commonfiles：...

10-20

福州房产电话呼叫软件在哪可以办理,电销系统-[热门]

福州房产电话呼叫软件在哪可以办理,电销系统因为电话营销机器人可以更好的进行智能交流，所以就会让广大客户的好感度...

12-17

智能外呼系统对接网关（智能外呼系统对接网关有什么用）

今天给各位分享智能外呼系统对接网关的知识，其中也会对智能外呼系统对接网关有什么用进行解释，如果能碰巧解决你现在...

11-06

巨人科技如何来管理员工

任何公司对自己员工的管理工作都是非常重要的，只有我们真正的做好各个方面的管理，你就会发现其实所有的事情都能够有...

05-15

400电话的智能网平台是怎么回事

对于400电话这样的一种业务，很多人是不了解的，甚至不知道这样一种业务的存在，毕竟自己从来没有接触过这样一种类型的...

05-16

阳江智能外呼系统（ai智能外呼系统销售）

本文目录一览： 1、自动外呼系统是什么，使用自动外呼营销系统违法吗？ 2、什么是智能外呼营销系统？求详细解答 3、自动...

11-24

400电话办理一年多少钱？解析金钱背后的谈判技巧、价格构成、影响因素和节省策略-400电话办

在商业社会中，电话交流作为最直接的联系方式，一直被视为商业合作的重要手段。而在以客户为中心的营销模式中，400电话...

07-21

宁波教育AI电话机器人办理价格-放心省心

宁波教育AI电话机器人办理价格进员工难以跟进。流失率居高不下：销售工作单调乏味，流失率居高不下。现在对于很多的传...

01-16

建立品牌美誊度的策略

品牌竞争是市场竞争在经历了价格、质量、服务等各方面的较量之后进入的一个新阶段。品牌与产品不同，它强调系统性和全...

10-23

办400电话需要多少钱开通一个400电话需要多少钱？

400电话由主电话和被电话分担，即400电话承担市政电话接入费，被电话承担所有400电话接听费。影响400电话价格的因素很多...

01-12

什么是客服外包，怎么挑选靠谱公司合作？

什么是客服外包？客服外包，是指企业将客服工作交由其他企业负责，客服外包类型主要有：售前咨询、售后服务等。这对...

01-16

400电话漏接短信功能意义有多大?

当企业漏接掉一个电话，400电话客服会在一定时间给企业发去漏接短信，这就很大程度上降低了企业漏接电话而造成的损失。...

12-22

Ruby中的block、proc、lambda区别总结

在规则引擎中，Ruby 的闭包使用特别频繁，而且有 block，Proc和 lambda 等后几种形式的用法，很让人困惑。为了深入理解代码，...

10-18

在正规平台办理电销卡的好处

选择电话营销时，重要的及时电话卡了，但是使用普通的电话卡因为电话的数量较多就很容易被封，那么就需要去办理电销卡...

12-04

靓车spavip会所企业彩铃录音

您好，欢迎致电靓车spavip会所。我们以专业的技术，为您的爱车提供汽车美容、精品装具、镀晶、镀膜、防爆膜、封釉等专业...

11-27

嘉兴不封号呼叫中心软件多少钱,呼叫中心软件办理费用-信誉保证

嘉兴不封号呼叫中心软件多少钱,呼叫中心软件办理费用预计电销机器人将会大规模运用，智能电销机器人的市场份额将逐步...

12-17

现在最火的餐饮加盟项目有哪些？你觉得现在餐饮行业好做吗？

2018年最火的餐饮加盟店之贝克士汉堡现在社会的生活方式都是快节奏的，人们会为了节省更多的时间而去选择快餐。然而汉...

12-14

重庆电销机器人代劳

汇港通自决研制鉴于大数据、云计划的产物。扶助大中小企业提率，提高管理，优化运维。移动crm经过大数据、云计划调整云...

10-31

大理州电销机器人培训（电销机器人话术剧情）

本文目录一览： 1、学习工业机器人到哪里学啊？2、电销机器人究竟多少钱？价格往来不断怎样这么大3、有谁用过电销机器...

04-22

一键呼救911呼叫中心！Uber推出呼叫功能提高救援效率

据境外媒体报道，让报警电话时用户的定位变得更准确，这不仅是在优化应急流程，更可能是在生死关头提高救援效率。FC...

10-19

云外呼系统质量

外呼系统是一种具有完善防封功能以及客户管理后台的系统，目前电销行业现在面临的问题就是现在封号问题严重，不管用哪...

11-27

win8图片库加入图片的方法介绍

Win8系统中的Metro界面真是灰常漂亮啊，我就喜欢在这界面下用不过可以用的软件真是少。Metro界面中的相片下的图片库，你打...

10-20

Python基础之hashlib模块详解

目录一、hashlib简介二、hash对象的方法三、hashlib实际操作四、小小案例一、hashlib简介 1.什么叫hash: hash是一种算法（不同...

10-18

突发：刚刚，美国官方宣布“封杀”中国移动！！！移动公司重磅回应...

12-04

电销机器人未来趋势图分析（机器人销售前景）

本文目次一览： 1、AI智能电销呆板人阛阓前景如何样？ 2、德律风发售将来的走向是什么？ 3、中科嘉智电销呆板人将来的发...

11-26

易才博普奥为全球最大中文书籍零售商提供整体人力资源外包服务

CTI论坛(ctiforum)6月30日消息（记者杨佳林）：人力资源外包专家、服务外包产业专业人才租赁供应商---北京易才博普奥管理顾...

10-19

电销顾客资源怎么找？

电销顾客资源怎么找？在电话销售过程中，正确的寻找到意向顾客是我们做电话销售人员的关键的一步。电话销售人员在每...

10-24

win7升级win8.1后360浏览器打不开了怎么办？

原先安装win7系统换为win8.1update（win8应该适用），之前安装在D盘的360极速/安全浏览器无法打开，可使用此方法。软件名称：...

10-20

商标注册人的权利和义务

（一）商标注册人的权利商标注册人的权利主要是指对注册商标所享有的专用权。我国《商标法》规定：经商标局核准注册...

10-23

合肥智能电销网络线路办理服务商-诚信合作

合肥智能电销网络线路办理服务商它不只能提高企业的营销效率，还能帮助企业提高服务效率，除此之外，企业搭建智能电销...

01-16

tensorflow中的梯度求解及梯度裁剪操作

10-18

本页收集关于tensorflow中的梯度求解及梯度裁剪操作的相关信息资讯供网民参考！

四合一精品企业网站建设

多一个网站就为企业多增加一条营销渠道

¥888元限时抢购

立即咨询 快速购买

企业400电话

智能AI客服机器人
￥15000

在线订购

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

推荐文章

上一篇：python numpy中multiply与*及matul 的区别说明

下一篇：Django分页器的用法你都了解吗

一起分享吧

tensorflow中的梯度求解及梯度裁剪操作

1. tensorflow中梯度求解的几种方式

1.1 tf.gradients

1.2 optimizer.compute_gradients

1.3 tf.stop_gradient

2. 梯度裁剪

2.1 tf.clip_by_global_norm介绍

1. tf.gradients

例子：

2. optimizer.compute_gradients

3. tf.stop_gradient

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

在线咨询