说明:最全专利文库
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111340694.X (22)申请日 2021.11.12 (71)申请人 安谋科技 (中国) 有限公司 地址 200233 上海市闵行区田林路1016号 科技绿洲三期1 1号楼 (72)发明人 韩冥生 余宗桥 (74)专利代理 机构 上海华诚知识产权代理有限 公司 313 00 代理人 肖华 (51)Int.Cl. G06F 30/27(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 111/10(2020.01) (54)发明名称 一种模型量化方法、 服务器、 电子设备及介 质 (57)摘要 本申请涉及模 型压缩技术领域, 特别涉及一 种模型量化方法、 服务器、 电子设备及介质。 其 中, 模型量化方法包括: 获取神经网络模型中算 子的激活值的第一数值范围; 在第一数值范围中 的最小数值大于等于零的情况下, 确定算子的量 化方式为无符号量化方式; 在确定出算子的量化 方式的情况下, 确定算子的激活值的量化结果的 第二数值范围; 根据第一数值范围和第二数值范 围确定算子的激活值与量化结果之间的映射关 系。 基于上述技术方案, 可 以根据算子的激活值 选取合适的量化方式, 如此使得确定出的算子的 激活值的量化结果的第二数值范围, 即量化数值 范围的整个范围都能被完全利用, 能够有效提高 量化精度。 权利要求书2页 说明书9页 附图3页 CN 114065622 A 2022.02.18 CN 114065622 A 1.一种模型量 化方法, 其特 征在于, 包括: 获取神经网络模型中算子的激活值的第一数值范围; 在所述第一数值范围中的最小数值大于等于零的情况下, 确定所述算子的量化方式为 无符号量化方式; 在确定出所述算子的量化方式的情况下, 确定所述算子的激活值的量化结果的第 二数 值范围; 根据所述第一数值范围和所述第二数值范围确定所述算子的激活值与所述量化结果 之间的映射关系。 2.根据权利要求1所述的模型量 化方法, 其特 征在于, 还 包括: 在所述第一数值范围中的最小数值小于零的情况下, 确定所述算子的量化方式为对称 量化方式。 3.根据权利要求2所述的模型量化方法, 其特征在于, 所述在确定出所述算子的量化方 式的情况 下, 确定所述 算子的激活值的量 化结果的第二数值范围; 包括: 获取所述算子的量 化比特数; 根据所述算子的量化比特数和所述算子的量化方式确定所述算子的激活值的量化结 果的第二数值范围。 4.根据权利要求3任一项所述的模型量化方法, 其特征在于, 根据 所述算子的量化比特 数和所述 量化方式确定所述 算子的激活值的量 化结果的第二数值范围, 包括: 根据所述 量化比特数确定量 化等级; 根据所述 量化等级和所述 量化方式确定所述 量化数值范围。 5.根据权利要求1 ‑4任一项所述的模型量化方法, 其特征在于, 根据 所述第一数值范围 和所述第二数值范围确定所述 算子的激活值与所述 量化结果之间的映射关系, 包括: 根据所述第一数值范围中绝对值 最大的数值, 将所述绝对值最大的数值的绝对值作为所述 算子的最大绝对值; 根据所述第二数值范围确定所述第二数值范围内的最大 数值; 将所述第二数值范围内的最大数值与所述算子的最大绝对值的比值作为所述所述算 子的激活值与所述 量化结果之间的映射系数。 6.根据权利要求5所述的模型量化方法, 其特征在于, 还包括: 将所述神经网络模型中 算子的激活值 通过所述映射系数映射至所述第二数值范围内。 7.一种服务器, 其特征在于, 包括: 存储器, 用于存储由所述服务器的一个或多个处理 器执行的指令, 以及 处理器, 是所述服务器的所述一个或多个处理器之一, 用于执行权利要求1 ‑6中任一项 所述模型量 化方法。 8.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储由所述电子设备的一个或多个处 理器执行的指令, 以及 处理器, 是所述电子设备的所述一个或多个处理器之一, 用于执行权利要求1 ‑6中任一 项所述模型量 化方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有指令, 所 述指令在执 行时使计算机执 行权利要求1至 6中任一项所述模型量 化方法。权 利 要 求 书 1/2 页 2 CN 114065622 A 210.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括指令, 所述指令用于 实现权利要求1 ‑6任一项所述模型量 化方法。权 利 要 求 书 2/2 页 3 CN 114065622 A 3
专利 一种模型量化方法、服务器、电子设备及介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-19 05:15:24
上传分享
举报
下载
原文档
(510.4 KB)
分享
友情链接
GB-T 17714-2022 啤酒桶质量通则.pdf
GB-Z 25425-2010 风力发电机组 公称视在声功率级和音值.pdf
DB52-T 1636.3-2021 机关事务云 第3部分:国有资产(房地产)管理数据 贵州省.pdf
GB-T 24343-2009 工业机械电气设备 绝缘电阻试验规范.pdf
GB-T 22452-2008 硼酸盐非线性光学单晶元件通用技术条件.pdf
YY-T 1869-2023 探测器阵列剂量测量系统 性能和试验方法.pdf
GB-T 23237-2009 腧穴定位人体测量方法.pdf
GB-T 21054-2023 信息安全技术 公钥基础设施 PKI系统安全测评方法.pdf
GB-T 36558-2018 电力系统电化学储能系统通用技术条件.pdf
GM-T 0125.1-2022 JSON Web 密码应用语法规范 第1部分:算法标识.pdf
T-CEC 716—2022 火力发电厂智能热网供热服务规范.pdf
T-CEC 680—2022 电化学储能电站技术监督导则.pdf
DB14-T 281-2021 水泵装置节能技术导则 山西省.pdf
GB-T 40260-2021 高分子膜材料气体渗透性能测试方法.pdf
gartner-magic-quadrant-for-access-management-august-2019.pdf
GM-T 0035.4-2014 射频识别系统密码应用技术要求 第4部分:电子标签与读写器通信密码应用技术要求.pdf
GB-T 31505-2015 信息安全技术 主机型防火墙安全技术要求和测试评价方法.pdf
GB-T 30659-2014 假肢和矫形器 要求和试验方法.pdf
GB-Z 43510-2023 集成电路TSV三维封装可靠性试验方法指南.pdf
GB-Z 18906-2002 开放式电子图书出版物结构.pdf
1
/
3
15
评价文档
赞助2元 点击下载(510.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。