说明:最全专利文库
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111340694.X (22)申请日 2021.11.12 (71)申请人 安谋科技 (中国) 有限公司 地址 200233 上海市闵行区田林路1016号 科技绿洲三期1 1号楼 (72)发明人 韩冥生 余宗桥  (74)专利代理 机构 上海华诚知识产权代理有限 公司 313 00 代理人 肖华 (51)Int.Cl. G06F 30/27(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 111/10(2020.01) (54)发明名称 一种模型量化方法、 服务器、 电子设备及介 质 (57)摘要 本申请涉及模 型压缩技术领域, 特别涉及一 种模型量化方法、 服务器、 电子设备及介质。 其 中, 模型量化方法包括: 获取神经网络模型中算 子的激活值的第一数值范围; 在第一数值范围中 的最小数值大于等于零的情况下, 确定算子的量 化方式为无符号量化方式; 在确定出算子的量化 方式的情况下, 确定算子的激活值的量化结果的 第二数值范围; 根据第一数值范围和第二数值范 围确定算子的激活值与量化结果之间的映射关 系。 基于上述技术方案, 可 以根据算子的激活值 选取合适的量化方式, 如此使得确定出的算子的 激活值的量化结果的第二数值范围, 即量化数值 范围的整个范围都能被完全利用, 能够有效提高 量化精度。 权利要求书2页 说明书9页 附图3页 CN 114065622 A 2022.02.18 CN 114065622 A 1.一种模型量 化方法, 其特 征在于, 包括: 获取神经网络模型中算子的激活值的第一数值范围; 在所述第一数值范围中的最小数值大于等于零的情况下, 确定所述算子的量化方式为 无符号量化方式; 在确定出所述算子的量化方式的情况下, 确定所述算子的激活值的量化结果的第 二数 值范围; 根据所述第一数值范围和所述第二数值范围确定所述算子的激活值与所述量化结果 之间的映射关系。 2.根据权利要求1所述的模型量 化方法, 其特 征在于, 还 包括: 在所述第一数值范围中的最小数值小于零的情况下, 确定所述算子的量化方式为对称 量化方式。 3.根据权利要求2所述的模型量化方法, 其特征在于, 所述在确定出所述算子的量化方 式的情况 下, 确定所述 算子的激活值的量 化结果的第二数值范围; 包括: 获取所述算子的量 化比特数; 根据所述算子的量化比特数和所述算子的量化方式确定所述算子的激活值的量化结 果的第二数值范围。 4.根据权利要求3任一项所述的模型量化方法, 其特征在于, 根据 所述算子的量化比特 数和所述 量化方式确定所述 算子的激活值的量 化结果的第二数值范围, 包括: 根据所述 量化比特数确定量 化等级; 根据所述 量化等级和所述 量化方式确定所述 量化数值范围。 5.根据权利要求1 ‑4任一项所述的模型量化方法, 其特征在于, 根据 所述第一数值范围 和所述第二数值范围确定所述 算子的激活值与所述 量化结果之间的映射关系, 包括: 根据所述第一数值范围中绝对值 最大的数值, 将所述绝对值最大的数值的绝对值作为所述 算子的最大绝对值; 根据所述第二数值范围确定所述第二数值范围内的最大 数值; 将所述第二数值范围内的最大数值与所述算子的最大绝对值的比值作为所述所述算 子的激活值与所述 量化结果之间的映射系数。 6.根据权利要求5所述的模型量化方法, 其特征在于, 还包括: 将所述神经网络模型中 算子的激活值 通过所述映射系数映射至所述第二数值范围内。 7.一种服务器, 其特征在于, 包括: 存储器, 用于存储由所述服务器的一个或多个处理 器执行的指令, 以及 处理器, 是所述服务器的所述一个或多个处理器之一, 用于执行权利要求1 ‑6中任一项 所述模型量 化方法。 8.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储由所述电子设备的一个或多个处 理器执行的指令, 以及 处理器, 是所述电子设备的所述一个或多个处理器之一, 用于执行权利要求1 ‑6中任一 项所述模型量 化方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有指令, 所 述指令在执 行时使计算机执 行权利要求1至 6中任一项所述模型量 化方法。权 利 要 求 书 1/2 页 2 CN 114065622 A 210.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括指令, 所述指令用于 实现权利要求1 ‑6任一项所述模型量 化方法。权 利 要 求 书 2/2 页 3 CN 114065622 A 3

.PDF文档 专利 一种模型量化方法、服务器、电子设备及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型量化方法、服务器、电子设备及介质 第 1 页 专利 一种模型量化方法、服务器、电子设备及介质 第 2 页 专利 一种模型量化方法、服务器、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 05:15:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。