(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111353074.X
(22)申请日 2021.11.16
(65)同一申请的已公布的文献号
申请公布号 CN 114239608 A
(43)申请公布日 2022.03.25
(73)专利权人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 张睿卿 王曦阳 刘辉 何中军
李芝 吴华
(74)专利代理 机构 北京鸿德 海业知识产权代理
有限公司 1 1412
专利代理师 田宏宾
(51)Int.Cl.
G06F 40/42(2020.01)G06F 40/58(2020.01)
G06F 40/51(2020.01)
G06N 3/04(2006.01)
G06N 20/00(2019.01)
(56)对比文件
CN 109960814 A,2019.07.02
CN 109960814 A,2019.07.02
CN 10982 9550 A,2019.0 5.31
CN 112733552 A,2021.04.3 0
CN 112329482 A,2021.02.0 5
CN 110162800 A,2019.08.23
WO 20191 14695 A1,2019.0 6.20
李业刚 等.多策略机 器翻译研究综述. 《中
文信息学报》 .2015,
审查员 陈银兰
(54)发明名称
翻译方法、 模型训练方法、 装置、 电子设备及
存储介质
(57)摘要
本公开提供了一种翻译方法、 模型训练方
法、 装置、 电子设备及存储介质, 涉及机器学习与
信息处理等人工智能技术领域。 具体实现方案
为: 基于待翻译的指定语句和预先训练的赋权模
型, 获取预先训练的至少两个翻译模 型中各所述
翻译模型翻译所述指定语句对应的权重; 基于各
所述翻译模 型翻译所述指定语句的权重, 采用所
述至少两个翻译模型对所述指定语句进行翻译。
本公开的技 术, 能够有效地 提高翻译的准确性。
权利要求书2页 说明书11页 附图7页
CN 114239608 B
2022.11.25
CN 114239608 B
1.一种翻译方法, 其中, 包括:
基于待翻译的指定语句和预先训练 的赋权模型, 获取预先训练 的至少两个翻译模型中
各所述翻译模型翻译所述指定语句对应的权 重;
基于各所述翻译模型翻译所述指定语句的权重, 采用所述至少两个翻译模型对所述指
定语句进行翻译;
基于各所述翻译模型翻译所述指定语句的权重, 采用所述至少两个翻译模型对所述指
定语句进行翻译, 包括:
基于各所述翻译模型翻译所述指定语句的权重, 获取所述至少两个翻译模型翻译所述
指定语句的过程中, 生成的各个位置的目标词;
基于各所述翻译模型翻译所述指定语句的权重, 获取所述至少两个翻译模型翻译所述
指定语句的过程中, 生成的各个位置的目标词, 包括:
对于各所述位置, 获取所述至少两个翻译模型中各所述翻译模型翻译所述指定语句的
过程中, 预测的所述 位置上的数个候选词以及各 所述候选词对应的概 率;
对于所述位置上的各所述候选词, 基于所述至少两个翻译模型中各所述翻译模型翻译
时预测的所述候选词对应的所述概率、 以及各所述翻译模型翻译所述指定语句的权重, 计
算所述候选词在所述 位置上的推理概 率;
基于所述位置上的所述数个候选词中各所述候选词在所述位置上的推理概率, 确定所
述位置的目标词。
2.根据权利要求1所述的方法, 其中, 基于各所述翻译模型翻译所述指定语句的权重,
采用所述至少两个翻译模型对所述指定语句进行翻译, 还 包括:
将所述各个位置的目标词, 按照从前至后的顺序拼接, 生成所述指定语句的翻译。
3.根据权利要求1所述的方法, 其中, 对于所述位置上的各所述候选词, 基于所述至少
两个翻译模型中各所述翻译模型翻译时预测的所述候选词对应的所述概率、 以及各所述翻
译模型翻译所述指定语句的权 重, 计算所述 候选词在所述 位置上的推理概 率, 包括:
对于所述位置上的各个所述候选词, 取各所述翻译模型翻译时预测的所述候选词对应
的所述概率、 与对应的所述翻译模型翻译所述指定语句的权重的乘积之和, 作为所述候选
词在所述 位置上的推理概 率。
4.一种翻译装置, 其中, 包括:
权重获取模块, 用于基于待翻译的指定语句和预先训练的赋权模型, 获取预先训练的
至少两个翻译模型中各 所述翻译模型翻译所述指定语句对应的权 重;
翻译模块, 用于基于各所述翻译模型翻译所述指定语句的权重, 采用所述至少两个翻
译模型对所述指定语句进行翻译;
所述翻译模块, 用于:
基于各所述翻译模型翻译所述指定语句的权重, 获取所述至少两个翻译模型翻译所述
指定语句的过程中, 生成的各个位置的目标词;
所述翻译模块, 用于:
对于各所述位置, 获取所述至少两个翻译模型中各所述翻译模型翻译所述指定语句的
过程中, 预测的所述 位置上的数个候选词以及各 所述候选词对应的概 率;
对于所述位置上的各所述候选词, 基于所述至少两个翻译模型中各所述翻译模型翻译权 利 要 求 书 1/2 页
2
CN 114239608 B
2时预测的所述候选词对应的所述概率、 以及各所述翻译模型翻译所述指定语句的权重, 计
算所述候选词在所述 位置上的推理概 率;
基于所述位置上的所述数个候选词中各所述候选词在所述位置上的推理概率, 确定所
述位置的目标词。
5.根据权利要求 4所述的装置, 其中, 所述翻译模块, 还用于:
将所述各个位置的目标词, 按照从前至后的顺序拼接, 生成所述指定语句的翻译。
6.根据权利要求 4所述的装置, 其中, 所述翻译模块, 用于:
对于所述位置上的各个所述候选词, 取各所述翻译模型翻译时预测的所述候选词对应
的所述概率、 与对应的所述翻译模型翻译所述指定语句的权重的乘积之和, 作为所述候选
词在所述 位置上的推理概 率。
7.一种电子设备, 包括:
至少一个处 理器; 以及
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑3中任一项所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于
使所述计算机执 行根据权利要求1 ‑3中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 114239608 B
3
专利 翻译方法、模型训练方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:03:33上传分享