专利名称:中文文本的纠错方法、装置和计算机设备专利类型:发明专利发明人:张帅
申请号:CN202011294999.7申请日:20201118公开号:CN112395861A公开日:20210223
摘要:本申请涉及人工智能领域的语义解析,揭示了中文文本的纠错方法,包括:判断当前任务领域的词库中的词汇量是否达到预设条件;若是,则在当前任务领域的词库中,构建预训练模型的语料训练集,训练当前任务领域的中文文本的纠错模型进行文本纠错,纠错模型包括词嵌入层,探测层、编码层以及输出层;若否,则通过文本语句中的拼音编辑距离、左右熵以及频数,进行文本纠错。当词汇量达到预训练模型的需求时,通过搭建预训练模型架构、优化的损失函数、训练语料进行模型训练,通过模型进行文本判错、纠错;当词汇量未达到需求时,通过文本语句中的拼音编辑距离、左右熵以及频数,进行文本纠错,灵活地适用于各种任务场景。本申请还适用于区块链领域。
申请人:平安普惠企业管理有限公司
地址:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
国籍:CN
代理机构:深圳市明日今典知识产权代理事务所(普通合伙)
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容