专利名称:一种基于图谱模型的话题探测系统专利类型:发明专利发明人:林欣,赵昂,杨静,贺樑申请号:CN201410326508.0申请日:20140710公开号:CN104050302A公开日:20140917
摘要:本发明公开了一种基于图谱模型的话题探测系统,该系统包括预处理模块、图谱结构构造模块和子图探测模块,预处理模块对语料文本集预处理;图谱结构构造模块用于构造表示原型的图谱结构,其顶点为语料文档的词项,其边缘为词对之间的相关度,根据词是否为实体词、词对之间是否存在依存关系以及词对之间的距离间隔赋予词对之间的相关度以不同的权值,构造以实体词为图谱中心的无向图;子图探测模块处理相关度图谱得到每个子图对应的词汇集合,再进行排序筛选得到每个子话题的最终结果。利用本发明,能够自动获得离散文本集合中隐含的话题,可应用于特征空间降维、相关度计算、语义扩展等自然语言处理相关领域。
申请人:华东师范大学
地址:200241 上海市闵行区东川路500号
国籍:CN
代理机构:上海蓝迪专利事务所
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- haog.cn 版权所有 赣ICP备2024042798号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务