基于句法分析和答案分类的中文问答系统

Chinese Question Answering Based on Syntax Analysis and Answer Classification

doi:
10.3321/j.issn:0372-2112.2008.05.001
摘要:
本文根据疑问词和谓语的距离信息对问句进行细致的句型分析,然后对答句进行浅层句法分析,在此基础上,抽取出问题特征集、答句特征集和组合特征集作为分类特征,引入最大熵模型和支持向量机训练答案抽取分类器.基于不同特征组合训练得到的分类器在五类事实性问题上进行了测试,其F值分别达到70.87%和85.75%.
作者 孙昂[1]    江铭虎[2]    贺一帆[1]    陈林[1]    袁保宗[3]
Author: SUN Ang[1]    JIANG Ming-hu[2]    HE Yi-fan[1]    CHEN Lin[1]    YUAN Bao-zong[3]
作者单位
  1. 清华大学人文学院计算语言学实验室,北京,100084
  2. 清华大学人文学院计算语言学实验室,北京,100084;清华大学心理学与认知科学中心,北京,100084
  3. 北京交通大学信息科学研究所,北京,100044
刊 名: 电子学报   ISTICEIPKU
Journal: ACTA ELECTRONICA SINICA
年,卷(期) 2008, 36(5)
分类号 TP391
关键词: 中文问答系统 知识脉络    句法分析 知识脉络    答案抽取 知识脉络    最大熵模型 知识脉络    支持向量机 知识脉络   
机标分类号 TP3 G35
基金项目 国家自然科学基金
参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
互动百科相关词

知识产权声明| 服务承诺| 联系我们| 人才招聘| 客户服务| 关于我们

互联网出版许可证:新出网证(京)字042号  互联网药品信息服务资格证书号:(京)-经营性-2011-0017  信息网络传播视听节目许可证 许可证号:0108284
京ICP证:010071  北京市公安局海淀分局备案编号:110108901585
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)©北京万方数据股份有限公司  万方数据电子出版社