学术论文

      基于线粒体SNP的疾病人群分类方法研究

      本文提出了一种基于线粒体SNP位点分析的疾病人群分类方法。采用基于关键字树的多序列比对算法将线柱体DNA对齐,通过卡方统计量和信息含量差值筛选获取与疾病关联的显著性线粒体SNP位点集合作为分类特征,使用k*算法生成有效分类器对未知人群序列进行有效疾病分类。与目前基于基因组序列的分类方法相比,本文算法能够减少比对及关联分析中的信息丢失,提高了疾病人群序列的分类准确率,节省了个性化医疗成本。在帕金森症病人数据集上的实验证明了本方法的有效性。
      作者: 王峻 郭茂祖 邹权
      作者单位: 哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001
      母体文献: 2009中国计算机大会论文集
      会议名称: 2009中国计算机大会
      会议时间: 2009年10月23日
      会议地点: 天津
      主办单位: 中国计算机学会
      语 种: chi
      在线出版日期: 2010年7月28日