κ-gram方法识别microRNA前体
杨良怀[1,2] 吕丕明[3] 陈立军[2] 邓明华[4,5]
[1]浙江工业大学信息工程学院,杭州310032 [2]北京大学信息科学与技术学院,北京100871 [3]中国科学院研究生院,北京100049 [4]北京大学数学科学学院,北京100871 [5]北京大学理论生物中心,北京100871
摘 要:
MicroRNAs(miRNAs)是动植物中较短的参与调控基因表达的功能性非编码RNA序列.第一个miRNA是通过实验手段发现的,然而通过实验手段识别miRNA在技术上仍然具有很大的挑战性和不完整性.因此,miRNA基因识别需要寻求计算方法来弥补实验方法的不足.提出了一个全新的miRNA前体的识别方法.在构造识别模型中,把初级序列和序列二级结构相结合,采用κ-gram方法把序列信息映射到高维特征空间中,然后通过特征选取方法提取特征,并用这些特征为miRNA前体的识别构造了基于SVM的识别模型.同时,采用隐马尔可夫模型(HMM)的学习方法进行了比较.实验结果表明,该方法是有效的,可以达到较高的敏感性和特异性. (共8页)



















cqvip.com