任选一种编程语言,设计一个双序列全局比对的程序。要求:
1) 输入两条蛋白质序列,输出比对结果例如:
Alignment Score: 12345
E E E E E K K K K K A A A A A F F F
E E E E E – – – – – B B B B B F F F
2) 使用BLOSUM62矩阵来对序列中氨基酸符号的match和mismatch打分。
3) 使用动态规划的方法(Needleman-Wunsch算法)。
4) 计算空位(gap)的罚分时,使用仿射空位罚分策
对齐方式
一种使用动态编程(DP)Needleman–Wunsch算法进行酶促步骤序列(ESS)对齐的程序。
该程序可以执行以下对齐:
pair ESS command line pairwise comparisson using DP
dbalign ESSs database(s) alignment using DP
multi ESSs multiple alignment using GA
使用DP
非比对序列相似性模型直接采用序列自身的统计信息来计算序列之间的相似度,具有运算速度快、 聚.类结果准确等优点。提出一种基于位置信息的非比对序列相似性模型,通过提取 K 词模型中每个词的 Local Frequency( LF) ,计算对应 K 词的 LF 熵,并结合 K 词频率进行序列的特征提取,应用于蛋白质聚类。实验结果表明.该方法能够有效地提取序列的信息,提高聚类的准确率。