蛋白质磷酸化位点的识别

内蒙古工业大学学报

JOURNALOFINNERMONGOLIA

文章编号:1001-5167(2011)03-0081-05

蛋白质磷酸化位点的识别

*

白海艳,吕 军,张 颖,计美珍,秦丹丹

(内蒙古工业大学理学院呼和浩特010051)

摘要:磷酸化是蛋白质重要的翻译后修饰之一,磷酸化位点的理论识别是计算生

物学的重要研究内容。磷酸化位点附近存在保守残基片段,而这种保守性又与激酶类型相关。选择注释数据相对较多的CK2,PKA和PKC三种激酶催化的磷酸化位点作为研究对象,以序列组分特征,残基位置特异性特征和残基的非近邻关联特征为参数,采用延森-香农离散量(Jensen-ShannonDivergence,JSD)作为各特征差异度量,再使用二次判别分析算法组合不同特征,对磷酸化位点进行预测。对CK2,PKA和PKC三种激酶磷酸化位点7-fold交叉检验,总精度分别达到了90%,90%和86%,这一结果要好于当前其它预测模型。

关键词:蛋白质磷酸化位点,延森-香农离散量,二次判别分析中图分类号:Q61 文献标识码:A

0 引 言

蛋白质翻译后修饰在生命活动中具有十分重要的作用,它使蛋白质的结构更为复杂,功能更为完整,调节更为精细,作用更为专一。常见的蛋白质翻译后修饰过程有六种,如泛素化,磷酸化,糖基化,酯基化,甲基化和乙酰化,其中磷酸化是蛋白质最重要的翻译后修饰之一。蛋白质磷酸化和去磷酸化过程是生物体内普遍存在的信息传导方式,几乎涉及所有的生理及病理过程。真核蛋白质约30%-50%要经历磷酸化过程[1],而脊椎动物基因组中有5%的基因编码蛋白激酶或磷酸酯酶,激酶的失活会导致一系列的疾病,如癌症等。因此,了解特定蛋白质激酶的磷酸化作用机制将会影响当前分子生物学的许多领域,对疾病的相关研究以及药物设计等方面也都有很大帮助。

磷酸化反应是泛指把磷酸基团在酶催化作用下转移到其它化合物的过程,蛋白质的磷酸化则是指在蛋白激酶催化作用下把ATP或GTP的磷酸基转移到底物蛋白质氨基酸残基的过程,其逆转过程是在蛋白磷酸酯酶催化的作用下,脱去磷酸基团的过程。一条蛋白质链的磷酸化一般只发生在丝氨酸(serine,S),苏氨酸(threonine,T)或酪氨酸(tyrosine,Y)这三个残基上。蛋白激酶(proteinkinase,PK)催化氨基酸的侧链羧基形成磷酸酯,蛋白磷酸酯酶催化蛋白质的磷酸酯键而去磷酸化,细胞内任何一种蛋白质的磷酸化状态是由蛋白质激酶和蛋白磷酸酯酶的两种相反酶活性之间的平衡决定的。目前对磷酸化位点的预测有两种技术,一种实验检测,另一种是计算生物学技术。

蛋白质磷酸化位点的实验检测技术在不断进步,最早使用的Edman降解法,之后发展到质谱技术,如今,质谱技术和Edman降解合用已经成为蛋白质测序中磷酸氨基酸残基定位的有效工具。关于蛋白

收稿日期:2011-01-19

基金项目:内蒙古自然科学基金项目(2010BS0104)作者简介:白海艳,女,硕士研究生

通讯作者:吕军,Email:[email protected]

*

质磷酸化位点检测的实验技术的详细描述可以参见文献

[2]

。尽管蛋白质组技术的发展异常迅猛,但是

对磷酸化蛋白质进行全面详尽地分析仍很困难。其原因主要是:首先,蛋白质磷酸化在体内是一种不稳定的动态过程;其次,磷酸化蛋白质在细胞内丰度较低;再者,磷酸化蛋白质的磷酸基团很容易在分离过程中丢失,且因其负电性而难于质子化。这些均给质谱分析鉴定磷酸化蛋白质造成困难。因此采用计算生物学方法对磷酸化位点预测成为必要的手段。

磷酸化位点的计算生物学预测开始于1999年,Blom[3]等给出一个基于神经网络算法的预测模型,直到现在已有十几种预测模型被提出。这些预测方法提取的参数主要有,氨基酸组分特征,氨基酸位置保守性特征,结构功能特征以及氨基酸生化指标特征。主要的机器学习算法有人工神经网络(ArtificialNeuralNetwork,ANN)[3,4],支持向量机(SupportVectorMachine,SVM)[5,6],K近邻[7],隐马尔可夫模型(HiddenMarkovModel,HMM)

[8]

,对数比回归模型(logisticregressionmodels)[9],位置特异得分

[10]

矩阵(position-specificscoringmatrix,PSSM),信息熵(Information-Entropy)

[11]

,贝叶斯决策理

论(Bayesiandecisiontheory,BDT)[12],加权投票(weightedvoting)[13]等。2008年Zhang等应用多样性增量结合二次判别分析(IncrementofDiversitywithQuadraticDiscriminantanalysis,IDQD)[14]对磷酸化位点进行了预测。最近Basu等

[15]

采用10个氨基酸生化特征参数,训练一个神经网络模型,对蛋白

质翻译后修饰位点进行了全面的预测取得较好的精度。

本文同样采用了前两类特征参数(氨基酸组分特征和位置特异性特征),但是在选择氨基酸组分特征参数时,从两方面进行了考虑,一方面是蛋白质序列单个氨基酸残基出现的频次,另一方面是考虑以蛋白质内部残基的相互接触能为权重的序列非紧邻二联体频次。然后再采用延森-香农离散量结合二次判别分析算法(Jensen-ShannonDivergencewithQuadraticDiscriminantanalysis,JSDQD)进行分类,获得较好的分类精度。

1 材料和方法

1.1 数据集

本文采用的是文献[14]的数据集。此文献使用了蛋白质磷酸化位点注释数据库Phospho.ELM6.0[16],而且选择了其中数据相对较多的CK2(caseinkinase2)家族,PKA(proteinkinaseA)家族和PKC(proteinkinaseC)家族,因酪氨酸的磷酸化注释数据很少,所以只针对S和T的磷酸化进行预测。磷酸化位点集中三种激酶家族分别包含292、330和376个磷酸化的S或T位点,非磷酸化位点集样本是按照与磷酸化位点样本数1.56:1,1.53:1和1.36:1的比例,从148个CK2型,206个PKA型和216个PKC型的磷酸化蛋白中的10244,18289和17067个未注释的S和T中选取的,即三种激酶类型CK2,PKA和PKC分别随机抽取456,505和512个非磷酸化位点样本。

截取窗口长度为L的序列片段为研究对象,即以磷酸化位点残基(S或T)为中心,向N端和C端分别截取长为L的片段,构成一个长为2@L+1的待测子序列。当磷酸化位点残基非常靠近一个蛋白质序列的N端或C端,片段长度可能小于L,此时,不足L的部分用字母X补齐。本文对CK2,PKA和PKC三种激酶类型,在选择单氨基酸组分特征时,最佳窗口长度分别为10,5和11,选择氨基酸位置保守性特征时,最佳窗口长度均为5,选择非近邻氨基酸关联特征时,窗口长度为25。1.2 算法

1.2.1 延森-香农离散量

在概率理论和统计学中,延森-香农离散量(Jensen-ShannonDivergence,JSD)是描述两个概率分布相似性的常用方法[17],它基于Kullback-Leibler熵[18],JSD的平方根是一个标准的距离尺度。给定样本A的一组特征向量n={ni}(比如单氨基酸频次),和样本B的一组同样特征m={mi},(i=1,2,..K),K为特征向量中的元素数,两样本的JSD定义为

JSD(

[17]

,)=KL(,s)+KL(,s)NM2N2M

(1)

这里,s=(+)/2,N=

NN

i=1

En,M=Em,KL

i

i

i=1

KK

是Kullback-Leibler熵[18],

KN(,s)=

N

1.2.2 二次判别分析

i=1

E

K

i

ilog2

iiN(+)/2NM

(2)

假设一个样本我们可以提取它的r组特征,将这r个参数构成一个r维的判别向量,则判别其分类归属的二次判别函数由下式给出

[19]

,

D1-D2

N=ln--ln

q22

E

12

(3)

其中p为训练正集的样本总数,q为训练负集的样本总数,即先验概率,

E

i

是r@r维协方差矩阵。

E

i

是矩阵

E

i

的行列式值,并且

i(R-Li)D

T

E

-1i

i) (i=1,2)(R-L(4)

i是训练集中R的平均向量,Di是R与Li之间的马氏距离,i=1表示训练正集,i=2表示训其中L

练负集。

(3)式是由Bayes理论导出。如果特征(信息参数)选的合适,正负集可在N空间的0附近分得很开,不过,由于正负集样本数的有限性,并且都可能对正态分布有偏离(正态分布是导出(3)的前提条件),两个集合在N空间的分界点不一定是0,最佳分界值要由经验确定,本文中我们选取得最佳分类域值为N0=-1。

2 参数提取

2.1 单氨基酸组分特征

选取了子序列中单个残基出现的频次,构成一个21维的特征向量。计算测试集中任一条子序列,与训练集中的每一条子序列的JSD,在训练正集中的均值记为QD1,负集均值记为QD2。为检验所提取的特征参数在磷酸化位点序列和非磷酸化位点序列间的差异性,统计测试正集和测试负集QD1的取值分布,结果表明QD1的取值分布在两个集合上有显著的差异。图1以PKA激酶类型为例,给出磷酸化和非磷酸化位点序列的QD1取值分布,可以看出,在各取值区间的相对频次和相对累积频次有显著的差异。

图1 PKA激酶磷酸化和非磷酸化序列组分特征参数的JSD分布.(a)相对频次.(b)相对累积频次.

Figure1FrequencydistributionsofJensen-Shannondivergenceof

thesequence'scompositionalfeatureforPKA.(a)Relativefrequencypercentage.

(b)Relativecumulativefrequency.

2.2 氨基酸位置保守性特征

磷酸化位点附近存在氨基酸位置保守性特征。选取子序列中的-5:-1和+1:+5共10个残基(以磷酸化位点为参考0位置),统计每一位置各残基出现的频次,构成一个21@10=210维的特征向量。计算测试集中任一条子序列,与训练集中的每一条子序列的JSD,在训练正集中的均值记为QD3,负集均值记为QD4。同样以PKA激酶类型为例,给出磷酸化和非磷酸化位点序列的QD3取值分布,见图2

图2 PKA激酶磷酸化和非磷酸化位置保守性特征参数的JSD分布.(a)相对频次.(b)相对累积频次.

Figure2FrequencydistributionsofJensen-Shannondivergenceofposition

conservativefeatureforPKA.(a)Relativefrequencypercentage.

(b)Relativecumulativefrequency.

2.3 非近邻氨基酸关联特征

统计序列距离大于2aa的两个残基的关联频次,并以内部残基相互接触能[20]作为权重因子,对这个加权的关联频次求和,作为序列氨基酸非近邻关联特征值,记为QD5,这是一个非JSD参数。同样以PKA激酶类型为例,给出磷酸化和非磷酸化的QD5取值分布,见图3

图3 PKA激酶磷酸化和非磷酸非近邻氨基酸对加权关联特征的分布.(a)相对频次.(b)相对累积频次.

Figure2Frequencydistributionsoftheweightedrelevancyfeatureofnon-adjacentaminoacidpairsforPKA.(a)Relativefrequencypercentage.

(b)Relativecumulativefrequency.

最后由QD1,QD2,QD3,QD4组成一个4维二次判别向量和由QD1,QD2,QD3,QD4和QD5组成一个5维二次判别向量,分别按照(3)式对一个待分类位点进行分类判别。

3 结果与讨论

112

3.1 结 果

内蒙古工业大学学报 2011年

采取自洽检验,7-fold交叉检验和独立检验对算法识别能力进行评价,而后两种检验分别独立执行10次,再计算平均结果。

识别结果的评估参数为正确率(accuracy,Ac),敏感性(sensitivity,Sn),特异性(specificity,Sp),查准率(precision,positivepredictivevalue,PPV)和相关系数(correlationcoefficient,CC)分别定义如下:

Ac=[(TP+TN)/(TP+FN+TN+FP)]@100%

Sn=[TP/(TP+FN)]@100%Sp=[TN/(TN+FP)]@100%PPV=[TP/(TP+FP)]@100%CC=

(TP+TN)@(TN+FP)@(TP+FP)@(TN+FN)

其中,TP,FN,TN和FP分别为真阳性(truepositive,TP),假阴性(falsenegative,FN),真阴性(true

0的选择的,为了实现negative,TN)和假阳性(falsepositive,FP)。以上评价指标,一般是依赖于阈值N

不同算法间更为公平的比较,本文还给出了识别结果的两个综合评价指标。一个是以Sn为纵坐标,1-Sp为横坐标绘制的受试者操作特性曲线下的面积(areaunderthecurveReceiverOperatorCharacteris-tics,auROC),另一个是以PPV为纵坐标,Sn为横坐标绘制的精度召回率曲线下的面积(areaunderthecurvePrecisionRecallCurves,auPRC)。3.1.1 自洽检验结果

自洽检验结果如表1,由表1可以看出,组合了非近邻二联体加权关联特征的5维参数进行二次判别分类,比4维参数进行二次判别分类的精确度要高。总分类精度提高2-3个百分点,这对于分类精度已经达到90%左右的分类问题是一个不错的提高。说明非近邻二联体加权关联特征在此问题中的有效性。

表1 磷酸化位点的自洽检验结果

Table1Theresultsofre-substitutiontestfortheCK2,PKAandPKCfamilies

Kinasefamily

CK2PKAPKC

No.ofQDparameters

454545

AC(%)87.8390.6489.4691.3886.7188.74

Sn(%)86.3089.7388.1891.8289.3691.76

Sp(%)88.8291.2390.3091.0984.7786.52

PPV(%)83.1786.7585.5987.0781.1683.33

CC0.750.800.780.820.730.78

auROC0.92820.94740.95260.96230.93410.9527

auPRC0.90900.93380.93930.95280.92100.9427

3.1.2 7-fold交叉检验结果

为了便于和Zhang等类结果,比IDQD

[14]

[14]

,Kim等和Zhao等的结果比较,本文同样采用7-fold交叉检验,结果

[5][6]

见表2。由表2可见,在测试数据集完全相同的情况下,组合了非近邻二联体加权关联特征的JSDQD分

结果均有提高。二次判别向量中的第5维QD5,是结果改善的原因。比较二次判别

向量为4维情形的JSDQD算法和IDQD算法的结果(结果没有显示),表明二者基本没有差别。这也再次证明,在生物信息学模式识别问题中,有效模式特征的选择比起算法的选择是更为主要的因素。和Kim等[5]的结果相比,除CK2激酶类型分类总精度稍低外,其它两个激酶类型的分类精度均高于他们的结果。这是因为Kim等[5]的研究中CK2类型只有81个磷酸化位点数据,而本文选择的三类磷酸化数据量分别比Kim等[5]的数据量扩大了18%,31%和31%,众所周知,小样本一般不能正确反映数据的统计特性。

表2 7折交叉检验结果

Table2Theresultsof7-foldcross-validationfortheCK2,PKAandPKCfamilies

KinasefamilyCK2

MethodSVM[5]W_SVM[6]IDQD[14]JSDQD

PKA

SVM[5]W_SVM[6]IDQD[14]JSDQD

PKC

SVM[5]W_SVM[6]IDQD[14]JSDQD

AC(%)91.4784.9186.1489.5189.9891.1190.1290.4682.9084.4284.6386.27

Sn(%)83.9074.5078.3290.2488.3289.7289.3390.9478.7175.5276.9489.36

Sp(%)96.4390.9691.1490.1591.1192.0190.6390.1485.7990.9890.2884.01

PPV(%)---85.10---85.77---80.41

CC0.82-0.710.780.79-0.800.800.65-0.680.73

auROC--0.91250.9377--0.94380.9527--0.90850.9323

auPRC--0.88960.9203--0.92230.9416--0.89640.9188

3.1.3 独立检验结果

将样本随机等分为训练集和测试集,在训练集中计算二次判别分析参数,然后在独立的测试集上检验分类器性能,结果见表3。表3给出了在独立测试集上得到了和交叉检验基本类似的结果。

表3 独立检验结果

Table3TheresultsoftheindependenttestfortheCK2,PKAandPKCfamilies

KinasefamilyCK2

MethodW_SVM[6]IDQD[14]JSDQD

PKA

W_SVM[6]IDQD[14]JSDQD

PKC

W_SVM[6]IDQD[14]

JSDQD

AC(%)83.6086.0787.83591.8888.2890.7782.4983.7685.50

Sn(%)74.1980.2786.9994.4486.7991.0378.3278.6289.36

Sp(%)89.6489.7888.3890.2189.2590.5985.5787.5482.66

PPV(%)82.1483.5782.7886.2384.0686.3780.0082.2979.16

CC--0.75--0.81--0.71

auROC-0.91200.9290-0.93530.95510.89920.9285

auPRC-0.88070.9068-0.90490.94120.88320.9133

3.2 讨 论

3.2.1 三类特征参数分类效率的比较

由图1到图3不难看出,磷酸化位点附近的氨基酸位置保守性特征具有最为有效的分类能力,其次是单氨基酸组分,最后是氨基酸非近邻加权关联特征。磷酸化位点上下文的基序是重要的酶识位点

[3,21]

,PKA、PKC和CK2激酶的最优7核苷底物序列

[3,21]

分别为[RK][RKS]X[ST][FLMI][AVI]

[ILMARK],[RK][QMTAS]X[ST][VILMF][AVI][ALIMPFRK]和[RKQHDSE][EDS]X[ST]E[D][EDS],底物基序影响到激酶的结合效率,所以对磷酸化起到至关重要的作用。理论分析表明,仅靠氨基酸位置保守性特征就可达到75%以上的识别精度,也说明了这一点。磷酸化位点附近的氨基酸组成对于识别精度的提高约为10%左右,氨基酸非近邻加权关联特征对于识别精度提高的贡献在5%左右。这三个特征通过非线性分类算法QD有效组合在一起,达到了满意的识别效果。3.2.2 氨基酸非近邻加权关联特征

依据Miyazawa等

[20]

的统计结果,在一个蛋白质中丝氨酸S和苏氨酸T最可能与2-3个残基接

触,也就是说,它们多数情况下是暴露在蛋白质表面的,这与它们可被磷酸化这一特征正好吻合。因一个残基如果是深埋在蛋白质内部,那么ATP或GTP的磷酸集团就不容易接触到这个残基,从而不易被磷酸化。酪氨酸Y的接触数峰值为6,意味着酪氨酸深埋在蛋白质内部。这也是酪氨酸Y被磷酸化的数据非常少的原因。统计表明,磷酸化的S或T平均比非磷酸化的S或T具有相对更少的接触数,而

[20]

Miyazawa等给出的蛋白质内部残基相互接触能正是基于各残基的接触数定义的,接触能反应了残基

间的相对接触概率,所以应用在磷酸化位点的识别上,起到了较好的效果。因Miyazawa等对接触的定义为,两个残基序列上的距离为大于1aa,且空间距离小于等于6.5埃[20],所以在计算中考虑了序列距离大于2aa的两个残基的关联频次,最后用接触能加权。

4 结 论

本文应用了JSDQD方法对CK2,PKA和PKC三种类型磷酸化位点进行识别,而且通过自洽检验,k-fold交叉检验和独立测试集检验,都取得了较高的识别精度,和IDQD[14]方法比较,本文的识别模型中增加了以接触能加权的残基非近邻关联频次,使得识别结果有了约5%的提高。有效的特征挖掘是生物信息学分类问题取得良好效果的最重要途径。随着研究的进一步深入,笔者将依据磷酸化的生化过程,挖掘发现更多的模式识别特征,为磷酸化的理论研究提供一些有价值的线索。

参考文献:

[1] PinnaLA,RuzzeneM.Howdoproteinkinasesrecognizetheirsubstrates?[J].BiochimBiophysActa,1996,1314

(3):191~225.

[2] 张倩,杨振,安学丽等.蛋白质的磷酸化修饰及其研究方法[J].首都师范大学学报(自然科学版),2006,27(6):43~

39.

[3] BlomN,GammeltoftS,BrunakS.Sequenceandstructure-basedpredictionofeukaryoticproteinphosphorylation

sites[J].J.Mol.Biol.,1999,294(40):1351~1362.

[4] IngrellCR,MillerML,JensenON,etal.NetPhosYeast:predictionofproteinphosphorylationsitesinyeast[J].

Bioinformatics,2007,23(7):895~897.

[5] KimJH,LeeJ,OhB,etal.PredictionofphosphorylationsitesusingSVMs[J].Bioinformatics,2004,20(17):

3179~3184.

[6] 赵凌志,刘颖,覃征.WeightedSVM在蛋白质磷酸化位点预测中的应用[J].计算机工程与应用,2006,42(3):155~

157.

[7] 王明会,王立荣,许文龙等.基于k近邻和BLOSUM62矩阵方法的磷酸化位点预测[J].中国生物医学工程学报,

2007,26(3):404~408.

[8] HuangHD,LeeTY,TzengSW,etal.IncorporatinghiddenMarkovmodelsforidentifyingproteinkinase-specific

phosphorylationsites[J].J.Comput.Chem.,2005,26(10):1032~1041.

[9] IakouchevaLM,RadivojacP,BrownCJ,etal.Theimportanceofintrinsicdisorderforproteinphosphorylation[J].

NucleicAcidsRes.,2004,32(3):1037~1049.

[10] ObenauerJC,CantleyLC.andYaffeMB.Scansite2.0:proteome-widepredictionofcellsignalinginteractionsu-singshortsequencemotifs[J].NucleicAcidsRes.,2003,31(13):3635~3641.

[11] WangMH,LiCH,ChenWZ,etal.PredictionofPK-specificphosphorylationsitebasedoninformationentropy

[J].Sci.ChinaSer.C-LifeSci.,2008,51(1):12~20.

[12] XueY,LiA,WangL,etal.PPSP:predictionofPK-specificphosphorylationsitewithBayesiandecisiontheory

[J].BMCBioinformatics,2006,7:163~174.

[13] WanJ,KangS,TangC,etal.Meta-predictionofphosphorylationsiteswithweightedvotingandrestrictedgrid

searchparameterselection[J].NucleicAcidsRes.,2008,36(4):e22.

[14] 张颖,罗辽复,吕军.使用多样性量预测磷酸化位点[J].内蒙古大学学报,2008,39(1):34~39.

[15] BasuS,PlewczynskD.AMS3.0:predictionofpost-translationalmodifications[J].BMCBioinformatics,2010,

11:210.

[16] DiellaF,CameronS,GemundC,etal.Phospho.ELM:adatabaseofexperimentallyverifiedphosphorylationsites

ineukaryoticproteins[J].BMCBioinformatics,2004,5:79.

[17] LinJ.DivergencemeasuresbasedontheShannonentropy[J].IEEETrans.OnInformationTheory,1991,37(1):

145~150.

[18] KullbackS,LeiblerRA.Oninformationandsufficiency[J].AnnMathStar,1951,22(1):79~86.

[19] ZhangMQ.Identificationofproteincodingregionsinthehumangenomebyquadraticdiscriminantanalysis[J].

ProcNatlAcadSciUSA,1997,94(2):565~568.

[20] MiyazawaS,JerniganRL.Residue-ResiduePotentialswithaFavorableContactPairTermandanUnfavorable

HighPackingDensityTerm,forSimulationandThreading[J].J.Mol.Biol.,1996,256(3),623~644.

[21] BrinkworthRI,BreinlRA,KobeB.Structuralbasisandpredictionofsubstratespecificityinproteinserinethreo-ninekinases[J].Proc.Natl.Acad.Sci.USA,2003,100(1):74~79.

RECOGNITIONOFPROTEINPHOSPHORYLATIONSITE

BAIHaiyan,LUJun,ZHANGYing,JIMeizhen,QINDandan

(SchoolofScience,InnerMongoliaUniversityofTechnology,Hohhot,010051)

Abstract:Proteinphosphorylationisoneofthemostimportantreversiblepost-translationalmod-ifications(PTMs),andthetheoreticalrecognitionofthephosphorylationsiteisanimportanttaskincomputationalbiologyresearches.Theconservativecharacteristicofresiduefragmentsaroundthephos-phorylationsitehassomerelationwithproteinkinase.Inthispaper,CK2,PKAandPKCphosphoryla-tionsites,whichhaverelativelymoreenzymeannotationdata,arechosenastheobjectofstudy,andthesequencecomponentcharacteristic,thecharacteristicofresiduepositionspecificity,aswellasthechar-acteristicofresiduepairnon-closeneighborrelevancy,aretakenasparameters.And,Jensen-ShannonDivergencewithQuadraticDiscriminantanalysis(JSDQD)isusedasthemethodforpredictingthephos-phorylationsites.The7-foldcross-validationtestaccuraciesofCK2,PKAandPKCare,respective-ly,90%,90%and86%,whicharehigherthanthoseobtainedbyotherpredictionmodelsusedcurrent-ly.

KeyWords:proteinphosphorylationsite;Jensen-Shannondivergence;quadraticdiscriminanta-nalysis


相关文章

  • 华农蛋白质的生物合成
  • 第16章 蛋白质的合成单元自测题 (一).名词解释 1. 无细胞翻译系统 2. 密码子(codon) 3. 摆动配对(wobblepairing) 4. 核糖体循环(ribosomecycle) 5. 多核糖体(polyribosome) 6. 操纵子(operon) 7. 顺式作用元件(cis e ...

  • 分子生物学常见试题
  • 分子生物学常见试题.txt38当乌云布满天空时,悲观的人看到的是"黑云压城城欲摧",乐观的人看到的是"甲光向日金鳞开".无论处在什么厄运中,只要保持乐观的心态,总能找到这样奇特的草莓.分子生物学常见试题 一, 名词解释 1, 基因:能够表达和产生蛋白质和RNA ...

  • 基因工程复习V2.1
  • 第一章 绪论 名词解释(镇鸿) 基因工程:通过基因操作,将目的基因或DNA 片段与合适的载体连接转入目标生物细胞,通过复 制.转录.翻译外源目的基因以及蛋白质的活性表达,使转基因生物获得新的遗传性状 的操作. 基因操作:泛指对基因进行酶切.连接.转化等分子生物学操作,是基因工程的技术基础. 遗传工程 ...

  • 常用封闭剂选择的窍门
  • 常用封闭剂选择的窍门 摘要: 杂交膜上有很多非特异性的蛋白质结合位点,为防止这些位点与抗体结合引起非特异的染色和背景,一般用惰性蛋白质或非离子去污剂封闭膜上的未结合位点来降低抗体的非特异性结合.封闭剂应该封闭所有未结合位点而不替换膜上的靶蛋白.不结合靶蛋白的表位,也不与抗体或检测试剂有交叉反应.最常 ...

  • 线粒体结构与功能
  • 线粒体 (mitochondria) 线粒体的研究历史 1890: R.Altman(亚特曼)在动物细胞中首次发现线粒体,命名为 生命小体(bioblast). 1897: Von Benda 命名为线粒体(Mitochondrion) 1900:L.Michaelis(米凯利斯) 用詹姆斯绿B对线 ...

  • 生物化学资料
  • 吴老师,我整理的很认真的!麻烦您帮我看一下啊!谢谢!非常感谢! 22章 糖酵解 1. 试比较:EMP 途径中,由葡萄糖分解为乳酸或乙醇,这两条代谢途径有何异同点? 人肌肉中,葡萄糖在被分解为丙酮酸的基础上,被进一步还原为乳酸:在酵母菌中,葡萄糖被分解为丙酮酸后,可脱羧生成乙醛,乙醛再还原为乙醇,称生 ...

  • 医学细胞生物学重点
  • 名词解释题 Cell theory[细胞学说] Plasmid[质粒] 质粒(Plasmid)是一类存在于细菌和真菌细胞中独立于DNA而自主复制的闭合.环状DNA分子 其中质粒基因横向传递(P11) Nucleoid[拟核] 原始细胞结构简单,仅由细胞膜包绕,在细胞质内含有DNA区域,但无被膜包围. ...

  • 高级生物化学
  • 工修饰不同 其中mRNA 最为突出. 真 (Phe ).甲硫的氨基酸顺序 (Met ).缬(Val ).(Edman 法)(8)用 拼版法确定多肽链的氨基酸排列顺序(9)确定肽链间的二硫键 答:1 原核生物核生物mRNA 分子的色(Trp ). 中mRNA 的转录与翻寿命较长, 不像原译几乎是同步发 ...

  • 第三条大分子生命链糖链
  • 第三条大分子生命链糖链 (作者:___________单位: ___________邮编: ___________) [关键词] 糖链; 糖蛋白; 糖脂; 蛋白聚糖 生命现象的分子基础主要依赖于生物大分子及其相关的一些小分子.生物化学研究人员一直认为:生物体内组成蛋白质的氨基酸链(肽链) .组成核酸 ...

  • 20**年-20**年分子生物学复习资料
  • 2013-2014分子生物学复习资料 一.中心法则 蛋白质 二.DNA复制 (一) DNA复制的特点 1.半保留复制 DNA复制时分别以两条亲代链作为模板链通过酶催化各形成一条子代链,亲代链分开处即子代链合成处成为复制叉. 2.半不连续复制 DNA亲代链5'到3'方向的复制时,是以小片段的形式从5' ...

© 2024 范文中心 | 联系我们 webmaster# onjobs.com.cn