氨基酸序列分析(精选四篇)
氨基酸序列分析 篇1
肌肉生长抑制素基因又称GDF-8 (growthdifferentialfactor 8) , 经蛋白同源性比较发现它属于生长转化因子β (TGF-β) 超家族新成员, 但不属于已发现的亚家族[2]。它在控制骨骼肌生长发育与分化上起着十分重要的作用。生长转化因子β超家族成员的典型特征: (1) N-端具有疏水的信号肽序列, 可籍以跨越内质网膜; (2) 前区具有糖基化位点; (3) 紧挨着生物活性区由4个氨基酸 (RSRR) 组成的保守的蛋白酶 (类胰蛋白酶) 加工位点; (4) C-末端包含9个保守的半胱氨酸的生物活性区, 靠分子间的二硫键形成二聚体。肌肉生长抑制素基因包括3个外显子和2个内含子, 其中第3个外显子是它的成熟区[1,3]。同源比对结果表明, 肌肉生长抑制素基因序列非常保守, 特别是成熟区更为保守[4], 所以通过异种基因克隆成为可能。
1 材料和方法
1.1 材料
东北马鹿血样, 采集地点为内蒙古林东乌兰坝鹿场第一养鹿小区;pMD 18-T载体、高保真LA Taq酶、T4DNA连接酶、dNTP等试剂, 购自宝生物工程 (大连) 有限公司;大肠杆菌感受态细胞DH 5α、DNA回收纯化、基因组、质粒提取试剂盒, 购于天为时代生物公司。
1.2 引物的设计及PCR扩增
目前, 在GenBank中还查不到关于鹿肌肉生长抑制素基因的序列, 因此只能用与马鹿物种最近的牛 (Bostauruscattle, 序列号为AB 076403) 肌肉生长抑制素基因序列进行引物设计, 由于单条序列很难找到保守区域, 在引物设计上有些困难, 因此借助Primer5.0引物设计软件结合PCR引物设计优化条件多设计几对引物, 最后筛选3对引物进行PCR扩增, 筛选出的3对引物见表1。
1.3 PCR产物的回收、纯化、T-载体克隆和阳性克隆的筛选
扩增产物回收纯化后连接到载体pMD 18-T上, 转化到大肠杆菌感受态细胞DH 5α中, 涂布于涂有X-gal和IPTG的LB培养基中, 挑取白斑, 用克隆引物进行扩增检测 (见图1, 2) 。
M.100bpDNA Marker (最亮的为500bp) ;A.第1外显子条带;B.第2外显子条带;C.第3外显子条带。
2 结果与分析
2.1 东北马鹿肌肉生长抑制素基因cDNA序列拼接
从转化后的克隆片段菌株筛选阳性克隆送北京华大公司进行测序, 将测序结果删掉质粒载体序列后, 根据5′-GU-AG-3′规则[5]找出外显子和内含子连接的核苷酸保守序列, 和Blastn进行同源比对分析确定外显子和内含子的连接处, 拼接出1条部分缺失5′UTR和3′UTR的cDNA (但不影响以后的分析结果) , 拼接后得到1条1 331bp的序列。
2.2 东北马鹿肌肉生长抑制素基因阅读框预测
M.100bpDNA Marker (最亮的为500bp) ;B.第2外显子条带;A.第1外显子条带;C.第3外显子条带。
在进行BlastX分析的时候只有按这个阅读框翻译的蛋白质击中蛋白质数据库中的肌肉长生抑制素家族基因, 而其他阅读框均不能得出有用的信息。只有+3是正确阅读框, 东北马鹿cDNA全序列为1 128bp, 可以翻译为1条由375个氨基酸组成的蛋白质序列。结果表明其包括3个外显子, 这与参考文献[2]报道的一致。本试验结果中第1外显子碱基数目为373bp, 第2外显子碱基数目为374bp, 第3外显子碱基数目为381bp, 进一步证明了引物设计的正确性。
2.3 蛋白质序列信号肽分析
登陆http://www.cbs.dtu.dk/services/SignalP-3.0站点, 通过两种方法 (神经网络和隐马尔可夫模型) 分析都得到相同的结果 (见图3、图4) 。该蛋白具有1个分泌信号结构, 氨基酸序列为MQKLQICVY-IYLFMLIVA, 符合生长转化因子家族的特征, 与参考文献[1]报道的一致。
2.4 蛋白质序列疏水性分析和跨膜区预测
序列位置为第6~21个氨基酸, 即ICVYIYLFM-LIVAGPV, 这些氨基酸几乎都是疏水性的, 结果见图5 (疏水性分析站点:http://www.expasy.org/cgibin/protscale.pl) 。跨膜区分析结果见图6 (跨膜区分析站点:http://www.ch.embnet.org/software/TM-PRED form.html) 。
2.6 蛋白质的二级结构分析
有文献报道, 利用神经网络 (PHD) 程序是目前分析蛋白质二级结构最好的程序。登陆http://npsa-pbil.ibcp.fr/cgi-bin/npsa automat.pl?page=/NPSA/npsa seccons.html对蛋白质的二级结构进行分析, 结果见图7。
2.7 蛋白质的三级结构分析
登陆http://swissmodel.expasy.org/, 通过对蛋白质结构数据库 (PDB) 的搜索, 用同源建模的方法得到第263~375个氨基酸的序列, 也就是成熟区段氨基酸序列与humanActivinA (PDBID为2arvB) 有42%的相似性, E value为3.26e-20, 预期模型精度 (RMSD) 为2。以2arvB序列 (见图8) 为模板分析出该蛋白的三级结构 (见图9) 。
3 讨论
基因DNA片段的获得比较困难, 常用的方法有染色体步移、建基因组文库后进行杂交筛选等。但这些方法都存在操作复杂、耗时长、投入大等缺点。而采用PCR方法来分段扩增基因组DNA片段具有简单、省时、快速等优点。因为目前GenBank中还不能查到关于鹿肌肉生长抑制素基因序列, 在对基因组DNA序列一无所知的情况下, 只能用物种最近而又能找到的牛肌肉生长抑制素序列进行引物设计。由于单条序列很难找到保守区域, 在引物设计上有些困难, 因此借助Primer 5.0引物设计软件结合PCR引物设计优化条件多设计几对引物, 最后筛选3对在内含子上的引物, 扩增3个外显子, 然后拼接出编码开放阅读框, 试验结果证明此方法是可行的。
从扩增结果可以看出:记录的所有供体位点均有保守的GT;受体位点中2个具有AG, 另外1个为AC。而一般真核生物的剪接位点都存在GT/AG的保守位点[5]。东北马鹿肌肉长生抑制素基因结构包括3个外显子, 从外显子和内含子的长度比例来看, 外显子短、内含子长, 这是很多动物肌肉生长抑制素基因结构的共同特点[4]。
动物肌肉生长抑制素基因在进化过程中是高度保守的[4]。进一步通过http://www.expasy.org/prosite/站点搜索功能位点发现:第298~313个氨基酸序列为IAPKRYKANYCSGEC, 模式为[LIVM]-x (2) -P-x (2) -[FY]-x (4) -C-x-G-x–C, 该位点为TGF BETA 1 (TGF-betafamilysignature) , 访问号为PS00250, 是生长转化因子β家族信号 (TGF-betafamilysignature) ;第216~237个氨基酸序列为LKQPESNLGIEIKALDENGHDL, 模式为L-x (6) -L-x (6) -L-x (6) -L, 访问号为PS00029, 是亮基酸拉链 (Leucinezipperpattern) ;第271~274个氨基酸序列为NISK, 访问号PS00001, 是糖基化位点 (N-glycosylationsite) 。由此可以推测出肌肉生长抑制素蛋白是糖蛋白。
信号肽序列通常在被转运多肽链的N端, 这些序列在10~40个氨基酸残基范围内, 氨基酸至少包含1个带正电荷的氨基酸, 在中部有一段长度为10~15个氨基酸残基的由高度疏水性的氨基酸组成的肽链, 常为A、L、V、I、F。这个疏水区极为重要, 其中某一个氨基酸被非极性氨基酸置换时, 信号肽即失去其功能。疏水序列表明, 一般蛋白质是很难通过脂膜的, 而信号肽可以引导它到达特定的细胞器并通过膜。本研究对蛋白质序列信号肽进行分析, 发现其保守序列为MQKLQICVYIYLFMLIVA, 符合生长转化因子β超家族的主要特征[2]。蛋白质序列疏水性分析和跨膜区分析结果表明:第6~21个氨基酸序列为ICVYIYLFMLIVAGPV, 这些氨基酸几乎都是疏水性的;2条保守序列有1个共有的部分ICVYIYLFM-LIVA。该研究结果进一步证实生长转化因子β超家族成员的结构特征。
蛋白质二级结构分析结果表明, 成熟区几乎没有α螺旋[Alphahelix (h) ], 基本都是折叠[Extended strand (e) ]和无规则卷曲[Random coil (c) ], 而在蛋白质三级结构分析中发现2个α螺旋, 这表明研究在分析蛋白质高级结构时采用的算法一致性比较低, 不同的算法分析的结构存在差异。对于蛋白质结构上的差异有待于进一步研究。
摘要:以与东北马鹿物种最近的牛 (Bos taurus cattle, 序列号为AB076403) 的肌肉生长抑制素 (myo-statin, MSTN) 基因序列为模版, 根据该基因保守序列进行引物设计, 扩增产物连接入pMD18-T载体, 克隆出3个外显子片段。根据5′-GU-AG-3′规则和同源基因比对拼接出带有部分5′、3′末端的cDNA, 并采用生物信息学技术对编码氨基酸序列进行蛋白质同源性比较和二级、三级结构等分析。结果表明:所获序列全长为1 128 bp, 编码375个氨基酸;具有较明显的螺旋、片层和无规卷曲等二级结构;有1个较明显的跨膜区和1个疏水区, 并发现明显的信号肽和糖基化位点。三级结构同源建模预测结果显示与Human Activin A的相似性为42%。结果说明东北马鹿和其他哺乳类生物的肌肉生长抑制素基因之间关系密切, 并同属于TGF-β家族。
关键词:东北马鹿,肌肉生长抑制素基因,基因克隆,生物信息学
参考文献
[1]McPHERRON A C, LAWLER A M, LEE S J.Regulation of skeletalmuscle mass in mice by a new TGF-βsuperfamily member[J].Nature, 1997, 387:83-90.
[2]姜运良, 连正兴, 李宁, 等.肌肉生长抑制素基因的研究进展[J].遗传, 2000, 22 (2) :119-121.
[3]CHEIFETZ S.The transforming growth factor-βsystem, a complexpattern of cross-reactive ligands and receptors[J].Cell, 1987, 48:409-415.
[4]McPHERRON AC, LEE S J.Double muscling in cattle due to muta-tions in the myostatin gene[J].Proc Natl Acad Sci, 1997, 94:12457-12461.
氨基酸序列分析 篇2
【报告来源】前瞻网
【报告内容】2013-2017年中国氨基酸行业产销需求与投资预测分析报告(百度报告名可查看最新资料及详细内容)
报告目录请查看《2013-2017年中国氨基酸行业产销需求与投资预测分析报告》
全世界氨基酸产量中作为调味品及食品添加剂的约占50%,饲料添加剂约占30%,药用和保健、化妆品及其他用途的氨基酸约为20%。由于氨基酸需求量大、价格贵,世界各大氨基酸生产国的厂商积极发展氨基酸生产技术,抢占世界市场,竞争十分激烈。
我国的氨基酸产业发展很快,具有一定的规模,与世界氨基酸行业发展基本类似,很多国内企业生产的氨基酸都是用于食品加工。然而,药用氨基酸的市场需求正在不断增长,我国是有13亿人口的大国,也是人口老年化发展进程非常迅速的国家,我国对药用氨基酸及其衍生物的需求量和富含氨基酸饮品(口服液)需求量都十分巨大。近年来,中国氨基酸行业市场规模不断扩大,至2011年行业规模以上企业销售收入已达635.50亿元。
随着氨基酸行业竞争的不断加剧,大型氨基酸企业间并购整合与资本运作日趋频繁,国内优秀的氨基酸生产企业愈来愈重视对行业市场的研究,特别是对产业发展环境和产品消费者的深入研究。
本报告最大的特点就是前瞻性和适时性。报告通过对大量一手市场调研数据的前瞻性分析,深入而客观地剖析中国当前氨基酸行业的总体市场容量、市场规模、竞争格局和市场需求特征,并根据氨基酸行业的发展轨迹及多年的实践经验,对氨基酸行业未来的发展趋势做出审慎分析与预测,是氨基酸生产企业、科研单位、销售企业、投资企业准确了解氨基酸行业当前最新发展动态,把握市场机会,做出正确经营决策和明确企业发展方向不可多得的精品,也是业内第一份对氨基酸行业上下游产业链以及行业重点企业进行全面系统分析的重量级报告。
氨基酸序列分析 篇3
口蹄疫病毒属于小RNA病毒科口蹄疫病毒属,其基因组是单股正链RNA,约8 500 nt,由5'UTR、ORF、3'UTR组成。通过对口蹄疫病毒不同毒株之间核苷酸序列同源性的比较分析发现,VP1基因是所有基因中最容易发生变异的基因,具有血清型的特异性。目前,VP1基因的遗传衍化关系是进行口蹄疫病毒分型的依据。A.R.Samuel等[2]根据FMDV的VP1基因序列的15%差异性把A-FMDV划分为10个拓扑型,把O型FMDV分成8个拓扑型。口蹄疫病毒的编码基因共编码4种结构蛋白(1A、1B、1C、1D)和7种非结构蛋白(2A、2B、2C、3A、3B、3C、3D)。VP1基因编码的1D蛋白与其他3种结构蛋白1A、1B、1C各60拷贝共同组成病毒衣壳,其中1D蛋白大部分暴露于病毒粒子外面,是诱导机体产生中和抗体的主要抗原,也是决定病毒抗原的主要成分。如O型口蹄疫病毒主要有5个抗原位点,其中3个都位于1D上。抗原位点1是FMDV最主要的抗原位点,由G-H环(122~157aa)和C端(200~213 aa)残基组成,在决定病毒的免疫原性和抗原性方面起重要作用。位点3位于病毒粒子表面五重轴的βB-C上,位点5位于G-H环内,与抗原位点1相互独立[3]。由于VP1在病毒的吸附、免疫保护及基因分型、疾病诊断和疫苗设计等方面都起着重要作用,相对于其他蛋白VP1是研究的最广泛的一个结构蛋白。
到目前为止,我国未曾爆发过南非型口蹄疫,因此相比于亚欧型口蹄疫(A、O、Asia1、C)针对南非型口蹄疫的研究相对薄弱一些,本研究就南非型口蹄疫病毒VP1基因序列及其编码的氨基酸序列进行简单分析,为南非2型口蹄疫的防控诊断及疫苗设计奠定一些理论基础。
1 材料与方法
1.1 主要试剂
TRYPTONE,为OXOID公司产品;YEAST EX-TRACT,为MERCK公司产品;质粒提取试剂盒,为爱思进生物技术(杭州)有限公司。
1.2 参考序列的筛选与合成
从NCBI下载大量SAT1/2/3-FMDV-1D2A2B基因序列及O-FMDV的8个拓扑型代表O-FM-DV,利用MEGA5.0和DNAStar分子生物学软件包比对分析最终选取相似性较低的序列代表SAT1(8条)、SAT2(10条)、SAT3(3条)。将所选取的1D2A2B目的片段克隆至p UC57-Amp载体上构建重组质粒,并在金唯智公司进行合成,最终提供的是含目的片段的TOP10F'穿刺菌。
1.3 重组质粒的鉴定
将制备的含目的序列的穿刺菌涂布于含50μg/m L氨苄西林的LB平板,37℃过夜培养,挑取单克隆菌落接种于含有氨苄西林的LB培养液中培养,按照AXYGEN试剂盒说明书提取质粒,用PvuⅡ进行初步的单酶切鉴定,酶切鉴定正确后把所提取的阳性质粒送往宝生物工程(大连)有限公司测序做进一步确认。
1.4 序列分析
利用生物信息学软件包DNAStar对所选取的SAT1/2/3及O-FMDV毒株的VP1基因的核苷酸序列进行同源性分析。再根据核苷酸序列推导出氨基酸序列,进而依据这些氨基酸序列进行序列变异性分析。
2 结果
2.1 SAT1/2/3-FMDV代表序列筛选及合成结果
经过DNAStar软件包中的Meg Align软件分析,最终筛选出同源性较小的序列作为各血清型的代表序列。SAT1/2/3-FMDV 3个血清型的代表毒株序列及O-FMDV的8个拓扑型代表毒株序列的登录号见表1。
2.2 重组质粒鉴定结果
将穿刺菌划板、挑单克隆、摇菌、提质粒获得的重组克隆质粒用PVUⅡ进行初步酶切鉴定,琼脂糖凝胶电泳后分别获得了约1 570 bp和2 260 bp的目的条带,与预期大小一致(见图1)。同时将提取的阳性质粒送往宝生物工程(大连)有限公司进行进一步测序验证,测序结果与所选取的毒株序列相似性为100%。
2.3 序列的比对分析
2.3.1 南非2型口蹄疫病毒VP1基因的序列分析
利用DNAStar分子生物学软件包分析SAT2与其他血清型1D基因核苷酸序列间的同源性并构建系统发育树,见图2、图3。
由图2、图3可以看出:各血清型内的VP1基因同源性分别是SAT1为70%~87%,SAT2为69%~90%,SAT3为75%~85%,O-FMDV为76%~85%。血清型间的同源性普遍偏低,SAT2与SAT1/3间的同源性为55%~60%,而SAT2与O-FMDV间的同源性为49%~55%。结果表明,SAT1/2/3血清型间的同源性比SAT2与O-FMDV血清型间的同源性偏高,说明SAT2与O型差异较大,4个血清型均属于完全不同的分支,见图4。FMDV各血清型内亲缘性较近,但3个南非型的型内同源性较O型的偏低,进一步说明了南非型口蹄疫的变异度更大。
M.DL-5 000 Marker;1,2.分别为SAT1(AY593841)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;3,4.分别为SAT1(AY593838)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;5,6.分别为SAT1(JF749860)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;7,8.分别为SAT2(JF749861)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;9,10.分别为SAT2(JF749862)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;11,12.分别为SAT2(A593847)-1D2A2B-p UC 57重组质粒及其酶切电泳结果;13,14.分别为SAT3-AY593850-1D2A2B-p UC57重组质粒及其酶切电泳结果;15,16.分别为SAT3(AY593853)-1D2A2B-p UC 57重组质粒及其酶切电泳结果。
2.3.2 南非2型口蹄疫病毒VP1基因氨基酸序列分析
用合成肽及单克隆抗体等技术确定了FMDV衣壳上存在很多不同的抗原表位,根据其在空间结构及功能上的相互关系被划分为一些相互独立的抗原位点。据报道,许多主要的抗原位点都位于VP1上,已证实O-FMDV有5个抗原位点,其中3个重要位点存在于VP1。因而VP1不仅是构成病毒衣壳的重要组成成分而且在决定病毒抗原性及免疫原性方面也扮演着重要角色。不同血清型FMDV的抗原位点大体相似,但也存在一些差异。研究表明,南非2型口蹄疫病毒VP1基因编码的暴露于衣壳表面的VP1蛋白至少包含2个抗原位点,其中一个位点主要涉及VP1蛋白的βG-βH环和RGD基序末端的氨基酸残基,类似于FMDV-O的中和位点1[4,5,6]。也有研究证明在此抗原位点中,VP2的79位氨基酸残基可能也起着一定的作用,但具体功能至今不太清楚。第二个抗原位点位于VP1 C端末端氨基酸残基。P.A.Opperman等[6]利用单链变量抗体重组技术(sc Fvs)证明了FMDV-SAT2(ZIM/7/83,AF540910)的165位氨基酸G突变为H,是病毒发挥免疫逃避机制的关键氨基酸。P.A.Opperman等[5]最近发现了两个新的非中和性抗原表位,而且都与VP2蛋白上的71,72位氨基酸残基有关,除此之外,第一个非中和性表位与VP1的48~50位氨基酸残基有着密切关系,第二个非中和性表位也涉及到VP1的84~86个和109~111个氨基酸残基。由此可见,VP1集中了FM-DV的重要抗原表位,是病毒抗原变异的关键所在。
研究利用DNAStar分子生物学软件就SAT2与SAT1/3和O-FMDV的VP1氨基酸主要抗原位点的变异性做一分析(见图5,因为不同血清型比对有缺失,因此氨基酸残基所在位置可能与参考文献不一致),明显可以看出型内氨基酸序列在同一血清型内相似性较大,但在不同的血清型间差异比较大,而且C端比N端的保守性高。FMDV最重要的抗原位点之一就是位于VP1蛋白上的βG-βH环和RGD基序末端的氨基酸残基。G-H环内的精氨酸-甘氨酸-天门冬氨酸(RGD)序列是由3个氨基酸残基组成的高保守型序列,突出于衣壳表面,具有结合细胞受体的功能,在病毒吸附过程中至关重要。本研究所选取的4个血清型所有序列的RGD基序均未发生变异(见图5的150~152位氨基酸残基),然而RGD基序两端的氨基酸残基序列变异度比较大:SAT2全部序列在比对结果的145~148位发生一致性缺失,SAT1此处相对保守(分别为P、R、E、N);SAT3变异性比较大,O-FMDV 146~148位发生缺失;SAT2在149,152,153,155,156,157,159,160,165位比较保守(分别为I、D、R、V、L、A、K、Y、H),其他3个血清型在这些位置也比较保守,但是某些血清型的氨基酸残基已发生变异。在149位SAT3为R、O-FMDV为V,在153位SAT1/3及O-FMDV均为L,在155位SAT1为O、SAT3为A,在159位SAT1/3均为R,在160位SAT1为I、SAT3为V、O-FMDV为A,在165位SAT3为T、O-FMDV此处缺失;SAT2的144位氨基酸残基比较保守(所选序列全部为A)、SAT3为V、SAT1及O-FMDV的变异性较大;SAT2在154,158,162位变异度比较大,而其他3个血清型在162位比较保守(SAT1/3/O-FMDV分别S、N、R)。SAT2在181~203位的氨基酸残基保守性较好。C端是SAT2在VP1上的第二个抗原位点的主要氨基酸残基:SAT2在图3中的217位为G,而SAT1此处变异性较大,SAT3及O-FMDV为V;SAT2在218位缺失,SAT1/3出现的是K、R,O-FMDV所有序列一致性为A。SAT2非中和性抗原位点主要涉及到49~51位、85~87位及110~112位氨酸残基。SAT2在50(F),52(V),85(H),87(R),109(F)位保守性较好,但在49,51,84,86,111位变异性都比较大,有多种氨基酸残基出现。其他血清型的FMDV在这些位置上出现的氨基酸残基基本与SAT2不一致。
3 讨论
FMDV的VP1基因是决定病毒免疫原性和抗原性最重要的基因,也是病毒基因组中变异性最大的区域。表1、表2中FMDV病毒VP1基因的序列同源性比较分析也证明了这一点,SAT1、SAT2、SAT3 3个血清型间的VP1基因的同源性小于65%,而SAT2与O-FMDV的VP1基因同源性小于55%,说明南非型(SAT1/2/3)与亚欧型(A、O、C、Asia1)差异性更明显,也充分表明了口蹄疫流行具有一定的地域性。因而,VP1基因常被用来作为遗传进化及分子流行病学监控的主要基因,在疫原追踪及基因工程疫苗研发方面具有重要意义。
VP1的空间结构表明,VP1结构蛋白通常暴露于病毒颗粒表面,在免疫反应中起重要作用。相关研究也表明,各型FMDV的VP1都参与了中和抗原位点的形成,特别是140~160位和200~213位氨基酸残基。从图3中的氨基酸序列比对可以看出,VP1上含有高保守性的能与宿主细胞受体结合的位点RGD基序,在病毒入侵和免疫保护的过程中起着重要作用。研究证明,145(N)、152(D)、158(Q)、218(A)位是O-FMDV抗原位点1的关键氨基酸,图3中的这些位点在O-FMDV的8个拓扑型中也比较保守,表明抗原位点1在O-FMDV中相当保守,但在145位SAT2发生缺失,SAT1是P,SAT3保守性较差;在152位SAT1、SAT2、SAT3也是D;在158位SAT1、SAT2、SAT3变异度都比较大;在218位SAT2发生缺失,SAT1、SAT3保守性差一些。在FMDV的4个血清型中,O型抗原位点1的关键性氨基酸在南非型中都已经发生了改变,而且其他位点的氨基酸也基本不一致,表明南非型抗原位点与亚欧型抗原位点差异较明显,再次证实了不同血清型间几乎无交叉反应。
注:.表示相同氨基酸;-表示缺失氨基酸。
通过对南非2型FMDV VP1基因及其编码的氨基酸序列进行分析发现,FMDV VP1上主要抗原位点所处位置虽然相似,但关键氨基酸发生了明显的变化。上述核酸及氨基酸的变异对病毒的抗原性及免疫原性均造成了重要影响。无论是核酸还是氨基酸,SAT2型内相似性也普遍偏低,表明FMDV-SAT2变异性更大,在防控上也会面临着更大的挑战。这些核苷酸或氨基酸的变异,究竟会对病毒造成什么样的影响,需要进一步研究。
摘要:VP1基因的遗传衍化关系是口蹄疫病毒分型的依据,而且许多重要的抗原位点也都位于VP1蛋白上。为了对南非2型口蹄疫病毒(SAT2-FMDV)VP1的编码基因序列及其氨基酸序列进行分析,为南非2型口蹄疫的诊断及疫苗设计提供理论基础,试验从NCBI下载大量的南非1/2/3型口蹄疫病毒(SAT1/2/3-FMDV)的1D2A2B基因片段,通过序列分析选择相似性较低的序列代表SAT1/2/3,将选中的代表序列连接于p UC57载体上进行合成,再对合成的含目的序列的穿刺菌进行划板、挑单克隆、摇菌、提质粒,得到重组质粒初步进行酶切鉴定后进行测序,测序正确后采用DNAStar软件包对这些合成序列进行分析。结果表明:SAT2-FMDV VP1的编码基因核苷酸序列变异度较大;虽然SAT2口蹄疫病毒VP1蛋白上主要抗原位点位置与其他血清型的差异性并不大,但是关键氨基酸已发生变化。
关键词:口蹄疫病毒,南非型,VP1基因,序列分析,核苷酸序列,氨基酸序列
参考文献
[1]MASON P W,GRUBMAN M J,BAXT B.Molecular basis of pathogenesis of FMDV[J].Virus Res,2003,91(1):9-32.
[2]SAMUEL A R,KNOWLES N J.Foot-and-mouth disease virus:cause of the recent crisis for the UK livestock industry[J].Trends Genet,2001,17(8):421-424.
[3]KITSON J D,Mc CAHON D,BELSHAM G J.Sequence analysis of monoclonal antibody resistant mutants of type O foot and mouth disease virus:evidence for the involvement of the three surface exposed capsid proteins in four antigenic sites[J].Virology,1990,179(1):26-34.
[4]CROWTHER J R,ROWE C A,BUTCHER R.Charactrization of monoclonal antibodies against a type SAT2 foot-and-mouth disease virus[J].Epidemiol Infect,1993,111(2):391-406.
[5]OPPERMAN P A,MAREE F F,Van WYNGAARDT W,et al.Mapping of antigenic determinants on a SAT2 foot-and-mouth disease virus using chicken single-chain antibody fragments[J].Virus Res,2012,167(2):370-379.
氨基酸序列分析 篇4
甲型H1N1流感能不断引起流行是由于其抗原性不断发生漂移所致[4],其中最重要是血凝素(hemagglutinin,HA)和神经氨酸酶(neuraminidase,NA)的变异[5]。血凝素是流感病毒最重要的蛋白,它的裂解性、受体特异性和糖基化是决定流感病毒感染性和致病性的重要因素。神经氨酸酶是病毒囊膜表面的另一种重要的糖蛋白,在决定病毒毒力和宿主特异性方面也具有重要作用,与HA共为流感病毒亚型分型的主要依据,NA同时也是抗流感病毒的重要作用靶点[6]。目前,国内虽然已经开发了H1N1流感疫苗并接种了2000多万人,但是,接种所致的不良反应事例的出现同样给健康的人们带来了灾难。有针对性地改造毒素的相应蛋白、获得更为安全有效的疫苗成为解决问题的关键,而解析甲型H1N1流感病毒HA、NA蛋白的抗原性表位成为关键的突破口。
本研究分析了甲型H1N1流感病毒HA、NA蛋白抗原性变化的情况,并对其可能的抗原性表位进行了分析预测,为新型甲型流感疫苗的制备提供依据,以便更有效及时地控制甲型流感的传播。
1 材料与方法
1.1 新型甲型H1N1流感病毒株HA和NA基因序列与氨基酸序列
从NCBI(http://www.ncbi.nlm.nih.gov/genomes/FLU/SwineFlu.html)网站下载新近公布的新发甲型H1N1流感病毒的核酸序列与氨基酸序列。从不同国家和地区随机挑选28株新型甲型H1N1流感病毒株来进行接下来的序列比较和抗原性分析。
1.2 新型甲型H1N1流感病毒的细胞抗原表位预测
用Clustal X软件分别对28例HA、NA氨基酸序列进行多序列比较,然后使用MEGA 2.0的邻接法(neighbor-joining method,NJ)构建进化树,分析彼此之间序列的变异大小。对比序列比对分析结果,选取其中代表性的序列作为基准株,用Protean软件对基准序列的亲水性、表面可能性、抗原指数进行综合分析,分析各指数值得到B细胞抗原表位预测结果;使用NetMHCⅡ2.2在线表位预测服务器,选定服务器包含的所有MHC classⅡ等位基因,以9个连续氨基酸为测定单位,根据各序列与MHC classⅡ等位基因的亲和能力不同,预测出其可能的T细胞抗原表位。
2 结果
2.1 新型甲型H1N1流感病毒分离株HA、NA氨基酸比较
用MEGA 2.0进行进化树分析,所得结果见图1、图2。从图1和2可以看出,28例HA以及NA氨基酸序列可以分为两个大的族群,通过对这两个族群的氨基酸序列进行分析发现,HA氨基酸序列按220位氨基酸为苏氨酸或者丝氨酸分为两个族群;NA氨基酸序列按106位异亮氨酸突变成缬氨酸、248位天冬氨酸突变成天冬氨酰分成两个大的族群;分别选取两种蛋白的两个族群中较有代表性的HA氨基酸序列CY046475与CY044869和NA氨基酸序列CY046477与GQ149691为基准序列以便进行下一步的细胞抗原性表位预测。
2.2 Protean软件分析基准株HA、NA蛋白B细胞抗原性特征
用Plot-Kyte-Doolittle亲水性[7]、Plot-Emini表面可能性[8]、Jameson-Wolf抗原指数[9]三参数综合考虑预测方案进行B细胞表位预测,HA氨基酸序列CY046475与CY044869的B细胞表位预测结果并没有明显差别,同样,NA氨基酸序列CY046477与GQ149691的B细胞表位预测结果也没有明显差别,因此,只选取HA氨基酸序列CY046475和NA氨基酸序列CY046477的结果列出。对各个参数进行综合分析,发现在HA蛋白中50-55、110-120、137-141、175-179、208-222、361-369、457-460、478-500各项指数均较高,提示可能是抗原性表位,见图3。综合各参数分析,发现在NA蛋白中1-9、57-60、97-105、137-141、143-150、162-168、210-215、219-222、258-263、273-280、310-323、415-425各项指数均较高,提示为抗原性表位,见图4。
注:进化树后的名称为GeneBank的登录号
2.3 NetMHCⅡ2.2软件分析基准株HA、NA蛋白T细胞抗原性特征
使用NetMHCⅡ2.2在线T细胞抗原表位预测服务器分析了基准株HA、NA蛋白T细胞抗原性表位,发现HA蛋白中8-16、41-49、61-69、96-104、155-169、215-223、259-267、309-331、346-354、532-542氨基酸区段抗原值较高,见图5;NA蛋白中32-40、74-85、132-140、155-163、177-185、256-264、351-359氨基酸区域抗原值较高,见图6,可能为T细胞抗原性表位。
注:纵坐标的分值表示NetMHCⅡ2.2软件预测的9氨基酸滑动肽与各MHC classⅡ等位基因的亲和力大小
注:纵坐标的分值表示NetMHCⅡ2.2软件预测的9氨基酸滑动肽与各MHC classⅡ等位基因的亲和力大小
3 讨论
甲型(A)流感病毒(influenza virus A)基因组含有8个RNA片段[10],第1、2、3个节段编码的是RNA多聚合酶;第4个节段负责编码血凝素(hemagglutinin,HA)蛋白;第5个节段负责编码核蛋白(nucleoprotein,NP);第6个节段编码的是神经氨酸酶(neuraminidase,NA);第7个节段编码基质蛋白(matrix protein,MP);第8个节段编码的是一种能起到拼接RNA功能的非结构蛋白,这种蛋白的其他功能尚不得而知。血凝素蛋白和神经氨酸酶被认为是最重要的免疫原性位点[11]。
经过对选自世界各国不同流感病毒株的HA、NA蛋白序列进行Clustal X分析,发现不同株之间氨基酸序列相对保守。HA蛋白最具特征性的变异为220位氨基酸的差别,28株中有15株为丝氨酸和13株为苏氨酸。对28例NA蛋白中有8例同时发生了106位异亮氨酸突变成缬氨酸、248位天冬氨酸突变成天冬氨酰。总体上来看,HA蛋白的变异性相对于NA蛋白较大。
利用Protean软件对基准株的HA、NA抗原表位进行预测,联合使用Kyte-Doolittle的亲水性方案,Plot-Emini的蛋白质表面可能性方案及Jameson-Wolf的抗原指数方案进行综合分析,发现HA蛋白有8段序列,NA蛋白有12段序列是可能的B细胞抗原表位。对220位氨基酸为苏氨酸的HA蛋白和106位氨基酸为缬氨酸、248位为天冬氨酰的NA蛋白与未发生相应变异的蛋白序列进行比较,发现变异位点并不影响HA、NA蛋白的B细胞表位特征。利用NetMHCⅡ2.2软件分析T细胞抗原表位也同样发现,上述变异位点并不影响HA、NA蛋白的T细胞表位特征。根据以上分析,提示新型甲型H1N1流感病毒关键蛋白HA、NA的一些区域抗原性相对比较稳定,可以作为检测以及疫苗研发的靶区域。
随着计算机技术的不断发展,细胞抗原性表位预测方法也得到了很大的进步与广泛的应用,如表位疫苗的设计、新的诊断试剂开发等。但是细胞抗原性表位预测仍然不够完善。目前,几乎所有的细胞抗原性表位预测的算法都是预测连续氨基酸组成的线性表位,而较少涉及构象性表位的研究。本研究仅是对新型H1N1流感病毒的HA和NA蛋白的细胞抗原性表位进行初步筛选,预测结果需要进一步用实验结果来证实。
摘要:目的:比较新型甲型H1N1流感病毒分离株HA、NA氨基酸序列之间的差异,分析HA、NA蛋白可能的抗原性细胞表位。方法:从GenBank中选取28株世界各地的新型甲型H1N1流感病毒分离株并下载各株HA、NA的氨基酸序列;使用ClustalX和MEGA2.0软件对氨基酸序列的进行进化树分析;用Protean软件预测HA、NA蛋白的B细胞表位;用NetMHCⅡ2.2预测T细胞抗原表位。结果:世界范围的毒株之间氨基酸序列相对保守,HA及NA均只有少数位点的变异,HA蛋白氨基酸序列之间较NA蛋白氨基酸序列之间变异较大;预测HA蛋白具有8个B细胞表位和10个T细胞表位;NA蛋白有12个B细胞表位和7个T细胞表位。结论:HA、NA蛋白的少数区域抗原性相对比较稳定,可以作为检测以及疫苗研究的靶区域。