设为首页收藏本站
开启辅助访问
切换到窄版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 1323|回复: 3

求助perl编程问题

[复制链接]
发表于 2011-6-20 14:49:27 | 显示全部楼层 |阅读模式
问题是这样的,用perl编写程序分离注释行内容,分离蛋白质序列,并转变成氨基酸三字母表示方式。说明使用的perl数据结构和程序的变量转换过程,解释含义。请求帮助,感激不尽
>1A23:A|PDBID|CHAIN|SEQUENCE
AQYEDGKQYTTLEKPVAGAPQVLEFFSFFCPHCYQFEEVLHISDNVKKKLPEGVKMTKYHVNFMGGDLGKDLTQAWAVAM
ALGVEDKVTVPLFEGVQKTQTIRSASDIRDVFINAGIKGEEYDAAWNSFVVKSLVAQQEKAAADVQLRGVPAMFVNGKYQ
LNPQGMDTSNMDVFVQQYADTVKYLSEKK
>1AAR:B|PDBID|CHAIN|SEQUENCE
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
>1AG2:A|PDBID|CHAIN|SEQUENCE
GLGGYMLGSAMSRPMIHFGNDWEDRYYRENMYRYPNQVYYRPVDQYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDV
KMMERVVEQMCVTQYQKESQAYY
>1AJ3:A|PDBID|CHAIN|SEQUENCE
AKLNESHRLHQFFRDMDDEESWIKEKKLLVSSEDYGRDLTGVQNLRKKHKRLEAELAAHEPAIQGVLDTGKKLSDDNTIG
KEEIQQRLAQFVDHWKELKQLAAARGQRLE
>1ARR:B|PDBID|CHAIN|SEQUENCE
MKGMSKMPQFNLRWPREVLDLVRKVAEENGRSVNSEIYQRVMESFKKEGRIGA
发表于 2011-6-23 17:09:51 | 显示全部楼层
利用正则表达式找到序列行,可以对序列行用split拆分,之后用相关的碱基密码替换各氨基酸,打印出来就应当可以了
发表于 2011-6-24 17:20:17 | 显示全部楼层
my %hash=(
        G=>Gly,
        A=>Ala,
        V=>Val,
        L=>Leu,
        I=>Ile,
        P=>Pro,
        F=>Phe,
        Y=>Tyr,
        W=>Trp,
        S=>Ser,
        T=>Thr,
        C=>Cys,
        M=>Met,
        N=>Asn,
        Q=>Gln,
        D=>Asp,
        E=>Glu,
        K=>Lys,
        R=>Arg,
        H=>His,
          );
open FL,"seq.txt";
while(<FL>){
    chomp;
    if(/^>/){
    }else{
        s/(.)/$hash{$1}/g;
    }
    print "$_\n";
}
close FL;
发表于 2011-7-13 12:15:51 | 显示全部楼层
1# jinzi
参看
http://yunbio.com/1262
或者
http://yunbio.com/1279
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|申请友链|小黑屋|手机版|Archiver|生物信息学论坛 ( 蜀ICP备09031721号  

GMT+8, 2017-1-17 15:06 , Processed in 0.150809 second(s), 21 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表