求perl的统计程序,统计病毒序列中的ATCG总数,以及各个核苷酸所占比例【病毒DNA中有四种核苷酸,即ACTG】
来源:学生作业帮 编辑:百度作业网作业帮 分类:综合作业 时间:2024/07/16 05:36:56
求perl的统计程序,统计病毒序列中的ATCG总数,以及各个核苷酸所占比例【病毒DNA中有四种核苷酸,即ACTG】
我有从网站下载的源文件HA.fa,并且从中提取了时间和病毒序列放置到excel表格中了,时间和病毒序列对应分开了.
我有从网站下载的源文件HA.fa,并且从中提取了时间和病毒序列放置到excel表格中了,时间和病毒序列对应分开了.
![求perl的统计程序,统计病毒序列中的ATCG总数,以及各个核苷酸所占比例【病毒DNA中有四种核苷酸,即ACTG】](/uploads/image/z/5631509-29-9.jpg?t=%E6%B1%82perl%E7%9A%84%E7%BB%9F%E8%AE%A1%E7%A8%8B%E5%BA%8F%2C%E7%BB%9F%E8%AE%A1%E7%97%85%E6%AF%92%E5%BA%8F%E5%88%97%E4%B8%AD%E7%9A%84ATCG%E6%80%BB%E6%95%B0%2C%E4%BB%A5%E5%8F%8A%E5%90%84%E4%B8%AA%E6%A0%B8%E8%8B%B7%E9%85%B8%E6%89%80%E5%8D%A0%E6%AF%94%E4%BE%8B%E3%80%90%E7%97%85%E6%AF%92DNA%E4%B8%AD%E6%9C%89%E5%9B%9B%E7%A7%8D%E6%A0%B8%E8%8B%B7%E9%85%B8%2C%E5%8D%B3ACTG%E3%80%91)
你是指,直接从fa文件里面提取计算,还是从excel啊?
fa比较容易
再问: 能直接从.fa里提取也好,结果是前边是时间,后边是ATCG的总数和各自所占比例,分数表示。以一个txt的文件输出结果
再答: 不知道你的时间指什么 恐怕明天才有时间帮你了
再问: 能否加你QQ,我的491615964,真心求助!
再答: #!/usr/bin/perl # Date: 2011-11-21 15:27:35 # 按下面测试下吧,最后那个hash具备了所有统计能力,你需要具体什么格式,说明了,再输出 use strict; use warnings; use Data::Dumper; open FH, "chr9.fa" || die $!; my %seqHash = (); my $curSeq; while () { next if /^\s*$/; chomp; if (/^>/) { $curSeq = $_; $seqHash{$curSeq} = ""; }else { $_ = uc($_); $seqHash{$curSeq} .= $_; } } close FH; print Dumper %seqHash; my %numHash = (); while(my($key, $value) = each %seqHash) { $numHash{$key}->{"A"} = $value=~s/A//g; $numHash{$key}->{"T"} = $value=~s/T//g; $numHash{$key}->{"C"} = $value=~s/C//g; $numHash{$key}->{"G"} = $value=~s/G//g; print $value."\n"; } print Dumper %numHash;
fa比较容易
再问: 能直接从.fa里提取也好,结果是前边是时间,后边是ATCG的总数和各自所占比例,分数表示。以一个txt的文件输出结果
再答: 不知道你的时间指什么 恐怕明天才有时间帮你了
再问: 能否加你QQ,我的491615964,真心求助!
再答: #!/usr/bin/perl # Date: 2011-11-21 15:27:35 # 按下面测试下吧,最后那个hash具备了所有统计能力,你需要具体什么格式,说明了,再输出 use strict; use warnings; use Data::Dumper; open FH, "chr9.fa" || die $!; my %seqHash = (); my $curSeq; while () { next if /^\s*$/; chomp; if (/^>/) { $curSeq = $_; $seqHash{$curSeq} = ""; }else { $_ = uc($_); $seqHash{$curSeq} .= $_; } } close FH; print Dumper %seqHash; my %numHash = (); while(my($key, $value) = each %seqHash) { $numHash{$key}->{"A"} = $value=~s/A//g; $numHash{$key}->{"T"} = $value=~s/T//g; $numHash{$key}->{"C"} = $value=~s/C//g; $numHash{$key}->{"G"} = $value=~s/G//g; print $value."\n"; } print Dumper %numHash;
求perl的统计程序,统计病毒序列中的ATCG总数,以及各个核苷酸所占比例【病毒DNA中有四种核苷酸,即ACTG】
RNA病毒逆转录后的DNA转录出的mRNA,与自身的核苷酸序列相同?为什么?
病毒一个DNA或RNA分子只有一条核苷酸链?
怎样计算核苷酸的频率给定一条DNA序列TCGCTCGTGGCCATG,分别计算核苷酸C和G的出现频率,以及两联核苷酸CG
原核细胞、真核细胞中所含碱基、核苷酸的种类;病毒体内碱基、核苷酸的种类,请尽量分一下类,
遗传信息指的是DNA分子中的还是基因中的核苷酸序列?
噬菌体、大豆、SARS病毒中所含有的碱基和核苷酸的种类是
病毒的复制是利用自身的核苷酸
病毒的遗传物质由几种核苷酸组成?
以DNA或RNA为遗传物质的病毒,体内的碱基种类及核苷酸种类分别是多少?
1、艾滋病病毒的核酸有几种?核糖有几种?核苷酸有几种?含有碱基A的核苷酸有几种?
做题时发现H1N1病毒的遗传物质是核糖核苷酸,为什么是核糖核苷酸啊?