亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
123下一頁
最近訪問板塊 發(fā)新帖
查看: 5202 | 回復(fù): 24
打印 上一主題 下一主題

perl 引號(hào) [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2015-08-12 00:12 |只看該作者 |倒序?yàn)g覽
我的文件fasta格式如下,有的ID都有一個(gè)雙引號(hào),如下所示。而有的沒有,我想把雙引號(hào)去掉,

">AT3G56040.1|PACid:19662817"
MANPQASPILHHPQNHLSLFHFRTTTSPRSFSSLHFRKPLLFLSSSSSFSSKLQQSEQQCNNHQVRHVSTVPVEYSTPTPPESDDFLSEIDRLKSLLSKLDVSKDLRRKDAVIDADSRVRRFFSENRGGLSKVFGYLGLNSNEMFLVKCVIAAGQEHALCMNYEEAFGEEEEEYTVRSSVKNALYALVEMIERFDVNSSGYKGRREMGTVLDSEEIAHFRKFLTFLEEIEQFYDCIGGIIGYQVMVLELLHQSSKRRNTNRSQLVEESLGC

論壇徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亞冠之德黑蘭石油
日期:2015-07-15 08:46:452015亞冠之平陽省
日期:2015-11-08 16:27:53白銀圣斗士
日期:2015-11-14 09:58:12
2 [報(bào)告]
發(fā)表于 2015-08-12 08:51 |只看該作者
一串兒葡萄皮這種不是標(biāo)準(zhǔn)的fasta格式文檔,BioPerl模塊不能正常識(shí)別。
建議直接用Perl腳本過濾數(shù)據(jù),或者如果文件不大的話,就直接用NotePad++之類的文本編輯器直接正則替換就好了!

論壇徽章:
10
2015亞冠之廣州富力
日期:2015-06-16 14:44:332015亞冠之西悉尼流浪者
日期:2015-08-19 13:14:352015亞冠之阿爾希拉爾
日期:2015-08-04 09:38:052015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-07-31 15:01:582015亞冠之首爾
日期:2015-07-27 14:24:312015亞冠之塔什干火車頭
日期:2015-07-20 09:47:202015亞冠之布里斯班獅吼
日期:2015-07-15 14:58:432015亞冠之首爾
日期:2015-07-07 09:31:262015亞冠之廣州恒大
日期:2015-07-06 15:41:272015亞冠之首爾
日期:2015-08-27 11:03:01
3 [報(bào)告]
發(fā)表于 2015-08-12 09:22 |只看該作者
use strict;
use warnings;
my $a='"fafdaf"';
$a=~s/\"//g;
print $a;
這樣不行么?還是我沒理解樓主的意思?

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2015-08-12 10:02 |只看該作者
我也是這么做的,可是有些地方會(huì)出現(xiàn)這種情況:>atcgutwurpwfaiwe
WWMNNMMJEFFYGGGSDFKNVJJNVSDFVNSDHFV"at9ouytrey|pcvyuqfqiufjqelityuio"MMNSHFBEYSBCSJHCNKADJNQACHKWJCNSJ
就是有的引號(hào)并沒有被去掉,而是帶引號(hào)的ID直接跟到上一個(gè)序列的后面去了。




回復(fù) 3# xiaoxingan99


   

論壇徽章:
95
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀(jì)念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
5 [報(bào)告]
發(fā)表于 2015-08-12 10:05 |只看該作者
回復(fù) 4# 一串兒葡萄皮


    有這種情況早干嗎不說? 這不是浪費(fèi)大家時(shí)間么

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2015-08-12 10:05 |只看該作者
我手動(dòng)替換后,報(bào)錯(cuò)說含有不匹配的>,是不是輸入的大于號(hào)跟原文件的大于號(hào)還有什么區(qū)別呢?

回復(fù) 2# b114213903


   

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2015-08-12 10:08 |只看該作者
我在替換之前沒有,只是用s/\"//g  替換后的結(jié)果會(huì)出現(xiàn)帶引號(hào)的ID會(huì)跟到上一個(gè)序列后面去。不好意思,沒說清楚。



回復(fù) 5# MMMIX


   

論壇徽章:
95
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀(jì)念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
8 [報(bào)告]
發(fā)表于 2015-08-12 10:12 |只看該作者
回復(fù) 7# 一串兒葡萄皮


    把能重現(xiàn)這個(gè)問題的輸入和你的(能直接執(zhí)行的)代碼都貼上來.

論壇徽章:
10
2015亞冠之廣州富力
日期:2015-06-16 14:44:332015亞冠之西悉尼流浪者
日期:2015-08-19 13:14:352015亞冠之阿爾希拉爾
日期:2015-08-04 09:38:052015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-07-31 15:01:582015亞冠之首爾
日期:2015-07-27 14:24:312015亞冠之塔什干火車頭
日期:2015-07-20 09:47:202015亞冠之布里斯班獅吼
日期:2015-07-15 14:58:432015亞冠之首爾
日期:2015-07-07 09:31:262015亞冠之廣州恒大
日期:2015-07-06 15:41:272015亞冠之首爾
日期:2015-08-27 11:03:01
9 [報(bào)告]
發(fā)表于 2015-08-12 10:41 |只看該作者
還是把你的代碼發(fā)上來看看吧,如果就是直接替換的話,應(yīng)該沒啥大問題的。

論壇徽章:
0
10 [報(bào)告]
發(fā)表于 2015-08-12 11:09 |只看該作者
我的代碼
#!/usr/bin/perl    -w
use warnings;
use strict;
use Bio::SeqIO;

my $file=$ARGV[0];
open(W,"<$file")|| die $!;
while(<W>){
   chomp;
    my$i='"\w+"';
        $i=~s/\"//g;

}
    open(M,">$file.new2") || die $!;
    my$all=Bio::SeqIO->new(-file=>"$file",-format=>'fasta');
    while(my$seq=$all->next_seq){
        my$id=$seq->id;
        my$seq=$seq->seq;


            print M ">$id\n";
            print M "$seq\n";
        }


    close W;
    close M;
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP