亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
論壇 程序設計 Shell perl
1234下一頁
最近訪問板塊 發(fā)新帖
查看: 4212 | 回復: 31
打印 上一主題 下一主題

[文本處理] perl [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2015-08-07 21:07 |只看該作者 |倒序瀏覽
我的文件 都是這種FASTA格式:
qwer.1         AFRTYUIFGHJKLVBNM
qwer.2         BVXNVFGSFYEBCSHB
qwer.3         HDFKSHFGSERYFIEURHFSUFDSHVBSJEUABFUHABFCAHFBC
rtyuip00.1    AFHBVSFHUACFKUSHDBAKFHAKUFHSADKFUA
hhjkl.1         JDNVKHFBAKHFAKFAFJNSADFJAS
hhjk.2         HFSDHNFKANFAKFIJI
hhjk.3         JNFAJNFALSDFLMAD
hhjk.4         KJGSEGJOAKFFDSMFAPOKEF
...
現(xiàn)在我想把小數(shù)點前相同的放到一起,點后的忽略。然后比較小數(shù)點前相同的ID后的序列長度,將最長的輸出來;若有多條一樣長則隨機輸出其中一條,請大神用perl寫個程序。其實就是處理可變剪切,不知道我是否描述清楚了。

論壇徽章:
0
2 [報告]
發(fā)表于 2015-08-07 21:10 |只看該作者

perl 匹配

我的文件 都是這種FASTA格式:
qwer.1         AFRTYUIFGHJKLVBNM
qwer.2         BVXNVFGSFYEBCSHB
qwer.3         HDFKSHFGSERYFIEURHFSUFDSHVBSJEUABFUHABFCAHFBC
rtyuip00.1    AFHBVSFHUACFKUSHDBAKFHAKUFHSADKFUA
hhjkl.1         JDNVKHFBAKHFAKFAFJNSADFJAS
hhjk.2         HFSDHNFKANFAKFIJI
hhjk.3         JNFAJNFALSDFLMAD
hhjk.4         KJGSEGJOAKFFDSMFAPOKEF
...
現(xiàn)在我想把小數(shù)點前相同的放到一起,點后的忽略。然后比較小數(shù)點前相同的ID后的序列長度,將最長的輸出來;若有多條一樣長則隨機輸出其中一條,請大神用perl寫個程序。其實就是處理可變剪切,不知道我是否描述清楚了。

論壇徽章:
95
程序設計版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設計版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設計版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
3 [報告]
發(fā)表于 2015-08-07 21:55 |只看該作者

論壇徽章:
30
申猴
日期:2014-04-10 09:43:532015年亞洲杯紀念徽章
日期:2015-03-20 14:40:232015亞冠之阿爾納斯爾
日期:2015-06-02 18:59:042015亞冠之阿爾希拉爾
日期:2015-06-30 15:22:572015亞冠之大阪鋼巴
日期:2015-07-20 10:44:332015亞冠之阿爾納斯爾
日期:2015-10-28 14:57:5215-16賽季CBA聯(lián)賽之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16賽季CBA聯(lián)賽之山西
日期:2016-07-25 21:54:2715-16賽季CBA聯(lián)賽之北京
日期:2016-10-27 12:07:2315-16賽季CBA聯(lián)賽之八一
日期:2017-07-07 16:39:0915-16賽季CBA聯(lián)賽之吉林
日期:2017-09-04 12:14:43
4 [報告]
發(fā)表于 2015-08-07 22:25 |只看該作者
  1. awk -F '[. ]+' '{a[$1]=a[$1]?a[$1]" "$3:$3}END{for(i in a){printf i" ";for(j=1;j<=split(a[i],b," ");j++) {if(length(b[j])>int(t))t=b[j]}print t;t=""}}' file
復制代碼
回復 1# super_two


   

論壇徽章:
0
5 [報告]
發(fā)表于 2015-08-07 22:31 |只看該作者
我是新手,麻煩您給解釋一下,謝謝~回復 2# zxy877298415


   

論壇徽章:
16
CU十二周年紀念徽章
日期:2013-10-24 15:41:3415-16賽季CBA聯(lián)賽之廣東
日期:2015-12-23 21:21:55青銅圣斗士
日期:2015-12-05 10:35:30黃金圣斗士
日期:2015-11-26 20:42:16神斗士
日期:2015-11-19 12:47:50每日論壇發(fā)貼之星
日期:2015-11-18 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-11-18 06:20:002015亞冠之城南
日期:2015-11-10 19:10:492015亞冠之薩濟拖拉機
日期:2015-10-28 18:47:282015亞冠之柏太陽神
日期:2015-08-30 17:21:492015亞冠之山東魯能
日期:2015-07-07 18:48:39摩羯座
日期:2014-08-29 23:01:42
6 [報告]
發(fā)表于 2015-08-07 22:32 |只看該作者
字典加數(shù)組 然后sort數(shù)組

論壇徽章:
95
程序設計版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設計版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設計版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
7 [報告]
發(fā)表于 2015-08-07 22:45 |只看該作者
為啥不自己先寫一個呢? 新手就應該多練習嘛

論壇徽章:
0
8 [報告]
發(fā)表于 2015-08-07 23:12 |只看該作者
我寫了一個,但是不能運行。我的想法就是用Bio::SeqIO模塊,提取出原始文件的ID,和序列,并以內length計算出每個序列的長度。
將提出的ID按照小數(shù)點前相同的ID及其序列放進一個數(shù)組,然后分別在這個數(shù)組中找出最長的序列輸出來,但是要將原始ID、序列以及長度都分別對應,我不知道如何才能對應好。不知道我這個思路對不對




回復 7# MMMIX


   

論壇徽章:
95
程序設計版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設計版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設計版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
9 [報告]
發(fā)表于 2015-08-08 00:29 |只看該作者
回復 8# super_two


    不能運行也罷, 貼上來看看.

論壇徽章:
22
處女座
日期:2014-10-11 13:33:292015亞冠之塔什干火車頭
日期:2015-07-20 19:59:042015亞冠之塔什干火車頭
日期:2015-07-26 10:59:31程序設計版塊每日發(fā)帖之星
日期:2015-08-05 06:20:00每日論壇發(fā)貼之星
日期:2015-08-05 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-08-07 06:20:00每日論壇發(fā)貼之星
日期:2015-08-07 06:20:002015亞冠之阿爾納斯爾
日期:2015-10-01 15:23:28白銀圣斗士
日期:2015-12-07 17:17:06操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-12-27 06:20:002015亞冠之廣州富力
日期:2015-07-08 15:48:31程序設計版塊每日發(fā)帖之星
日期:2015-06-11 22:20:00
10 [報告]
發(fā)表于 2015-08-08 00:31 |只看該作者
本帖最后由 聆雨淋夜 于 2015-08-08 00:36 編輯

想得復雜點了
  1. awk -F '[. ]+' '$1!=a{ml=length($3);a=$1;b[$1]=$3}$1==a{if(length($3)>ml){ml=length($3);b[$1]=$3}}END{for(i in b)print i"  "b[i]}' file
復制代碼
hhjk  KJGSEGJOAKFFDSMFAPOKEF
hhjkl  JDNVKHFBAKHFAKFAFJNSADFJAS
rtyuip00  AFHBVSFHUACFKUSHDBAKFHAKUFHSADKFUA
qwer  HDFKSHFGSERYFIEURHFSUFDSHVBSJEUABFUHABFCAHFBC
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP