平臺(tái) 論壇博客文庫(kù)

› 論壇 › 程序設(shè)計(jì) › Perl › Perl 5.1 怎么處理 UTF-16LE的encoding 問(wèn)題?

最近訪問(wèn)板塊

查看: 3121 | 回復(fù): 2

Perl 5.1 怎么處理 UTF-16LE的encoding 問(wèn)題? [復(fù)制鏈接]

百分百好牛

白手起家

論壇徽章:: 0

電梯直達(dá)

1樓 [收藏(0)] [報(bào)告]

發(fā)表于 2011-05-10 17:12 |只看該作者 |倒序?yàn)g覽

本帖最后由百分百好牛于 2011-05-10 17:14 編輯

我有個(gè)很古老的程序（沒(méi)有source code了），會(huì)生成一個(gè)log文件，設(shè)這個(gè)文件名叫l(wèi)og.txt，這個(gè)文件encoding很奇怪，用ultraedit32 打開(kāi) 如下：

0000000: 5400 4400 4400 3e00 2000 4c00 6f00 6100 T.D.D.>. .L.o.a.

復(fù)制代碼

如果我用notepad打開(kāi)，再save as呢，就成了下面這個(gè)，其實(shí)是 utf-16的

0000000: fffe 5400 4400 4400 3e00 2000 4c00 6f00 ..T.D.D.>. .L.o.

復(fù)制代碼

但是，這個(gè)log.txt不能直接處理，比如說(shuō)按我下面的這個(gè)方法去查找，會(huì)失敗，因?yàn)閷?shí)際上，每次讀出來(lái)的行是 T.D.D.不是我想要的 TDD。

open STDIN, "< log.txt";
while(<>)
{
if (/TDD/)
{
# Add my logic.
}
}

復(fù)制代碼

現(xiàn)在我想把他轉(zhuǎn)化成一個(gè)標(biāo)準(zhǔn)的utf16或者utf8,卻總是提示失敗，如下：

perl.exe open.pl utf-16le utf8 log.txt

use strict;
use warnings;
use Encode;
# read arguments
my $enc_in = shift || die 'pass file encoding as first parameter';
my $enc_out = shift || die 'pass STDOUT encoding as second parameter';
print STDERR "going to read files as encoded in: $enc_in\n";
print STDERR "going to write to standard output in: $enc_out\n";
die "no files :-(\n" unless @ARGV;
binmode STDOUT, ":encoding($enc_out)"; # latin1, cp1252, utf8, UTF-8
print STDERR map "* $_\n", Encode->encodings; # list loaded encodings
for ( @ARGV ) { # process files
open my $fh, "<:encoding($enc_in)", $_ or die "open $_: $!";
print while <$fh>;
close $fh;
}
print STDERR map "* $_\n", Encode->encodings; # more encodings now

復(fù)制代碼

錯(cuò)誤的提示總類似于
UTF-16LE : Partial character at open.pl line 18, <$fh> line 2011.

希望有經(jīng)驗(yàn)的兄弟過(guò)來(lái)幫忙看看。

perl 5.1
windows 2008

文庫(kù)|博客

使用正則表達(dá)式與lex實(shí)現(xiàn)詞法分析器
C語(yǔ)言的MIPS匯編實(shí)現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點(diǎn)：Transparent mode全新升級(jí)|附下載

jason680

富可敵國(guó)

論壇徽章:: 145

2樓 [報(bào)告]

發(fā)表于 2011-05-10 19:49 |只看該作者

我有個(gè)很古老的程序（沒(méi)有source code了），會(huì)生成一個(gè)log文件，設(shè)這個(gè)文件名叫l(wèi)og.txt，這個(gè)文件encoding很 ...
百分百好牛發(fā)表于 2011-05-10 17:12

Perl 5.1 !!??
要不....
升級(jí)先...
好像Perl 5.8才支持unicode

C:\Users\Jason>perl -v

This is perl, v5.10.1 built for MSWin32-x86-multi-thread
(with 2 registered patches, see perl -V for more detail)

Copyright 1987-2009, Larry Wall

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門(mén)| 【大話IT】RadonDB低門(mén)檻向MySQL集群下戰(zhàn)書(shū) | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

2gua

版主

論壇徽章:: 0

3樓 [報(bào)告]

發(fā)表于 2011-05-10 20:57 |只看該作者

你把Perl 5.1，變成>=Perl 5.10。

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門(mén)| 【大話IT】RadonDB低門(mén)檻向MySQL集群下戰(zhàn)書(shū) | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

返回列表

Chinaunix › 論壇 › 程序設(shè)計(jì) › Perl › Perl 5.1 怎么處理 UTF-16LE的encoding 問(wèn)題?

積分 0, 距離下一級(jí)還需積分

亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Perl 5.1 怎么處理 UTF-16LE的encoding 問(wèn)題? [復(fù)制鏈接]