diff --git a/README.cn b/README.cn
index eb7f7a9bf1..11b587564b 100644
--- a/README.cn
+++ b/README.cn
@@ -4,9 +4,9 @@ specially designed to be readable as is.
The following documentation is written in EUC-CN encoding.
-?绻?你用一般的文字编辑器阅览这份文档, 请忽略文中奇特的注记字符. 这份文
-件是以 POD (简明文档格式) 写成; 这种格式是为了能?萌酥苯佣寥《乇鹕杓?
-的. 关于此格式的进一步资讯, 请参考 perlpod 线上文档.
+如果你用一般的文字编辑器阅览这份文件, 请忽略文中奇特的注记字符.
+这份文件是以 POD (简明文件格式) 写成; 这种格式是为了能让人直接读取,
+而特别设计的. 关于此格式的进一步信息, 请参考 perlpod 线上文件.
=head1 NAME
@@ -16,16 +16,16 @@ perlcn -
欢迎来到 Perl 的天地!
-从 5.8.0 版开始, Perl 具备了详尽的 Unicode (统一码) 支援, 也连带支援了
-许多拉丁语系以外的编码方式; CJK (中?蘸?) 便是其中的一部份. Unicode 是
-国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界, 以及两者间
-的一切 (希腊文, 叙利亚文, 阿拉伯文, 希伯来文, 印度文, 印地安文, 等等).
-它也?菽闪硕嘀肿饕迪低秤肫教? (?? PC 及麦金塔).
+从 5.8.0 版开始, Perl 具备了完善的 Unicode (统一码) 支援,
+也连带支援了许多拉丁语系以外的编码方式; CJK (中日韩) 便是其中的一部份.
+Unicode 是国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界,
+以及两者间的一切 (希腊文, 叙利亚文, 亚拉伯文, 希伯来文, 印度文,
+印地安文, 等等). 它也容纳了多种作业系统与平台 (如 PC 及麦金塔).
-Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字串资料可用 Unicode
-表示, Perl 的函式与算符 (例?缯?规表示式比对) 也能对 Unicode 进行操作.
-在输?爰笆涑鍪?, 为了处理以 Unicode 之前的编码方式储存的资料, Perl 提供
-了「Encode」这个模块, 可以?媚闱嵋椎囟寥〖靶慈刖捎械谋嗦胱柿?.
+Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字符串数据可用 Unicode
+表示; Perl 的函式与算符 (例如正规表示式比对) 也能对 Unicode 进行操作.
+在输入及输出时, 为了处理以 Unicode 之前的编码方式储存的数据, Perl
+提供了 Encode 这个模块, 可以让你轻易地读取及写入旧有的编码数据.
Encode 延伸模块支援下列简体中文的编码方式:
@@ -36,46 +36,51 @@ Encode
cp936 字码页 936, 也称为 GBK (扩充国标码)
hz 7 比特逸出式 GB2312 编码
-举例来说, 将 euc-cn 编码的档案转成 Unicode, 祗需键?胂铝兄噶?:
+举例来说, 将 EUC-CN 编码的档案转成 Unicode, 祗需键入下列指令:
perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
-Perl 也内附了「piconv」, 一支完?? Perl 写成的字符转换工具程序, 用法
-?缦?:
+Perl 也内附了 "piconv", 一支完全以 Perl 写成的字符转换工具程序, 用法如下:
piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
-另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码, ?缦滤?:
+另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码, 如下所示:
#!/usr/bin/env perl
- # 启动 euc-cn 字串解析; 标准输出?爰氨曜即砦蠖忌栉? euc-cn 编码
- use encoding 'euc-cn', STDIN => 'euc-cn',
- STDOUT => 'euc-cn', STDERR => 'euc-cn';
-
+ # 启动 euc-cn 字串解析; 标准输出入及标准错误都设为 euc-cn 编码
+ use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
print length("骆驼"); # 2 (双引号表示字符)
- print length('骆驼'); # 4 (单引号表示字节)
- print index("谆谆教诲", "蛔唤"); # -1 (不包含此子字串)
+ print length('骆驼'); # 4 (单引号表示位元组)
+ print index("谆谆教诲", "蛔唤"); # -1 (不包含此子字符串)
print index('谆谆教诲', '蛔唤'); # 1 (从第二个字节开始)
+在最后一列例子里, "谆" 的第二个位元组与 "谆" 的第一个位元组结合成 EUC-CN
+码的 "蛔"; "谆" 的第二个位元组则与 "教" 的第一个位元组结合成 "唤".
+这解决了以前 EUC-CN 码比对处理上常见的问题.
+
=head2 额外的中文编码
-?绻?需要更多的中文编码, 可以从 CPAN (L) 下载
+如果需要更多的中文编码, 可以从 CPAN (L) 下载
Encode::HanExtra 模块. 它目前提供下列编码方式:
gb18030 扩充过的国标码, 包含繁体中文
另外, Encode::HanConvert 模块则提供了简繁转换用的两种编码:
- gbk-trad GBK 简体中文与 Unicode 繁体中文互转
big5-simp Big5 繁体中文与 Unicode 简体中文互转
+ gbk-trad GBK 简体中文与 Unicode 繁体中文互转
-?粝朐? GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两
-支程序.
+若想在 GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两支程序,
+或在程序内使用下列写法:
-=head2 进一步的资讯
+ use Encode::HanConvert;
+ $euc_cn = big5_to_gb($big5); # 从 Big5 转为 GBK
+ $big5 = gb_to_big5($euc_cn); # 从 GBK 转为 Big5
-请参考 Perl 内附的大量说明文档 (不幸?怯糜?文写的) , 来学习更多关于
+=head2 进一步的信息
+
+请参考 Perl 内附的大量说明文件 (不幸全是用英文写的), 来学习更多关于
Perl 的知识, 以及 Unicode 的使用方式. 不过, 外部的资源相当丰富:
=head2 提供 Perl 资源的网址
@@ -130,6 +135,10 @@ Unix/Linux
=back
+=head1 SEE ALSO
+
+L, L, L, L, L
+
=head1 AUTHORS
Jarkko Hietaniemi Ejhi@iki.fiE
diff --git a/README.jp b/README.jp
index 328671184b..e05c50d2f3 100644
--- a/README.jp
+++ b/README.jp
@@ -2,7 +2,7 @@ If you read this file _as_is_, just ignore the funny characters you
see. It is written in the POD format (see perlpod manpage) which is
specially designed to be readable as is.
-The following documentation is written in FOO encoding.
+The following documentation is written in euc-jp encoding.
=head1 NAME
@@ -10,7 +10,7 @@ perljp -
=head1 棱汤
-ようこそ Perl へ!
+Perl の坤肠へようこそ!
Perl 5.8.0 より、Unicodeサポ〖トが络升に动步され、その冯蔡ラテン矢机笆嘲の矢机コ〖ドのサポ〖トが CJK (面柜胳、泣塑胳、ハングル)を崔めて裁わりました。Unicodeは坤肠面の矢机を办つの矢机コ〖ドで胺うことを誊回した筛洁惮呈であり、澎から谰、はたまたその粗の矢机∈ギリシャ矢机、キリ〖ル矢机、アラビア矢机、ヘブライ矢机、ディ〖ヴァナガ〖リ矢机、などなど∷や、これまではOSベンダ〖が迫极に年めていた矢机(PCおよびMacintosh)がすでに崔まれています。
@@ -71,7 +71,7 @@ Perl5.8
=item *
- 掐叫蜗
+掐叫蜗
笆布の毋はいづれもShift_JISの掐蜗をEUC-JPに恃垂して叫蜗します。
diff --git a/README.ko b/README.ko
index e83bfc2a8c..404e392be2 100644
--- a/README.ko
+++ b/README.ko
@@ -1,179 +1,192 @@
-If you read this file _as_is_, just ignore the funny characters you
-see. It is written in the POD format (see perlpod manpage) which is
-specially designed to be readable as is.
-
-This file is in Korean encoded in EUC-KR.
-
-捞 巩辑甫 perldoc阑 结辑 焊瘤 臼绊 流立 焊绰 版快俊绰 阿 何盒狼
-开且阑 钎矫窍扁 困秦 静牢 =head, =item, 'L' 殿篮 公矫窍绞矫坷.
-捞 巩辑绰 蝶肺 perldoc阑 静瘤 臼绊 焊歹扼档 佬绰单 喊 瘤厘捞
-绝绰 POD 屈侥栏肺 楼咯 乐嚼聪促. 歹 磊技茄 巴篮 perlpod
-概春倔阑 曼绊窍绞矫坷.
-
-
-=head1 NAME
-
-perlko - Perl苞 茄惫绢 牢内爹
-
-=head1 DESCRIPTION
-
-Perl狼 技拌俊 坷脚 巴阑 券康钦聪促 !
-
-Starting for Perl release 5.8.0 Perl has extensive support for Unicode
-and as a part of that, extensive support for non-Latin characters
-encodings, including the CJK (Chinese-Japanese Korean). Unicode is an
-international standard that aims to include all of world's
-characters: Western, Eastern, and everything in between (Greek,
-Cyrillic, Arabic, Hebrew, Indic, Amerindian, and so on), and
-encodings of various operating system platforms (PC and MacIntosh).
-
-Perl篮 5.8.0 滚傈俊辑何磐 蜡聪内靛/ISO 10646俊 措茄 堡裹困茄 瘤盔 扁瓷阑
-啊瘤绊 乐嚼聪促. 蜡聪内靛 瘤盔狼 老券栏肺 茄吝老阑 厚吩茄 技拌 阿惫俊辑
-蜡聪内靛 捞傈俊 静绊 乐菌绊 瘤陛档 澄府 静捞绊 乐绰 荐腹篮 牢内爹阑
-瘤盔钦聪促. 蜡聪内靛绰 傈 技拌俊辑 静捞绰 葛电 攫绢甫 困茄 钎扁 眉拌 -
-蜡反狼 扼凭 舅颇邯, 虐副 舅颇邯, 弊府胶 舅颇邯, 牢档客 悼巢 酒矫酒狼
-宏扼固 胶农赋飘 拌凯, 酒而, 洒宏府, 茄吝老狼 茄磊, 茄惫绢狼 茄臂,
-老夯绢狼 啊唱, 合固 牢叼救狼 钎扁 眉拌 殿- 荐侩窍绰 巴阑 格钎肺 窍绊
-乐扁 锭巩俊 扁粮俊 静捞带 阿 攫绢 棺 惫啊 弊府绊 款康 眉拌俊 绊蜡茄
-巩磊 笼钦苞 牢内爹阑 葛滴 器褒窍绊 乐嚼聪促.
-
-
-Perl篮 郴何利栏肺 蜡聪内靛甫 巩磊 钎泅阑 困秦 荤侩钦聪促. 焊促 备眉利栏肺
-富窍搁 Perl 胶农赋飘 救俊辑 UTF-8 巩磊凯阑 镜 荐 乐绊,
-阿辆 窃荐客 楷魂磊 (抗甫 甸绢, 沥痹侥, index, substr)啊 官捞飘 窜困
-措脚 蜡聪内靛 臂磊 窜困肺 悼累钦聪促. (歹 磊技茄 巴篮
-perlunicode 概春倔阑 曼绊窍绞矫坷.) 蜡聪内靛啊 澄府 焊鞭登扁 傈俊
-澄府 静捞绊 乐菌绊, 咯傈洒 澄府 静捞绊 乐绰 阿惫/阿 攫绢喊 牢内爹栏肺
-涝免仿阑 窍绊 捞甸 牢内爹栏肺 等 单捞磐客 巩辑甫 促风绰 巴阑 到扁 困秦
-'Encode'啊 静看嚼聪促. 公均焊促 'Encode'甫 结辑 荐腹篮 牢内爹 荤捞狼
-函券阑 奖霸 且 荐 乐嚼聪促.
-
-'Encode'绰 促澜苞 鞍篮 茄惫绢 牢内爹阑 瘤盔钦聪促.
-
- euc-kr : US-ASCII客 KS X 1001阑 鞍捞 静绰 钢萍官捞飘 牢内爹
- (如洒 肯己屈捞扼绊 阂覆.) KS X 2901苞 RFC 1557 曼绊.
- cp949 : MS-Windows 9x/ME俊辑 静捞绰 犬厘 肯己屈.
- euc-kr俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙.
- alias绰 uhc, windows-949, x-windows-949,
- ks_c_5601-1987. 盖 付瘤阜 捞抚篮 利例窍瘤 臼篮
- 捞抚捞瘤父, Microsoft 力前俊辑 CP949狼 狼固肺
- 静捞绊 乐澜.
- johab : KS X 1001:1998 何废 3俊辑 痹沥茄 炼钦屈.
- 巩磊 饭欺配府绰 cp949客 付蛮啊瘤肺 US-ASCII,
- KS X 1001俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙.
-
- iso-2022-kr : RFC 1557俊辑 痹沥茄 茄惫绢 牢磐齿 皋老 背券侩 牢内爹栏肺
- US-ASCII客 KS X 1001阑 饭欺配府肺 窍绰 痢俊辑
- euc-kr苞 鞍瘤父 牢内爹 规侥捞 促抚.
- 1997-8斥 版鳖瘤 静看栏唱 歹 捞惑 皋老 背券俊 静捞瘤
- 臼澜.
- ksc5601-raw : KS X 1001(KS C 5601)阑 GL(溜, MSB甫 0栏肺 茄 版快)
- 俊 初疽阑 锭狼 牢内爹. US-ASCII客 搬钦窍瘤 臼绊
- 窜刀栏肺 静捞绰 老篮 X11 殿俊辑 臂裁 牢内爹
- (ksc5601.1987-0. '0'篮 GL阑 狼固窃.)栏肺 静捞绰 巴阑
- 力寇窍绊绰 芭狼 绝澜.
-
-抗甫 甸绢, euc-kr 牢内爹栏肺 等 颇老阑 UTF-8肺 函券窍妨搁 促澜苞
-鞍捞 窍搁 邓聪促.
-
-
- perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8
-
-开函券篮 促澜苞 鞍捞 且 荐 乐嚼聪促.
-
- perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr
-
-捞繁 函券阑 粱歹 祈府窍霸 且 荐 乐档废 Encode 葛碘阑 结辑
-鉴荐窍霸 Perl肺父 静牢 piconv啊 Perl俊 甸绢 乐嚼聪促.
-弊 捞抚俊辑 舅 荐 乐淀捞 piconv绰 Unix俊 乐绰 iconv甫
-葛胆肺 茄 巴涝聪促. 弊 荤侩过篮 酒贰客 鞍嚼聪促.
-
- piconv -f FOO -t utf8 < file.euckr > file.utf8
- piconv -f utf8 -t FOO < file.utf8 > file.euckr
-
-肚, 'encoding' 葛碘阑 结辑 茄惫绢 牢内爹阑 静搁辑 臂磊 窜困
-(官捞飘 窜困啊 酒聪扼) 贸府甫 奖霸 且 荐 乐嚼聪促.
-
- #!/usr/local/bin/perl
-
- use encoding 'euc-kr', STDIN => 'euc-kr',
- STDOUT-> 'euc-kr', STDERR=>'euc-kr';
-
- print length("啊唱"); # 2 (奴 蝶咳钎绰 臂磊 窜困 贸府甫 瘤矫)
- print length('啊唱'); # 4 (累篮 蝶咳钎绰 官捞飘 窜困 贸府甫 瘤矫)
- print index("茄碍, 措悼碍", "堪"); # -1 ('堪'捞 绝澜)
- print index('茄碍, 措悼碍', '堪'); # 7 (8锅掳客 9锅掳 官捞飘啊 '堪'狼
- 内靛蔼苞 老摹窃.)
-
-
-=head2 歹 磊技洒 舅绊 酵栏搁...
-
-Perl阑 汲摹窍搁 措窜洒 磊技茄 巩辑啊 鞍捞 蝶扼 坷哥, 捞 巩辑甫 烹秦
-Perl 傈馆 挥 酒聪扼 蜡聪内靛 瘤盔, Encode狼 荤侩过 殿俊 腹篮 巴阑
-硅匡 荐 乐嚼聪促. 阂青洒档 捞 巩辑绰 泅犁 葛滴 康绢肺 静咯 乐嚼聪促.
-捞 巩辑 寇俊档 促澜苞 鞍篮 磊丰啊 乐嚼聪促. 捞 格废篮 搬内
-肯傈茄 巴捞 酒聪绊 老何 措钎利牢 巴父 葛篮 巴涝聪促.
-
-
-=head2 Perl 包访 磊丰
-
-=over 4
-
-=item L
-
- O'Reilly狼 Perl 昆 其捞瘤
-
-=item L
-
- Comprehensive Perl Archive Network
-
-=item L
-
- Perl 皋老傅 府胶飘. 腹篮 府胶飘 啊款单
- perl-unicode俊辑 'Encode'俊 措秦 稠狼窃.
-
-=back
-
-=head2 Perl阑 歹 表霸 傍何窍绰单 档框阑 临 荐 乐绰 茄惫绢 包访 荤捞飘
-
-=over 4
-
-=item L
-
- O'Reilly俊辑 唱柯 茄惫绢 Perl 辑利 格废
-
-=item L
-
- Perl俊 包访等 CGI, DB, 楷悼 殿俊 措茄 沥焊 棺 春胶 力傍
-
-=back
-
-=head2 蜡聪内靛 包访 磊丰
-
-=over 4
-
-=item L
-
- 蜡聪内靛 牧家矫决.
-
-=item L
-
-扁夯利栏肺 Unicode客 鞍篮 ISO 钎霖牢 ISO/IEC 10646 UCS(Universal
-Character Set)阑 父靛绰 ISO/IEC JTC1/SC2/WG2狼 昆 其捞瘤.
-
-=item L
-
- 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)
-
-=item L
-
- 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)狼 茄惫绢 锅开
-
-=back
-
-=head1 AUTHORS
-
-Jarkko Hietaniemi Ejhi@iki.fiE
-脚沥侥 Ejshin@mailaps.org
-
-=cut
+If you read this file _as_is_, just ignore the funny characters you
+see. It is written in the POD format (see perlpod manpage) which is
+specially designed to be readable as is.
+
+This file is in Korean encoded in EUC-KR.
+
+捞 巩辑甫 perldoc阑 结辑 焊瘤 臼绊 流立 焊绰 版快俊绰 阿 何盒狼
+开且阑 钎矫窍扁 困秦 静牢 =head, =item, 'L' 殿篮 公矫窍绞矫坷.
+捞 巩辑绰 蝶肺 perldoc阑 静瘤 臼绊 焊歹扼档 佬绰单 喊 瘤厘捞
+绝绰 POD 屈侥栏肺 楼咯 乐嚼聪促. 歹 磊技茄 巴篮 perlpod
+概春倔阑 曼绊窍绞矫坷.
+
+
+=head1 NAME
+
+perlko - Perl苞 茄惫绢 牢内爹
+
+=head1 DESCRIPTION
+
+Perl狼 技拌俊 坷脚 巴阑 券康钦聪促 !
+
+
+Perl篮 5.8.0魄何磐 蜡聪内靛/ISO 10646俊 措茄 堡裹困茄 瘤盔阑 钦聪促.
+蜡聪内靛 瘤盔狼 老券栏肺 茄吝老阑 厚吩茄 技拌 阿惫俊辑
+蜡聪内靛 捞傈俊 静绊 乐菌绊 瘤陛档 澄府 静捞绊 乐绰 荐腹篮 牢内爹阑
+瘤盔钦聪促. 蜡聪内靛绰 傈 技拌俊辑 静捞绰 葛电 攫绢甫 困茄 钎扁 眉拌 -
+蜡反狼 扼凭 舅颇邯, 虐副 舅颇邯, 弊府胶 舅颇邯, 牢档客 悼巢 酒矫酒狼
+宏扼固 拌凯 胶农赋飘, 酒而 巩磊, 洒宏府 巩磊, 茄吝老狼 茄磊, 茄惫绢狼 茄臂,
+老夯绢狼 啊唱, 合固 牢叼救狼 钎扁 眉拌 殿- 荐侩窍绰 巴阑 格钎肺 窍绊
+乐扁 锭巩俊 扁粮俊 静捞带 阿 攫绢 棺 惫啊 弊府绊 款康 眉拌俊 绊蜡茄
+巩磊 笼钦苞 牢内爹阑 葛滴 器褒窍绊 乐嚼聪促.
+
+
+Perl篮 郴何利栏肺 蜡聪内靛甫 巩磊 钎泅阑 困秦 荤侩钦聪促. 焊促 备眉利栏肺
+富窍搁 Perl 胶农赋飘 救俊辑 UTF-8 巩磊凯阑 镜 荐 乐绊,
+阿辆 窃荐客 楷魂磊(抗甫 甸绢, 沥痹侥, index, substr)啊 官捞飘 窜困
+措脚 蜡聪内靛 臂磊 窜困肺 悼累钦聪促. (歹 磊技茄 巴篮
+perlunicode 概春倔阑 曼绊窍绞矫坷.) 蜡聪内靛啊 澄府 焊鞭登扁 傈俊
+澄府 静捞绊 乐菌绊, 咯傈洒 澄府 静捞绊 乐绰 阿惫/阿 攫绢喊 牢内爹栏肺
+涝免仿阑 窍绊 捞甸 牢内爹栏肺 等 单捞磐客 巩辑甫 促风绰 巴阑 到扁 困秦
+'Encode'啊 静看嚼聪促. 公均焊促 'Encode'甫 结辑 荐腹篮 牢内爹 荤捞狼
+函券阑 奖霸 且 荐 乐嚼聪促.
+
+'Encode'绰 促澜苞 鞍篮 茄惫绢 牢内爹阑 瘤盔钦聪促.
+
+ euc-kr : US-ASCII客 KS X 1001阑 鞍捞 静绰 钢萍官捞飘 牢内爹
+ (如洒 肯己屈捞扼绊 阂覆.) KS X 2901苞 RFC 1557 曼绊.
+ cp949 : MS-Windows 9x/ME俊辑 静捞绰 犬厘 肯己屈.
+ euc-kr俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙.
+ alias绰 uhc, windows-949, x-windows-949,
+ ks_c_5601-1987. 盖 付瘤阜 捞抚篮 利例窍瘤 臼篮
+ 捞抚捞瘤父, Microsoft 力前俊辑 CP949狼 狼固肺
+ 静捞绊 乐澜.
+ johab : KS X 1001:1998 何废 3俊辑 痹沥茄 炼钦屈.
+ 巩磊 饭欺配府绰 cp949客 付蛮啊瘤肺 US-ASCII,
+ KS X 1001俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙.
+
+ iso-2022-kr : RFC 1557俊辑 痹沥茄 茄惫绢 牢磐齿 皋老 背券侩 牢内爹栏肺
+ US-ASCII客 KS X 1001阑 饭欺配府肺 窍绰 痢俊辑
+ euc-kr苞 鞍瘤父 牢内爹 规侥捞 促抚.
+ 1997-8斥 版鳖瘤 静看栏唱 歹 捞惑 皋老 背券俊 静捞瘤
+ 臼澜.
+ ksc5601-raw : KS X 1001(KS C 5601)阑 GL(溜, MSB甫 0栏肺 茄 版快)
+ 俊 初疽阑 锭狼 牢内爹. US-ASCII客 搬钦窍瘤 臼绊
+ 窜刀栏肺 静捞绰 老篮 X11 殿俊辑 臂裁 牢内爹
+ (ksc5601.1987-0. '0'篮 GL阑 狼固窃.)栏肺 静捞绰 巴阑
+ 力寇窍绊绰 芭狼 绝澜.
+
+抗甫 甸绢, euc-kr 牢内爹栏肺 等 颇老阑 UTF-8肺 函券窍妨搁 促澜苞
+鞍捞 窍搁 邓聪促.
+
+
+ perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8
+
+开函券篮 促澜苞 鞍捞 且 荐 乐嚼聪促.
+
+ perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr
+
+捞繁 函券阑 粱歹 祈府窍霸 且 荐 乐档废 Encode 葛碘阑 结辑
+鉴荐窍霸 Perl肺父 静牢 piconv啊 Perl俊 甸绢 乐嚼聪促.
+弊 捞抚俊辑 舅 荐 乐淀捞 piconv绰 Unix俊 乐绰 iconv甫
+葛胆肺 茄 巴涝聪促. 弊 荤侩过篮 酒贰客 鞍嚼聪促.
+
+ piconv -f euc-kr -t utf8 < file.euckr > file.utf8
+ piconv -f utf8 -t euc-kr < file.utf8 > file.euckr
+
+肚, 'encoding' 葛碘阑 结辑 茄惫绢 牢内爹阑 静搁辑 臂磊 窜困
+(官捞飘 窜困啊 酒聪扼) 贸府甫 奖霸 且 荐 乐嚼聪促.
+
+ #!/usr/local/bin/perl
+
+ use encoding 'euc-kr', STDIN => 'euc-kr',
+ STDOUT-> 'euc-kr', STDERR=>'euc-kr';
+
+ print length("啊唱"); # 2 (奴 蝶咳钎绰 臂磊 窜困 贸府甫 瘤矫)
+ print length('啊唱'); # 4 (累篮 蝶咳钎绰 官捞飘 窜困 贸府甫 瘤矫)
+ print index("茄碍, 措悼碍", "堪"); # -1 ('堪'捞 绝澜)
+ print index('茄碍, 措悼碍', '堪'); # 7 (8锅掳客 9锅掳 官捞飘啊 '堪'狼
+ 内靛蔼苞 老摹窃.)
+
+
+=head2 歹 磊技洒 舅绊 酵栏搁...
+
+Perl阑 汲摹窍搁 措窜洒 磊技茄 巩辑啊 鞍捞 蝶扼 坷哥, 捞 巩辑甫 烹秦
+Perl 傈馆 挥 酒聪扼 蜡聪内靛 瘤盔, Encode狼 荤侩过 殿俊 腹篮 巴阑
+硅匡 荐 乐嚼聪促. 阂青洒档 捞 巩辑绰 泅犁 葛滴 康绢肺 静咯 乐嚼聪促.
+捞 巩辑 寇俊档 促澜苞 鞍篮 磊丰啊 乐嚼聪促. 捞 格废篮 搬内
+肯傈茄 巴捞 酒聪绊 老何 措钎利牢 巴父 葛篮 巴涝聪促.
+
+
+=head2 Perl 包访 磊丰
+
+=over 4
+
+=item L
+
+ O'Reilly狼 Perl 昆 其捞瘤
+
+=item L
+
+ Comprehensive Perl Archive Network
+
+=item L
+
+ Perl 皋老傅 府胶飘. 腹篮 府胶飘 啊款单
+ perl-unicode俊辑 'Encode'俊 措秦 稠狼窃.
+
+=back
+
+=head2 Perl阑 歹 表霸 傍何窍绰单 档框阑 临 荐 乐绰 茄惫绢 包访 荤捞飘
+
+=over 4
+
+=item L
+
+ Perl 茄惫 荤侩磊 葛烙
+
+=item L
+
+ 茄惫绢 Perl 春胶 弊缝
+
+=item L
+
+ Perl 噶芭胶 (辑匡)
+
+=item L
+
+ Home for Korean Perlmanias
+
+=item L
+
+ O'Reilly俊辑 唱柯 茄惫绢 Perl 辑利 格废
+
+=item L
+
+ Perl 扁檬 碍谅 棺 家胶, 弥辟 悼氢, 包访 秦寇 荤捞飘 傅农
+
+=item L
+
+ Perl俊 包访等 CGI, DB, 楷悼 殿俊 措茄 沥焊 棺 春胶 力傍
+
+=back
+
+=head2 蜡聪内靛 包访 磊丰
+
+=over 4
+
+=item L
+
+ 蜡聪内靛 牧家矫决.
+
+=item L
+
+扁夯利栏肺 Unicode客 鞍篮 ISO 钎霖牢 ISO/IEC 10646 UCS(Universal
+Character Set)阑 父靛绰 ISO/IEC JTC1/SC2/WG2狼 昆 其捞瘤.
+
+=item L
+
+ 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)
+
+=item L
+
+ 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)狼 茄惫绢 锅开
+
+=back
+
+=head1 AUTHORS
+
+Jarkko Hietaniemi Ejhi@iki.fiE
+脚沥侥 Ejshin@mailaps.org
+
+=cut
diff --git a/README.tw b/README.tw
index 02c0d4e22b..698b5d7724 100644
--- a/README.tw
+++ b/README.tw
@@ -4,9 +4,9 @@ specially designed to be readable as is.
The following documentation is written in Big5 encoding.
-狦ノゅ絪胯竟綷凝硂ゅン, 叫┛菠ゅい疭爹癘才. 硂ゅ
-ン琌 POD (虏ゅンΑ) 糶Θ; 硂贺Α琌琵钡弄τ疭砞璸
-. 闽Α秈˙戈癟, 叫把σ perlpod 絬ゅン.
+狦ノゅ絪胯竟綷凝硂ゅン, 叫┛菠ゅい疭爹癘才.
+硂ゅン琌 POD (虏ゅンΑ) 糶Θ; 硂贺Α琌琵钡弄,
+τ疭砞璸. 闽Α秈˙戈癟, 叫把σ perlpod 絬ゅン.
=head1 NAME
@@ -16,20 +16,20 @@ perltw -
舧ㄓ Perl ぱ!
-眖 5.8.0 秨﹍, Perl ㄣ称冈荷 Unicode (窾瓣絏) や穿, 硈盿や穿
-砛┰粂╰絪絏よΑ; CJK (いら龙) 獽琌ㄤい场. Unicode 琌
-瓣悔┦夹非, 刚瓜瞇籠┮Τ才: ﹁よ, 狥よ, のㄢ丁
-ち (镁ゅ, 痹ㄈゅ, ┰ゅ, ㄓゅ, ゅ, ゅ, 单单).
-ウ甧贺穨╰参籔キ籓 ( PC の沉娥).
+眖 5.8.0 秨﹍, Perl ㄣ称Ч到 Unicode (窾瓣絏) や穿,
+硈盿や穿砛┰粂╰絪絏よΑ; CJK (いら龙) 獽琌ㄤい场.
+Unicode 琌瓣悔┦夹非, 刚瓜瞇籠┮Τ才: ﹁よ, 狥よ,
+のㄢ丁ち (镁ゅ, 痹ㄈゅ, ┰ゅ, ㄓゅ, ゅ,
+ゅ, 单单). ウ甧贺穨╰参籔キ籓 ( PC の沉娥).
Perl セō Unicode 秈︽巨. 硂ボ Perl ず场﹃戈ノ Unicode
-ボ, Perl ㄧΑ籔衡才 (ㄒタ砏ボΑゑ癸) 癸 Unicode 秈︽巨.
-块の块, 矪瞶 Unicode ぇ玡絪絏よΑ纗戈, Perl 矗ㄑ
-Encode硂家舱, 琵淮弄の糶侣Τ絪絏戈.
+ボ; Perl ㄧΑ籔衡才 (ㄒタ砏ボΑゑ癸) 癸 Unicode 秈︽巨.
+块の块, 矪瞶 Unicode ぇ玡絪絏よΑ纗戈, Perl
+矗ㄑ Encode 硂家舱, 琵淮弄の糶侣Τ絪絏戈.
Encode ┑家舱や穿タ砰いゅ絪絏よΑ:
- big5 程 Big5 絪絏
+ big5 ﹍ Big5 絪絏 (ぱらゅ)
big5-hkscs Big5 + 翠栋
cp950 絏 950 (Big5 + 稬硁睰才)
@@ -37,8 +37,7 @@ Encode
perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8
-Perl ずpiconv, やЧ Perl 糶Θ才锣传ㄣ祘Α, ノ猭
-:
+Perl ず "piconv", やЧ Perl 糶Θ才锣传ㄣ祘Α, ノ猭:
piconv -f big5 -t utf8 < file.big5 > file.utf8
piconv -f utf8 -t big5 < file.utf8 > file.big5
@@ -47,13 +46,15 @@ Perl
#!/usr/bin/env perl
# 币笆 big5 ﹃秆猂; 夹非块の夹非岿粇常砞 big5 絪絏
- use encoding 'big5', STDIN => 'big5',
- STDOUT => 'big5', STDERR => 'big5';
-
+ use encoding 'big5', STDIN => 'big5', STDOUT => 'big5';
print length("纃緈"); # 2 (蛮ま腹ボ才)
print length('纃緈'); # 4 (虫ま腹ボじ舱)
print index("轿轿毙唬", "谓伪"); # -1 (ぃ﹃)
- print index('轿轿毙唬', '谓伪'); # 1 (眖材竊秨﹍)
+ print index('轿轿毙唬', '谓伪'); # 1 (眖材じ舱秨﹍)
+
+程ㄒ柑, "轿" 材じ舱籔 "轿" 材じ舱挡Θ Big5
+絏 "谓"; "轿" 材じ舱玥籔 "毙" 材じ舱挡Θ "伪".
+硂秆∕玡 Big5 絏ゑ癸矪瞶盽ǎ拜肈.
=head2 肂いゅ絪絏
@@ -66,14 +67,18 @@ Encode::HanExtra
, Encode::HanConvert 家舱玥矗ㄑ虏羉锣传ノㄢ贺絪絏:
big5-simp Big5 タ砰いゅ籔 Unicode 虏砰いゅが锣
- gbk-trad GBK 虏砰いゅ籔 Unicode 羉砰いゅが锣
+ gbk-trad GBK 虏砰いゅ籔 Unicode タ砰いゅが锣
+
+璝稱 GBK 籔 Big5 ぇ丁が锣, 叫把σ赣家舱ず b2g.pl 籔 g2b.pl ㄢや祘Α,
+┪祘Αずㄏノ糶猭:
-璝稱 GBK 籔 Big5 ぇ丁が锣, 叫把σ赣家舱ず b2g.pl 籔 g2b.pl ㄢ
-や祘Α.
+ use Encode::HanConvert;
+ $euc_cn = big5_to_gb($big5); # 眖 Big5 锣 GBK
+ $big5 = gb_to_big5($euc_cn); # 眖 GBK 锣 Big5
=head2 秈˙戈癟
-叫把σ Perl ず秖弧ゅン (ぃ┋琌ノ璣ゅ糶) , ㄓ厩策闽
+叫把σ Perl ず秖弧ゅン (ぃ┋琌ノ璣ゅ糶), ㄓ厩策闽
Perl 醚, の Unicode ㄏノよΑ. ぃ筁, 场戈方讽伦碔:
=head2 矗ㄑ Perl 戈方呼
@@ -134,8 +139,26 @@ Unicode
Unix/Linux UTF-8 の Unicode 氮拜
+=head2 いゅて戈癟
+
+=item ぐ或 "タ砰いゅ" ぃ "羉砰いゅ"?
+
+L
+
+=item いゅて硁砰羛幅
+
+L
+
+=item Linux 硁砰いゅて璸购
+
+L
+
=back
+=head1 SEE ALSO
+
+L, L, L, L, L
+
=head1 AUTHORS
Jarkko Hietaniemi Ejhi@iki.fiE