diff --git a/README.cn b/README.cn index eb7f7a9bf1..11b587564b 100644 --- a/README.cn +++ b/README.cn @@ -4,9 +4,9 @@ specially designed to be readable as is. The following documentation is written in EUC-CN encoding. -?绻?你用一般的文字编辑器阅览这份文档, 请忽略文中奇特的注记字符. 这份文 -件是以 POD (简明文档格式) 写成; 这种格式是为了能?萌酥苯佣寥《乇鹕杓? -的. 关于此格式的进一步资讯, 请参考 perlpod 线上文档. +如果你用一般的文字编辑器阅览这份文件, 请忽略文中奇特的注记字符. +这份文件是以 POD (简明文件格式) 写成; 这种格式是为了能让人直接读取, +而特别设计的. 关于此格式的进一步信息, 请参考 perlpod 线上文件. =head1 NAME @@ -16,16 +16,16 @@ perlcn - 欢迎来到 Perl 的天地! -从 5.8.0 版开始, Perl 具备了详尽的 Unicode (统一码) 支援, 也连带支援了 -许多拉丁语系以外的编码方式; CJK (中?蘸?) 便是其中的一部份. Unicode 是 -国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界, 以及两者间 -的一切 (希腊文, 叙利亚文, 阿拉伯文, 希伯来文, 印度文, 印地安文, 等等). -它也?菽闪硕嘀肿饕迪低秤肫教? (?? PC 及麦金塔). +从 5.8.0 版开始, Perl 具备了完善的 Unicode (统一码) 支援, +也连带支援了许多拉丁语系以外的编码方式; CJK (中日韩) 便是其中的一部份. +Unicode 是国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界, +以及两者间的一切 (希腊文, 叙利亚文, 亚拉伯文, 希伯来文, 印度文, +印地安文, 等等). 它也容纳了多种作业系统与平台 (如 PC 及麦金塔). -Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字串资料可用 Unicode -表示, Perl 的函式与算符 (例?缯?规表示式比对) 也能对 Unicode 进行操作. -在输?爰笆涑鍪?, 为了处理以 Unicode 之前的编码方式储存的资料, Perl 提供 -了「Encode」这个模块, 可以?媚闱嵋椎囟寥〖靶慈刖捎械谋嗦胱柿?. +Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字符串数据可用 Unicode +表示; Perl 的函式与算符 (例如正规表示式比对) 也能对 Unicode 进行操作. +在输入及输出时, 为了处理以 Unicode 之前的编码方式储存的数据, Perl +提供了 Encode 这个模块, 可以让你轻易地读取及写入旧有的编码数据. Encode 延伸模块支援下列简体中文的编码方式: @@ -36,46 +36,51 @@ Encode cp936 字码页 936, 也称为 GBK (扩充国标码) hz 7 比特逸出式 GB2312 编码 -举例来说, 将 euc-cn 编码的档案转成 Unicode, 祗需键?胂铝兄噶?: +举例来说, 将 EUC-CN 编码的档案转成 Unicode, 祗需键入下列指令: perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8 -Perl 也内附了「piconv」, 一支完?? Perl 写成的字符转换工具程序, 用法 -?缦?: +Perl 也内附了 "piconv", 一支完全以 Perl 写成的字符转换工具程序, 用法如下: piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8 piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn -另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码, ?缦滤?: +另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码, 如下所示: #!/usr/bin/env perl - # 启动 euc-cn 字串解析; 标准输出?爰氨曜即砦蠖忌栉? euc-cn 编码 - use encoding 'euc-cn', STDIN => 'euc-cn', - STDOUT => 'euc-cn', STDERR => 'euc-cn'; - + # 启动 euc-cn 字串解析; 标准输出入及标准错误都设为 euc-cn 编码 + use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn'; print length("骆驼"); # 2 (双引号表示字符) - print length('骆驼'); # 4 (单引号表示字节) - print index("谆谆教诲", "蛔唤"); # -1 (不包含此子字串) + print length('骆驼'); # 4 (单引号表示位元组) + print index("谆谆教诲", "蛔唤"); # -1 (不包含此子字符串) print index('谆谆教诲', '蛔唤'); # 1 (从第二个字节开始) +在最后一列例子里, "谆" 的第二个位元组与 "谆" 的第一个位元组结合成 EUC-CN +码的 "蛔"; "谆" 的第二个位元组则与 "教" 的第一个位元组结合成 "唤". +这解决了以前 EUC-CN 码比对处理上常见的问题. + =head2 额外的中文编码 -?绻?需要更多的中文编码, 可以从 CPAN (L) 下载 +如果需要更多的中文编码, 可以从 CPAN (L) 下载 Encode::HanExtra 模块. 它目前提供下列编码方式: gb18030 扩充过的国标码, 包含繁体中文 另外, Encode::HanConvert 模块则提供了简繁转换用的两种编码: - gbk-trad GBK 简体中文与 Unicode 繁体中文互转 big5-simp Big5 繁体中文与 Unicode 简体中文互转 + gbk-trad GBK 简体中文与 Unicode 繁体中文互转 -?粝朐? GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两 -支程序. +若想在 GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两支程序, +或在程序内使用下列写法: -=head2 进一步的资讯 + use Encode::HanConvert; + $euc_cn = big5_to_gb($big5); # 从 Big5 转为 GBK + $big5 = gb_to_big5($euc_cn); # 从 GBK 转为 Big5 -请参考 Perl 内附的大量说明文档 (不幸?怯糜?文写的) , 来学习更多关于 +=head2 进一步的信息 + +请参考 Perl 内附的大量说明文件 (不幸全是用英文写的), 来学习更多关于 Perl 的知识, 以及 Unicode 的使用方式. 不过, 外部的资源相当丰富: =head2 提供 Perl 资源的网址 @@ -130,6 +135,10 @@ Unix/Linux =back +=head1 SEE ALSO + +L, L, L, L, L + =head1 AUTHORS Jarkko Hietaniemi Ejhi@iki.fiE diff --git a/README.jp b/README.jp index 328671184b..e05c50d2f3 100644 --- a/README.jp +++ b/README.jp @@ -2,7 +2,7 @@ If you read this file _as_is_, just ignore the funny characters you see. It is written in the POD format (see perlpod manpage) which is specially designed to be readable as is. -The following documentation is written in FOO encoding. +The following documentation is written in euc-jp encoding. =head1 NAME @@ -10,7 +10,7 @@ perljp - =head1 棱汤 -ようこそ Perl へ! +Perl の坤肠へようこそ! Perl 5.8.0 より、Unicodeサポ〖トが络升に动步され、その冯蔡ラテン矢机笆嘲の矢机コ〖ドのサポ〖トが CJK (面柜胳、泣塑胳、ハングル)を崔めて裁わりました。Unicodeは坤肠面の矢机を办つの矢机コ〖ドで胺うことを誊回した筛洁惮呈であり、澎から谰、はたまたその粗の矢机∈ギリシャ矢机、キリ〖ル矢机、アラビア矢机、ヘブライ矢机、ディ〖ヴァナガ〖リ矢机、などなど∷や、これまではOSベンダ〖が迫极に年めていた矢机(PCおよびMacintosh)がすでに崔まれています。 @@ -71,7 +71,7 @@ Perl5.8 =item * - 掐叫蜗 +掐叫蜗 笆布の毋はいづれもShift_JISの掐蜗をEUC-JPに恃垂して叫蜗します。 diff --git a/README.ko b/README.ko index e83bfc2a8c..404e392be2 100644 --- a/README.ko +++ b/README.ko @@ -1,179 +1,192 @@ -If you read this file _as_is_, just ignore the funny characters you -see. It is written in the POD format (see perlpod manpage) which is -specially designed to be readable as is. - -This file is in Korean encoded in EUC-KR. - -捞 巩辑甫 perldoc阑 结辑 焊瘤 臼绊 流立 焊绰 版快俊绰 阿 何盒狼 -开且阑 钎矫窍扁 困秦 静牢 =head, =item, 'L' 殿篮 公矫窍绞矫坷. -捞 巩辑绰 蝶肺 perldoc阑 静瘤 臼绊 焊歹扼档 佬绰单 喊 瘤厘捞 -绝绰 POD 屈侥栏肺 楼咯 乐嚼聪促. 歹 磊技茄 巴篮 perlpod -概春倔阑 曼绊窍绞矫坷. - - -=head1 NAME - -perlko - Perl苞 茄惫绢 牢内爹 - -=head1 DESCRIPTION - -Perl狼 技拌俊 坷脚 巴阑 券康钦聪促 ! - -Starting for Perl release 5.8.0 Perl has extensive support for Unicode -and as a part of that, extensive support for non-Latin characters -encodings, including the CJK (Chinese-Japanese Korean). Unicode is an -international standard that aims to include all of world's -characters: Western, Eastern, and everything in between (Greek, -Cyrillic, Arabic, Hebrew, Indic, Amerindian, and so on), and -encodings of various operating system platforms (PC and MacIntosh). - -Perl篮 5.8.0 滚傈俊辑何磐 蜡聪内靛/ISO 10646俊 措茄 堡裹困茄 瘤盔 扁瓷阑 -啊瘤绊 乐嚼聪促. 蜡聪内靛 瘤盔狼 老券栏肺 茄吝老阑 厚吩茄 技拌 阿惫俊辑 -蜡聪内靛 捞傈俊 静绊 乐菌绊 瘤陛档 澄府 静捞绊 乐绰 荐腹篮 牢内爹阑 -瘤盔钦聪促. 蜡聪内靛绰 傈 技拌俊辑 静捞绰 葛电 攫绢甫 困茄 钎扁 眉拌 - -蜡反狼 扼凭 舅颇邯, 虐副 舅颇邯, 弊府胶 舅颇邯, 牢档客 悼巢 酒矫酒狼 -宏扼固 胶农赋飘 拌凯, 酒而, 洒宏府, 茄吝老狼 茄磊, 茄惫绢狼 茄臂, -老夯绢狼 啊唱, 合固 牢叼救狼 钎扁 眉拌 殿- 荐侩窍绰 巴阑 格钎肺 窍绊 -乐扁 锭巩俊 扁粮俊 静捞带 阿 攫绢 棺 惫啊 弊府绊 款康 眉拌俊 绊蜡茄 -巩磊 笼钦苞 牢内爹阑 葛滴 器褒窍绊 乐嚼聪促. - - -Perl篮 郴何利栏肺 蜡聪内靛甫 巩磊 钎泅阑 困秦 荤侩钦聪促. 焊促 备眉利栏肺 -富窍搁 Perl 胶农赋飘 救俊辑 UTF-8 巩磊凯阑 镜 荐 乐绊, -阿辆 窃荐客 楷魂磊 (抗甫 甸绢, 沥痹侥, index, substr)啊 官捞飘 窜困 -措脚 蜡聪内靛 臂磊 窜困肺 悼累钦聪促. (歹 磊技茄 巴篮 -perlunicode 概春倔阑 曼绊窍绞矫坷.) 蜡聪内靛啊 澄府 焊鞭登扁 傈俊 -澄府 静捞绊 乐菌绊, 咯傈洒 澄府 静捞绊 乐绰 阿惫/阿 攫绢喊 牢内爹栏肺 -涝免仿阑 窍绊 捞甸 牢内爹栏肺 等 单捞磐客 巩辑甫 促风绰 巴阑 到扁 困秦 -'Encode'啊 静看嚼聪促. 公均焊促 'Encode'甫 结辑 荐腹篮 牢内爹 荤捞狼 -函券阑 奖霸 且 荐 乐嚼聪促. - -'Encode'绰 促澜苞 鞍篮 茄惫绢 牢内爹阑 瘤盔钦聪促. - - euc-kr : US-ASCII客 KS X 1001阑 鞍捞 静绰 钢萍官捞飘 牢内爹 - (如洒 肯己屈捞扼绊 阂覆.) KS X 2901苞 RFC 1557 曼绊. - cp949 : MS-Windows 9x/ME俊辑 静捞绰 犬厘 肯己屈. - euc-kr俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙. - alias绰 uhc, windows-949, x-windows-949, - ks_c_5601-1987. 盖 付瘤阜 捞抚篮 利例窍瘤 臼篮 - 捞抚捞瘤父, Microsoft 力前俊辑 CP949狼 狼固肺 - 静捞绊 乐澜. - johab : KS X 1001:1998 何废 3俊辑 痹沥茄 炼钦屈. - 巩磊 饭欺配府绰 cp949客 付蛮啊瘤肺 US-ASCII, - KS X 1001俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙. - - iso-2022-kr : RFC 1557俊辑 痹沥茄 茄惫绢 牢磐齿 皋老 背券侩 牢内爹栏肺 - US-ASCII客 KS X 1001阑 饭欺配府肺 窍绰 痢俊辑 - euc-kr苞 鞍瘤父 牢内爹 规侥捞 促抚. - 1997-8斥 版鳖瘤 静看栏唱 歹 捞惑 皋老 背券俊 静捞瘤 - 臼澜. - ksc5601-raw : KS X 1001(KS C 5601)阑 GL(溜, MSB甫 0栏肺 茄 版快) - 俊 初疽阑 锭狼 牢内爹. US-ASCII客 搬钦窍瘤 臼绊 - 窜刀栏肺 静捞绰 老篮 X11 殿俊辑 臂裁 牢内爹 - (ksc5601.1987-0. '0'篮 GL阑 狼固窃.)栏肺 静捞绰 巴阑 - 力寇窍绊绰 芭狼 绝澜. - -抗甫 甸绢, euc-kr 牢内爹栏肺 等 颇老阑 UTF-8肺 函券窍妨搁 促澜苞 -鞍捞 窍搁 邓聪促. - - - perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8 - -开函券篮 促澜苞 鞍捞 且 荐 乐嚼聪促. - - perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr - -捞繁 函券阑 粱歹 祈府窍霸 且 荐 乐档废 Encode 葛碘阑 结辑 -鉴荐窍霸 Perl肺父 静牢 piconv啊 Perl俊 甸绢 乐嚼聪促. -弊 捞抚俊辑 舅 荐 乐淀捞 piconv绰 Unix俊 乐绰 iconv甫 -葛胆肺 茄 巴涝聪促. 弊 荤侩过篮 酒贰客 鞍嚼聪促. - - piconv -f FOO -t utf8 < file.euckr > file.utf8 - piconv -f utf8 -t FOO < file.utf8 > file.euckr - -肚, 'encoding' 葛碘阑 结辑 茄惫绢 牢内爹阑 静搁辑 臂磊 窜困 -(官捞飘 窜困啊 酒聪扼) 贸府甫 奖霸 且 荐 乐嚼聪促. - - #!/usr/local/bin/perl - - use encoding 'euc-kr', STDIN => 'euc-kr', - STDOUT-> 'euc-kr', STDERR=>'euc-kr'; - - print length("啊唱"); # 2 (奴 蝶咳钎绰 臂磊 窜困 贸府甫 瘤矫) - print length('啊唱'); # 4 (累篮 蝶咳钎绰 官捞飘 窜困 贸府甫 瘤矫) - print index("茄碍, 措悼碍", "堪"); # -1 ('堪'捞 绝澜) - print index('茄碍, 措悼碍', '堪'); # 7 (8锅掳客 9锅掳 官捞飘啊 '堪'狼 - 内靛蔼苞 老摹窃.) - - -=head2 歹 磊技洒 舅绊 酵栏搁... - -Perl阑 汲摹窍搁 措窜洒 磊技茄 巩辑啊 鞍捞 蝶扼 坷哥, 捞 巩辑甫 烹秦 -Perl 傈馆 挥 酒聪扼 蜡聪内靛 瘤盔, Encode狼 荤侩过 殿俊 腹篮 巴阑 -硅匡 荐 乐嚼聪促. 阂青洒档 捞 巩辑绰 泅犁 葛滴 康绢肺 静咯 乐嚼聪促. -捞 巩辑 寇俊档 促澜苞 鞍篮 磊丰啊 乐嚼聪促. 捞 格废篮 搬内 -肯傈茄 巴捞 酒聪绊 老何 措钎利牢 巴父 葛篮 巴涝聪促. - - -=head2 Perl 包访 磊丰 - -=over 4 - -=item L - - O'Reilly狼 Perl 昆 其捞瘤 - -=item L - - Comprehensive Perl Archive Network - -=item L - - Perl 皋老傅 府胶飘. 腹篮 府胶飘 啊款单 - perl-unicode俊辑 'Encode'俊 措秦 稠狼窃. - -=back - -=head2 Perl阑 歹 表霸 傍何窍绰单 档框阑 临 荐 乐绰 茄惫绢 包访 荤捞飘 - -=over 4 - -=item L - - O'Reilly俊辑 唱柯 茄惫绢 Perl 辑利 格废 - -=item L - - Perl俊 包访等 CGI, DB, 楷悼 殿俊 措茄 沥焊 棺 春胶 力傍 - -=back - -=head2 蜡聪内靛 包访 磊丰 - -=over 4 - -=item L - - 蜡聪内靛 牧家矫决. - -=item L - -扁夯利栏肺 Unicode客 鞍篮 ISO 钎霖牢 ISO/IEC 10646 UCS(Universal -Character Set)阑 父靛绰 ISO/IEC JTC1/SC2/WG2狼 昆 其捞瘤. - -=item L - - 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ) - -=item L - - 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)狼 茄惫绢 锅开 - -=back - -=head1 AUTHORS - -Jarkko Hietaniemi Ejhi@iki.fiE -脚沥侥 Ejshin@mailaps.org - -=cut +If you read this file _as_is_, just ignore the funny characters you +see. It is written in the POD format (see perlpod manpage) which is +specially designed to be readable as is. + +This file is in Korean encoded in EUC-KR. + +捞 巩辑甫 perldoc阑 结辑 焊瘤 臼绊 流立 焊绰 版快俊绰 阿 何盒狼 +开且阑 钎矫窍扁 困秦 静牢 =head, =item, 'L' 殿篮 公矫窍绞矫坷. +捞 巩辑绰 蝶肺 perldoc阑 静瘤 臼绊 焊歹扼档 佬绰单 喊 瘤厘捞 +绝绰 POD 屈侥栏肺 楼咯 乐嚼聪促. 歹 磊技茄 巴篮 perlpod +概春倔阑 曼绊窍绞矫坷. + + +=head1 NAME + +perlko - Perl苞 茄惫绢 牢内爹 + +=head1 DESCRIPTION + +Perl狼 技拌俊 坷脚 巴阑 券康钦聪促 ! + + +Perl篮 5.8.0魄何磐 蜡聪内靛/ISO 10646俊 措茄 堡裹困茄 瘤盔阑 钦聪促. +蜡聪内靛 瘤盔狼 老券栏肺 茄吝老阑 厚吩茄 技拌 阿惫俊辑 +蜡聪内靛 捞傈俊 静绊 乐菌绊 瘤陛档 澄府 静捞绊 乐绰 荐腹篮 牢内爹阑 +瘤盔钦聪促. 蜡聪内靛绰 傈 技拌俊辑 静捞绰 葛电 攫绢甫 困茄 钎扁 眉拌 - +蜡反狼 扼凭 舅颇邯, 虐副 舅颇邯, 弊府胶 舅颇邯, 牢档客 悼巢 酒矫酒狼 +宏扼固 拌凯 胶农赋飘, 酒而 巩磊, 洒宏府 巩磊, 茄吝老狼 茄磊, 茄惫绢狼 茄臂, +老夯绢狼 啊唱, 合固 牢叼救狼 钎扁 眉拌 殿- 荐侩窍绰 巴阑 格钎肺 窍绊 +乐扁 锭巩俊 扁粮俊 静捞带 阿 攫绢 棺 惫啊 弊府绊 款康 眉拌俊 绊蜡茄 +巩磊 笼钦苞 牢内爹阑 葛滴 器褒窍绊 乐嚼聪促. + + +Perl篮 郴何利栏肺 蜡聪内靛甫 巩磊 钎泅阑 困秦 荤侩钦聪促. 焊促 备眉利栏肺 +富窍搁 Perl 胶农赋飘 救俊辑 UTF-8 巩磊凯阑 镜 荐 乐绊, +阿辆 窃荐客 楷魂磊(抗甫 甸绢, 沥痹侥, index, substr)啊 官捞飘 窜困 +措脚 蜡聪内靛 臂磊 窜困肺 悼累钦聪促. (歹 磊技茄 巴篮 +perlunicode 概春倔阑 曼绊窍绞矫坷.) 蜡聪内靛啊 澄府 焊鞭登扁 傈俊 +澄府 静捞绊 乐菌绊, 咯傈洒 澄府 静捞绊 乐绰 阿惫/阿 攫绢喊 牢内爹栏肺 +涝免仿阑 窍绊 捞甸 牢内爹栏肺 等 单捞磐客 巩辑甫 促风绰 巴阑 到扁 困秦 +'Encode'啊 静看嚼聪促. 公均焊促 'Encode'甫 结辑 荐腹篮 牢内爹 荤捞狼 +函券阑 奖霸 且 荐 乐嚼聪促. + +'Encode'绰 促澜苞 鞍篮 茄惫绢 牢内爹阑 瘤盔钦聪促. + + euc-kr : US-ASCII客 KS X 1001阑 鞍捞 静绰 钢萍官捞飘 牢内爹 + (如洒 肯己屈捞扼绊 阂覆.) KS X 2901苞 RFC 1557 曼绊. + cp949 : MS-Windows 9x/ME俊辑 静捞绰 犬厘 肯己屈. + euc-kr俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙. + alias绰 uhc, windows-949, x-windows-949, + ks_c_5601-1987. 盖 付瘤阜 捞抚篮 利例窍瘤 臼篮 + 捞抚捞瘤父, Microsoft 力前俊辑 CP949狼 狼固肺 + 静捞绊 乐澜. + johab : KS X 1001:1998 何废 3俊辑 痹沥茄 炼钦屈. + 巩磊 饭欺配府绰 cp949客 付蛮啊瘤肺 US-ASCII, + KS X 1001俊 8,822磊狼 茄臂 澜例阑 歹茄 巴烙. + + iso-2022-kr : RFC 1557俊辑 痹沥茄 茄惫绢 牢磐齿 皋老 背券侩 牢内爹栏肺 + US-ASCII客 KS X 1001阑 饭欺配府肺 窍绰 痢俊辑 + euc-kr苞 鞍瘤父 牢内爹 规侥捞 促抚. + 1997-8斥 版鳖瘤 静看栏唱 歹 捞惑 皋老 背券俊 静捞瘤 + 臼澜. + ksc5601-raw : KS X 1001(KS C 5601)阑 GL(溜, MSB甫 0栏肺 茄 版快) + 俊 初疽阑 锭狼 牢内爹. US-ASCII客 搬钦窍瘤 臼绊 + 窜刀栏肺 静捞绰 老篮 X11 殿俊辑 臂裁 牢内爹 + (ksc5601.1987-0. '0'篮 GL阑 狼固窃.)栏肺 静捞绰 巴阑 + 力寇窍绊绰 芭狼 绝澜. + +抗甫 甸绢, euc-kr 牢内爹栏肺 等 颇老阑 UTF-8肺 函券窍妨搁 促澜苞 +鞍捞 窍搁 邓聪促. + + + perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8 + +开函券篮 促澜苞 鞍捞 且 荐 乐嚼聪促. + + perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr + +捞繁 函券阑 粱歹 祈府窍霸 且 荐 乐档废 Encode 葛碘阑 结辑 +鉴荐窍霸 Perl肺父 静牢 piconv啊 Perl俊 甸绢 乐嚼聪促. +弊 捞抚俊辑 舅 荐 乐淀捞 piconv绰 Unix俊 乐绰 iconv甫 +葛胆肺 茄 巴涝聪促. 弊 荤侩过篮 酒贰客 鞍嚼聪促. + + piconv -f euc-kr -t utf8 < file.euckr > file.utf8 + piconv -f utf8 -t euc-kr < file.utf8 > file.euckr + +肚, 'encoding' 葛碘阑 结辑 茄惫绢 牢内爹阑 静搁辑 臂磊 窜困 +(官捞飘 窜困啊 酒聪扼) 贸府甫 奖霸 且 荐 乐嚼聪促. + + #!/usr/local/bin/perl + + use encoding 'euc-kr', STDIN => 'euc-kr', + STDOUT-> 'euc-kr', STDERR=>'euc-kr'; + + print length("啊唱"); # 2 (奴 蝶咳钎绰 臂磊 窜困 贸府甫 瘤矫) + print length('啊唱'); # 4 (累篮 蝶咳钎绰 官捞飘 窜困 贸府甫 瘤矫) + print index("茄碍, 措悼碍", "堪"); # -1 ('堪'捞 绝澜) + print index('茄碍, 措悼碍', '堪'); # 7 (8锅掳客 9锅掳 官捞飘啊 '堪'狼 + 内靛蔼苞 老摹窃.) + + +=head2 歹 磊技洒 舅绊 酵栏搁... + +Perl阑 汲摹窍搁 措窜洒 磊技茄 巩辑啊 鞍捞 蝶扼 坷哥, 捞 巩辑甫 烹秦 +Perl 傈馆 挥 酒聪扼 蜡聪内靛 瘤盔, Encode狼 荤侩过 殿俊 腹篮 巴阑 +硅匡 荐 乐嚼聪促. 阂青洒档 捞 巩辑绰 泅犁 葛滴 康绢肺 静咯 乐嚼聪促. +捞 巩辑 寇俊档 促澜苞 鞍篮 磊丰啊 乐嚼聪促. 捞 格废篮 搬内 +肯傈茄 巴捞 酒聪绊 老何 措钎利牢 巴父 葛篮 巴涝聪促. + + +=head2 Perl 包访 磊丰 + +=over 4 + +=item L + + O'Reilly狼 Perl 昆 其捞瘤 + +=item L + + Comprehensive Perl Archive Network + +=item L + + Perl 皋老傅 府胶飘. 腹篮 府胶飘 啊款单 + perl-unicode俊辑 'Encode'俊 措秦 稠狼窃. + +=back + +=head2 Perl阑 歹 表霸 傍何窍绰单 档框阑 临 荐 乐绰 茄惫绢 包访 荤捞飘 + +=over 4 + +=item L + + Perl 茄惫 荤侩磊 葛烙 + +=item L + + 茄惫绢 Perl 春胶 弊缝 + +=item L + + Perl 噶芭胶 (辑匡) + +=item L + + Home for Korean Perlmanias + +=item L + + O'Reilly俊辑 唱柯 茄惫绢 Perl 辑利 格废 + +=item L + + Perl 扁檬 碍谅 棺 家胶, 弥辟 悼氢, 包访 秦寇 荤捞飘 傅农 + +=item L + + Perl俊 包访等 CGI, DB, 楷悼 殿俊 措茄 沥焊 棺 春胶 力傍 + +=back + +=head2 蜡聪内靛 包访 磊丰 + +=over 4 + +=item L + + 蜡聪内靛 牧家矫决. + +=item L + +扁夯利栏肺 Unicode客 鞍篮 ISO 钎霖牢 ISO/IEC 10646 UCS(Universal +Character Set)阑 父靛绰 ISO/IEC JTC1/SC2/WG2狼 昆 其捞瘤. + +=item L + + 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ) + +=item L + + 蜡葱胶/府椽胶俊辑 蜡聪内靛客 UTF-8 荤侩俊 措茄 巩翠笼(FAQ)狼 茄惫绢 锅开 + +=back + +=head1 AUTHORS + +Jarkko Hietaniemi Ejhi@iki.fiE +脚沥侥 Ejshin@mailaps.org + +=cut diff --git a/README.tw b/README.tw index 02c0d4e22b..698b5d7724 100644 --- a/README.tw +++ b/README.tw @@ -4,9 +4,9 @@ specially designed to be readable as is. The following documentation is written in Big5 encoding. -狦ノゅ絪胯竟綷凝硂ゅン, 叫┛菠ゅい疭爹癘才. 硂ゅ -ン琌 POD (虏ゅンΑ) 糶Θ; 硂贺Α琌琵钡弄τ疭砞璸 -. 闽Α秈˙戈癟, 叫把σ perlpod 絬ゅン. +狦ノゅ絪胯竟綷凝硂ゅン, 叫┛菠ゅい疭爹癘才. +硂ゅン琌 POD (虏ゅンΑ) 糶Θ; 硂贺Α琌琵钡弄, +τ疭砞璸. 闽Α秈˙戈癟, 叫把σ perlpod 絬ゅン. =head1 NAME @@ -16,20 +16,20 @@ perltw - 舧ㄓ Perl ぱ! -眖 5.8.0 秨﹍, Perl ㄣ称冈荷 Unicode (窾瓣絏) や穿, 硈盿や穿 -砛┰粂╰絪絏よΑ; CJK (いら龙) 獽琌ㄤい场. Unicode 琌 -瓣悔┦夹非, 刚瓜瞇籠┮Τ才: ﹁よ, 狥よ, のㄢ丁 -ち (镁ゅ, 痹ㄈゅ, ┰ゅ, ㄓゅ, ゅ, ゅ, 单单). -ウ甧贺穨╰参籔キ籓 ( PC の沉娥). +眖 5.8.0 秨﹍, Perl ㄣ称Ч到 Unicode (窾瓣絏) や穿, +硈盿や穿砛┰粂╰絪絏よΑ; CJK (いら龙) 獽琌ㄤい场. +Unicode 琌瓣悔┦夹非, 刚瓜瞇籠┮Τ才: ﹁よ, 狥よ, +のㄢ丁ち (镁ゅ, 痹ㄈゅ, ┰ゅ, ㄓゅ, ゅ, +ゅ, 单单). ウ甧贺穨╰参籔キ籓 ( PC の沉娥). Perl セō Unicode 秈︽巨. 硂ボ Perl ず场﹃戈ノ Unicode -ボ, Perl ㄧΑ籔衡才 (ㄒタ砏ボΑゑ癸) 癸 Unicode 秈︽巨. -块の块, 矪瞶 Unicode ぇ玡絪絏よΑ纗戈, Perl 矗ㄑ -Encode硂家舱, 琵淮弄の糶侣Τ絪絏戈. +ボ; Perl ㄧΑ籔衡才 (ㄒタ砏ボΑゑ癸) 癸 Unicode 秈︽巨. +块の块, 矪瞶 Unicode ぇ玡絪絏よΑ纗戈, Perl +矗ㄑ Encode 硂家舱, 琵淮弄の糶侣Τ絪絏戈. Encode ┑家舱や穿タ砰いゅ絪絏よΑ: - big5 程 Big5 絪絏 + big5 ﹍ Big5 絪絏 (ぱらゅ) big5-hkscs Big5 + 翠栋 cp950 絏 950 (Big5 + 稬硁睰才) @@ -37,8 +37,7 @@ Encode perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8 -Perl ずpiconv, やЧ Perl 糶Θ才锣传ㄣ祘Α, ノ猭 -: +Perl ず "piconv", やЧ Perl 糶Θ才锣传ㄣ祘Α, ノ猭: piconv -f big5 -t utf8 < file.big5 > file.utf8 piconv -f utf8 -t big5 < file.utf8 > file.big5 @@ -47,13 +46,15 @@ Perl #!/usr/bin/env perl # 币笆 big5 ﹃秆猂; 夹非块の夹非岿粇常砞 big5 絪絏 - use encoding 'big5', STDIN => 'big5', - STDOUT => 'big5', STDERR => 'big5'; - + use encoding 'big5', STDIN => 'big5', STDOUT => 'big5'; print length("纃緈"); # 2 (蛮ま腹ボ才) print length('纃緈'); # 4 (虫ま腹ボじ舱) print index("轿轿毙唬", "谓伪"); # -1 (ぃ﹃) - print index('轿轿毙唬', '谓伪'); # 1 (眖材竊秨﹍) + print index('轿轿毙唬', '谓伪'); # 1 (眖材じ舱秨﹍) + +程ㄒ柑, "轿" 材じ舱籔 "轿" 材じ舱挡Θ Big5 +絏 "谓"; "轿" 材じ舱玥籔 "毙" 材じ舱挡Θ "伪". +硂秆∕玡 Big5 絏ゑ癸矪瞶盽ǎ拜肈. =head2 肂いゅ絪絏 @@ -66,14 +67,18 @@ Encode::HanExtra , Encode::HanConvert 家舱玥矗ㄑ虏羉锣传ノㄢ贺絪絏: big5-simp Big5 タ砰いゅ籔 Unicode 虏砰いゅが锣 - gbk-trad GBK 虏砰いゅ籔 Unicode 羉砰いゅが锣 + gbk-trad GBK 虏砰いゅ籔 Unicode タ砰いゅが锣 + +璝稱 GBK 籔 Big5 ぇ丁が锣, 叫把σ赣家舱ず b2g.pl 籔 g2b.pl ㄢや祘Α, +┪祘Αずㄏノ糶猭: -璝稱 GBK 籔 Big5 ぇ丁が锣, 叫把σ赣家舱ず b2g.pl 籔 g2b.pl ㄢ -や祘Α. + use Encode::HanConvert; + $euc_cn = big5_to_gb($big5); # 眖 Big5 锣 GBK + $big5 = gb_to_big5($euc_cn); # 眖 GBK 锣 Big5 =head2 秈˙戈癟 -叫把σ Perl ず秖弧ゅン (ぃ┋琌ノ璣ゅ糶) , ㄓ厩策闽 +叫把σ Perl ず秖弧ゅン (ぃ┋琌ノ璣ゅ糶), ㄓ厩策闽 Perl 醚, の Unicode ㄏノよΑ. ぃ筁, 场戈方讽伦碔: =head2 矗ㄑ Perl 戈方呼 @@ -134,8 +139,26 @@ Unicode Unix/Linux  UTF-8 の Unicode 氮拜 +=head2 いゅて戈癟 + +=item ぐ或 "タ砰いゅ" ぃ "羉砰いゅ"? + +L + +=item いゅて硁砰羛幅 + +L + +=item Linux 硁砰いゅて璸购 + +L + =back +=head1 SEE ALSO + +L, L, L, L, L + =head1 AUTHORS Jarkko Hietaniemi Ejhi@iki.fiE