Skip to content

Commit 29311f8

Browse files
committed
Issue #44
Do not translate ASCII and Unicode.
1 parent 934da82 commit 29311f8

11 files changed

+65
-69
lines changed

doc/digraph.jax

+9-10
Original file line numberDiff line numberDiff line change
@@ -27,8 +27,8 @@
2727
*E104* *E39*
2828
:dig[raphs] {char1}{char2} {number} ...
2929
ダイグラフ{char1}{char2}をリストに追加する。{number}
30-
そのキャラクタを表す10進表記。通常、文字はユニコードで
31-
ある|digraph-encoding| を参照。
30+
そのキャラクタを表す10進表記。通常、文字はUnicodeであ
31+
|digraph-encoding| を参照。
3232
例: >
3333
:digr e: 235 a: 228
3434
< ダイグラフの定義をを無効にするには最初の文字に
@@ -51,12 +51,11 @@ Vimは普通|+digraphs|特性を持ってコンパイルされる。この特性
5151
{訳注: 10進数はそのキャラクタのASCIIコードである。}
5252

5353
*digraph-encoding*
54-
10進数の数字は通常、その文字のユニコード番号である。Note その数字の意味は
55-
'encoding' が変わっても変わらない。必要ならば、その文字がユニコードから
56-
'encoding' へと変換される。そのためには変換が有効になっていなければならない。
57-
そうでないと処理が失敗する。NUL 文字は "10" と表示される。これは、内部的に NUL
58-
文字は NL で表現されているからである。ファイルに書き込むときに NUL 文字に変換
59-
される。
54+
10進数の数字は通常、その文字のUnicode番号である。Note その数字の意味は
55+
'encoding' が変わっても変わらない。必要ならば、その文字がUnicodeから'encoding'
56+
へと変換される。そのためには変換が有効になっていなければならない。そうでないと
57+
処理が失敗する。NUL 文字は "10" と表示される。これは、内部的に NUL文字は NL で
58+
表現されているからである。ファイルに書き込むときに NUL 文字に変換される。
6059

6160
Vim が |+multi_byte| 機能なしでコンパイルされている場合は、その文字を
6261
'encoding' と同じエンコーディングで指定しなければならない。次のようにするとよ
@@ -68,8 +67,8 @@ Vim が |+multi_byte| 機能なしでコンパイルされている場合は、
6867
digraph oe 189
6968
endif
7069
71-
これは、ユニコードで番号339、latin9 (iso-8859-15) で番号189の文字に対して
72-
ダイグラフ "oe" を定義している。
70+
これは、Unicodeで番号339、latin9 (iso-8859-15) で番号189の文字に対してダイグラ
71+
"oe" を定義している。
7372

7473
==============================================================================
7574
2. ダイグラフを使う *digraphs-use*

doc/eval.jax

+2-2
Original file line numberDiff line numberDiff line change
@@ -4451,8 +4451,8 @@ readfile({fname} [, {binary} [, {max}]])
44514451
バイナリモードでない場合:
44524452
- NLの前に現れるCR文字を除去する。
44534453
- 最後の行がNLで終わるかどうかは関係ない。
4454-
- 'encoding' がユニコードのときは UTF-8 のバイトオーダーマーク
4455-
は取り除かれる
4454+
- 'encoding' がUnicodeのときは UTF-8 のバイトオーダーマークは
4455+
取り除かれる
44564456
{max}を指定すると、読み込む行数の最大値となる。ファイルの最初
44574457
の10行をチェックするときに役に立つ: >
44584458
:for line in readfile(fname, '', 10)

doc/indent.jax

+1-2
Original file line numberDiff line numberDiff line change
@@ -82,8 +82,7 @@ Cのファイルに対して自動的に'cindent'をオンにしてそれ以外
8282
! '!' をキーの前に置くと、Vimはそのキーを挿入するのではなく替わりに現在
8383
の行のインデントを再調整する。これにより現在の行の再調整するためのコマ
8484
ンドキーを定義することができる。CTRL-Fはそのデフォルトキーである。
85-
CTRL-I<Tab>のアスキーコードだから、CTRL-Iを定義する際に気をつけるこ
86-
と。
85+
CTRL-I<Tab>のASCIIコードだから、CTRL-Iを定義する際に気をつけること。
8786
* '*' をキーの前に置くと、Vimはインデント再調整を行なってからそのキーを
8887
挿入する。'cinkeys' に "*<Return>"が含まれている時には、Vimは新しい行
8988
を作成する前に現在行のインデントを再調整する。

doc/index.jax

+2-2
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66

77
*index*
88
このファイルには各モードのすべてのコマンドが列挙されており、タグと短い説明が示
9-
されている。一覧はアスキーコード順に並んでいる
9+
されている。一覧はASCIIコード順に並んでいる
1010

1111
ヒント: 機能で検索するときは、検索コマンドを使用する。例えば、何かを削除するコ
1212
マンドを検索したいなら、"/削除"を使用する。
@@ -1100,7 +1100,7 @@ You found it, Arthur! *holy-grail*
11001100
|:argglobal| :argg[lobal] グローバル引数リストを使用する
11011101
|:arglocal| :argl[ocal] ローカル引数リストを使用する
11021102
|:argument| :argu[ment] 引数リストの指定したファイルを開く
1103-
|:ascii| :as[cii] カーソル位置の文字のアスキーコードを表示
1103+
|:ascii| :as[cii] カーソル位置の文字のASCIIコードを表示
11041104
|:autocmd| :au[tocmd] オートコマンドの入力と表示
11051105
|:augroup| :aug[roup] 使用するオートコマンドグループの選択と表示
11061106
|:aunmenu| :aun[menu] すべてのモードに対してメニュー項目を削除

doc/mbyte.jax

+21-22
Original file line numberDiff line numberDiff line change
@@ -27,8 +27,8 @@
2727
10. UTF-8を使う |mbyte-utf8|
2828
11. 主なオプション |mbyte-options|
2929

30-
NOTE: このファイルにはユニコードの文字が含まれている。他のエンコーディングを使
31-
用している場合は、変な文字、あるいは四角形として表示されるかもしれない。
30+
NOTE: このファイルにはUnicodeの文字が含まれている。他のエンコーディングを使用
31+
している場合は、変な文字、あるいは四角形として表示されるかもしれない。
3232

3333
==============================================================================
3434
1. はじめに (Getting started) *mbyte-first*
@@ -317,12 +317,12 @@ Note: すべてのエンコーディングは0から128までの文字がASCII
317317
2 euc-tw 繁体中国語 (Unix only)
318318
2 2byte-{name} Unix: ダブルバイトエンコーディングのどれか (Vim特有の名前)
319319
2 cp{number} MS-Windows: インストールされているダブルバイトのコードページ
320-
u utf-8 UTF-8にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
321-
u ucs-2 UCS-2にエンコードされた16ビットのユニコード (ISO/IEC 10646-1)
320+
u utf-8 UTF-8にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
321+
u ucs-2 UCS-2にエンコードされた16ビットのUnicode (ISO/IEC 10646-1)
322322
u ucs-2le リトルエンディアンのucs-2
323323
u utf-16 ucs-2を拡張してさらに多くの文字を表現できるようにしたもの
324324
u utf-16le リトルエンディアンのutf-16
325-
u ucs-4 UCS-4にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
325+
u ucs-4 UCS-4にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
326326
u ucs-4le リトルエンディアンのucs-4
327327

328328
{name}にはシステムがサポートしているエンコーディングの名前を入れることができ
@@ -418,8 +418,8 @@ MS-WindowsはリトルエンディアンのUCS-2を使用するので、MS-Windo
418418

419419
Unicode 8bit 機能する。(普通はこうしない)
420420
Unicode 2byte 機能しない。
421-
Unicode Unicode 問題なく機能する。(Vim内部ではユニコードはすべてUTF-8
422-
で扱われるため'termencoding'が空でも同じく機能する)
421+
Unicode Unicode 問題なく機能する。(Vim内部ではUnicodeはすべてUTF-8で扱
422+
われるため'termencoding'が空でも同じく機能する)
423423

424424
エンコーディングの変換 *charset-conversion*
425425

@@ -475,7 +475,7 @@ Vimはいろいろな場面で自動的にエンコーディングを変換す
475475
'encoding'の設定と違うエンコーディングのファイルを読み書きするときは、エンコー
476476
ディングを変換する必要がある。次の変換がサポートされている:
477477
- Latin-1(ISO-8859-1)、UTF-8、UCS-2、UCS-4の間の変換はVimが自前で行なう。
478-
- MS-Windowsでは、'encoding'がユニコードなら各コードページとの変換は機能する
478+
- MS-Windowsでは、'encoding'がUnicodeなら各コードページとの変換は機能する
479479
- 'charconvert'による変換。
480480
- 可能であれば、iconvライブラリを使用して変換することができる。
481481
古いバージョンのGNU iconv()では変換が失敗することがある(Vimが用意する
@@ -502,9 +502,8 @@ GUIではマルチバイト文字を完全にサポートしている。端末
502502
を設定する。Vimは入力された文字を'termencoding'から'encoding'へと変換する。そ
503503
して表示するときに'encoding'から'termencoding'へと変換する。端末のエンコーディ
504504
ングに、Vimが取り扱う文字がすべて含まれていない場合、文字の情報が失なわれてし
505-
まう。下記で説明しているxtermのように、ユニコードをサポートしている端末なら問
506-
題はない。ほぼすべての文字セットは情報を失なわずにユニコードに変換できるからで
507-
ある。
505+
まう。下記で説明しているxtermのように、Unicodeをサポートしている端末なら問題は
506+
ない。ほぼすべての文字セットは情報を失なわずにUnicodeに変換できるからである。
508507

509508

510509
UTF-8をXFree86 xtermで使う *UTF8-xterm*
@@ -1213,13 +1212,13 @@ Combining forms:
12131212
==============================================================================
12141213
10. UTF-8を使う (Using UTF-8) *mbyte-utf8* *UTF-8* *utf-8* *utf8*
12151214
*Unicode* *unicode*
1216-
ユニコードは、他の文字セットをすべて含むように設計された。そのため、どんな言語
1217-
のテキストでもユニコードを使って書くことができる(希少な言語を除く)。そして、
1218-
のエンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在さ
1219-
せることが可能である
1215+
Unicodeは、他の文字セットをすべて含むように設計された。そのため、どんな言語の
1216+
テキストでもUnicodeを使って書くことができる(希少な言語を除く)。そして、他のエ
1217+
ンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在させる
1218+
ことが可能である
12201219

1221-
ユニコードにはいくつかのエンコード法がある。もっとも一般的なのは、1文字を 1
1222-
たは複数バイトで表わすUTF-8であり、ASCII と後方互換性がある。MS-Windowsでは
1220+
Unicodeにはいくつかのエンコード法がある。もっとも一般的なのは、1文字を 1 また
1221+
は複数バイトで表わすUTF-8であり、ASCII と後方互換性がある。MS-Windowsでは
12231222
UTF-16 も使われる(以前は UCS-2 と呼ばれていた)。こちらは 16 ビットを基本単位と
12241223
する。Vimはこれらのエンコーディングすべてをサポートしているが、Vim でユニコー
12251224
ドを使う場合、内部では常に UTF-8 が使われている。
@@ -1235,8 +1234,8 @@ Vimは幅広くUTF-8をサポートしており、それは以下の環境で機
12351234
空白で埋められる。Note:オプション'guifontset'はGTK+ 2 GUIでは使用しない。
12361235

12371236
*bom-bytes*
1238-
ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのユニコードエンコー
1239-
ディングを判別するのに使われる:
1237+
ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのUnicodeエンコーディ
1238+
ングを判別するのに使われる:
12401239
EF BB BF utf-8
12411240
FE FF utf-16 big endian
12421241
FF FE utf-16 little endian
@@ -1275,9 +1274,9 @@ Overlong sequenceに対して特別な処理はされない。通常の文字と
12751274
{訳注: たぶん、"<00>"と表示されてるOverlong sequenceだけはたとえ|/\_.|でもマッ
12761275
チしないということ。}
12771276

1278-
ファイルやバッファには、ユニコードで表現できる範囲(31ビット)の文字をすべて書く
1279-
ことができる。ただし、それを表示できるのは使用フォントがその文字を提供している
1280-
場合のみ
1277+
ファイルやバッファには、Unicodeで表現できる範囲(31ビット)の文字をすべて書くこ
1278+
とができる。ただし、それを表示できるのは使用フォントがその文字を提供している場
1279+
合のみ
12811280

12821281
便利なコマンド:
12831282
- "ga"はカーソル位置の文字のコードを10進数、16進数、8進数で表示する。合成文字

doc/options.jax

+16-16
Original file line numberDiff line numberDiff line change
@@ -714,7 +714,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
714714
{Vi にはない}
715715
{Vimが|+multi_byte|機能付きでコンパイルされたときのみ
716716
有効}
717-
'encoding'が"utf-8"などユニコードエンコーディングのときのみ効果がある
717+
'encoding'が"utf-8"などUnicodeエンコーディングのときのみ効果がある
718718
East Asian Width Class Ambiguous な文字(ユーロ、登録商標記号、著作権記
719719
号、ギリシャ文字、キリル文字など)をどう扱うかを定める。
720720

@@ -1357,12 +1357,12 @@ Note 1番目の形式では、行全体がオプション指定に使われる
13571357
大文字・小文字の変更について詳細を指定する。このオプションはコンマ区切
13581358
りで以下の単語を含む:
13591359
internal 内部の大文字・小文字対応関数を使う。現在のロケールに
1360-
よって対応が変更されない。これは'encoding'がユニコード
1360+
よって対応が変更されない。これは'encoding'がUnicode
13611361
エンコーディング, "latin1", "iso-8859-15"のときのみ問
13621362
題になる。"internal"が除かれるとシステムライブラリ関数
13631363
towupper()とtowlower()が利用可能ならば使われる。
1364-
keepascii アスキー文字(0x00から0x7f)についてはUS大文字小文字対応
1365-
を使う。現在のロケールは効果を持たない。
1364+
keepascii ASCII文字(0x00から0x7f)についてはUS大文字小文字対応を
1365+
使う。現在のロケールは効果を持たない。
13661366
これはおそらくトルコ語でだけ問題になる。
13671367

13681368
*'cdpath'* *'cd'* *E344* *E346*
@@ -2601,9 +2601,9 @@ Note 1番目の形式では、行全体がオプション指定に使われる
26012601
照。
26022602

26032603
NOTE: このオプションの値を変更しても、Vim内部の既存のテキストのエンコー
2604-
ディングは変化しないので注意。非アスキー文字がおかしくなる恐れもある。
2605-
既定の値から変更しないか、Vimの起動時に限って設定すること。|multibyte|
2606-
を参照。メニューを再読み込みするには|:menutrans|を参照。
2604+
ディングは変化しないので注意。非ASCII文字がおかしくなる恐れもある。既
2605+
定の値から変更しないか、Vimの起動時に限って設定すること。|multibyte|
2606+
参照。メニューを再読み込みするには|:menutrans|を参照。
26072607

26082608
このオプションはモードライン (|modeline|) では設定できません。テキスト
26092609
が壊れてしまうため。
@@ -2856,13 +2856,13 @@ Note 1番目の形式では、行全体がオプション指定に使われる
28562856
警告: 文字エンコーディングを変換すると、情報が失われるおそれが
28572857
ある!'encoding' が "utf-8" だと、変換は大抵成功するし、逆変換
28582858
をしても同じテキストになる。'encoding' が "utf-8" でないときは、
2859-
非アスキー文字が失われるかもしれない!変換できない文字をどう扱
2860-
うかは引数|++bad|で指定することができる。
2861-
空ファイルやアスキー文字のみのファイルではほとんどのエンコーディングで
2862-
うまくので'fileencodings'の最初の値が使われる("ucs-bom"を除く。これ
2863-
はBOMがなければいけない)。他のエンコーディングがよければ自動コマンドイ
2864-
ベントBufReadPostを使って、そのエンコーディングが使われるかどうかを判
2865-
定すること。例: >
2859+
非ASCII文字が失われるかもしれない!変換できない文字をどう扱う
2860+
かは引数|++bad|で指定することができる。
2861+
空ファイルやASCII文字のみのファイルではほとんどのエンコーディングでう
2862+
まくので'fileencodings'の最初の値が使われる("ucs-bom"を除く。これは
2863+
BOMがなければいけない)。他のエンコーディングがよければ自動コマンドイベ
2864+
ントBufReadPostを使って、そのエンコーディングが使われるかどうかを判定
2865+
すること。例: >
28662866
au BufReadPost * if search('\S', 'w') == 0 |
28672867
\ set fenc=iso-2022-jp | endif
28682868
< これは、ファイルが空白文字しか含まないとき'fileencoding'
@@ -2873,7 +2873,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
28732873
:setglobal fenc=iso-8859-2
28742874
< とする。これは存在しないファイルが空のファイルとは異なるエンコーディン
28752875
グになることを意味する。
2876-
ファイル先頭にユニコードの BOM (Byte Order Mark: バイト順マーク) があ
2876+
ファイル先頭にUnicodeの BOM (Byte Order Mark: バイト順マーク) があ
28772877
るかどうか調べるには、"ucs-bom" という特別な値が使える。この値を
28782878
"utf-8" 等のUnicode系の値よりも後に指定すると正しく機能しない。
28792879
8ビットエンコーディング("latin1"など)の項目はリストの最後に書かなけれ
@@ -7205,7 +7205,7 @@ Note 1番目の形式では、行全体がオプション指定に使われる
72057205
的に'termencoding'が"utf-8"に設定される。
72067206
これを他の値に設定しようとしても失敗し、エラーメッセージが表示される。
72077207
Win32 GUIでは'termencoding'は入力された文字に対しては適用されない。
7208-
Win32では常にユニコード文字が渡されるからである
7208+
Win32では常にUnicode文字が渡されるからである
72097209
空のときは、'encoding' で指定されたエンコーディングが使われる。これが
72107210
通常の値である。
72117211
'termencoding''encoding' の組み合わせが全て正しいわけではない。

doc/pattern.jax

+1-1
Original file line numberDiff line numberDiff line change
@@ -511,7 +511,7 @@ after: \v \m \M \V マッチするもの ~
511511
|/\M| \M \M 以降のパターン文字を 'magic' がオフの状態で処理します
512512
|/\v| \v \v 以降のパターン文字を "very magic" で処理します
513513
|/\V| \V \V 以降のパターン文字を "very nomagic" で処理します
514-
|/\Z| \Z \Z ユニコードの合成文字かどうかを無視します
514+
|/\Z| \Z \Z Unicodeの合成文字かどうかを無視します
515515
ヘブライ語やアラビア語で母音を検索するときに便利です。
516516

517517
|/\%d| \%d \%d 10進数指定の特定の文字 (例 \%d123)

doc/quickref.jax

+3-3
Original file line numberDiff line numberDiff line change
@@ -610,9 +610,9 @@
610610
説明とヘルプへのリンクをつけてある。
611611

612612
各オプションの簡易説明: *option-list*
613-
'aleph' 'al' Aleph文字(ヘブライ語)用のアスキーとする
613+
'aleph' 'al' Aleph文字(ヘブライ語)用のASCIIコードとする
614614
'allowrevins' 'ari' 挿入モードとコマンドラインモードで、 CTRL-_
615-
使うことを認める。
615+
使うことを認める。
616616
'altkeymap' 'akm' デフォルトの第2言語(Farsi/ヘブライ)
617617
'ambiwidth' 'ambw' Unicode文字の不明瞭な文字幅を決定する
618618
'antialias' 'anti' Mac OS X: フォントを滑らかに表示する。
@@ -630,7 +630,7 @@
630630
'backupdir' 'bdir' バックアップファイル用のディレクトリを指定
631631
'backupext' 'bex' バックアップファイル用の拡張子
632632
'backupskip' 'bsk' 指定のパターンに合致するファイルはバックアップ
633-
しない。
633+
しない。
634634
'balloondelay' 'bdlay' バルーンウィンドウが出るまでの遅延時間(ms)
635635
'ballooneval' 'beval' バルーン評価のON/OFF
636636
'balloonexpr' 'bexpr' バルーンウィンドウに表示する式

0 commit comments

Comments
 (0)