Tutorial(MovableType 3 入門 )
ティプス1(文字エンコード)
シフトJIS:
主にパソコンで使用されてきたエンコード。WINDOWSやMACINTOSHで使用される。
文字集合としてJISX0201とJISX0208などを含む。
charsetパラメータなどで指定する場合の名前は"Shift_JIS"。区切りはアンダースコア(_)であって、ハイフン(-)でないことに注意。
ISO-2022-JP(JISコード)
主にインターネットの電子メールなどに使用されてきたエンコード。
文字集合としてUS-ASCII、JISX0202、JIS0208などを含む。
JISあるいはJISコードと呼ばれる場合もあるが、実際にはJIS(日本工業規格)の多くのコードの中の主要ではない1つにコードに過ぎない。また、ISO/IECに規格である。 ISO/IEC2022とも実は関係がない。
charsetパラメータなどで指定する場合の名前は"ISO-2022-JP"。
EUC-JP
主にUNIXワークステーションなどで使用されるエンコード、現在はLINUXなどでも使われる。
文字集合としてUS-ASCII、JISX0208などを含む。
charsetパラメータなどで指定する場合の名前は,"EUC-JP"、単に"EUC"と書くことはできないことに注意。
EUCには各国語版があり、日本語用のものはそれを示す-JPを名前に前につける必要がある。
UTF-8
これからのインターネットの標準とされるエンコード、どのエンコードを使っても大差ない場合は、これを使うのが最も安全。
US-ASCIIと互換性がある。 文字集合はISO/IEC10646(Unicode)。 charsetパラメータなどで指定する場合の名前は"UTF-8"。
UTF-16
UTF-8と同様にISO/IEC10646(Unicode)を文字集合として持つが、最下位の桁から書いていく「リトルエンディアン」と最上位から書いていく「ビッグエンディアン」があるが、
UTF-16はその影響を受け、「リトルエンディアンのUTF-16」と「ビッグエンディアンのUTF-16」がある。
(UTF-8は影響を受けないので、その区別はない。)
charsetパラメータなどで指定する場合の名前は"UTF-16"。