Iso8859-1是西方國家頻繁使用的字符編碼格式。用iso8859-1編碼unicode碼中的東方字庫部分的字符時統統編碼成??,也就是說:用iso8859-1編碼unicode碼時信息會有損失。但用iso8859-1解碼任意(iso8859-1編碼的和非iso8859-1編碼的)字符流時,信息不會有損失,這是因為一個字節中的所有256個字符對iso8859-1都是合法的都是合法的。有時候在一些linux操作系統和一些應用服務器里,默認的解碼方式是iso8859-1,這是大多數亂碼的原因。
Gb18030, gbk,gb2312是漢字字符的編碼格式,用gb18030(gbk,gb2312和gb18030是同一系列,不過字庫要小,但使用方式是一樣的,這里不區分,統統用gb18030)編碼unicode碼時非中英文的字符會被編碼為?,也就是說,用gb18030只能編碼unicode中的中英文字符,其他的字符都會被損失掉。同樣用gb18030解碼只能解碼gb18030編碼的字符流。
文章來源于領測軟件測試網 http://www.kjueaiud.com/