很多中文問題就是從這兩個最簡單的類派生出來的。而卻有很多類
不直接支持把Encoding輸入,這給我們帶來諸多不便。很多程序難得用encoding
了,直接用default的encoding,這就給我們移植帶來了很多困難
--
2.UTF-8
--UTF-8是和Unicode一一對應的,其實現很簡單
--
-- 7位的Unicode: 0 _ _ _ _ _ _ _
--11位的Unicode: 1 1 0 _ _ _ _ _ 1 0 _ _ _ _ _ _
--16位的Unicode: 1 1 1 0 _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _
--21位的Unicode: 1 1 1 1 0 _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _
--大多數情況是只使用到16位以下的Unicode:
--"你"的gb碼是:0xC4E3 ,unicode是0x4F60
--我們還是用上面的例子
-- --例1:0xC4E3的二進制:
-- -- 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 1
-- -- 由于只有兩位我們按照兩位的編碼來排,但是我們發現這行不通,
-- -- 因為第7位不是0因此,返回"?"
文章來源于領測軟件測試網 http://www.kjueaiud.com/