軟件本地化測試的技術問題之字符集問題本地化軟件測試
首先要討論的問題就是不同字符集的使用。西方語言,如英語、法語和德語,使用不到256個字符,所以它們可以用單字節編碼表示!綰是亞洲語言,比如中文和日文,卻有幾萬個字符,所以需要職字節編碼。因此在做本地化測試的時候,應該檢查開發人員是否使用了正確的字符編碼。
不同的操作系統采用不同的方法輸八和輸出字節,這些不同的方法使字符的編碼規范化從而代表不同的語言,這樣我們就很容易看出在特定的編碼中哪些寧符是被支持的,哪些字符是不被支持的。比如,英文字符幾乎被所有的編碼作為子集而提供支持,但是某些重音字符(如∈,e)和所有其他的擴展符弓卻不一定被支持。字符集是操作系統r”所使用的字符映射表,例如,某些uNIx系統使用只包含128字符的7位AscII字符集(包括Tab、空格、標點、符號、大小寫字母、數字和回車鍵等)。然而對于很多語言來說,7位AscII字符集遠遠不夠。因為它不包含特殊字符(比如6、a或a)。所以一個新的標準8位AscII誕生了,它包含256個字符。微軟的wind使用的就是8位AscII字符集,對于uNIx計算機,還有一個IsO標準(Is08859.x),微軟和IsO標準極為相似。但是即使擁有256個字符,8位AscII還是無法滿足所有語言的需求。漢語、U語和韓語這些語言的字符都很多,仍無法適用擴展后的AscII字符集,對于
這些語言,可以使用16位字符集(雙字節、多字節或變數字節),這就是后來產生的統一的字符編碼標準unicode,采用取字節對字符進行編碼,幾乎包含了所有語言的每個字符。目前,很多操作系統都支持unicode,如windowsNT4 0、windows 2000、windowsxP和uNⅨ系列。
文章來源于領測軟件測試網 http://www.kjueaiud.com/