中文資訊科技應用 | 首頁 | 前頁 | 交流 | 搜尋 | 地圖

中文教學 > 中文資訊科技應用 > 中文編碼 > 中文亂碼

中文亂碼


亂碼之源:編碼與解碼不一致

根據 Shannon & Weaver 的傳播理論,語言訊息先經發訊人編碼,成為電子資訊以供 電腦處理與傳播,收訊人便以發訊人所用的編碼系統解碼,把資訊還原為語言訊息,便可理解。

發訊人 > 訊息 > 編碼 > 資訊 > 解碼 > 訊息 > 收訊人

問題顯然是,由於中文字(或漢字)的編碼系統很多,一旦發訊人所用的編碼系統與收訊人所用的解碼系統並不相同時,資訊便不能還原為原來 的語言訊息,也就是說,收訊人解編的結果無法理解,是不可理喻的「亂碼」。


亂碼示例

SAMPLE.HTM 16-Feb-04 17:10 1K
WWStar.txt 17-Feb-04 16:33 1K
dec.htm 17-Feb-04 16:33 1K
email.htm 17-Feb-04 16:33 3K
sample.htm 16-Feb-04 17:10 1K
uni.htm 17-Feb-04 16:33 1K
uni2dec.htm 17-Feb-04 16:33 1K

解決亂碼的方法

1. 以發訊人所用的編碼系統解碼。

2. 猜測發訊人所用的編碼系統,以發訊人所用的編碼系統解碼。

3. 運用軟件猜測發訊人所用的編碼系統。