記事本的ANSI另存新檔是什麼?
我們在記事本上面另存新檔所看到的編碼選項:ANSI,他其實並不是一種編碼,那它到底是什麼呢?
ASCII
你可以在ASCII的維基頁面獲得更多相關資訊。簡單來說,ASCII包含128個字符,分為控制字元和顯示字元。它主要用於顯示英文26個字母,並不包含其他語言,如中文、日文等。
根據我查找的資訊,這裡的ANSI通常指的是Windows系統上的標準代碼頁,即微軟的Windows-1252。
Windows-1252,又稱CP-1252,是拉丁字母的單字元編碼,通常在Microsoft Windows中用於英語和一些羅曼語言(西班牙語、葡萄牙語、法語和德語)。然而,這個編碼並不包含中文。對於中文,Windows系統有不同的代碼頁,如繁體中文使用的是codepage 950,而簡體中文則使用codepage 936,分別對應著BIG5和GB2312、GBK字元集。
UTF8
這種情況帶來了一些問題,因此後來出現了 Unicode,其目標是讓所有文字都能使用同一種編碼,從而解決編碼問題。UTF8則是它的一種編碼方式。對於Unicode的詳細資訊,可參考這篇文章:聊聊編碼那些事——Unicode,gb2312,cp936,GBK,GB18030。
ANSI
總之,當你在記事本中選擇ANSI另存新檔時,實際上是使用你目前作業系統的預設編碼來保存檔案。例如,如果你使用繁體中文,則編碼可能是BIG5;如果使用簡體中文,則可能是GBK編碼。要避免出現亂碼,建議使用UTF-8編碼。
後記
我將原本的草稿丟給ChatGPT潤飾,捨棄了很多贅詞、口語化的語句,最終採用的是很精簡的重點,而想深究的人也可以查看參考連結獲取更多細節;其他的人也能粗略的瞭解這段緣由,挺好