掃二維碼與項(xiàng)目經(jīng)理溝通
我們在微信上24小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
在 Linux 操作系統(tǒng)中,中文編碼問題一直是用戶們比較頭疼的問題之一。因?yàn)椴煌木幋a方式會導(dǎo)致亂碼等一系列問題,尤其是在編輯文本等工作中尤為明顯。其中,GB2312 編碼是一種非常常用的中文編碼方式,本文將為讀者們介紹完整的 Linux 下 GB2312 中文編碼指南。

康樂網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、響應(yīng)式網(wǎng)站等網(wǎng)站項(xiàng)目制作,到程序開發(fā),運(yùn)營維護(hù)。創(chuàng)新互聯(lián)從2013年創(chuàng)立到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。
1. GB2312 簡介
GB2312 編碼是中國國家標(biāo)準(zhǔn)的漢字內(nèi)碼字符集,其中的每個(gè)字符用兩個(gè)字節(jié)表示,共收錄了 7,445 個(gè)一級漢字和 6,817 個(gè)二級漢字,同時(shí)還包括拉丁字母、筆畫和符號等。GB2312 的編碼范圍是0xB0A1~0xF7FE。
2. Linux下的GB2312編碼設(shè)置
在 Linux 操作系統(tǒng)中,對于行末符號、文件編碼等問題,不同的編輯器的處理方式不同。下面我們來介紹一下一些常用的編輯器設(shè)置:
(1)Gedit
Gedit 是 Linux 下的一款文本編輯器,它默認(rèn)是支持 GBK 和 UTF-8 編碼格式的。如果需要支持 GB2312 編碼,則需要安裝插件,在終端輸入以下指令即可:
“`
sudo apt-get install gedit-plugins
“`
然后,在 Gedit 編輯器中的“文件” – “打開”,“字符編碼”處選擇“GB2312”,就可以打開 GB2312 編碼格式的文本文件,或?qū)⒁延形谋巨D(zhuǎn)換成 GB2312 編碼格式。
(2)VIM
VIM 是 Linux 下的一種非常實(shí)用的文本編輯器,也支持 GB2312 編碼。在 VIM 編輯器中打開 GB2312 編碼文件時(shí),可以輸入以下命令將其轉(zhuǎn)換成 UTF-8 編碼:
“`
:set fileencoding=utf-8
“`
如果需要將已有的普通文本轉(zhuǎn)換成 GB2312 編碼,則可以輸入如下指令:
“`
iconv -f utf-8 -t gb2312 oldfile.txt > newfile.txt
“`
其中,oldfile.txt 是要轉(zhuǎn)換的文件,newfile.txt 是轉(zhuǎn)換后的目標(biāo)文件名。
(3)Sublime Text
Sublime Text 是 Linux 下的一款非常流行的文本編輯器,也支持 GB2312 編碼。在 Sublime Text 編輯器中,要支持 GB2312 編碼,則需要安裝相應(yīng)的插件,可通過在菜單 “Preferences” – “Packages” – “Package Control” 中搜尋并安裝 “GB2312 Encoding Support”。
有了上述編輯器的支持,在 Linux 環(huán)境下使用 GB2312 編碼就更加方便了。
3. GB2312 編碼轉(zhuǎn)換命令
除了編輯器的設(shè)置,我們也可以通過下面的命令來進(jìn)行 GB2312 編碼的操作。
(1)iconv
iconv 命令是一個(gè)非常實(shí)用的轉(zhuǎn)換編碼的命令,它可以將一種編碼轉(zhuǎn)換成另一種編碼格式。在 Linux 終端下,輸入以下指令即可將 UTF-8 編碼的文本轉(zhuǎn)換成 GB2312 編碼:
“`
iconv -f UTF-8 -t GB2312 oldfile.txt > newfile.txt
“`
其中,oldfile.txt 是要轉(zhuǎn)換的文件,newfile.txt 是轉(zhuǎn)換后的目標(biāo)文件名。
(2)chardet
chardet 命令是一款 Python 編寫的編碼檢測工具,它可以自動(dòng)檢測文件編碼格式。在 Linux 終端下,輸入以下指令即可檢測文件的編碼格式:
“`
chardet /path/to/file
“`
這里需要將 /path/to/file 替換成你要檢測的文件路徑即可。
4.
GB2312 編碼是一種常用的中文編碼方式,在 Linux 環(huán)境下的設(shè)置和操作也非常便捷。通過本文的介紹,相信讀者們已經(jīng)學(xué)會了如何在 Linux 下使用 GB2312 編碼。當(dāng)然,這里只是介紹了一些常用的編輯器和命令,還有其他的操作方式,讀者們可以自行探索和學(xué)習(xí)。
相關(guān)問題拓展閱讀:
windows上的壓縮,不要放到linux來解壓. LINUX用的是gzip ,bz
1、這是zip格式的缺陷,zip文件格式中沒有字段標(biāo)志出文件名的編碼格式。Windows下生成的zip文件中的編碼是GBK/GB2312等,而linux下的默認(rèn)編碼格式為UTF-8,所以才會出現(xiàn)亂碼。
2、解決方法
1、使用unzip解壓的時(shí)候,指定字符集(需要unzip支持,有些unzip命令不支持大O選項(xiàng),自己可以安裝較新的unzip版本):
md5@crc4:~/$ unzip -O CP936 test.zip
2、借助于p7zip和convmv:
a、在Fedora下的命令是
su -c ‘yum install p7zip convmv’
b、在ubuntu下的安裝命令是
sudo apt-get install p7zip convmv
安裝完之后,就可以用7za和convmv兩個(gè)命令完成解壓縮任務(wù)。
LANG=C 7za 搏基x your-zip-file.zip
convmv -f GBK -t utf8 –notest -r .
說明:
1)、之一條命令用于解壓縮,而LANG=C表示以US-ASCII這樣的編碼輸出文件名,如果基吵謹(jǐn)沒有這個(gè)語言設(shè)置,它同樣會輸出亂碼,只碰敬不過是UTF8格式的亂碼(convmv會忽略這樣的亂碼)。
2)、第二條命令是將GBK編碼的文件名轉(zhuǎn)化為UTF8編碼,-r表示遞歸訪問目錄,即對當(dāng)前目錄中所有文件進(jìn)行轉(zhuǎn)換。
網(wǎng)上找了很多,都有點(diǎn)麻煩,下面只需要一個(gè)命令即可。
我們納尺本地壓縮一般是GBK,而linux默認(rèn)是UTF-8,導(dǎo)致中答茄備文清毀亂碼,解壓如下:
linux解壓命令:unzip -O CP936 ***.zip
打開電腦,在桌面右鍵—》新建—》文本文檔行茄芹
然后右鍵文檔畢件—》打開方式—》記事本
打開記事本之后,我們的目的主要是查看文件的編碼格式系統(tǒng)納告默認(rèn)的什么,選擇頭部菜單的“文件–》另存為”
點(diǎn)擊之后,有一個(gè)另存為的彈窗出現(xiàn),如下圖,我們可以看到默認(rèn)編碼格式為”ANSI”
如果要更改編碼格式,那么就在編碼下拉框中選擇你需要的編碼格式
1.在Vim中直接進(jìn)行轉(zhuǎn)換文件編碼,比如將一個(gè)文件轉(zhuǎn)換成utf-8格式
:set fileencoding=utf-8
2. enconv 轉(zhuǎn)換文件編碼孝頌猛,比如要將一個(gè)GBK編碼的文件轉(zhuǎn)換成UTF-8編碼,操作如下
enconv -L zh_CN -x UTF-8 filename
3. iconv 轉(zhuǎn)換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個(gè)UTF-8 編碼的文件轉(zhuǎn)換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
查看文件編碼file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令進(jìn)行編碼轉(zhuǎn)換文件內(nèi)容編碼轉(zhuǎn)換 iconv命令用于轉(zhuǎn)換指定文件的編碼,默認(rèn)輸出到標(biāo)準(zhǔn)輸出設(shè)備,亦可指定輸出文件。 用法: iconv 有如下選項(xiàng)可用: 輸入/輸出格式規(guī)范: -f, –from-code=名稱 原始文本編碼巧橋 -t, –to-code=名稱 輸出編碼 信息: -l, –list 列舉所有已知的字符集 輸出控制: -c 從輸出中忽略無效的字符 -o, –output=FILE 輸出文件 -s, –silent 關(guān)閉警告 –verbose 打印進(jìn)度信息 -?, –help 給出該系統(tǒng)求助櫻譽(yù)列表 –usage 給出簡要的用法信息 -V, –version 打印程序版本號 例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 這個(gè)命令讀取aaa.txt文件,從utf-8編碼轉(zhuǎn)換為gb2312編碼,其輸出定向到bbb.txt文件。
在Linux下處理漢如棚指字的最和握省力的方法就是統(tǒng)統(tǒng)使渣配用UTF8編碼。
locale使用zh_cn.utf-8
源代碼使用utf8編碼保存。
在linux下,其實(shí)不用選擇gb2312,我都用的是utf8,當(dāng)然也需要按照以上步驟進(jìn)行設(shè)陸胡念置,肯定不會出現(xiàn)亂碼!個(gè)人喜好,大家隨意!
之前我試了很多方法,比如在/etc/sysconfig/i18n文件中改系統(tǒng)字體,在/etc/my.cnf中字段后加入如下語句default-character-set=gb2312等等早困,我覺得沒有必要。
以上步驟看似很簡單,但是我的失敗教訓(xùn),也是我的成功心得?,F(xiàn)在與大家分享,看后有收獲的做慎,不頂一下就是你的不厚道了!
你好!
初步
判斷
是
漢字的罩虧御問題吧
你把
漢字
換物巖成對應(yīng)
的
字母試試看!
Good
luck
如果對你有幫助,望采空跡納。
初步 判櫻答稿鄭斷 是 漢字的問題吧
你把 漢字脊敬慧 換成對應(yīng) 的 字母試試看!
linux下 gb2312的介紹就聊到這里吧,感謝你花時(shí)間閱讀本站內(nèi)容,更多關(guān)于linux下 gb2312,Linux下GB2312中文編碼完全指南,Linux 下 zip 文件解壓亂碼如何解決?,linux下怎么改變文件的編碼格式,linux 下運(yùn)行C的程序,終端運(yùn)行出現(xiàn)亂碼,該怎么解決???!的信息別忘了在本站進(jìn)行查找喔。
香港服務(wù)器選創(chuàng)新互聯(lián),2H2G首月10元開通。
創(chuàng)新互聯(lián)(www.cdcxhl.com)互聯(lián)網(wǎng)服務(wù)提供商,擁有超過10年的服務(wù)器租用、服務(wù)器托管、云服務(wù)器、虛擬主機(jī)、網(wǎng)站系統(tǒng)開發(fā)經(jīng)驗(yàn)。專業(yè)提供云主機(jī)、虛擬主機(jī)、域名注冊、VPS主機(jī)、云服務(wù)器、香港云服務(wù)器、免備案服務(wù)器等。

我們在微信上24小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流