在Python中解決中英文混雜出錯的問題

前兩天用Python寫了個小腳本，其中有個需求是從一個文本文件A中讀取數(shù)據(jù)，然后處理一下寫進一個新的文本文件B中。不過A文件中既有英文也有中文。
寫出處理這個需求的代碼并不復雜，隨手就能寫下類似的代碼：

1def write_a_line(line, fp):
2    fp.write(line)

不過這段程序一旦碰到有漢字的字符串時，可能就會遇到下面的問題：

Traceback (most recent call last):
 File "", line 1, in 
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1:
ordinal not in range(128)

恩，這種情況對于我們平時使用C＃或者Java的程序員來說確實比較頭大。從這個錯誤提示來看，Python在寫文件時，對line變量進行了編碼操作，而且是針對line對象進行ASCII碼的編碼。

我們都知道Python是支持unicode的，而且還有針對unicode的類型“unicode”。要想讓字符串稱為unicode字符串，可以在字符串的引號前面加入一個小寫字母“u”。翻閱Python的文檔，我們可以發(fā)下write方法接收的是str對象。不過Python并不像C＃，它不用聲明變量的類型。所以我們應該先看看line到底是個什么對象。于是為了解決這個問題，我把上面的代碼加了一行：

1def write_a_line(line, fp):
2    print line.__class__.__name__
3    fp.write(line)

代碼運行之后，我發(fā)現(xiàn)當line中有中文的時候，我們的line變量的類型是unicode。從網(wǎng)上搜了一下與unicode與寫文件相關的帖子，可以得到一個信息，對這unicode對象調encode方法進行編碼就可以正常寫文件了。于是代碼又編程了下面的樣子：

1def write_a_line(line, fp):
2    if line.__class__.__name__ == “unicode”:
3        line = line.encode(“GB2312”)
4    fp.write(line)

這里要注意的問題是不能一棍子打死，line可能會是unicode對象也可能是str對象，不過我們只對unicode對象進行編碼。這下問題總算是解決了。

名稱欄目：在Python中解決中英文混雜出錯的問題
文章出自：http://uogjgqi.cn/article/dhjiigp.html

掃二維碼與項目經(jīng)理溝通

我們在微信上24小時期待你的聲音

解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯(lián)網(wǎng)交流

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

在Python中解決中英文混雜出錯的問題

掃二維碼與項目經(jīng)理溝通

其他資訊

行業(yè)動態(tài)

企業(yè)網(wǎng)站建設的重要性！

服務項目

網(wǎng)站建設

移動端/APP

微信/小程序

技術支持

其它服務

更多服務項目

聯(lián)系吧在百度地圖上找到我們

電話：13518219792

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

在Python中解決中英文混雜出錯的問題

掃二維碼與項目經(jīng)理溝通

其他資訊

行業(yè)動態(tài)

企業(yè)網(wǎng)站建設的重要性！

服務項目

網(wǎng)站建設

移動端/APP

微信/小程序

技術支持

其它服務

更多服務項目

聯(lián)系吧 在百度地圖上找到我們

電話：13518219792

企業(yè)網(wǎng)站建設的重要性！

聯(lián)系吧在百度地圖上找到我們