python爬蟲亂碼怎么解決 python爬蟲一部分中文亂碼一部分中文正常,如何解決?
python爬蟲一部分中文亂碼一部分中文正常,如何解決?這個問題沒有遇到過,有的中文亂碼,有的正常中文,正常情況下,一個網頁的編碼格式是一個,不能是幾個,要么正常,要么亂碼,不清楚你用哪個包做爬蟲,這
python爬蟲一部分中文亂碼一部分中文正常,如何解決?
這個問題沒有遇到過,有的中文亂碼,有的正常中文,正常情況下,一個網頁的編碼格式是一個,不能是幾個,要么正常,要么亂碼,不清楚你用哪個包做爬蟲,這里我就簡單的以requests包為例,介紹如何設置網頁編碼,使中文正常顯示,實際測試環境win7python3.6主要步驟如下:1https://www.baidu.com/例如,使用請求的get方法來請求這個頁面。代碼如下:
程序運行結果如下。您可以看到頁面的編碼方式是iso-8859-1:
并且iso-8859-1本身不支持中文,所以頁面的中文內容顯示為亂碼,到目前為止,我們可以重新顯示以下中文代碼:
,只要不支持中文代碼,我們就可以重新顯示以下行:]-3。就整個過程而言,其實很簡單。在使用Python作為爬蟲時,經常會遇到中文亂碼的情況。一般來說,只要設置網頁的編碼格式,比如UTF-8,就可以支持中文。網上有很多關于中文亂碼的信息。你可以參考它的幫助和學習它也很有幫助。我不在這里重復了。希望以上分享的內容能對您有所幫助。