Win10 Python 3 使用OCR
在本篇經驗中,我們將介紹如何在Win10上使用Python 3編程環境進行OCR操作。同時,我們也會介紹如何安裝Google Tesseract-OCR及其對應的Python包。安裝Google Te
在本篇經驗中,我們將介紹如何在Win10上使用Python 3編程環境進行OCR操作。同時,我們也會介紹如何安裝Google Tesseract-OCR及其對應的Python包。
安裝Google Tesseract-OCR和Python包
要在Python中使用OCR功能,通常可以使用Google的Tesseract。首先,在命令行中輸入以下命令`pip search tesseract`,可以查看與Tesseract相關的所有包。其中,pytesseract是一個Google Tesseract的Python封裝。我們可以通過`pip install`命令來安裝它。
然而,如果我們直接運行PyPI上的示例代碼,可能會遇到TesseractNotFoundError錯誤。這是因為僅僅安裝了封裝器是不夠的,還需要安裝Tesseract本身。幸運的是,Tesseract的安裝非常簡單。我們可以參考Tesseract-OCR的GitHub頁面或其Wiki中的說明進行安裝。
安裝完成后,我們進入Tesseract-OCR的主目錄,即tesseract可執行文件所在的路徑。接下來,我們需要在Python代碼中添加設置Tesseract路徑的代碼,并重新運行程序。這樣,我們就可以看到圖片中的文字被成功識別并輸出了。
將Tesseract路徑添加到環境變量
為了方便起見,我們可以將Tesseract的路徑添加到系統的環境變量中,這樣就不用每次都手動指定路徑了。在系統屬性的環境變量設置中,我們可以將Tesseract的路徑添加到Path變量中。
完成以上步驟后,需要重新啟動終端(如果是使用VSCode,則重啟VSCode),以使新的環境變量生效。然后,我們就可以運行Python代碼,順利地使用Tesseract進行OCR操作了。
此外,由于Tesseract已經被添加到Path變量中,我們還可以直接在命令行中使用Tesseract。只需輸入`tesseract`即可查看幫助信息。
通過以上步驟,我們成功地在Win10上搭建了Python 3環境,并學會了如何使用Tesseract-OCR進行OCR操作。希望這篇文章對你有所幫助!