為什麼這篇pdfplumber教學鄉民發文收入到精華區:因為在pdfplumber教學這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者jasonhsu14 (14號星期五的傑森)看板Python標題[問題] pip install...
因工作需求
需要用讀取pdf上的表格
雖然試用過tabula,但其顯現的效果不太好
所以想嘗試換用pdfplumber
但在pip install pdfplumber的過程中遇到ERROR
看起來是UniDecodeError的問題
'cp950' codec can't decode byte 0xe2 in position 4981: illegal multibyte
sequence
不知道如何pip 的時候解決這個問題.....
另外我的PYTHON是3.8
雖然上網GOOGLE過相關辦法
sys.setdefaultencoding("utf-8")
但上述辦法似乎在好幾個版本前就被拿掉
所以還想請問版上大大有成功安裝過pdfplumber的經驗分享
或我該如何解決這個問題
或是面臨稍微有點複雜的pdf表格,該如何讀取
說是複雜,其實他就是沒有明確的表格 只用空格來區隔
所以導致我用tabula時候會某A欄的資料跑到隔壁欄去
先謝謝願意看到這邊了解我問題的版友們
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.228.220.91 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1605683838.A.9B2.html
我剛有看了一下你說的那篇,他看起來5天前修好這個
但我今天安裝時候還是有問題..
還是我應該退到3.7去安裝才行?
※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 11/18/2020 19:46:30
先謝謝樓上兩位回答
我Python3.8.3,後來改安裝0.5.21的版本是OK的
至於最新版的....我還是會出現UnicodeError錯誤QQ
※ 編輯: jasonhsu14 (61.228.220.91 臺灣), 11/19/2020 09:06:09