PDF複製出來的文字變亂碼(字型問題)
文章推薦指數: 80 %
翻譯公司經過底下幾項測試1.透過Adobe Reader複製後貼在任何編輯軟體都是口口口口口口口口口口口口口口口口2.透過http://convertpdftoword.net轉成doc是空白檔.
[email protected]
跳到主文
我的網站有全世界208種翻譯的服務喔!
有需要的,可以看看喔!
部落格全站分類:寵物日記
相簿
部落格
留言
名片
Sep22Fri201700:15
PDF複製出來的文字變亂碼(字型問題)
翻譯公司經過底下幾項測試
1.透過AdobeReader複製後貼在任何編輯軟體都是口口口口口口口口口口口口口口口口
2.透過http://convertpdftoword.net轉成doc是空白檔案
3.透過http://www.pdfonline.com轉成doc是_RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP
4.透過SolidConverterPDF轉出來跟RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP類似
5.透過FoxitPDFEditor要改字型卻出現新字型的編碼與某些選取對象的目前字型不相容。
變更字型作業已被取消。
爬了文,看到是內嵌包的字型在本身的電腦沒有所造成
求助PDF內容複製變亂碼問題有提到解決方法,但也要AcrobatXStandard以上的版本才有TouchUp文字工具的功能
請教是否有工具可以把內嵌的字型給撈出來,或者有其他方法可以正確的轉成doc?
應該不會需要動到OCR吧
謝謝
附加壓縮檔:201110/mobile01-1245a341b7e52749e807cfdbc04d25c0.zip
下載點二
請參考此文,我測試結果是可行的,可惜辨識準確率未達100%。
謝謝提供方法
我不想動OCR是因為有400多頁@@
vanewrote:
請參考此文,我測試結...(恕刪)
piligowrote:
謝謝提供方法我不想動...(恕刪)
很不幸地,我目前知道的解法都得動用OCR,步驟稍為省事的是用ACROBAT將PDF檔轉為JPEG,再用ACROBAT開啟轉出的JPEG,接著套用ACROBAT內建的OCR,最後再轉存為DOC即可。
附件是我轉存的結果。
附加壓縮檔:201110/mobile01-ce6c12e5fbb4794283e0d64ab63bb1e3.zip
AdobeReader裡頭有一個功能是,檔案==>另存文字,存好後如果用筆記本開啟會亂碼的話,
請使用流灠器打開文字檔,再把編碼選萬國碼,看看是不是還是亂碼。
因為你的檔案都是英文,所以存好是不會有亂碼的。
你還是乖乖OCR吧....英文的OCR起來總比中文的容易多了吧
我用Acrobat的編輯文字複製一樣是亂碼,就算不會亂碼也要一頁一頁複製,應該也不會比OCR快....
感覺這是故意弄成這樣的,467頁包了351種字型,字型名稱像是亂碼(Google不到結果)
哇~難道您也是處理過相同的電子檔,連原始檔有467頁包了351種字型也都吻合XD
nsps5606wrote:
你還是乖乖OCR吧....(恕刪)
謝謝您的處理範本
vanewrote:
很不幸地,我目前知道...(恕刪)
看來非OCR不可
話說既然PDF可以把字型包進去,卻不能抽出來,期待有人開發出此工具
謝謝大家
書籍掃描後利用Acrobat10OCR的ClearScan進行辨識,
該pdf檔便會內嵌一推字型,
只能說掃描時要好好掃,辨識率高,字型的種類才會下降。
piligowrote:
哇~難道您也是處理過...(恕刪)
piligowrote:
哇~難道您也是處理過...(恕刪)
你可以利用googledocs
googleDOCS
會自動將PDF或圖片中可以辨識的文字擷取出來,並記錄在Google文件中做後續編輯
附檔是gdocs轉出來的,再下載轉存為txt,排板可能要調整一下
大概看了一下,亂碼部份都是pdf裡斜體字,所以你只要針對亂碼部份做修正就可以了
至少不用轉來轉去做ocr,只要傳上gdocs後,下載回來再修正就可以了!
附加壓縮檔:201110/mobile01-06cb6556b494404edd636eaa6d3a9384.zip
SCANSOFTPDFCONVERTERPRO好像是一般convert
solidconvert不能會是亂碼
AnyBizSoftPDFConverter將PDF檔案轉換成Word、PowerPoint、HTML網頁或者是純文字,並且也支援批次轉檔以及已加密的PDF檔案。
anyPdftool的pdfconvert好像有supportocr
PDFOCR
把pdf文件中的文字辨識出來pdf軟體工具-
==>try
InChapter7,IhaveaddedanewsectiontitledCitingSourcesOrallythat
helpsstudentswithallthesechallenges.Itdealswithbothprintandonline
附加壓縮檔:201110/mobile01-926b1366d1ef5f9f04acdb4c972e5b6e.zip
看來這軟體小但可OCR
不過格式字的大小好像都跑了..
而且如是圖片scan的中文字+圖的雜誌不知道
能ocr轉成word嗎??
剛try過中文的圖片
看不懂
有些ebook一ocr就軟體crash.
可能中文ocr要別軟體吧
google
中文OCR光學文字識別工具ReadirisPro
以下內文出自:https://www.mobile01.com/topicdetail.php?f=511&t=2391720有關翻譯的問題歡迎諮詢天成翻譯公司
全站熱搜
創作者介紹
marshawitd45o
[email protected]
marshawitd45o發表在痞客邦留言(0)人氣()
E-mail轉寄
全站分類:不設分類上一篇:CP值超高爭先看美式針織文字圓領毛衣07008
下一篇:大學生不會英文字母當不成工友 李家同痛批:教育沒品管
歷史上的今天
2017:滿滿生肉片製成日燒肉店鮮肉蛋糕夯 鮮紅肉片造形精緻美味受肉食女喜愛
2017:台南搬家公司ptt
2017:「我們的樂齡Style」-樂齡攝影展9/17吳園登場@【千秋報】最新最快一...
2017:大學生不會英文字母當不成工友 李家同痛批:教育沒品管
▲top
留言列表
發表留言
站方公告
[公告]MIB廣告分潤計劃、PIXwallet錢包帳戶條款異動通知[公告]2021年度農曆春節期間服務公告[公告]新版部落格預設樣式上線
活動快報
臺南牽手創作祭
創作分享臺南遊記,就有機會獲得旅遊獎勵金,總獎勵...
看更多活動好康
我的好友
熱門文章
文章分類
未分類文章(1176)
最新文章
最新留言
動態訂閱
文章精選
文章精選
2019一月(8)
2018十二月(11)
2018十一月(60)
2018十月(73)
2018九月(25)
2018八月(31)
2018七月(25)
2018六月(49)
2018五月(60)
2018四月(103)
2018三月(93)
2018二月(74)
2018一月(93)
2017十二月(64)
2017十一月(81)
2017十月(64)
2017九月(45)
2017七月(10)
2017六月(68)
2017五月(58)
2017四月(23)
2017三月(58)
所有文章列表
文章搜尋
新聞交換(RSS)
誰來我家
參觀人氣
本日人氣:
累積人氣:
QRCode
POWEREDBY
(登入)
回到頁首
回到主文
免費註冊
客服中心
痞客邦首頁
©2003-2021PIXNET
關閉視窗
延伸文章資訊
- 1PDF內容複製- 石偉呈
你是否遇過一個PDF內的文字內容無法複製?Why? ... 這個雖然看不出甚麼,不過給它選取起來按"Ctrl + C" 然後貼到Word裡面就會發現PDF的內容被複製到WORD裡面了。
- 2PDF檔不能複製!教你一招不用下載軟體就可以破解的方法
有時候會遇到PDF 檔是不能使用複製的功能,連使用ctrl + c 都還是無法複製文字,這時候該怎麼辦呢?是不是會去下載一些奇奇怪怪的軟體來幫你破解啊!
- 3簡單幾招破解PDF無法複製 - lazyorangelife
1.開啟軟體「PDF PasswordRemover」。 2.點選「開啟PDF檔」。 3.選擇無法複製的PDF檔。
- 4複製PDF 的內容, Adobe Reader
複製PDF 的文字與影像 · 在Reader 中開啟PDF 文件。用滑鼠右鍵按一下文件,然後從蹦現功能表選擇「選擇工具」。 請選擇「選擇工具」 · 拖曳以選取文字,或按 ...
- 5PDF複製出來的文字變亂碼(字型問題)
翻譯公司經過底下幾項測試1.透過Adobe Reader複製後貼在任何編輯軟體都是口口口口口口口口口口口口口口口口2.透過http://convertpdftoword.net轉成doc是空白檔.