PDF複製出來的文字變亂碼(字型問題)

文章推薦指數: 80 %
投票人數:10人

翻譯公司經過底下幾項測試1.透過Adobe Reader複製後貼在任何編輯軟體都是口口口口口口口口口口口口口口口口2.透過http://convertpdftoword.net轉成doc是空白檔. [email protected] 跳到主文 我的網站有全世界208種翻譯的服務喔! 有需要的,可以看看喔! 部落格全站分類:寵物日記 相簿 部落格 留言 名片 Sep22Fri201700:15 PDF複製出來的文字變亂碼(字型問題) 翻譯公司經過底下幾項測試 1.透過AdobeReader複製後貼在任何編輯軟體都是口口口口口口口口口口口口口口口口 2.透過http://convertpdftoword.net轉成doc是空白檔案 3.透過http://www.pdfonline.com轉成doc是_RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP 4.透過SolidConverterPDF轉出來跟RI[_WIGXMSR_XMXPIH_'MXMRK_7SYVGIW_3VEP類似 5.透過FoxitPDFEditor要改字型卻出現新字型的編碼與某些選取對象的目前字型不相容。

變更字型作業已被取消。

爬了文,看到是內嵌包的字型在本身的電腦沒有所造成 求助PDF內容複製變亂碼問題有提到解決方法,但也要AcrobatXStandard以上的版本才有TouchUp文字工具的功能 請教是否有工具可以把內嵌的字型給撈出來,或者有其他方法可以正確的轉成doc? 應該不會需要動到OCR吧 謝謝 附加壓縮檔:201110/mobile01-1245a341b7e52749e807cfdbc04d25c0.zip 下載點二 請參考此文,我測試結果是可行的,可惜辨識準確率未達100%。

謝謝提供方法 我不想動OCR是因為有400多頁@@ vanewrote: 請參考此文,我測試結...(恕刪) piligowrote: 謝謝提供方法我不想動...(恕刪) 很不幸地,我目前知道的解法都得動用OCR,步驟稍為省事的是用ACROBAT將PDF檔轉為JPEG,再用ACROBAT開啟轉出的JPEG,接著套用ACROBAT內建的OCR,最後再轉存為DOC即可。

附件是我轉存的結果。

附加壓縮檔:201110/mobile01-ce6c12e5fbb4794283e0d64ab63bb1e3.zip AdobeReader裡頭有一個功能是,檔案==>另存文字,存好後如果用筆記本開啟會亂碼的話, 請使用流灠器打開文字檔,再把編碼選萬國碼,看看是不是還是亂碼。

因為你的檔案都是英文,所以存好是不會有亂碼的。

你還是乖乖OCR吧....英文的OCR起來總比中文的容易多了吧 我用Acrobat的編輯文字複製一樣是亂碼,就算不會亂碼也要一頁一頁複製,應該也不會比OCR快.... 感覺這是故意弄成這樣的,467頁包了351種字型,字型名稱像是亂碼(Google不到結果) 哇~難道您也是處理過相同的電子檔,連原始檔有467頁包了351種字型也都吻合XD nsps5606wrote: 你還是乖乖OCR吧....(恕刪) 謝謝您的處理範本 vanewrote: 很不幸地,我目前知道...(恕刪) 看來非OCR不可 話說既然PDF可以把字型包進去,卻不能抽出來,期待有人開發出此工具 謝謝大家 書籍掃描後利用Acrobat10OCR的ClearScan進行辨識, 該pdf檔便會內嵌一推字型, 只能說掃描時要好好掃,辨識率高,字型的種類才會下降。

piligowrote: 哇~難道您也是處理過...(恕刪) piligowrote: 哇~難道您也是處理過...(恕刪) 你可以利用googledocs googleDOCS 會自動將PDF或圖片中可以辨識的文字擷取出來,並記錄在Google文件中做後續編輯 附檔是gdocs轉出來的,再下載轉存為txt,排板可能要調整一下 大概看了一下,亂碼部份都是pdf裡斜體字,所以你只要針對亂碼部份做修正就可以了 至少不用轉來轉去做ocr,只要傳上gdocs後,下載回來再修正就可以了! 附加壓縮檔:201110/mobile01-06cb6556b494404edd636eaa6d3a9384.zip SCANSOFTPDFCONVERTERPRO好像是一般convert solidconvert不能會是亂碼 AnyBizSoftPDFConverter將PDF檔案轉換成Word、PowerPoint、HTML網頁或者是純文字,並且也支援批次轉檔以及已加密的PDF檔案。

anyPdftool的pdfconvert好像有supportocr PDFOCR 把pdf文件中的文字辨識出來pdf軟體工具- ==>try InChapter7,IhaveaddedanewsectiontitledCitingSourcesOrallythat helpsstudentswithallthesechallenges.Itdealswithbothprintandonline 附加壓縮檔:201110/mobile01-926b1366d1ef5f9f04acdb4c972e5b6e.zip 看來這軟體小但可OCR 不過格式字的大小好像都跑了.. 而且如是圖片scan的中文字+圖的雜誌不知道 能ocr轉成word嗎?? 剛try過中文的圖片 看不懂 有些ebook一ocr就軟體crash. 可能中文ocr要別軟體吧 google 中文OCR光學文字識別工具ReadirisPro 以下內文出自:https://www.mobile01.com/topicdetail.php?f=511&t=2391720有關翻譯的問題歡迎諮詢天成翻譯公司 全站熱搜 創作者介紹 marshawitd45o [email protected] marshawitd45o發表在痞客邦留言(0)人氣() E-mail轉寄 全站分類:不設分類上一篇:CP值超高爭先看美式針織文字圓領毛衣07008 下一篇:大學生不會英文字母當不成工友 李家同痛批:教育沒品管 歷史上的今天 2017:滿滿生肉片製成日燒肉店鮮肉蛋糕夯 鮮紅肉片造形精緻美味受肉食女喜愛 2017:台南搬家公司ptt 2017:「我們的樂齡Style」-樂齡攝影展9/17吳園登場@【千秋報】最新最快一... 2017:大學生不會英文字母當不成工友 李家同痛批:教育沒品管 ▲top 留言列表 發表留言 站方公告 [公告]MIB廣告分潤計劃、PIXwallet錢包帳戶條款異動通知[公告]2021年度農曆春節期間服務公告[公告]新版部落格預設樣式上線 活動快報 臺南牽手創作祭 創作分享臺南遊記,就有機會獲得旅遊獎勵金,總獎勵... 看更多活動好康 我的好友 熱門文章 文章分類 未分類文章(1176) 最新文章 最新留言 動態訂閱 文章精選 文章精選 2019一月(8) 2018十二月(11) 2018十一月(60) 2018十月(73) 2018九月(25) 2018八月(31) 2018七月(25) 2018六月(49) 2018五月(60) 2018四月(103) 2018三月(93) 2018二月(74) 2018一月(93) 2017十二月(64) 2017十一月(81) 2017十月(64) 2017九月(45) 2017七月(10) 2017六月(68) 2017五月(58) 2017四月(23) 2017三月(58) 所有文章列表 文章搜尋 新聞交換(RSS) 誰來我家 參觀人氣 本日人氣: 累積人氣: QRCode POWEREDBY (登入) 回到頁首 回到主文 免費註冊 客服中心 痞客邦首頁 ©2003-2021PIXNET 關閉視窗



請為這篇文章評分?