關(guān)于pdf格式如何轉(zhuǎn)換成word文檔格式,pdf格式怎么轉(zhuǎn)換成word格式這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!
1、pdf已經(jīng)是圖片格式了 要轉(zhuǎn)word只能如下 一、“選擇文字工具,選好了貼到word里” 如果你的PDF文件是用文字制做而不是圖片制做的,可以“在Adobe Acrobat 7.0中有選擇文字的工具,可以選好了貼到word里”。
2、但是根據(jù)你介紹的情況,你的PDF文件是用圖片做的,所以不能用這種方法。
3、 二、批量截圖 截圖的辦法對于不是很清楚的圖片來說,并不可取,因為它要么會損失信息,要么會如樓主所說加大工作量。
4、 我建議你先用Adobe Acrobat中的導(dǎo)出功能,將這個文件導(dǎo)出為圖像。
5、做法:在上面菜單上選文件>導(dǎo)出>提取圖像為>JPEG文件(其他二種也行,JPEG文件比較?。?,再按提示,選擇一個適當(dāng)?shù)奈募A,保存圖像 。
6、 這種方法保存下來的一張張圖片,比你一頁頁截圖省力多了,而且保留了原文件的全部信息。
7、不過500頁可不一個小數(shù),會很慢,但至少不用你親自動手干預(yù)了。
8、 三、批量識別 如果你想進(jìn)行編輯,就必須進(jìn)行OCR識別。
9、關(guān)鍵在于你如何能夠批量進(jìn)行這個工作。
10、 好一點的OCR軟件都可以一次導(dǎo)入多幅圖片進(jìn)行識別,然后輸出。
11、不過,好像500頁的確有點多了,我從來也沒有超過50頁的記錄,通常也就是二、三十頁。
12、就算50頁,也比一頁一頁強,是吧? 我用過不少OCR軟件,覺得漢王文本王、清華紫光TH比較好用。
13、它們的識別率都非常高,還可以識別表格、繁體字、英文、豎排文字等;輸出方式也很靈活,可以只輸出文字,也可以按原稿排版格式輸出WORD文件;使用起來也都不復(fù)雜。
14、 不知你用的是什么版本的漢王,識別率會那么低。
15、我有的時候識別質(zhì)量很次的報紙上的文章,它的識別率也還是可以接受的。
16、 四、提高識別率 如果你的底圖質(zhì)量非常差的話,建議你先在圖片處理軟件中將導(dǎo)出的圖片進(jìn)行放大、去點、銳化等處理,然后再送到OCR中識別。
17、 我估計,你可能還是送入OCR的圖片損失了部分原文的信息,造成識別率下降。
18、因為你既然能放大,放大后截圖的識別率還可以,那就說明原圖的信息足夠OCR識別了。
19、只是你在操作過程中損失了部分東西。
20、 所以,我建議你: 1)先將你的PDF文件導(dǎo)出5-10頁圖片出來 2)用漢王等OCR軟件進(jìn)行批量識別(識別中注意將不規(guī)則的部分框除) 3)輸出成word文檔 如果它們能很順利地被識別出來,那后面的事就不用我說了。
21、如果不行,那就真的是你的底圖的問題了,這就需要對導(dǎo)出的圖片進(jìn)行批量修正處理。
本文分享完畢,希望對大家有所幫助。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!