gImageReader提供圖像和PDF識別功能,將英文的內(nèi)容添加到軟件就可以識別文字,您可以添加多張圖像到軟件上識別文字內(nèi)容,軟件默認識別為TXT文本,方便用戶復制文本使用,也可以選擇識別PDF,可以將識別的結果導出為PDF格式,軟件界面還是很簡單的,添加圖像完畢點擊Recognize
selection就可以立即顯示文字結果,適合需要讀取圖像內(nèi)容,讀取PDF內(nèi)容的朋友使用;gImageReader也提供截圖功能,可以對當前電腦桌面全屏截圖,從而識別文字!
從磁盤、掃描設備、剪貼板和屏幕截圖導入 PDF 文檔和圖像
一次處理多個圖像和文檔
手動或自動識別區(qū)域定義
識別純文本或 hOCR 文檔
識別的文本直接顯示在圖像旁邊
對識別的文本進行后處理,包括拼寫檢查
從 hOCR 文檔生成 PDF 文檔
1、gImageReader可以讓用戶快速復制文本內(nèi)容
2、無法復制的內(nèi)容就可以在這款軟件識別文字
3、可以對任意位置識別,添加到軟件的圖像可以隨意放大和縮小
4、可以使用鼠標左鍵選擇識別的區(qū)域,可以在右側(cè)顯示識別結果
5、提供多種導出方式,可以保存為TXT文本,可以保存為PDF文本
1、將gimagereader_3.4.1直接安裝到電腦,點擊下一步
2、設置軟件的安裝地址C:Program FilesgImageReader
3、添加圖像或者是PDF到軟件上識別內(nèi)容,可以在軟件界面預覽內(nèi)容
4、可以在軟件選擇粘貼圖像內(nèi)容,也可以點擊相機按鈕全屏截圖
5、軟件可以識別英文的內(nèi)容,點擊頂部Recognize selection English [eng] (en_US)按鈕就可以識別內(nèi)容
6、也可以切換到PDF識別,ocr識別,以下文檔有未保存的更改。在繼續(xù)之前,您希望保存哪些文檔?
7、可以使用鼠標左鍵劃取您需要識別的文字范圍
8、其他設置
自動頁面分割
帶有方向和腳本檢測的頁面分割
假設文本為單列
假設單個垂直對齊文本塊
假設一個統(tǒng)一的文本塊
假設一行文本
假設一個單詞
假設圓圈中有一個單詞
不按特定順序稀疏文本
帶有方向和腳本檢測的稀疏文本
9、Toggle output pane可以切換輸出頁面
10、Batch Export是批量輸出功能,可以對識別的內(nèi)容保存
11、進入保存設置界面,可以選擇保存為PDF格式
12、高級設置界面,可以選擇輸出模式,輸入大小,圖像格式,文字類型
13、設置結束點擊APPLY按鈕保存修改的內(nèi)容
14、也可以在軟件右側(cè)的輸出區(qū)域選擇Export to plain text、Export to PDF、Export to ODT
一、純文本模式識別和后處理
可以通過拖動(左鍵單擊 + 鼠標移動)圍繞圖像部分的矩形區(qū)域來選擇要識別的區(qū)域。通過在選擇時按 CTRL 鍵可以進行多項選擇。
或者,可從主工具欄訪問的自動布局檢測按鈕將嘗試自動定義適當?shù)淖R別區(qū)域,并在必要時調(diào)整圖像的旋轉(zhuǎn)。
可以通過右鍵單擊它們時出現(xiàn)的上下文菜單刪除和重新排序選擇。也可以通過拖動選擇矩形的角來調(diào)整現(xiàn)有選擇的大小。
可以通過按主工具欄中的識別按鈕來識別圖像的選定部分(或整個圖像,如果未定義選擇)?;蛘?,可以通過右鍵單擊選擇來識別各個區(qū)域。從選擇上下文菜單中,還可以將識別的文本重定向到剪貼板,而不是輸出窗格。
如果選擇多個頁面進行識別,程序允許用戶在識別完整頁面和識別頁面之間進行選擇。為每個單獨的頁面手動選擇區(qū)域,或?qū)γ總€頁面執(zhí)行頁面布局分析以自動檢測適當?shù)淖R別區(qū)域。
識別的文本將出現(xiàn)在輸出窗格中(除非文本被重定向到剪貼板),一旦識別出某些文本,它就會自動顯示。
如果識別語言的拼寫詞典可用,則會為輸出的文本啟用自動拼寫檢查。使用的拼寫詞典可以從識別按鈕旁邊的語言菜單中更改,或者從文本區(qū)域中右鍵單擊時出現(xiàn)的菜單中更改。
當識別出額外的文本時,它將被追加、插入到光標位置,或者替換文本緩沖區(qū)的先前內(nèi)容,具體取決于在追加模式菜單中選擇的模式,該菜單可以在輸出窗格的工具欄中找到。
其他后處理工具包括去除換行符、折疊空格等(可從輸出窗格工具欄中的第二個按鈕獲得),以及搜索和替換文本。單擊輸出窗格工具欄中的查找和替換按鈕,然后單擊替換按鈕,可以定義搜索和替換規(guī)則列表。
通過單擊輸出窗格工具欄中的相應按鈕,可以撤消和重做對文本緩沖區(qū)的更改。
通過單擊輸出窗格工具欄中的保存按鈕,可以將文本緩沖區(qū)的內(nèi)容保存到文件中。
二、在 hOCR、PDF 模式下進行識別和后處理
在 hOCR 模式下,始終識別所選來源的整個頁面。
識別結果在輸出窗格中呈現(xiàn)為樹結構,分為頁面、段落、文本行、單詞和圖形。
選擇樹結構中的條目時,相應區(qū)域會在圖像中突出顯示。此外,條目的格式和布局屬性顯示在文檔樹下方的“屬性”選項卡中。原始 hOCR 源在文檔樹下方的“源”選項卡中可見。
可以通過雙擊相應的詞條目來編輯文檔樹中的詞文本。如果單詞拼寫錯誤,它將呈現(xiàn)為紅色。右鍵單擊文檔樹中的單詞將顯示帶有拼寫建議的菜單。
可以通過在“屬性”選項卡中雙擊所需的屬性值來修改所選條目的屬性。文本條目的有趣操作是調(diào)整邊界區(qū)域、更改語言和修改字體大小。語言屬性還定義了用于檢查相應單詞的拼寫語言。還可以通過調(diào)整畫布中選擇矩形的大小來編輯邊界區(qū)域。
可以通過右鍵單擊相應的選定項目來合并相鄰的單詞項目。
可以通過右鍵單擊相應項目從文檔中刪除任意項目。
可以通過選擇相應頁面項的上下文菜單中的添加圖形區(qū)域條目并在畫布上繪制一個矩形來定義新的圖形區(qū)域。
文檔樹可以通過輸出窗格工具欄中的另存為 hOCR 文本按鈕保存為hOCR HTML 文檔??梢酝ㄟ^輸出窗格工具欄中的打開 hOCR 文件按鈕導入現(xiàn)有文檔。
可以從輸出窗格工具欄中的PDF 導出菜單生成 PDF 文件。有兩種模式可用:
PDF將生成與源文檔具有相同布局和圖形/圖片的重構 PDF。
帶有不可見文本覆蓋的 PDF將生成一個 PDF,其中未修改的源圖像作為背景,不可見(但可選擇)的文本覆蓋在圖像中相應的源文本之上。此導出模式對于生成在視覺上與輸入相同但具有可搜索和可選擇文本的文檔很有用。
導出為 PDF 時,系統(tǒng)會提示用戶選擇要使用的字體系列、是否遵守 OCR 引擎檢測到的字體大小以及是否嘗試使文本行間距均勻化。此外,用戶可以選擇用于 PDF 文檔中圖像的顏色格式、分辨率和壓縮方法,以控制生成的輸出的大小。
除了 PDF,hOCR 文檔還可以導出為純文本和 ODT。
主工具欄中的HOCR 批量導出按鈕允許將一組 hOCR HTML 文件批量導出為 PDF/ODT/文本。處理所選源文件夾下的所有 hOCR HTML 文件,并在 HTML 文件旁邊寫入相應的 PDF/ODT/文本文件。N 個最低級別的組輸出選項允許指定將源樹的 N 個最低層次級別的 HTML 文件存儲到最低級別以上的單個導出的 PDF/ODT/文本文件 N 個文件夾級別中。
gImageReader 3.4.1(2023 年 1 月 29 日):
* Bug修復:
- 修復了即使 PDF 沒有文本也無法正確顯示 pdf 文本的警告
- 適應 enchant2 詞典位置變化
- [Qt] 修復為文本編輯器設置自定義字體
- 修復選擇沒有 hocr html 文件的文件夾時批量導出對話框中的崩潰
- 各種 Wayland 修復
- [Gtk] 修復錯誤地將導出文件名傳遞給 hOCR 文本和 ODT 導出
- [Gtk] 重做 Utils::string_html_escape 以修復可能的 unicode 字符串損壞
* 改進:
- 為自動檢測區(qū)域添加 2px 邊距
- 允許通過在前綴前加上 script/ 并保留空 lang 代碼來指定自定義腳本 tessdatas
- 在崩潰保存文件中使用正確的文件擴展名
- 使 WConf 可見性持久化
* 更新翻譯
gImageReader 3.4.0(2022 年 1 月 28 日):
* 添加對 tesseract 5.0 的支持
* 添加 Qt6 支持
* 為源文檔添加縮略圖視圖
* 增加批量識別多個文檔的模式
* 在樹中顯示資源
* 如果輸出文件存在于具有相同基本名稱的源旁邊,則允許直接從源樹打開輸出文件
* 允許移動圖像選擇框
* 文本:添加多標簽支持
* HOCR:允許指定是否插入/附加新輸出
* HOCR:允許一次打開多個文件,也可以從命令行打開
* HOCR:添加校對小部件(僅限Qt界面)
* HOCR:新的批量導出對話框
* HOCR:為低置信度詞添加快速導航
網(wǎng)友評論