丹青中英日文文件辨識(shí)系統(tǒng)是一款用于中英文辨識(shí)的
OCR文字識(shí)別軟件,可以快速讀取OCR格式的文檔資源,支持文檔重新編輯、保存操作,軟件可識(shí)別繁體中文、簡體中文、英文、日文及阿拉伯?dāng)?shù)字。
丹青中英文文件辨識(shí)系統(tǒng)能辨識(shí)的范圍包括各式彩色、黑白、表格及非表格文件;能辨識(shí)的內(nèi)容包括繁體中文、簡體中文、英文、日文及阿拉伯?dāng)?shù)字。辨識(shí)后的文本文件所占的內(nèi)存空間遠(yuǎn)較未辨識(shí)前的影像檔案小。在經(jīng)過校對(duì)后即可儲(chǔ)存成TXT、RTF、DOC、XLS、SLK、 CSV等各種檔案格式,并且可以在一般的文字處理軟件中被開啟和編輯。除此之外還可直接傳送成電子郵件,或?qū)n案以HTML格式,透過網(wǎng)絡(luò)瀏覽器直接開啟。
【功能特點(diǎn)】
1、輸出檔案
傳送至其他應(yīng)用軟件:可將辨識(shí)結(jié)果直接傳送至您所指定的應(yīng)用軟件中再處理,例如可設(shè)定辨識(shí)結(jié)果自動(dòng)儲(chǔ)存成HTML檔案并直接傳送至網(wǎng)絡(luò)瀏覽器中。
可儲(chǔ)存多種檔案格式:辨識(shí)后的結(jié)果可儲(chǔ)存成不同之檔案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的應(yīng)用與處理。
2、影像掃描
可處理彩色、灰階或黑白的文件影像。
傾斜校正:自動(dòng)偵測(cè)文件影像傾斜角度,并提供旋轉(zhuǎn)影像之功能。
3、辨識(shí)文件< 文件分析及辨識(shí) >
自動(dòng)辨識(shí):輕按一鈕,即可自動(dòng)分析、辨識(shí)、校對(duì)影像文件,圖文分離,并轉(zhuǎn)換成可編輯的文件檔案。
設(shè)定辨識(shí)字集:不需切換語文環(huán)境,即可辨識(shí)繁中、簡中、純英文及日文四種文件。
高辨識(shí)速率:在Pentium III 667MHz個(gè)人電腦環(huán)境下,每秒鐘能辨識(shí)高達(dá)150個(gè)中文字。
多種字體辨識(shí)及重現(xiàn):能夠辨識(shí)多種印刷字體,如明體、黑體、仿宋體、楷書、圓體、隸書等,并在辨識(shí)后還原成原稿的字體。
原文重現(xiàn)編輯環(huán)境:可辨識(shí)各種表格及影像,辨識(shí)結(jié)果依照原文件的圖文版面格式呈現(xiàn),方便您校對(duì)、編輯,節(jié)省重新排版的時(shí)間。
4、自動(dòng)校對(duì)與學(xué)習(xí)
再辨識(shí)功能:提供合/分字、合/分行、合/分區(qū)塊、變更區(qū)塊屬性等再辨識(shí)功能,讓您能夠修正錯(cuò)誤的辨識(shí)結(jié)果。
學(xué)習(xí)新字功能:可將易辨識(shí)錯(cuò)誤的字元輸入到學(xué)習(xí)資料庫中,提高下次辨識(shí)之正確率。
候選字功能:提供原文影像供辨識(shí)后圖文作校對(duì),且針對(duì)型態(tài)相近之文字及語意上前后相連的字詞提供候選字輕松更正辨識(shí)錯(cuò)誤的文字。
自動(dòng)校對(duì):利用內(nèi)建的常用詞庫自動(dòng)校對(duì)辨識(shí)出的文字,并標(biāo)示出辨識(shí)時(shí)所碰到的疑問字,節(jié)省您校對(duì)的時(shí)間。
【軟件特色】
可辨識(shí)繁中、簡中、英文及日文四種文件
提供繁中、簡中和日文三種操作介面
辨識(shí)后的文件可儲(chǔ)存成各種常用檔案格式再編輯
超高辨識(shí)速率及辨識(shí)率再提升,快速原文重現(xiàn)各式文件