佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > 圖片識(shí)別工具Tesseract初探

圖片識(shí)別工具Tesseract初探

熱門標(biāo)簽:硅谷的囚徒呼叫中心 集中運(yùn)營管理辦法 服務(wù)器配置 百度競價(jià)排名 阿里云 科大訊飛語音識(shí)別系統(tǒng) 網(wǎng)站排名優(yōu)化 地方門戶網(wǎng)站

一、框架介紹

Tesseract 是一款圖片識(shí)別工具,可以抓取圖片中的文字,可以支持多種語言(默認(rèn)是英語),需要下載開源文件可以在github上下載,如果知識(shí)應(yīng)用不想太多深究直接在google code里邊搜索下載即可。

二、Tesseract內(nèi)容 

Doc:說明文檔 

Tessdata:存放各種文字庫(chi_sim.traineddata:中文 等) 

Tessseract.exe 即可以啟動(dòng)文件開始調(diào)用Tesseract 可以通過cmd方式調(diào)用,先cd到對(duì)應(yīng)的目錄,然后 輸入 tesseract.exe 圖片名 導(dǎo)出文件名(如:tesseract.exe 1.jpg 1) 就可以把和tesseract同目錄的 1.jpg文件識(shí)別結(jié)果存放在 1.txt文件中。當(dāng)然如果需要支持中文,需要在tessdata中添加 chi_sim.traineddata 文件,

然后 調(diào)用例子:tesseract.exe 1.jpg 1 -L chi_sim 制定是根據(jù)什么文字庫進(jìn)行識(shí)別。 當(dāng)然圖片地址可以引用全路徑、輸出結(jié)果也可以全路徑如果只是想把Tesseract做為一個(gè)工具做文字解析,并不追求太高成功率使用者,這樣即可滿足需要了,直接通過CMD調(diào)用exe進(jìn)行執(zhí)行。有需要玩的小伙伴可以直接下載附件 Tesseract_簡單使用.rar文件

三、.Net項(xiàng)目高級(jí)使用

如果.Net項(xiàng)目需要使用 DLL方式引用進(jìn)行研發(fā),可以下載Tesseract_DLL引用包。

X86和X64是針對(duì)Tesseract關(guān)聯(lián)引用DLL,根據(jù)程序所在系統(tǒng)位數(shù)進(jìn)行自適應(yīng)配置。

liblept168.dll 這個(gè)文件會(huì)在windows server 2003中發(fā)布IIS情況下無法加載錯(cuò)誤信息: Failed to find library "liblept168.dll" for platform x86. 如果發(fā)布在更高版本系統(tǒng)中即可正常使用Tesseract.DLL即是要添加到對(duì)應(yīng)的項(xiàng)目中的。以下是測試tesseract.dll 代碼: 

 using (var engine = new TesseractEngine(Server.MapPath(@"~/tessdata"), "eng", EngineMode.Default))
         {
           // have to load Pix via a bitmap since Pix doesn't support loading a stream.
           using (var image = new System.Drawing.Bitmap(imageFile.PostedFile.InputStream))
           {
             using (var pix = PixConverter.ToPix(image))
             {
               using (var page = engine.Process(pix))
               {
                 meanConfidenceLabel.InnerText = String.Format("{0:P}", page.GetMeanConfidence());
                 resultText.InnerText = page.GetText();
               }
             }
           }
         }

TesseractEngine:構(gòu)造函數(shù)參數(shù)注意事項(xiàng)=》第一個(gè)是字庫路徑必須使用tessdata結(jié)尾,第二個(gè)如果需要使用chi_sim即中文

以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。

您可能感興趣的文章:
  • Python實(shí)現(xiàn)基于PIL和tesseract的驗(yàn)證碼識(shí)別功能示例
  • python使用Tesseract庫識(shí)別驗(yàn)證
  • python3.5+tesseract+adb實(shí)現(xiàn)西瓜視頻或頭腦王者輔助答題
  • Python+Selenium+PIL+Tesseract自動(dòng)識(shí)別驗(yàn)證碼進(jìn)行一鍵登錄
  • Java OCR tesseract 圖像智能文字字符識(shí)別技術(shù)實(shí)例代碼
  • python下調(diào)用pytesseract識(shí)別某網(wǎng)站驗(yàn)證碼的實(shí)現(xiàn)方法
  • Perl使用Tesseract-OCR實(shí)現(xiàn)驗(yàn)證碼識(shí)別教程
  • Python3.6使用tesseract-ocr的正確方法

標(biāo)簽:威海 甘孜 烏蘭察布 廣西 開封 隨州 西雙版納 梧州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《圖片識(shí)別工具Tesseract初探》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    武冈市| 舟曲县| 兴城市| 防城港市| 武强县| 集安市| 大悟县| 连州市| 合川市| 沙坪坝区| 曲阜市| 天峻县| 泰兴市| 青浦区| 个旧市| 安庆市| 旬邑县| 岗巴县| 巴青县| 洛扎县| 日喀则市| 观塘区| 察雅县| 乐都县| 塘沽区| 电白县| 汕头市| 沙坪坝区| 双江| 新宾| 大竹县| 咸阳市| 邢台县| 永春县| 绵阳市| 尼玛县| 米脂县| 五河县| 昌江| 安溪县| 巴彦县|