国产精品视频被艹_九九自拍视频精品_亚洲国产清纯系在线观看_十八禁深夜福利老司机视频_熟女日韩精品2区_午夜激情经典日韩_亚洲国产成人欧美在线观看_中文字幕人成乱码熟女超碰_大陆一级成人毛片_18禁在线看网站

產(chǎn)品中心

了解詳情

工業(yè)領(lǐng)域

生胎輪廓掃描檢測(cè)設(shè)備

工程胎成型機(jī)纏繞斷面檢測(cè)設(shè)備

輪胎模具字符AI視覺檢測(cè)設(shè)備

胎面標(biāo)識(shí)AI視覺檢測(cè)設(shè)備

首胎字符AI視覺檢測(cè)設(shè)備

帶束層瑕疵AI視覺檢測(cè)設(shè)備

消費(fèi)領(lǐng)域

優(yōu)顏3D美學(xué)分析儀

3D智能面部掃描儀

高精度微型3D相機(jī)

應(yīng)用場(chǎng)景

了解詳情

關(guān)于我們

了解詳情

資訊

了解詳情

展會(huì)信息

返回列表

OCR識(shí)別系列之一——基礎(chǔ)介紹

1、OCR定義

OCR，中文又叫光學(xué)字符識(shí)別，它是利用光學(xué)技術(shù)和計(jì)算機(jī)技術(shù)將目標(biāo)上的文字信息提取出來。OCR識(shí)別是計(jì)算器視覺研究領(lǐng)域之一，目前生活中的應(yīng)用也比較成熟，比方說，身份證識(shí)別，車牌號(hào)識(shí)別，拍題搜答案等應(yīng)用。

2、OCR分類

目前主要根據(jù)識(shí)別字體分成兩類：印刷體識(shí)別和手寫體識(shí)別。印刷體識(shí)別相對(duì)簡(jiǎn)單些，字體比較規(guī)則，有幾十種字體規(guī)則。但是也有一些因?yàn)樽址∷⒛E的斷裂，粘連，遮擋等造成識(shí)別困難，總的來說，印刷體的識(shí)別目前識(shí)別情況已經(jīng)相當(dāng)不錯(cuò)了，但是還沒能達(dá)到100%識(shí)別準(zhǔn)確。

手寫字體一直是OCR界想攻克的難關(guān)，主要因?yàn)槭謱懽煮w比較多樣化且具有個(gè)人特色，就比方說醫(yī)生開的藥方，人眼都很難辨認(rèn)寫的是什么，機(jī)器也很難理解。

3、OCR識(shí)別方法

典型的OCR技術(shù)流程:

輸入——>圖像預(yù)處理——>文字檢測(cè)——>文本識(shí)別——>輸出

傳統(tǒng)的OCR識(shí)別技術(shù)流程:

圖像預(yù)處理（彩色圖像灰度化，二值化處理，圖像變化角度檢測(cè)，矯正處理等）——>版面劃分（直線檢測(cè)，傾斜檢測(cè)）——>字符定位切分——>字符識(shí)別——>版面恢復(fù)——>后處理——>校對(duì)等

深度學(xué)習(xí)OCR識(shí)別技術(shù)流程:

輸入圖像——>深度學(xué)習(xí)文字區(qū)域檢測(cè)——>預(yù)處理——>特征提取——>深度學(xué)習(xí)識(shí)別器——>深度學(xué)習(xí)后處理

傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相似點(diǎn):

傳統(tǒng)機(jī)器學(xué)習(xí):數(shù)據(jù)預(yù)處理——>特征提取——>選擇分類器

深度學(xué)習(xí):數(shù)據(jù)預(yù)處理——>模型設(shè)計(jì)——>訓(xùn)練

在深度學(xué)習(xí)沒有發(fā)展起來前，對(duì)于復(fù)雜的場(chǎng)景基本都是采用傳統(tǒng)方法做字符的特征提取，然后輸入分類器，得到OCR模型。第一步特征設(shè)計(jì)和提取，我們需要對(duì)字符進(jìn)行設(shè)計(jì)它獨(dú)有的特征，來為后面分類做準(zhǔn)備，字符有哪些特征呢？結(jié)構(gòu)特征：字符端點(diǎn)，交叉點(diǎn)，圈的個(gè)數(shù)，線條數(shù)等，第二步將這些特征送入分類器（SVM）做分類，得出識(shí)別結(jié)果。這種方式的缺點(diǎn)是需要大量時(shí)間做特征設(shè)計(jì)，通過人工設(shè)計(jì)的特征（HOG）來訓(xùn)練字符識(shí)別模型。這種方法，一旦字符變化，模糊或者背景干擾等情況出現(xiàn)時(shí)，模型的泛化能力迅速下降，過度依賴字符切分的結(jié)果，在字符扭曲，粘連，噪聲干擾的情況下，切分的錯(cuò)誤尤其突出。這也就是為什么現(xiàn)在基本都會(huì)選擇深度學(xué)習(xí)去做OCR。

暴力的字符模板匹配法，通常應(yīng)用在字體統(tǒng)一，清晰度高，識(shí)別場(chǎng)景簡(jiǎn)單，識(shí)別字符簡(jiǎn)單的基于深度學(xué)習(xí)的字符識(shí)別（文字檢測(cè)+文字識(shí)別），目前來說用的效果比較好的就是先利用神經(jīng)網(wǎng)絡(luò)對(duì)文字區(qū)域進(jìn)行定位，然后對(duì)定位到的文字進(jìn)行字符識(shí)別。

目前現(xiàn)有的可以直接使用的OCR主要有以下兩種：
l、谷歌開源OCR引擎Tesseract，因?yàn)槭峭鈬碎_發(fā)的，所以中文識(shí)別效果并不好，但是在英文及數(shù)字識(shí)別上效果不錯(cuò)。
2、百度公司開發(fā)的OCR的API，通過寫一個(gè)python腳本就可以對(duì)其進(jìn)行調(diào)用實(shí)現(xiàn)文字識(shí)別，但是并不是免費(fèi)，少量調(diào)用不收費(fèi)，大量調(diào)用就要收費(fèi)了。用來進(jìn)行漢字識(shí)別效果還不錯(cuò)。

網(wǎng)站編輯：小優(yōu)智能科技有限公司發(fā)布時(shí)間：Aug 02,2023

軟件開發(fā)工程項(xiàng)目的三種工程類型

web前端技術(shù)與三維可視化