產(chǎn)品分類

      當(dāng)前位置: 首頁(yè) > 工業(yè)控制產(chǎn)品 > 自動(dòng)化控制 > 人工智能

      類型分類:
      科普知識(shí)
      數(shù)據(jù)分類:
      人工智能

      人工智能之OCR識(shí)別技術(shù)簡(jiǎn)析

      發(fā)布日期:2022-10-09 點(diǎn)擊率:211


      文字識(shí)別是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的分支之一,歸屬于模式識(shí)別和人工智能,是計(jì)算機(jī)科學(xué)的重要組成部分。計(jì)算機(jī)文字識(shí)別,俗稱光學(xué)字符識(shí)別,英文全稱是Optical Character Recognition(簡(jiǎn)稱OCR),它是利用光學(xué)技術(shù)和計(jì)算機(jī)技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來(lái),并轉(zhuǎn)換成一種計(jì)算機(jī)能夠接受、人可以理解的格式。OCR技術(shù)是實(shí)現(xiàn)文字高速錄入的一項(xiàng)關(guān)鍵技術(shù)。

      OCR技術(shù)的興起便是從印刷體識(shí)別開(kāi)始的,印刷體識(shí)別的成功為后來(lái)手寫(xiě)體的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。印刷體識(shí)別的主要流程大致分為以下幾個(gè)部分:圖像預(yù)處理、版面處理、圖像切分、特征提取和模型訓(xùn)練、識(shí)別后處理。

      圖像預(yù)處理

      輸入文本經(jīng)過(guò)掃描儀進(jìn)入計(jì)算機(jī)后,由于紙張的厚薄、光潔度和印刷質(zhì)量都會(huì)造成文字畸變,產(chǎn)生斷筆、粘連和污點(diǎn)等干擾,所以在進(jìn)行文字識(shí)別之前,要對(duì)帶有噪聲的文字圖像進(jìn)行處理。由于這種處理工作是在文字識(shí)別之前,所以被稱為預(yù)處理。預(yù)處理一般包括灰度化、二值化,傾斜檢測(cè)與校正,行、字切分,平滑,規(guī)范化等等。

      版面處理

      版面處理分為三個(gè)主要部分,版面分析、版面理解、版面重構(gòu)。

      版面分析將文本圖像分割為不同部分,并標(biāo)定各部分屬性,如:文本、圖像、表格。目前在版面分析方面的工作核心思想都是基于連通域分析法,后衍生出的基于神經(jīng)網(wǎng)絡(luò)的版面分析法等也都是以連通域?yàn)榛A(chǔ)進(jìn)行的。連通域是指將圖像經(jīng)過(guò)二值化后轉(zhuǎn)為的二值矩陣中任選一個(gè)像素點(diǎn),若包圍其的所有像素點(diǎn)中存在相同像素值的像素點(diǎn)則視為兩點(diǎn)連通,以此類推,這樣的像素點(diǎn)構(gòu)成的一個(gè)集合在圖像中所在的區(qū)域即一個(gè)連通域。根據(jù)連通域大小或像素點(diǎn)分布等特征可以將連通域的屬性標(biāo)記出來(lái),用作進(jìn)一步處理的依據(jù)。

      圖像切分

      圖像切分大致可以分為兩個(gè)主要類別,行(列)切分和字切分。經(jīng)過(guò)切分處理后,才能方便對(duì)單個(gè)文字進(jìn)行識(shí)別處理。

      特征提取與模型訓(xùn)練

      特征提取與模型訓(xùn)練在深度學(xué)習(xí)廣泛應(yīng)用于圖像識(shí)別領(lǐng)域之前,模板匹配是較為常見(jiàn)的一種識(shí)別方式,之后由于神經(jīng)網(wǎng)絡(luò)的復(fù)蘇,基于反饋的神經(jīng)網(wǎng)絡(luò)給OCR領(lǐng)域帶來(lái)了又一春。現(xiàn)在隨著計(jì)算機(jī)硬件計(jì)算能力的提升,利用大批數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面取得了傲人的成績(jī)。

      特征提取是從單個(gè)字符圖像上提取統(tǒng)計(jì)特征或結(jié)構(gòu)特征的過(guò)程。特征匹配是從已有的特征庫(kù)中找到與待識(shí)別文字相似度最高的文字的過(guò)程。

      識(shí)別后處理

      識(shí)別校正是在識(shí)別結(jié)果基礎(chǔ)上根據(jù)語(yǔ)種的語(yǔ)言模型進(jìn)行,當(dāng)然在單文種識(shí)別中相對(duì)容易一些,而在多語(yǔ)種則較為復(fù)雜。

      OCR的應(yīng)用案例有哪些

      印刷體識(shí)別應(yīng)用擴(kuò)展較多且技術(shù)發(fā)展較為成熟,無(wú)論在識(shí)別準(zhǔn)確率方面還是在識(shí)別效率方面,都達(dá)到了較高的標(biāo)準(zhǔn)。

      車牌識(shí)別

      車牌識(shí)別系統(tǒng)是OCR工業(yè)化應(yīng)用較早而且成功的典型案例,如今從停車場(chǎng)到小區(qū)門禁,車牌識(shí)別技術(shù)已走進(jìn)生活的各個(gè)角落。

      驗(yàn)證碼識(shí)別

      驗(yàn)證碼的主要目的是強(qiáng)制人機(jī)交互來(lái)抵御機(jī)器自動(dòng)化攻擊的。驗(yàn)證碼作為一種輔助安全手段在Web安全中有著特殊的地位,驗(yàn)證碼安全和web應(yīng)用中的眾多漏洞相比似乎微不足道,但是千里之堤毀于蟻穴,有些時(shí)候如果能繞過(guò)驗(yàn)證碼,則可以把手動(dòng)變?yōu)樽詣?dòng),對(duì)于Web安全檢測(cè)有很大的幫助。

      下一篇: PLC、DCS、FCS三大控

      上一篇: 索爾維全系列Solef?PV

      推薦產(chǎn)品

      更多
      主站蜘蛛池模板: 精品一区二区三区在线观看l | 视频在线观看一区二区| 久久久久人妻一区精品性色av| 亚洲av无码一区二区三区天堂古代| 欧洲精品码一区二区三区| 久久国产免费一区| 成人精品一区二区三区中文字幕| 国产精品无码一区二区在线观 | 91在线一区二区三区| 国产日韩AV免费无码一区二区三区| 男人的天堂av亚洲一区2区| 性无码一区二区三区在线观看| 东京热无码一区二区三区av| 国产嫖妓一区二区三区无码| 在线观看一区二区三区视频| 亚洲国产欧美国产综合一区| 国产福利91精品一区二区三区| 久久精品一区二区三区资源网 | 亚洲国产AV一区二区三区四区| 一区二区三区日韩| 日韩免费无码一区二区三区| 免费视频精品一区二区三区| 亚洲色婷婷一区二区三区| 熟女大屁股白浆一区二区| 国产品无码一区二区三区在线蜜桃| 四虎永久在线精品免费一区二区| 精品一区二区三区无码免费直播| 日韩AV无码一区二区三区不卡| 国产日韩精品一区二区三区| 国产精品成人一区无码| 日韩一区二区三区视频| 国产91精品一区二区麻豆亚洲| 一区二区三区在线观看免费| 香蕉免费看一区二区三区| 日韩精品无码一区二区三区AV| 亚洲无人区一区二区三区| 亚洲AV无码一区二区三区人 | 大屁股熟女一区二区三区| 国产免费一区二区三区不卡| 另类免费视频一区二区在线观看| 无码国产精品一区二区免费式芒果|