成人h动漫精品一区二区ji,麻豆蜜桃AV蜜臀AV色欲A,无套大战乌克兰白嫩美女

當前位置： OFweek 人工智能網(wǎng) > 模式識別 > 正文

使用Google的Tesseract和OpenCV構建光學字符識別（OCR）系統(tǒng)

2020-06-04 10:02

磐創(chuàng)AI

關注

EAST具有U形網(wǎng)絡。網(wǎng)絡的第一部分包括在ImageNet數(shù)據(jù)集上訓練的卷積層。下一部分是特征合并分支，該分支將當前特征圖與上一階段的未合并特征圖連接在一起。然后是卷積層，以減少計算并生成輸出特征圖。最后，使用卷積層，輸出是顯示文本存在的得分圖和幾何圖，幾何圖可以是旋轉的框或覆蓋文本的四邊形，這可以從研究論文中包含的結構圖像中直觀地理解：

我強烈建議你親自閱讀本文（https：／／arxiv．org／abs／1704．03155），以更好地了解EAST模型。OpenCV從版本3．4開始包含EAST文本檢測器模型，這使得實現(xiàn)自己的文本檢測器變得超級方便。生成的本地化文本框可以通過Tesseract OCR傳遞以提取文本，這樣你將擁有一個完整的OCR端到端模型。

使用TensorFlow對象的API進行文本檢測的自定義模型TensorFlow Object API：https：／／github．com／tensorflow／models／tree／master／research／object＿detection構建文本檢測器的最后一種方法是用使用了TensorFlow Object API的自定義文本檢測器模型。它是一個開放源代碼框架，用于為目標檢測任務構建深度學習模型。要詳細了解它，我建議先閱讀下面這篇詳細的文章。https：／／www．a(chǎn)nalyticsvidhya．com／blog／2020／04／build－your－own－object－detection－model－using－tensorflow－api／要構建你的自定義文本檢測器，你顯然需要一個包含很多圖像的數(shù)據(jù)集，至少要多于100個；然后你需要對這些圖像進行注釋，以便模型可以知道目標對象在哪里并了解有關它的一切；最后，你可以從TensorFlow’s detection model zoo（https：／／github．com／tensorflow／models／blob／master／research／object＿detection／g3doc／detection＿model＿zoo．md）中根據(jù)性能和速度之間的權衡選擇一種預訓練的模型。你可以參考這個綜合性的博客來構建你的自定義模型。博客：https：／／tensorflow－object－detection－api－tutorial．readthedocs．io／en／latest／training．html＃configuring－a－training－pipeline現(xiàn)在。訓練可能需要一些計算，但是如果你真的沒有足夠的計算能力，請不要擔心！你可以使用Google合作實驗室滿足所有要求！這篇文章（https：／／www．a(chǎn)nalyticsvidhya．com／blog／2020／03／google－colab－machine－learning－deep－learning）將教你如何有效地使用它。最后，如果你想往前走了一步，并建立一個最先進的YOLO文本探測器模型，該文章（https：／／www．a(chǎn)nalyticsvidhya．com／blog／2018／12／practical－guide－object－detection－yolo－framewor－python／）將是一個了解它的所有細節(jié)的敲門磚，是一個很好的入門教程！

尾注：在這篇文章中，我們討論了OCR中存在的問題以及可以用來解決這項任務的各種方法。我們還討論了這些方法的各種缺點，以及為什么OCR不像看起來那么容易！

<上一頁 1 2 3