摘要:近年來,中國經濟的增長一定程度帶來文檔數據與信息量的增長,中國政府、企業對經濟活動中產生的文檔進行電子化存儲、數據提取、分析挖掘具有巨大需求。2020年中國智能文字識別服務市場規模為30億元,2023年市場規模約為89.8億元,增長率遠超全球市場總增速。
一、定義及分類
智能文字識別是指相比傳統簡單文字識別,智能文字識別技術融合智能圖像處理、光學字符識別、深度學習、自然語言處理等技術,可在多語言、多版式、曲面、褶皺、背景干擾等復雜場景下進行文字信息的識別分析與理解,能夠獲得較高的識別性能并具備認知與理解能力。
智能文字識別(OCR)通??梢愿鶕涔δ芎蛻妙I域進行分類。智能文字識別按應用領域可以分為印刷體文字識別、手寫文字識別、混合文字識別;按技術可以分為光學字符識別、深度學習文本識別、傳統特征提取文本識別;按輸出結果可以分為文本檢測、文本識別;按部署環境可以分為離線文字識別、在線文字識別;按語言和腳本可以分為拉丁字母文字識別、非拉丁字母文字識別。
二、行業政策
1、主管部門及監管體制
智能文字識別行業屬于軟件和信息技術服務業,行業的行政主管部門主要是工信部以及各行政區劃設立的通信管理局。智能文字識別行業涉及商業大數據業務,因此相關企業需受征信行業主管部門中國人民銀行監管。行業的內部管理機構是中國軟件行業協會,軟件產品登記的業務主管部門是工信部,軟件著作權登記的業務主管部門是國家版權局中國版權保護中心。
2、相關政策
智能文字識別行業屬于軟件和信息技術服務業,具體到AI及大數據軟件領域,軟件和信息技術服務業既是國家戰略性新興產業的重要組成部分,也是關系國民經濟和社會發展全局的先導性產業,具有技術更新快、應用領域廣、滲透能力強等突出特點,對經濟社會發展發揮重要支撐和引領作用。“十三五”以來,圍繞制造強國和網絡強國建設目標,中國通過發布實施一系列的政策、法律法規為軟件產業實現快速發展創造了良好的環境。
三、發展歷程
文字識別OCR發展歷程OCR技術自20世紀70年代誕生以來,經歷了早期階段、發展階段、數字化時代三個發展階段,行業經歷了從早期的基礎技術探索到現代深度學習方法的演進,從單一語言的識別到多語言多樣性的支持,不斷推動著OCR技術的發展和應用。
四、行業壁壘
1、技術與人才壁壘
智能文字識別行業具備技術密集的特點,智能文字識別技術涉及OCR、NLP、圖像處理、深度學習等尖端技術的融合,需要底層算法構建、模型訓練、測試和部署等多個技術環節的配合。
全球人工智能的技術和產品呈現日新月異的發展態勢,例如如何在資源受限的移動端設備上設計兼顧性能和效率的輕量OCR模型,如何通過語義及知識的深度挖掘提升OCR性能,均是行業的研究熱點與難點。同時,市場需求也在不斷變化,促使智能文字識別廠商根據下游客戶的不同需求,開發標準化程度不同、形態不同的產品,提升識別的準確率、速度、穩定性,才能夠在激烈的市場競爭中立于不敗之地。智能文字識別技術在實際應用場景上的商業化落地,需要長時間的技術積累與持續的研發投入,也需要大量的優秀研發人員進行底層算法與應用模型的研究,新進入此領域的科技公司的技術追趕難度較大,同時也難以在短期內培養出尖端的研發人才團隊。
2、客戶資源壁壘
智能文字識別行業按銷售模式可以分為C端業務與B端業務,而智能文字識別B端服務不同細分市場的競爭格局有所差異,B端業務可分為B端基礎技術服務、B端標準化服務、B端場景化解決方案三種形態,技術的附加值、服務的復雜程度依次增高。
對于B端服務細分市場,智能文字識別行業的頭部企業通過多元化的B端產品線布局,在多個下游行業樹立了多家標桿企業客戶,其落地案例通常會形成較大行業影響,影響此行業內眾多企業的供應商選擇。另外,大型企業客戶通常對于場景化解決方案需求更高,此類項目落地周期相對較長,更換成本較高。因此對于新廠商而言,形成較高客戶資源壁壘。
對于C端APP細分市場,先行進入市場的智能文字識別APP,利用先發優勢,已積累大量用戶,形成了品牌效應。用戶在產品內積累越來越多個人文檔資產,遷移成本較高,使產品擁有較高用戶粘性,這對本行業的新進企業形成了較高的用戶壁壘,同時已樹立的品牌效應也進一步加強用戶壁壘。
3、銷售能力壁壘
由于不同行業客戶對于智能文字識別技術的需求與應用場景不同,智能文字識別服務提供商對于各行業場景的深度理解、研發出可在行業場景中落地的應用產品是其能否在本行業立足的關鍵因素之一。如為保險行業客戶研發出智能核保、理賠流程的智能文字識別解決方案;為政府客戶研發出智能證件審核的智能文字識別解決方案;為物流業客戶研發出運單信息自動錄入的智能文字識別解決方案。
因此,一家成功的智能文字識別企業不僅需要尖端研發人才,也同時需要可鏈接行業客戶需求和內部研發團隊的銷售團隊,銷售團隊對客戶所在行業的真實業務場景、業務邏輯、產業鏈上下游等有充分的理解,以客戶的痛點、需求為核心,充分調動公司內部如研發、實施、售后服務等各類資源,以實現行業解決方案的落地。而行業的深度理解需要依靠大量案例的經驗積累,這對本行業的新進企業形成了較高的銷售能力壁壘。
4、數據資源壁壘
融合了深度學習、NLP等人工智能技術的智能文字識別,其算法的設計和優化需要由海量的高質量場景數據驅動,需要在各行業各類大數據應用場景積累的海量數據對智能文字識別算法模型進行訓練。所以相比市場新進廠商而言,進入智能文字識別領域較久、落地案例更為豐富的廠商在各類場景、各類行業數據的累積上優勢明顯,其智能文字識別算法模型更為成熟,識別準確率、識別速度也更為出色。這對本行業的新進企業形成了較高的數據壁壘。
五、產業鏈
1、行業產業鏈分析
智能文字識別行業的產業鏈上游涉及到圖像采集、圖像預處理、特征提取、識別算法、語言模型等多個關鍵技術和環節,這些技術共同構成了OCR系統的基礎,為文字識別提供了堅實的技術支持。智能文字識別行業位于產業鏈中游,主要代表企業有百度云、騰訊云、阿里云、Google Cloud、ABBYY、合合信息等。
智能文字識別行業的產業鏈下游涉及到各種應用場景和產品服務,包括應用軟件開發、文檔管理和數字化服務、電子商務和金融服務、智能設備和物聯網應用、人工智能應用開發等方面,這些應用場景和產品服務為OCR技術的商業化應用提供了廣闊的空間和機遇。
2、行業領先企業分析
合合信息是一家人工智能及大數據科技企業,基于自主研發的領先的智能文字識別及商業大數據核心技術,為全球C端用戶和多元行業B端客戶提供數字化、智能化的產品及服務。2022年合合信息實現營業收入98846.18萬元,實現凈利潤28371.77萬元;2023年一季度合合信息實現營業收入26602.31萬元,實現凈利潤7969.02萬元。
合合信息智能文字識別技術融合了智能圖像處理、復雜場景文字識別、NLP等AI技術,相比傳統簡單文字識別,具備更多認知與理解能力,可適應多語言、多版式、多樣式等復雜場景,并可應用到多個商業化場景中并形成落地的產品或服務,例如票據分類、證照票據結構化、合同關鍵信息抽取、智能審核等。合合信息智能文字識別業務包含掃描全能王、名片全能王C端APP收入以及B端服務收入。企業招股書數據顯示,2022年合合信息智能文字識別服務業務收入為72489.24萬元,其中:B端服務收入為7120.43萬元,C端APP(掃描全能王和名片全能王)服務收入為65368.81萬元。
六、行業現狀
相比傳統簡單文字識別,智能文字識別技術融合圖像處理、OCR、深度學習、NLP等AI技術,具備更多認知與理解能力,可適應多語言、多版式、多樣式等復雜場景,識別準確率大大提升,同時可基于理解能力進一步開發文檔解析、分類、對比、審核等功能,是個人文檔資產管理與企業數字化轉型的關鍵。
從下游行業應用來看,金融、物流運輸的市場規模是占比最高的兩個細分行業,且增速也最快,主要由于金融、物流運輸企業在業務流程方面的基礎信息化建設程度、投入意愿相對其他行業來說相對較高,在證照、單據、表格等文檔的智能錄入、分類、比對、審核方面進行降本增效具有較大需求,為智能文字識別技術的商業化快速落地帶來基礎。據統計,2020年全球智能文字識別服務市場規模達75億美元,2023年全球智能文字識別服務市場規模約為123.2億美元。
近年來,中國經濟的高速增長一定程度帶來文檔數據與信息量的增長,中國政府、企業對經濟活動中產生的文檔進行電子化存儲、數據提取、分析挖掘具有巨大需求。2020年中國智能文字識別服務市場規模為30億元,2023年市場規模接約為89.8億元,增長率遠超全球市場總增速。
七、發展因素
1、有利因素
(1)人工智能列入中國“新基建”范圍,政策利好加速產業新生態的構建
人工智能對社會與經濟的影響日益凸顯,各國政府先后出臺人工智能發展相關政策,推動產業發展,將其上升到國家戰略高度。中國中央及各地政府近年來先后發布了多條人工智能利好政策。智能文字識別作為人工智能應用中商業推廣落地較快的領域,正成為人工智能新基建落地應用的“領頭雁”,已成為人工智能新基建對外提供的重要智能化服務能力之一。人工智能融入實體經濟的過程,也將為智能文字識別產業生態引入豐富的人才、技術、場景等要素。
(2)深度學習、NLP賦能下,智能文字識別技術不斷提升
當前深度學習技術不斷發展,加速了智能文字識別技術性能提升,為復雜場景的文字識別應用提供先決條件。文字識別應用范圍從簡單的印刷體數字、字母符號識別,逐步演進到自然場景下多形態文本檢測與識別、手寫體文本檢測與識別等復雜情形。同時,深度學習的出現,使NLP技術在閱讀理解、機器翻譯、問答系統等領域取得了一定成功,大幅提升智能文字識別的技術水平。
(3)企業及政府的數字化轉型需求不斷提升
在第四次工業革命背景下,人工智能、大數據與云計算、5G等新一代信息技術的快速發展與融合,使得數字化基礎設施和產業生態已經成為了社會的“新基建”,其中人工智能是推動數字化轉型與創新的原動力,將成為引領第四次工業革命的核心驅動力。企業及政府數字化轉型意在實現運營自動化、管理網絡化、決策智能化,有利于加快業務流程重組,有效地降本增效。中國企業信息化與IT投入近些年不斷提升,且相比發達國家仍有較大上升空間。智能文字識別技術可幫助企業與政府實現文檔存量數字化、增量電子化,隨著企業與政府數字化、信息化與智能化需求的不斷提高,預計將持續推動智能文字識別服務行業發展。
(4)個人用戶對文檔資產管理愈發受到重視
互聯網、智能手機的高速發展,使消費者習慣于利用智能終端進行數據處理。同時,在互聯網時代下信息爆炸式的增長,且通常個人數據資產都較為珍貴,如合同、名片、發票、筆記等,使得消費者對個人資產管理數字化意識和需求不斷增強。由于紙質文檔不易保存,難以對信息進行快速的查詢、分類、分享,因此用戶更傾向于將個人文檔通過掃描、拍照等方式數字化,在本地或者云端進行有效的存儲、分類等,以便隨時隨地在手機、電腦等多終端進行同步、查詢、管理及分享,滿足個人的辦公、求職、學習等不同場景的需求。個人用戶對文檔資產管理持續存在的需求將不斷推動智能文字識別服務行業發展。
2、不利因素
智能文字識別憑借著較高的實際應用價值,一直以來都是人工智能領域的研究熱點,2014年以來,隨著深度學習技術在智能文字識別的廣泛應用,中國智能文字識別技術取得了飛躍性發展。同時,中國智能文字識別行業在發展過程中面臨著不同行業及不同規??蛻舨町惢枨蟆⒓夹g挑戰、數據質量和數量問題、數據隱私和安全問題、市場競爭和行業標準、人才短缺和技術壁壘、應用場景限制等多個方面的不利因素,需要克服這些困難,才能實現行業的持續健康發展。
八、競爭格局
近年來,物聯網、云計算、大數據的快速發展推動數據量爆發式增長,智能文字識別作為文檔數據管理的關鍵技術,擁有較大發展前景。目前中國已經將人工智能上升到國家戰略層面,政府明確提出要加快發展人工智能產業,推動數字經濟高質量發展。與此同時,人工智能在全球也遍地開發,技術和產品日新月異,促使智能文字識別廠商根據下游客戶的不同需求,開發標準化程度不同、形態不同的產品,提升識別的準確率、速度、穩定性,才能夠在激烈的市場競爭中立于不敗之地。目前,智能文字識別領域的主要競爭企業有百度云、騰訊云、阿里云、Google Cloud、ABBYY、合合信息等。
九、發展趨勢
智能文字識別(OCR)作為計算機視覺領域的重要分支,OCR典型應用是通過圖像文字識別實現信息錄入。同時,由于文字和符號包含豐富的語義信息,基于OCR提取文字信息繼而進行分析,能夠幫助機器更好地理解圖像。
借助人工智能技術,近年來智能文字識別(OCR)性能的不斷提升為產業數字化催生出更復雜的OCR應用場景提供了堅實支撐。同時,覆蓋手機、電子產品以及云服務在內的更加多樣化的服務載體,進一步加快了OCR的普及,持續向社會生產生活的更多領域滲透。未來,智能文字識別(OCR)技術發展將會更加智能化、高效化和個性化。隨著技術的不斷進步和應用領域的不斷拓展,文字識別技術將會在更多的領域得到應用,并且將會更好地滿足用戶的需求和偏好,市場前景一片光明。
智研咨詢倡導尊重與保護知識產權,對有明確來源的內容注明出處。如發現本站文章存在版權、稿酬或其它問題,煩請聯系我們,我們將及時與您溝通處理。聯系方式:gaojian@chyxx.com、010-60343812。