4月30日下午,福昕軟件(688095)在數(shù)字中國峰會(huì)上重磅發(fā)布可信智能文檔自動(dòng)化處理平臺(tái)——福昕智信TidaClaw,直擊數(shù)字治理智能化的“最后一公里”難題——高質(zhì)量數(shù)據(jù)集建設(shè),著力解決海量文檔向結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化過程中廣泛存在的結(jié)果不可信、過程不可控、系統(tǒng)不可靠等痛點(diǎn),助力各類數(shù)據(jù)治理主體將高價(jià)值非結(jié)構(gòu)化文檔高效轉(zhuǎn)化為可審計(jì)、可追溯、可信任的數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)價(jià)值共創(chuàng)。
福昕智信TidaClaw依托福昕自主知識(shí)產(chǎn)權(quán),構(gòu)建了特色鮮明、功能齊全,新一代一站式集團(tuán)級、工程化的文檔分類與解析處理中樞,擁有“標(biāo)簽庫、武器庫、智能體、自動(dòng)化、安全鎖”五大核心能力,是能夠全面支撐各類數(shù)字治理主體實(shí)現(xiàn)文檔數(shù)據(jù)資產(chǎn)化升級的新型數(shù)字基礎(chǔ)設(shè)施。
“標(biāo)簽庫”:千種標(biāo)簽+靈活組合,文檔屬性精準(zhǔn)識(shí)別
面對金融合同、政務(wù)公文、工程圖紙、醫(yī)療病歷等形態(tài)各異的文檔,通用OCR或單一AI模型往往難以準(zhǔn)確理解其語義與用途。直面文檔識(shí)別和語義理解難題,TidaClaw獨(dú)創(chuàng)多維文檔標(biāo)簽體系,內(nèi)置1000+預(yù)設(shè)行業(yè)標(biāo)簽,支持“分類→領(lǐng)域→標(biāo)簽”的樹狀層級組織,多維度覆蓋業(yè)務(wù)類、流程/場景類、內(nèi)容類、格式類等應(yīng)用,允許自定義擴(kuò)展并基于文檔生成。
“武器庫”:海納百川,文檔智能處理的集大成者
平臺(tái)打造開放的“智能武器庫”,海納百川(301667),匯眾智。由此,任意開源、閉源的文檔處理工具都可輕松接入平臺(tái),進(jìn)入處理流程。已經(jīng)集成的工具涵蓋福昕IDP Parser、PaddleX文字識(shí)別、福昕印章識(shí)別、福昕CAD圖紙?zhí)幚淼群诵哪K,能按文檔標(biāo)簽智能匹配最優(yōu)工具組合,實(shí)現(xiàn)“一類文檔、一套策略”。無論是原生PDF、模糊掃描件、復(fù)雜表格,還是CAD圖紙或多語種公告,平臺(tái)都能動(dòng)態(tài)智能調(diào)用最適配的處理能力,滿足跨行業(yè)、多場景的精細(xì)化處理需求。
“智能體”:獨(dú)創(chuàng)置信度評測,自動(dòng)化結(jié)果可衡量、可信任
自動(dòng)化最大的風(fēng)險(xiǎn),不是慢,而是“錯(cuò)而不覺”。TidaClaw獨(dú)創(chuàng)全鏈路置信度評測體系,覆蓋報(bào)紙、年報(bào)、論文、合同、發(fā)票、公告、報(bào)告、手冊等8類主流文檔類型,對每份文檔、每個(gè)字段輸出量化可信評分,并設(shè)置“高置信自動(dòng)流轉(zhuǎn)、低置信人工復(fù)核”的智能分流機(jī)制有效規(guī)避由大模型“幻覺”或圖像噪聲引發(fā)的錯(cuò)誤。更為關(guān)鍵的是,平臺(tái)依托抽檢數(shù)據(jù)持續(xù)優(yōu)化置信模型——每一次人工修正都能轉(zhuǎn)化為系統(tǒng)學(xué)習(xí)樣本,據(jù)此,平臺(tái)“越用越準(zhǔn)、越用越可靠”,自動(dòng)化結(jié)果的可信閉環(huán)得以有效構(gòu)建。
“自動(dòng)化”:端到端編排,“無人值守”級處理,全流程自治
TidaClaw不止于單點(diǎn)智能,更追求全流程自治。平臺(tái)搭載拖拽式可視化工(850102)作流設(shè)計(jì)器,支持節(jié)點(diǎn)化流程編排與標(biāo)準(zhǔn)化模板活化復(fù)用,可實(shí)現(xiàn)文檔接入、分類、解析、校驗(yàn)、歸檔全流程自動(dòng)化;同時(shí),內(nèi)置智能重試、異常跳轉(zhuǎn)、條件分支等高級邏輯,并自動(dòng)調(diào)度“武器庫”中的工具資源,實(shí)現(xiàn)真正的端到端自動(dòng)化。所有操作均生成全鏈路血緣信息,完整記錄處理節(jié)點(diǎn)、所用工具、執(zhí)行時(shí)間及操作人,為問題溯源、審計(jì)檢查與流程優(yōu)化提供有力支撐,自動(dòng)化由此真正“看得見、管得住、可迭代”。
“安全鎖”:本地部署+國產(chǎn)適配,筑牢數(shù)據(jù)主權(quán)安全防線
在能源(850101)、金融、政務(wù)等數(shù)據(jù)安全(885942)敏感領(lǐng)域,數(shù)據(jù)安全(885942)是智能化的前提與基礎(chǔ)。TidaClaw堅(jiān)持完全本地化部署,確保文檔數(shù)據(jù)與處理過程始終運(yùn)行于客戶自有網(wǎng)絡(luò)環(huán)境,杜絕外泄風(fēng)險(xiǎn)。平臺(tái)全面適配國產(chǎn)操作系統(tǒng)(885844)與主流國產(chǎn)芯片,從底層規(guī)避“卡脖子”風(fēng)險(xiǎn)。同時(shí),內(nèi)置實(shí)時(shí)數(shù)據(jù)流向監(jiān)測與預(yù)警機(jī)制,結(jié)合RBAC權(quán)限控制與全操作審計(jì)日志,就像一把“鎖”,實(shí)現(xiàn)“事前授權(quán)、事中監(jiān)控、事后追溯”的全周期(883436)安全閉環(huán)。
目前,福昕智信TidaClaw已在金融、政務(wù)、工程建設(shè)等關(guān)鍵行業(yè)落地驗(yàn)證,實(shí)現(xiàn)金融文檔結(jié)構(gòu)化提取、政務(wù)文檔標(biāo)準(zhǔn)化管理、工程圖紙專業(yè)化預(yù)處理,成為政企智能化進(jìn)程中穩(wěn)定、透明、可審計(jì)的文檔處理核心樞紐。未來,福昕軟件(688095)將持續(xù)深耕數(shù)據(jù)“可信智能”,助力中國各類數(shù)字治理主體在AI時(shí)代實(shí)現(xiàn)更可靠、更高效、更安全的文檔管理智能化,打造支撐AI的高質(zhì)量數(shù)據(jù)集。
(中國日報(bào)福建記者站編輯:胡美東)
