以基礎(chǔ)研究引領(lǐng)圖像提取產(chǎn)業(yè)市場
醫(yī)療影像、無人駕駛、人臉識(shí)別……如今隨著智能化時(shí)代加速到來,圖像提取日益成為風(fēng)口浪尖上的技術(shù),而這其中,圖像興趣點(diǎn)特征信息提取及檢測又是重中之重,廣泛應(yīng)用于醫(yī)療檢測、智能制造、農(nóng)業(yè)病蟲害檢測等領(lǐng)域。
2023年9月,浙江某銀行業(yè)務(wù)單據(jù)壓縮工作中,運(yùn)用了陜西科技大學(xué)章為川團(tuán)隊(duì)聯(lián)合青島認(rèn)知人工智能研究院提出的“注意力再注意力”的圖像技術(shù)成果,即非線性變換端到端網(wǎng)絡(luò)架構(gòu)來代替線性變換作為圖像和視頻壓縮的主體架構(gòu)。
據(jù)統(tǒng)計(jì),該銀行在浙江省有支行82個(gè)、網(wǎng)點(diǎn)約4000個(gè),平均每個(gè)支行每天產(chǎn)生的業(yè)務(wù)流水單據(jù)圖片數(shù)據(jù)量約20GB。總行擬對浙江省82家支行業(yè)務(wù)流水單據(jù)進(jìn)行統(tǒng)一管理,通過對這些業(yè)務(wù)單據(jù)數(shù)據(jù)進(jìn)行壓縮,降低支行到總行的傳輸帶寬投入,以及總行的存儲(chǔ)設(shè)備投入。預(yù)計(jì),這一技術(shù)應(yīng)用以后,每年將為相關(guān)銀行直接節(jié)省成本1217萬元。
“由基礎(chǔ)理論構(gòu)建到產(chǎn)學(xué)研轉(zhuǎn)化應(yīng)用,圖像提取技術(shù)的正在創(chuàng)造不計(jì)其數(shù)的價(jià)值。”章為川說。
基礎(chǔ)研究賦能產(chǎn)業(yè)創(chuàng)新
在陜西科技大學(xué),由章為川領(lǐng)銜的圖像計(jì)算實(shí)驗(yàn)室團(tuán)隊(duì)由5名教師和15名研究生組成。這支20人的團(tuán)隊(duì),手中的課題涉及圖像壓縮、醫(yī)學(xué)圖像分析與處理、興趣點(diǎn)檢測及圖像配準(zhǔn)、3D重建,以及相關(guān)技術(shù)在無人駕駛中的運(yùn)用等。
盡管團(tuán)隊(duì)組建時(shí)間不長,但他們卻在產(chǎn)學(xué)研轉(zhuǎn)化領(lǐng)域迅速出擊。目前,團(tuán)隊(duì)聯(lián)合西安捷達(dá)測控有限公司提出了一個(gè)多尺度特征融合的網(wǎng)絡(luò)架構(gòu)用于陜西省安康市永久性農(nóng)田的SAR圖像變化檢測方案,相關(guān)算法的準(zhǔn)確率達(dá)80%以上;同時(shí),團(tuán)隊(duì)還聯(lián)合西安交通大學(xué)第一附屬醫(yī)院神經(jīng)外科,對腦膠質(zhì)瘤患者術(shù)前的腫瘤進(jìn)行定位及腫瘤級(jí)別進(jìn)行分類,對術(shù)后患者生存期預(yù)測進(jìn)行建模。
章為川團(tuán)隊(duì)與西安捷達(dá)測控有限公司合作SAR圖像變化檢測項(xiàng)目
這些正在落地的轉(zhuǎn)化合作都基于圖像局部特征提取設(shè)計(jì)、局部特征數(shù)學(xué)解析表達(dá)式的構(gòu)建等科學(xué)研究。2023年,已是格里菲斯大學(xué)首席研究員的章為川回國加入陜科大,此前他在圖像興趣點(diǎn)檢測領(lǐng)域,以及植物病蟲害檢測及分類、醫(yī)學(xué)圖像處理、可解釋性深度學(xué)習(xí)網(wǎng)絡(luò)設(shè)計(jì)領(lǐng)域均做出了一系列原創(chuàng)性成果,并在《IEEE模式分析與機(jī)器智能匯刊》、《模式識(shí)別》(PR)等國際知名學(xué)術(shù)期刊發(fā)表80余篇論文成果。
回國后,章為川為團(tuán)隊(duì)定下了發(fā)展基調(diào):“科學(xué)研究不可以總是做跟隨性研究,一定要沉住氣、靜下心,在前沿領(lǐng)域持續(xù)開展原始創(chuàng)新。”盡管團(tuán)隊(duì)如今在產(chǎn)學(xué)研轉(zhuǎn)化領(lǐng)域多點(diǎn)開花,但章為川始終認(rèn)為基礎(chǔ)理論才是產(chǎn)生經(jīng)濟(jì)價(jià)值的根基,基礎(chǔ)理論的原始創(chuàng)新研究雖然在短期內(nèi)無法產(chǎn)生任何經(jīng)濟(jì)效益,甚至有些基礎(chǔ)理論研究看不到在工業(yè)生產(chǎn)領(lǐng)域的價(jià)值,但必須承認(rèn),恰恰是基礎(chǔ)理論研究制約了許多國家的科研和工業(yè)現(xiàn)代化的發(fā)展。
就拿團(tuán)隊(duì)目前的主要研究方向圖像興趣點(diǎn)檢測來說,這也是章為川很早就關(guān)注的方向。而正是因?yàn)樯罡诨A(chǔ)理論研究,章為川甚至撼動(dòng)了長期以來被廣泛寫在計(jì)算機(jī)視覺和圖像處理教科書中的“共識(shí)”。
撼動(dòng)學(xué)界“共識(shí)”
所謂興趣點(diǎn),學(xué)者們通常把角點(diǎn)和斑點(diǎn)歸為興趣點(diǎn),分別用水平和豎直方向的圖像一階導(dǎo)數(shù)和二階導(dǎo)數(shù)信息來檢測角點(diǎn)和斑點(diǎn)。角點(diǎn)檢測器和斑點(diǎn)檢測器分別以Harris檢測器和SIFT檢測器為代表。目前為止,這兩個(gè)算法幾乎成了興趣點(diǎn)檢測器的標(biāo)準(zhǔn)算法,被寫入各種各樣的計(jì)算機(jī)視覺和圖像處理的教課書中,廣泛運(yùn)用于圖像配準(zhǔn)、3D重建、無人駕駛、人機(jī)對話、目標(biāo)跟蹤、人臉識(shí)別等不同的計(jì)算機(jī)任務(wù)中,并且現(xiàn)有基于深度學(xué)習(xí)網(wǎng)絡(luò)的興趣點(diǎn)檢測算法大多也是基于Harris算法和SIFT算法的理論架構(gòu)而設(shè)計(jì)的。
早在2013年時(shí),章為川已敏銳地從實(shí)驗(yàn)中發(fā)現(xiàn)圖像水平和豎直方向的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)信息用來檢測角點(diǎn)和斑點(diǎn)的理論架構(gòu)存在問題。但是Harris算法和SIFT算法構(gòu)建的兩個(gè)基礎(chǔ)理論就如兩座大山,幾十年來一直是興趣點(diǎn)檢測的主流理論架構(gòu),難以撼動(dòng)。
針對內(nèi)心的疑問,章為川曾試著跟人討論,但對方聽了他說的話之后,直接勸他放棄這個(gè)幼稚且不切實(shí)際的想法,畢竟只有完整的數(shù)學(xué)推導(dǎo)并從中總結(jié)得到的興趣點(diǎn)特性才能向世人證實(shí)這兩個(gè)基本理論架構(gòu)存在重大缺陷。
為建立離散曲率解析表達(dá)式,章為川和他的合作者孫長明曾經(jīng)整整花了5個(gè)多月,用了2000多張A4紙去證明長期以來本科高等數(shù)學(xué)教材中的離散曲率計(jì)算公式存在的重大理論缺陷,并提出了新的離散曲率計(jì)算公式。“我們要得到的不是近似解,而是閉式解,但很多式子按照常規(guī)解題思路無法繼續(xù)推導(dǎo)得到,需要用到大量的數(shù)學(xué)運(yùn)算技巧,導(dǎo)致運(yùn)算復(fù)雜度非常高。有時(shí)候,我們要花一周甚至兩周才能讓離散曲率解析式往前推動(dòng)一步。”
過程中,章為川面臨的最大問題就是變量繁多,在連續(xù)5個(gè)多月的數(shù)學(xué)推導(dǎo)過程中,不可以犯任何的書寫和運(yùn)算錯(cuò)誤,面對毅力和耐力的重大考驗(yàn),他堅(jiān)持了下來。之后,文章在《IEEE圖像處理匯刊》順利發(fā)表。
2023年8月章為川回國前夕,更成熟的研究成果發(fā)表在《IEEE模式分析與機(jī)器智能匯刊》。文章中寫道:“盡管文獻(xiàn)中已經(jīng)有很多關(guān)于興趣點(diǎn)檢測的文章,但我們總是有一個(gè)疑問:我們是否充分考慮過如何利用灰度變化信息來檢測圖像中的興趣點(diǎn)?我們的主要問題如下:我們是否充分考慮過如何準(zhǔn)確地獲取圖像的一階或二階導(dǎo)數(shù)信息來檢測興趣點(diǎn)?我們是否充分考慮過角點(diǎn)和斑點(diǎn)之間的特征差異?我們是否充分考慮過如何準(zhǔn)確地檢測圖像中的角點(diǎn)和斑點(diǎn)?我們的研究表明,現(xiàn)有的興趣點(diǎn)檢測方法存在兩個(gè)主要問題:一是從來沒有人解釋如何準(zhǔn)確地從圖像中提取灰度變化信息來檢測興趣點(diǎn),無論是角點(diǎn)還是斑點(diǎn);二是從來沒有人從數(shù)學(xué)解析表達(dá)式的角度準(zhǔn)確解釋角點(diǎn)和斑點(diǎn)之間的特征差異,以及興趣點(diǎn)的幅度響應(yīng)、比例因子和濾波方向之間的關(guān)系。”
經(jīng)過多年的持續(xù)叩問,章為川和孫長明建立了不同的角點(diǎn)和斑點(diǎn)模型,并利用一階和二階廣義高斯(各向異性/各向同性)方向?qū)?shù)濾波器去推導(dǎo)不同角點(diǎn)和斑點(diǎn)的數(shù)學(xué)解析表達(dá)式,并總結(jié)角點(diǎn)和斑點(diǎn)的物理屬性,進(jìn)而對角點(diǎn)和斑點(diǎn)進(jìn)行了重新詮釋,如:什么是角點(diǎn),什么是斑點(diǎn),角點(diǎn)和斑點(diǎn)的聯(lián)系和區(qū)別,如何從圖像中提取特征信息用于準(zhǔn)確描述角點(diǎn)和斑點(diǎn),如何從圖像中提取特征信息用于準(zhǔn)確檢測角點(diǎn)和斑點(diǎn),圖像水平和豎直方向的一階導(dǎo)數(shù)無法用來準(zhǔn)確地描述邊緣和角點(diǎn)的特征差異,圖像多尺度水平和豎直方向的二階導(dǎo)數(shù)無法用來準(zhǔn)確描述斑點(diǎn)和角點(diǎn)的特征差異及準(zhǔn)確檢測斑點(diǎn)等。
基于角點(diǎn)和斑點(diǎn)的數(shù)學(xué)解析表達(dá)式,他們不僅做出了國際領(lǐng)先的原創(chuàng)成果,而且他們的算法在不同圖像仿射變換條件下具有更穩(wěn)定的檢測性能,且在圖像配準(zhǔn)、3D重建、圖像斑塊檢測、血管內(nèi)的血斑檢測、植物病蟲害檢測等不同的計(jì)算機(jī)視覺任務(wù)中,相關(guān)算法性能指標(biāo)均比現(xiàn)有算法好,提出的理論架構(gòu)也能更好地指導(dǎo)深度網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)用于圖像興趣點(diǎn)檢測。此外,相關(guān)方法和成果還獲得牛津大學(xué)、悉尼大學(xué)、悉尼科技大學(xué)、約翰·霍普金斯大學(xué)和捷克理工大學(xué)等世界一流高校的學(xué)者在多篇論文中的多次引用和高度評(píng)價(jià)。
質(zhì)疑、獨(dú)立、不盲從,章為川相信,要想在如今的時(shí)代屹立科技強(qiáng)國之林,唯有秉持這樣的科學(xué)精神才能產(chǎn)生原創(chuàng)性的成果,才能發(fā)展出獨(dú)立自主的科技產(chǎn)品,為祖國建設(shè)添磚加瓦,為民族復(fù)興鋪路架橋。
章為川團(tuán)隊(duì)