“中國有多少數(shù)學家投入到人工智能的基礎算法研究中?”日前,在上海召開的院士沙龍活動中,中國工程院院士徐匡迪等多位院士的發(fā)問引發(fā)業(yè)界共鳴,被稱為“徐匡迪之問”。
“我國人工智能領(lǐng)域真正搞算法的科學家鳳毛麟角。”在4月28日召開的“超聲大數(shù)據(jù)與人工智能應用與推廣大會”上,東南大學生物科學與醫(yī)學工程學院教授萬遂人表示,“徐匡迪之問”直擊我國人工智能發(fā)展的核心關(guān)鍵問題,“如果這種情況不改變,我國人工智能應用很難走向深入、也很難獲得重大成果”。
我國人工智能領(lǐng)域發(fā)展的現(xiàn)狀如何?依靠開源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展?為什么要有自己的底層框架和核心算法?
“如果缺少核心算法,當碰到關(guān)鍵性問題時,還是會被人‘卡脖子’?!闭憬髮W應用數(shù)學研究所所長孔德興教授對科技日報記者表示,我國人工智能產(chǎn)業(yè)的創(chuàng)新能力并沒有傳說中的那樣強,事實是,產(chǎn)業(yè)發(fā)展過度依賴開源代碼和現(xiàn)有數(shù)學模型,真正屬于中國自己的東西并不多。
4個月零基礎學會人工智能、16講入門人工智能、算法線下大課……類似培訓在網(wǎng)絡上非?;鸨?,通過對于現(xiàn)有算法、模型的學習和訓練,成長為人工智能工程師的“短平快”可見一斑。
既然代碼是開源的,拿來用就好,為什么還有可能被“卡脖子”?
孔德興解釋,開源代碼是可以拿過來使用,但專業(yè)性、針對性不夠,效果往往不能滿足具體任務的實際要求。以圖像識別為例,用開源代碼開發(fā)出的AI即使可以準確識別人臉,但在對醫(yī)學影像的識別上卻難以達到臨床要求。 “例如對肝臟病灶的識別,由于邊界模糊、對比度低、器官黏連甚至重疊等困難,用開源代碼很難做到精準識別。在三維重構(gòu)、可視化等方面難以做到精準反應真實的解剖信息,甚至會出現(xiàn)誤導等問題,這在醫(yī)學應用上是‘致命’的?!?
“碰到專業(yè)性高的研究任務,一旦被‘卡脖子’將會是非常被動的,所以一定要有自己的算法?!笨椎屡d說。 換句話說,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算。用開源代碼“調(diào)教”出的AI頂多是個“常人”,而要幫助AI成長為“細分領(lǐng)域?qū)<摇?,需以?shù)學為基礎的原始核心模型、代碼和框架創(chuàng)新。
所謂“樹大根深”,人工智能的發(fā)展也是同樣道理,越在底層深深扎下根基,越能夠發(fā)展出強大的產(chǎn)業(yè)。
那么,借助開源代碼,“半路出家”的AI產(chǎn)業(yè)為什么會難以為繼?
孔德興解釋說,在獲得同樣數(shù)據(jù)的前提下,以開源代碼運行,AI深度學習之后或許能輸出結(jié)果,但由于訓練框架固定、算法限制,當用戶進行具體的實際應用時,將很難達到所期望的結(jié)果,而且難以修改、完善、優(yōu)化算法。
“如果從底層算法做起,那么整個數(shù)學模型、整個算法設計、整個模擬訓練‘一脈相承’,不僅可以協(xié)同優(yōu)化,而且可以根據(jù)需求隨時修改,從而真正解決實際問題。”孔德興說,基礎算法往往是指研究共性問題的算法,它涉及到基礎數(shù)學理論、高性能數(shù)值計算等學科,可以應用到多種實際問題中;而針對性強的應用算法往往會應用到具體問題所涉及的“具體知識、先驗信息”,從而更好地解決實際應用問題。
“基礎算法和應用算法都很重要,擁有基礎算法將更有助于應用算法的豐富與深入?!笨椎屡d說,AI要應對的現(xiàn)實生活是復雜、多變的,當能夠“應對自如”時,才能夠促成產(chǎn)業(yè)的“繁茂”。
“一方面是政策引導,其實國家已經(jīng)在加大這方面的扶持,例如科研基金上的設置等。”針對如何解決“徐匡迪之問”反映出來的問題,孔德興認為,第二方面是行業(yè)企業(yè)在進行科技創(chuàng)新時,應有意識將數(shù)學學者納入進來。
“如果通過算法的開發(fā),最終產(chǎn)品落地了,企業(yè)應該將算法開發(fā)時的數(shù)學學者納入到成果分享中來?!笨椎屡d說,社會目前對于數(shù)學科學等“軟實力”的認可程度不足,行業(yè)或法規(guī)層面應該做好數(shù)學研究成果的產(chǎn)權(quán)保護工作。
“第三方面,數(shù)學家本身應該積極參與到人工智能發(fā)展的浪潮里?!笨椎屡d呼吁,AI的未來發(fā)展需要數(shù)學家深度參與。由于目前仍處于“弱人工智能”時代(可以說是數(shù)據(jù)智能時代),AI的實現(xiàn)主要是依賴計算機的巨大算力和巨大的存儲能力,底層算法的問題或許并不突出,但在未來的發(fā)展,AI將可能融入邏輯、思維等智慧的內(nèi)容,這些都需要數(shù)學科學的原始創(chuàng)新,有大量的基礎問題亟待數(shù)學家攻克。
算法的進階一定是來源于“原創(chuàng)者”,而不是“跟隨者”??椎屡d說:“實際上深度學習的應用已遇到了天花板,我們需要新的數(shù)學技術(shù)(如部分依賴邏輯、部分依賴數(shù)據(jù)的‘聰明算法’),讓計算機變得聰明起來。這些工作都需要數(shù)學家的參與?!?