ZKIZ Archives


中國AI力量崛起 直追美國

作為人工智能國際頂級會議,由美國人工智能協會(American Association for Artificial Intelligence)組織的AAAI大會在美國舊金山召開,在今年的大會上中國面孔成為不可忽視的力量。在2571篇投稿論文中,中國和美國的投稿數量分別占到31%和30%,雖然在被接收論文數量上,中國還是低於美國,但數量已經大幅提升。

一個小插曲則是,今年的AAAI大會原計劃在新奧爾良召開,由於和中國春節沖突,AAAI Fellow、AAAI現任執委楊強教授和幾位教授緊急向組委會發送郵件,使得最終破格更改了時間和地點。

可見,中國在AI領域正在蓄勢,逐步成長為中堅力量。據《烏鎮指數:全球人工智能發展報告》,在全球人工智能專利數量方面,中國以15745個緊跟在美國26891個之後位列第二,日本以14604個排名第三。值得一提的是,三國占總體專利的73.85%。

華人勢力

“不僅僅是學者,來參會的中國公司也變多了。”楊強表示。從今年的活動贊助商而言,百度、騰訊和亞馬遜、IBM一並成為金牌贊助商,小i機器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中,百度、騰訊、華為、360、今日頭條、攜程等中國公司的人工智能團隊也有出現。

百度研究院院長林元慶對第一財經記者說,過去幾年里,她在參加國際上人工智能領域的頂級會議中,確實可以看到參加會議的華人非常多,而且在過去幾年里增長很快。他認為這同時也和國內幾家公司在人工智能領域的投入有關系。

“中國人適合做人工智能,世界上43%的人工智能論文都是中國人寫的。”創新工場創始人李開複曾向第一財經表示。根據美國白宮此前發布的《國家人工智能研究與發展策略規劃》來看,從2013年到2015年,SCI收錄的論文中,“深度學習”或“深度神經網絡”的文章增長了約6倍,按照文章數量計算,美國已經不再是世界第一。在增加“文章必須至少被引用過一次”附加條件後,中國在2014年和2015年都超過美國,位居前列。

“這一輪人工智能並不是一個新的革命,而是18世紀工業革命自動化的一個延續,技術一旦掌握到手里,可以迅速擴展到做全世界的生意,所以這對於中國起到了一個彎道超車的作用。”楊強表示。

中國人數學好、刻苦努力無疑為中國發展人工智能提供了良好的基礎,但更大的驅動力在於產業需求。一方面對於傳統企業而言,需要新技術來推動產業變革,“中國的經濟結構還有很多不合理、低效率的地方,通過人工智能浪潮,就形成了一種新的競爭。”楊強強調。

對於互聯網巨頭或新興獨角獸公司而言,同樣需要借助人工智能技術,激發已經存儲的海量數據,提升服務精準度,創造潛在盈利機會,“互聯網大市場孕育的應用到C輪需要人工智能。”李開複表示。例如今日頭條在借助人工智能技術,將新聞內容和視頻進行重新排序,實現資訊分發的千人千面,美圖也利用人像數據庫,對數據進行標記、結構化,優化圖像算法。

“全世界只有中美兩國有如此大量的數據、大規模的計算和應用場景,在應用層面中美基本處於同一起跑線。”地平線機器人技術創始人兼首席執行官余凱向第一財經表示。余凱曾擔任百度研究院副院長、深度學習實驗室(IDL)主任,帶領的團隊將深度學習技術成功應用於廣告、搜索、圖像、語音等方面,在此之前他也曾在美國NEC研究院、西門子數據研究部、微軟亞洲研究院工作。

在余凱看來,中國有世界上最大的互聯網公司,且擁有搜索、社交、電商、互聯網金融等很好的應用場景,“大規模的計算平臺都需要大規模的應用場景,在小實驗室是做不了的,年輕人在這樣的工作環境中會得到持續的鍛煉,包括工程實驗能力、對算法的理解等。”

“最大的優勢是人多,這種優勢體現在三個層面,人多意味著市場大,有更強的驅動力去把這件事情做好。其次針對社會服務層面,需要很多數據。第三,人才基數比較大,冒出頂尖人才相對多一些。”第四範式創始人、首席執行官戴文淵告訴記者,“從數據量、投入的人力財力來看,中美之間沒有多少差距,且中國更有優勢。”

中美差異

但將論文數量視為中國人工智能發展水平有失公允,雖然在靠近商業價值應用層面中美並駕齊驅,但在基礎性、原創性研究、創新土壤、人才儲備層面,中國相較美國還存在不小的差距。

“國內更多是技術的落地、產業化和應用,國外仍然有很多人在公司和研究院做前沿研究,包括尋求方法論上的突破,我們擅長把事情做得更細致,相對而言突破性和奠基性的工作還不夠多。”地平線機器人技術聯合創始人、算法副總裁黃暢告訴第一財經。

黃暢畢業於清華大學計算機科學與技術系,曾在美國南加州大學和NEC美國研究院擔任研究員,2012年加入百度美國研發中心,2013年和余凱參與組建百度深度學習研究院,任高級科學家、主任研發架構師。在黃暢看來,做研究無外乎尋找新的問題和研究新的方法,而在這兩方面國內和國外相比還存在不小的差距。

楊強認為,深度學習是不斷發展的,研究領域的領導者應該是開拓新的領域,而不是在原有的基礎上深挖。“把一個10層的深度模型拓展到100層甚至1000層,我覺得這個確實是一個進步,中國人目前是這個層次,但這些在我看來並不是一個原創。”楊強舉例說道。

“現在很多高校是看教授和學生的論文達標情況,頂級會議論文的發表對學生申請院校、教授評級、申請科研經費等都有幫助,真正做出突破性理論研究,不迎合考核體系的非常少。”戴文淵直言。在他看來,雖然有相當數量的人參與到人工智能研究,但優秀的研究成果並不與參與人數的激增成正比。

余凱認為,有一些中國學生很擅長“刷分”、“刷榜”。“別人做到99.5%,我做了99.7%,並不一定有實質性突破,世界也沒有因為這個刷分而變得不一樣。原創性的創新需要不一樣的思考,現在講深度學習比較多,所有的人都進行深度學習,而不是思考What is wrong ?How to be different?”余凱強調。

在人工智能領域浸染十年有余的戴文淵也有同樣的感受,“很多人用力的方向有問題,準確率達到99.1%、99.15%或者99.2%,其實沒有什麽差別,並不應該把精力用在這些地方,而應該關註不到60分的領域,去把它做及格。”

回歸至深度學習的歷史發展脈絡來看,正是一個邊緣化課題走向主流技術的路徑。早在上世紀80年代初期,深度學習學派的開山人物Hinton一直堅持神經網絡的探索,但受限於當時的電腦速度、數據量等問題,深度學習理論是一項邊緣化的研究,當時AI的主流研究方向與之截然相反,推崇小樣本學習,主推SVM學習。

正是以Hinton為代表的一群人對深度學習的堅持,才一步步將邊緣課題變成人工智能核心技術。“十年前進入這個領域,中國學生都在學優化理論,現在一窩蜂地學習深度學習,很少有人在懷疑深度學習是不是最優解,就像之前很少有人去思考優化是不是最優解。”戴文淵說道。

人員成本居高不下

在余凱看來,中美之間的差距表現在兩方面,一方面是人才儲備的匱乏,很多高校在很長時間內並沒有人工智能專業,而在美國基本上大的院校都有人工智能教授。以美國卡梅隆大學為例,設有專門的機器人研究所,其中光教授就有100多位,縱向而言,中國布局的時間也比較晚。

早在2012年余凱回國在百度成立了人工智能團隊,擔任百度人工智能研究院執行院長,在他的記憶里,當時在高校招人非常困難,很多是在招進百度之後再自己培養。

其次從產業鏈而言,谷歌或者Facebook的人工智能團隊不僅可以從斯坦福等院校招人,還可以從微軟、IBM、HP等大公司挖走人工智能領域的人才,“當時別的企業還想著從百度挖人,無論從科研教育還是整個產業界,起步都是晚的,規模還是小的。”

至今余凱仍會頻繁去美國參加一些學術會議,讓自己保持更多的思考,“國外技術創業比較多,大家探討的是數學公式及算法,而在中國大部分在講趨勢、概念,如果PPT上放上公式就變得很無聊,心態比較浮躁。”

資本驅動之下,人工智能成為創業最火熱的領域,也在加速人才的流動。根據華創資本發布的《2016早期企業薪酬調研報告》來看,人工智能和大數據領域類的早期企業在過去一年的員工離職率高達44%,人員流動活躍。

“付不起工資、搶不到人”成為人工智能企業在人才招聘方面面臨的最大博弈。“人才比較少,需要的公司又多,人工智能的人員成本因此居高不下。”戴文淵表示,“我們想要尋找突破常規的人才,需要找到能夠將30分的東西做到60分甚至80分的人才,例如目前做深度學習的人有很多,但遷移學習的人才就非常少。”

“德才兼備”是余凱選人的標準,所謂德即對人工智能本身的熱情,願意為之做長期奮鬥,而不是短期的。“大部分人是在趕時髦,如果冰天雪地的時候心還是熱的,那才叫熱情”,才則是數學功底、統計功底、編程能力等等。

“優秀的人才、優質的研究成果永遠匱乏,好比人工智能領域論文從每年800篇漲到3000篇,但真正出色的論文在數量上基本不會有太大變化,許多人是在隨大流、挖坑灌水、解決細枝末節的問題,產生的真實價值並不大。”黃暢補充道。

與O2O、電商等產業不同,人工智能的技術創新仍舊需要長期且基礎性的理論研究工作,如何從頂層設計出發,加強人工智能基礎理論研究和核心技術突破,加強人工智能科研人才、技術人才的培養與引進,才是人工智能發展的持續動力。

人工智能挑戰

一派繁榮之下,正視人工智能的作用變得更為重要。“相較於告訴人們人工智能能做什麽,目前更重要的反倒是告訴人們,人工智能不能做什麽。”余凱笑著說道。結合當下的發展情況人工智能仍然面臨諸多挑戰。

首要挑戰就是數據不足的問題。眾所周知,人工智能建立在海量數據基礎之上,通過大數據訓練,來優化算法模型,以人臉識別技術為例,訓練這一算法模型需要至少百萬級別的圖片數據。

目前人工智能主要是監督式學習,有監督的訓練就需要帶標簽的數據,因此數據的質量和精準度及輸出結果密切相關。“如何剔除數據中的噪音、垃圾信息,獲取優質且帶有標簽的數據成為新挑戰,也正是因為這個原因,半監督式甚至無監督式學習方法必然成為未來的研究熱點。”黃暢說道。

另一大挑戰在於深度學習的推廣和場景遷移能力不足,每個領域的數據都需要重新收集、標準和再訓練,很難進行跨領域推廣。這些挑戰也是人工智能工業界和學術界急需突破的問題。“在招聘的過程中,學習深度學習的人很多,而懂得遷移學習,具備思辨能力的人很少。”戴文淵表示。反映到人才培養和教育而言,如何引導並鼓勵學生進行跨領域、原創性的探索研究尤為重要。

例如今年AAAI最佳論文來自斯坦福大學計算機科學系的Russell Stewart、Stefano Drmon,他們所撰寫的論文《用物理和特定領域知識讓神經網絡進行不帶標簽的監督學習》,就是將物理知識與深度學習相結合,通過跨領域研究給AI帶來新的啟發。

PermaLink: https://articles.zkiz.com/?id=245178

Next Page

ZKIZ Archives @ 2019