中國AI力量崛起直追美國

Random Tags

何壽地貸晉善 696 顧攻破局阿披還五從九黃榕 Reform 豐祥仍為形不與助本事洗頹人心張娜鹽改害臺件可酷將薩諾 0497 價廉管過楊鳴破冰 501 大超被褲等內 0408 免不了為十追內改需話偽 Passage 漫長撐英費難雅迪說下來炒寶等鄧峰亞奶都卯

中國AI力量崛起直追美國

作為人工智能國際頂級會議，由美國人工智能協會(American Association for Artificial Intelligence)組織的AAAI大會在美國舊金山召開，在今年的大會上中國面孔成為不可忽視的力量。在2571篇投稿論文中，中國和美國的投稿數量分別占到31%和30%，雖然在被接收論文數量上，中國還是低於美國，但數量已經大幅提升。

一個小插曲則是，今年的AAAI大會原計劃在新奧爾良召開，由於和中國春節沖突，AAAI Fellow、AAAI現任執委楊強教授和幾位教授緊急向組委會發送郵件，使得最終破格更改了時間和地點。

可見，中國在AI領域正在蓄勢，逐步成長為中堅力量。據《烏鎮指數：全球人工智能發展報告》，在全球人工智能專利數量方面，中國以15745個緊跟在美國26891個之後位列第二，日本以14604個排名第三。值得一提的是，三國占總體專利的73.85%。

華人勢力

“不僅僅是學者，來參會的中國公司也變多了。”楊強表示。從今年的活動贊助商而言，百度、騰訊和亞馬遜、IBM一並成為金牌贊助商，小i機器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中，百度、騰訊、華為、360、今日頭條、攜程等中國公司的人工智能團隊也有出現。

百度研究院院長林元慶對第一財經記者說，過去幾年里，她在參加國際上人工智能領域的頂級會議中，確實可以看到參加會議的華人非常多，而且在過去幾年里增長很快。他認為這同時也和國內幾家公司在人工智能領域的投入有關系。

“中國人適合做人工智能，世界上43%的人工智能論文都是中國人寫的。”創新工場創始人李開複曾向第一財經表示。根據美國白宮此前發布的《國家人工智能研究與發展策略規劃》來看，從2013年到2015年，SCI收錄的論文中，“深度學習”或“深度神經網絡”的文章增長了約6倍，按照文章數量計算，美國已經不再是世界第一。在增加“文章必須至少被引用過一次”附加條件後，中國在2014年和2015年都超過美國，位居前列。

“這一輪人工智能並不是一個新的革命，而是18世紀工業革命自動化的一個延續，技術一旦掌握到手里，可以迅速擴展到做全世界的生意，所以這對於中國起到了一個彎道超車的作用。”楊強表示。

中國人數學好、刻苦努力無疑為中國發展人工智能提供了良好的基礎，但更大的驅動力在於產業需求。一方面對於傳統企業而言，需要新技術來推動產業變革，“中國的經濟結構還有很多不合理、低效率的地方，通過人工智能浪潮，就形成了一種新的競爭。”楊強強調。

對於互聯網巨頭或新興獨角獸公司而言，同樣需要借助人工智能技術，激發已經存儲的海量數據，提升服務精準度，創造潛在盈利機會，“互聯網大市場孕育的應用到C輪需要人工智能。”李開複表示。例如今日頭條在借助人工智能技術，將新聞內容和視頻進行重新排序，實現資訊分發的千人千面，美圖也利用人像數據庫，對數據進行標記、結構化，優化圖像算法。

“全世界只有中美兩國有如此大量的數據、大規模的計算和應用場景，在應用層面中美基本處於同一起跑線。”地平線機器人技術創始人兼首席執行官余凱向第一財經表示。余凱曾擔任百度研究院副院長、深度學習實驗室(IDL)主任，帶領的團隊將深度學習技術成功應用於廣告、搜索、圖像、語音等方面，在此之前他也曾在美國NEC研究院、西門子數據研究部、微軟亞洲研究院工作。

在余凱看來，中國有世界上最大的互聯網公司，且擁有搜索、社交、電商、互聯網金融等很好的應用場景，“大規模的計算平臺都需要大規模的應用場景，在小實驗室是做不了的，年輕人在這樣的工作環境中會得到持續的鍛煉，包括工程實驗能力、對算法的理解等。”

“最大的優勢是人多，這種優勢體現在三個層面，人多意味著市場大，有更強的驅動力去把這件事情做好。其次針對社會服務層面，需要很多數據。第三，人才基數比較大，冒出頂尖人才相對多一些。”第四範式創始人、首席執行官戴文淵告訴記者，“從數據量、投入的人力財力來看，中美之間沒有多少差距，且中國更有優勢。”

中美差異

但將論文數量視為中國人工智能發展水平有失公允，雖然在靠近商業價值應用層面中美並駕齊驅，但在基礎性、原創性研究、創新土壤、人才儲備層面，中國相較美國還存在不小的差距。

“國內更多是技術的落地、產業化和應用，國外仍然有很多人在公司和研究院做前沿研究，包括尋求方法論上的突破，我們擅長把事情做得更細致，相對而言突破性和奠基性的工作還不夠多。”地平線機器人技術聯合創始人、算法副總裁黃暢告訴第一財經。

黃暢畢業於清華大學計算機科學與技術系，曾在美國南加州大學和NEC美國研究院擔任研究員，2012年加入百度美國研發中心，2013年和余凱參與組建百度深度學習研究院，任高級科學家、主任研發架構師。在黃暢看來，做研究無外乎尋找新的問題和研究新的方法，而在這兩方面國內和國外相比還存在不小的差距。

楊強認為，深度學習是不斷發展的，研究領域的領導者應該是開拓新的領域，而不是在原有的基礎上深挖。“把一個10層的深度模型拓展到100層甚至1000層，我覺得這個確實是一個進步，中國人目前是這個層次，但這些在我看來並不是一個原創。”楊強舉例說道。

“現在很多高校是看教授和學生的論文達標情況，頂級會議論文的發表對學生申請院校、教授評級、申請科研經費等都有幫助，真正做出突破性理論研究，不迎合考核體系的非常少。”戴文淵直言。在他看來，雖然有相當數量的人參與到人工智能研究，但優秀的研究成果並不與參與人數的激增成正比。

余凱認為，有一些中國學生很擅長“刷分”、“刷榜”。“別人做到99.5%，我做了99.7%，並不一定有實質性突破，世界也沒有因為這個刷分而變得不一樣。原創性的創新需要不一樣的思考，現在講深度學習比較多，所有的人都進行深度學習，而不是思考What is wrong ?How to be different?”余凱強調。

在人工智能領域浸染十年有余的戴文淵也有同樣的感受，“很多人用力的方向有問題，準確率達到99.1%、99.15%或者99.2%，其實沒有什麽差別，並不應該把精力用在這些地方，而應該關註不到60分的領域，去把它做及格。”

回歸至深度學習的歷史發展脈絡來看，正是一個邊緣化課題走向主流技術的路徑。早在上世紀80年代初期，深度學習學派的開山人物Hinton一直堅持神經網絡的探索，但受限於當時的電腦速度、數據量等問題，深度學習理論是一項邊緣化的研究，當時AI的主流研究方向與之截然相反，推崇小樣本學習，主推SVM學習。

正是以Hinton為代表的一群人對深度學習的堅持，才一步步將邊緣課題變成人工智能核心技術。“十年前進入這個領域，中國學生都在學優化理論，現在一窩蜂地學習深度學習，很少有人在懷疑深度學習是不是最優解，就像之前很少有人去思考優化是不是最優解。”戴文淵說道。

人員成本居高不下

在余凱看來，中美之間的差距表現在兩方面，一方面是人才儲備的匱乏，很多高校在很長時間內並沒有人工智能專業，而在美國基本上大的院校都有人工智能教授。以美國卡梅隆大學為例，設有專門的機器人研究所，其中光教授就有100多位，縱向而言，中國布局的時間也比較晚。

早在2012年余凱回國在百度成立了人工智能團隊，擔任百度人工智能研究院執行院長，在他的記憶里，當時在高校招人非常困難，很多是在招進百度之後再自己培養。

其次從產業鏈而言，谷歌或者Facebook的人工智能團隊不僅可以從斯坦福等院校招人，還可以從微軟、IBM、HP等大公司挖走人工智能領域的人才，“當時別的企業還想著從百度挖人，無論從科研教育還是整個產業界，起步都是晚的，規模還是小的。”

至今余凱仍會頻繁去美國參加一些學術會議，讓自己保持更多的思考，“國外技術創業比較多，大家探討的是數學公式及算法，而在中國大部分在講趨勢、概念，如果PPT上放上公式就變得很無聊，心態比較浮躁。”

資本驅動之下，人工智能成為創業最火熱的領域，也在加速人才的流動。根據華創資本發布的《2016早期企業薪酬調研報告》來看，人工智能和大數據領域類的早期企業在過去一年的員工離職率高達44%，人員流動活躍。

“付不起工資、搶不到人”成為人工智能企業在人才招聘方面面臨的最大博弈。“人才比較少，需要的公司又多，人工智能的人員成本因此居高不下。”戴文淵表示，“我們想要尋找突破常規的人才，需要找到能夠將30分的東西做到60分甚至80分的人才，例如目前做深度學習的人有很多，但遷移學習的人才就非常少。”

“德才兼備”是余凱選人的標準，所謂德即對人工智能本身的熱情，願意為之做長期奮鬥，而不是短期的。“大部分人是在趕時髦，如果冰天雪地的時候心還是熱的，那才叫熱情”，才則是數學功底、統計功底、編程能力等等。

“優秀的人才、優質的研究成果永遠匱乏，好比人工智能領域論文從每年800篇漲到3000篇，但真正出色的論文在數量上基本不會有太大變化，許多人是在隨大流、挖坑灌水、解決細枝末節的問題，產生的真實價值並不大。”黃暢補充道。

與O2O、電商等產業不同，人工智能的技術創新仍舊需要長期且基礎性的理論研究工作，如何從頂層設計出發，加強人工智能基礎理論研究和核心技術突破，加強人工智能科研人才、技術人才的培養與引進，才是人工智能發展的持續動力。

人工智能挑戰

一派繁榮之下，正視人工智能的作用變得更為重要。“相較於告訴人們人工智能能做什麽，目前更重要的反倒是告訴人們，人工智能不能做什麽。”余凱笑著說道。結合當下的發展情況人工智能仍然面臨諸多挑戰。

首要挑戰就是數據不足的問題。眾所周知，人工智能建立在海量數據基礎之上，通過大數據訓練，來優化算法模型，以人臉識別技術為例，訓練這一算法模型需要至少百萬級別的圖片數據。

目前人工智能主要是監督式學習，有監督的訓練就需要帶標簽的數據，因此數據的質量和精準度及輸出結果密切相關。“如何剔除數據中的噪音、垃圾信息，獲取優質且帶有標簽的數據成為新挑戰，也正是因為這個原因，半監督式甚至無監督式學習方法必然成為未來的研究熱點。”黃暢說道。

另一大挑戰在於深度學習的推廣和場景遷移能力不足，每個領域的數據都需要重新收集、標準和再訓練，很難進行跨領域推廣。這些挑戰也是人工智能工業界和學術界急需突破的問題。“在招聘的過程中，學習深度學習的人很多，而懂得遷移學習，具備思辨能力的人很少。”戴文淵表示。反映到人才培養和教育而言，如何引導並鼓勵學生進行跨領域、原創性的探索研究尤為重要。

例如今年AAAI最佳論文來自斯坦福大學計算機科學系的Russell Stewart、Stefano Drmon，他們所撰寫的論文《用物理和特定領域知識讓神經網絡進行不帶標簽的監督學習》，就是將物理知識與深度學習相結合，通過跨領域研究給AI帶來新的啟發。

PermaLink: https://articles.zkiz.com/?id=245178

📖 ZKIZ Archives

Random Tags

中國AI力量崛起 直追美國

中國AI力量崛起直追美國