📖 ZKIZ Archives


馬化騰:發展人工智能 四大要素缺一不可

騰訊董事會主席兼首席執行官馬化騰周日在深圳IT領袖峰會表示,發展人工智能,需要場景、大數據、計算能力和人才等四個要素缺一不可。

4月2日,2017中國(深圳)IT領袖峰會正式開幕,在“人工智能:中國機遇與挑戰”為主題的高端對話環節,馬化騰表示,騰訊在業務層面,比如社交網絡業務、後臺數據分析等都已經用上人工智能,只是大家感受不到,這是在後端,現在騰訊想在前端做出一些產品。

AlphaGo通過人機對戰讓全世界對人工智能的認知到了新的高潮,騰訊的團隊也本著練手的心態在做嘗試。“絕藝和AlphaGo不同的是,我們的AI全程得到國內頂尖棋手的指導。”

3月19日,騰訊AI Lab(騰訊人工智能實驗室)研發的圍棋人工智能程序“絕藝”(Fine Art)在東京以11戰全勝的戰績,在最具傳統和權威的計算機圍棋大賽——第10屆UEC杯上奪冠,戰勝了日本的DeepZenGo、法國的“瘋石”(Crazy Stone)等世界圍棋AI高手。3月26日,“絕藝”還在東京與日本著名新銳棋手一力遼在“電聖戰”中進行了人機對弈,並獲得冠軍。

馬化騰認為,絕藝贏得比賽是小小的成功,但是不能過於欣喜,但是也不能說這是一個毫無意義的事情。

對於人工智能的意義,馬化騰表示,AlphaGo給業界帶來的最大觸動在於,以後在很多領域如果能做出模擬器定義參數自己學習,找到規律遠超人類的想象。

“AlphaGo出來以後經過了十億盤對弈超越了過去人類所有交戰的盤數,自己尋找規律,對人類認知的範圍極大的擴張,這給人類很大的啟示。”

在對話中,主持人吳鷹提問,人工智能是通過模擬人腦的思維方式,還是完全不同的路徑實現飛躍。

對此馬化騰認為,我們期待有本質性的飛躍,但其實現在AI都是圈定一個比較窄的領域,通過各種參數訓練,屬於很窄的技能模擬,現階段要研發出通用的AI很難。

他表示,從現在的研究狀態到下一步實現通用人工智能,是不是能夠超越當前的碳基智慧,是不是其他的元素有可能形成更高級的生命和智慧,超越人類現在發現的知識,這些是有可能的。

對於場景、數據、計算能力和人才這四個要素,馬化騰認為,技術如果沒有場景落地、平臺業務支持的話基本是空中樓閣很難往下走,而業務產生的大量數據則需要進行標簽化和清理,因為里面有很多垃圾數據對發展AI並沒有實際用處,在計算能力上需要布局雲資源,拿出幾十萬核的計算能力,最後是人才,騰訊過去一年招了很多人工智能方面的人才,包括在美國西雅圖還設了一個實驗室。

據了解,騰訊AI Lab於2016年成立,專註於人工智能的基礎研究及應用探索,不斷提升AI的決策、理解及創造能力,同時為騰訊各產品業務提供AI技術支撐,產品已應用在微信、QQ及天天快報等上百個產品。

2017年3月23日,騰訊宣布任命人工智能領域頂尖科學家張潼博士擔任騰訊AI Lab(騰訊人工智能實驗室)主任。張潼博士將作為騰訊AI Lab第一負責人,帶領50余位AI科學家及200多位AI應用工程師團隊,專註於人工智能的基礎研究,主要包括計算機視覺、語音識別、自然語言處理和機器學習這四個垂直領域。同時,基於騰訊自身的業務需求,騰訊AI Lab還會在內容、社交、遊戲和平臺工具型AI四個方向進行研發與應用合作。

針對吳鷹提到騰訊是否有可能將業務數據開放出來給創業公司使用的可能,馬化騰表示,對於這個問題內部也有討論。這里面還涉及保護個人信息安全和隱私的問題,如果數據不進行脫敏,不處理幹凈無法談下一步。他認為,關於數據開放,業界在向互惠互利的大方向走,但是數據要什麽模式、怎麽清理、做什麽標簽才能給其他部門、其他公司使用,還需要進一步探討並建立標準和規則。

附馬化騰問答實錄:

吳鷹:為什麽重視人工智能?有什麽看法?

馬化騰:在公司內部結合業務形態我們已經有一些業務,比如微信朋友圈和QQ空間我們有上十億的人臉照片,在國內有相當長的研究,包括後臺數據分析,都用上人工智能技術,只是大家感受不到,這是在後端,在前端希望做出一些產品。

AlphaGo通過人機對戰的事件讓全世界對人工智能的認知到了新的高潮,團隊也本著練手的心態做嘗試。Google收購的DeepMind團隊論文發表之後,全世界原來做計算機圍棋的團隊走入瓶頸的團隊都用人工智能的方式來做,紛紛采用深入學習的方法融入到圍棋的軟件開發。

我們內部團隊有三個團隊在做,在不同的部門,這個部門剛好可以突破這個瓶頸。更大的特點,和AlphaGo不同的是,我們AI全程得到國內頂尖棋手的指導,我們十幾位研發人員不懂圍棋,一開始連黑先下還是白先下規則都不知道,所以結合計算機原理以及很多專家的訓練。

絕藝贏得比賽是小小的成功,不能過於欣喜,但是也不能說這是一個毫無意義的事情。

過去對AI很多從一些規則或者簡單的訓練得出來能夠改善計算處理的能力,最終發現一個更同步和更深層的意義,能夠在計算機的後臺用雲計算大數據的方式去高速學習,可以自己跟自己對弈。

AlphaGo出來以後經過了十億盤對弈超越了過去人類所有交戰的盤數,自己尋找規律,對人類認知的範圍極大的擴張,這給人類很大的啟示。在很多領域,圍棋以外的,金融、醫療、病理的檢測,如果用計算機後臺做出模擬器,充分的嘗試。就如自動駕駛一樣,模擬做各種各樣的反饋,自然會琢磨出一套理論和經驗,給我們帶來很大的思考。以後在很多領域如果能做出模擬器定義參數自己學習,找到規律的能力遠超我們想象的,這是我們得到最大的啟發。

問:人工智能要取得突破性進展,是模仿人的神經網絡、人腦的效率,通過仿生人腦思維的方式突破,還是完全不一樣的方式?

馬化騰:我們期待有本質性的飛躍,比如說發現飛機的空氣動力學、流體動力學和鳥不一樣的,車輪和人型馬一樣,仿生是某些垂直的領域,包括圍棋是選非常窄的領域,通過各種參數訓練。

郭為剛提到用AlphaGo下一盤棋消耗多少能源,垂直領域訓練消耗能源,但是實際用消耗不了多少。現在訓練出來的單機版本跟職業棋手差不多,訓練需要很長時間,最麻煩的是改一個參數,規則改一點、算法改一點,全部重新來消耗很大,所以這屬於很窄的技能模擬。

未來下一步到通用的,再下一步是不是有更本質性的發現背後的原理,智能其實可以超越現在碳基智慧,是不是有其他的元素可以形成更高級的生命和智慧呢?這是超越人類現在發現的知識,這是有可能的。

有人突發奇想說,現在認識的宇宙是高智能生命用量子計算模擬出來的環節,一切都是模擬起來的,這是發揮大家腦洞大開的想象力吧。

吳鷹:有沒有可能把數據分享出來,讓這些創業公司來用?

馬化騰:這個問題在內部也有討論。首先,人工智能關註哪幾塊:場景、大數據、計算能力、人才

場景:想把技術應用在什麽情景下?是不是高頻跟用戶接觸,這是落地很重要的地方。我們看到研究院、研發團隊,如果沒有場景落地、平臺業務支持的話,基本上很難往下走。

大數據,也是平臺、業務部門里面有大量的實際運轉數據產生出來,這里面很多大數據是垃圾數據,沒有標簽、沒有人規劃定義,用算法也學不出來,學完之後也是走火入魔瘋狂的結果,這里面數據的清洗標簽化難度相當高,要雇很多人,用比較笨的方法用人腦去清洗幹凈再讓AI去學,這個過程是混合的過程。

計算能力,雲資源,這方面我們也要做雲,要拿幾十萬核的計算能力CPU還是有能力的,而且在雲里面本身有比較好的調用。

人才,通過一年的時間招了很多人,包括在西雅圖還設了一個實驗室。

我們觀察到很多AI的大佬們,更關註怎麽落地,把畢生的研究成果體現出來。內部BG之間也在溝通微信、手機QQ平臺數據能不能用?大家知道,BG或者部門里面平臺他們也很希望近水樓臺先得月,數據在身邊流動為什麽不讓人先研究一把,所以現在我們處在內部怎麽把數據分享出來的階段。

還有一個用戶很關註的是個人因素,就是你不要把我的數據都賣了。這里面有很重要的個人信息安全和個人隱私的問題,如果數據不進行脫敏,我們是絕不能用的,只有先進行脫敏處理,沒有人能夠通過數據倒推到某個人,這樣處理幹凈才可以談下一步。

數據要什麽模式,清理做什麽標簽才能給其他的部門,包括外部合作夥伴怎麽用。同時也有很多的數據是來自於合作夥伴或者業界的其他公司,他們也遇到這樣的問題,拿到一堆裸數據不知道怎麽用,業界要形成一個標準互惠互利,這個路徑還有很長時間,大方向在往前走。

PermaLink: https://articles.zkiz.com/?id=244075

Next Page

ZKIZ Archives @ 2019