ZKIZ Archives


百度大腦險勝最強大腦背後 :200萬人2億照片做訓練

在AlphaGo的升級版化身“神秘棋手”Master以60勝0負1平的戰績橫掃人類圍棋高手之後,人工智能又一次成功挑戰人類大腦。這一次是在“人臉識別”領域。

在《最強大腦》的首場“人機大戰”中,百度人工智能在跨年齡識別的任務上以3:2的比分險勝最強大腦代表王峰。

 在此前,從深藍到AlphaGo的多次人機大戰中,交鋒的重點包括記憶能力、邏輯推理、計算能力等,這一次人工智能要挑戰的,除了這些之外,還包括人類經過幾百萬年進化的聽覺、視覺等感官天賦。

在北京大學心理學系教授魏坤琳看來,在這個專業方向上,人工智能的準確率已經達到很高的水準,下一步應該是提高運算的效率和能耗。“如果這個時代,人工智能這麽快地來到的話,我們應該怎麽做才能夠更好地發揮我們的能力,更好地發展,和更好地生存。”

 人臉識別背後:微整形、雙胞胎、跨年齡

與百度人工智能進行首場“人機大戰”的90後選手王峰堪稱“腦王”。2011年時,他曾以5分鐘記憶500個數字、1小時記2660個數字、聽記300個英文數字的成績打破3項世界紀錄,獲得世界腦力錦標賽上“世界記憶總冠軍”,並打破快速記憶撲克牌的世界紀錄。

“世界記憶之父”托尼博曾高度評價他:“王峰的紀錄在今後幾年恐怕都沒有外國選手可以打破,王峰是比賽有史以來最優秀的一名選手。而他所在的‘中國記憶精英戰隊’是全球最頂尖的記憶團隊。”

這一次,王峰和百度人工智能比拼的是人臉識別中的跨年齡識別。按照比賽規則,第一輪由章子怡從20張蜜蜂少女隊成員童年照中挑出2張高難度照片,選手通過平均只有三秒的動態錄像表演將所選童年照和在場的成年少女相匹配;第二輪人機共同觀察一位30歲以上的觀眾,隨後將他從30張小學集體照中找出。

節目組測試跨年齡人臉識別評測結果

百度首席科學家吳恩達坦言,在這次比賽中,百度選擇的競賽項目對於機器來說非常困難,對於人類來說相對容易。因為機器沒有直覺,也並沒有久遠的進化歷史,只能靠分析數據來學習。“特別對於識別整容、化濃妝或者十幾年跨度的照片,我們並沒有大量的數據可以分析。”

可以看到的是,這兩輪比賽的技術難點一方面在於蜜蜂少女隊人員眾多且每個人在賽場上化妝表演, 不排除有微整形、戴美瞳等因素幹擾。此外,挑選的童年照都在0—4歲範圍內,與現在的年齡跨度較大。而第二回合樣本容量大,30張集體照大約需要在1000-2000個人臉中找到對應的人,年齡跨度也覆蓋在80、90後等年齡層中。同時,比賽現場有實時照片傳輸、現場攝影機捕捉人臉圖像晃動、燈光幹擾等因素都會影響人工智能的識別準確率。

經過幾分鐘的屏氣凝神,第一位童年照的主人輕松被雙方找到。然而在確認第二張童年照的主人時,百度大腦卻打出了兩份有著萬分之一概率不同的答案。百度首席科學家吳恩達教授解釋說,這是因為兩份答案的概率很接近,極有可能是現場有一對雙胞胎。

人工智能識別相似度極高的雙胞胎

最終,小度機器人用概率地找到了答案,這一輪,王峰惜敗;接下來雙方在超過千人的合影中都準確找到了對應的人。

有意思的是,在比賽結束之後,有媒體提問百度深度學習實驗室主任(IDL)林元慶:“如果讓打敗幾乎所有圍棋高手的AlphaGo和百度大腦比試一場,到底誰會贏?”

林元慶給出的答案是:谷歌和百度二者選擇的方向,特別是“人機大戰”的方向非常不一樣。“去年AlphaGo出來的時候,我們正在投入非常大的力量在無人車,百度內部沒有做圍棋的項目。”

人臉識別技術解密

在人類大腦中,有特定的腦區(Fusiform face area(FFA)去負責圖像識別。王峰提到,自己在識別人臉的過程中,會先觀察照片上的人臉特征,例如鼻子兩側、嘴角、耳朵等等,然後記住這些特征,再進行匹配。相比之下,人工智能的識別有怎樣的不同?

林元慶告訴第一財經記者,通常情況下,人臉識別主要包括人臉檢測、人臉圖像預處理、人臉圖像特征提取、人臉圖像匹配與識別四個步驟。目前百度人臉測試集有2百萬人的2億張圖片作為訓練樣本數據。

人臉識別流程圖

其中,人臉檢測主要包括根據眼睛、眉毛、嘴巴、鼻子等器官的特征以及相互之間的幾何位置關系來檢測人臉,即在在一副圖像或一序列圖像(比如視頻)中判斷是否有人臉,若有則返回人臉的大小、位置等信息。

人臉識別

而由於系統獲取的原始圖像由於受到各種條件的限制和隨機幹擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。

人臉圖像預處理

人臉圖像的預處理主要包括人臉對準,人臉圖像的增強,以及歸一化等工作。其中,人臉對準是為了得到人臉位置端正的人臉圖像;圖像增強是為了改善人臉圖像的質量,不僅在視覺上更加清晰圖像,而且使圖像更利於計算機的處理與識別;歸一化工作的目標是取得尺寸一致,灰度取值範圍相同的標準化人臉圖像。

人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。

人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進行比較,根據相似程度對人臉的身份信息進行判斷。這一過程又分為兩類:

一類是人臉確認,是一對一進行圖像比較的過程,將某人面像與指定人員面像進行一對一的比對,根據其相似程度(一般以是否達到或超過某一量化的可信度指標/閥值為依據)來判斷二者是否是同一人。   

另一類是人臉辨認,是一對多進行圖像匹配對比的過程。將某人面像與數據庫中的多人的人臉進行比對(有時也稱“一對多”比對),並根據比對結果來鑒定此人身份,或找到其中最相似的人臉,並按相似程度的大小輸出檢索結果。

影響人臉識別的因素有:光照、人臉姿態、遮擋程度;影響特征提取的因素有:光照、表情、遮擋、年齡、模糊是影響人臉識別精度的關鍵因素。

例如,在雙胞胎識別上,人臉識別是在臉部骨骼上取盡可能多的點,通過計算機把這些點分別與自己已經存儲的臉比較,有差別就判斷出來。而雙胞胎之所以會不容易識別,就是因為骨骼太相似,導致差別特別細微,如果選取的面部骨骼點不夠多,就無法進行識別。

而跨年齡階段人臉識別中影響的因素更多:一方面,類內變化通常會大於類間變化,這造成了人臉識別的巨大困難。同時,跨年齡的訓練數據難以收集。沒有足夠多的數據,基於深度學習的神經網絡很難學習到跨年齡的類內和類間變化。

基於第一點,百度IDL的人臉團隊選擇用度量學習的方法。即通過學習一個非線性投影函數,把圖像空間投影到特征空間中。在這個特征空間里,跨年齡的同一個人的兩張人臉的距離會比不同人的相似年齡的兩張人臉的距離要小。

針對第二點,考慮到跨年齡人臉的稀缺性,百度IDL用一個用大規模人臉數據訓練好的模型作為底座,然後用跨年齡數據對他做更新。這樣不容易過擬合。而將這兩點結合起來做端到端的訓練,可以大幅度提升跨年齡識別的識別率。

打敗人類不是終極目的

從打敗幾乎所有圍棋高手的AlphaGo,到首場人機大戰中戰勝人類大腦的百度大腦,未來人工智能是否將顛覆人類世界?

在羅輯思維羅振宇眼里,人工智能不僅僅是人類的延伸,更是人類的替代。他援引尤瓦爾·赫拉利在新書《未來簡史》中的觀點,“未來可能出現一種沒用的人。如果人工智能足夠強大,願意毫無怨言地被剝削、被奴役,那有的人類可能連被剝削的價值都沒有了。近在眼前的是一系列職業的消失。”

而在北京大學心理學系教授魏坤琳看來,機器贏了就機器贏了,這是科技發展的必然結果。這天遲早會到來,只是來的早和晚的事情。

“任何新技術出現的時候老百姓都恐慌,汽車出現恐慌,火車出現恐慌,計算機出現恐慌。這個是終極恐慌人工智能的出現,可能讓很多一般智力活動(包括很多白領的工作)甚至專業人員(包括某些領域的醫生)的工作受到威脅。但是,我覺得人類的整體的失業率不一定會下滑,有些的工作死了,新的工作又產生了。” 魏坤琳說。

 林元慶則認為,人工智能替代人類,可能會替代一些比較低端的工作,例如汽車工廠里的流水線機器人, “人工智能威脅到人類,這個事情我們的觀點覺得很遙遠。”

他告訴記者,百度的目的不是宣傳人工智能打敗了人類,最重要的是看一看百度的人工智能已經到了怎麽樣的水平。

目前,圍繞人工智能人臉識別的行業應用包括如金融領域的遠程預授信、人臉識別閘機等。

例如,遠程預授信依靠的是以大數據和人工智能為基礎的嚴謹風控體系。借助大數據+人工智能技術,風控部門為有信貸需求的群體繪制用戶畫像,建立信用體系,加上圖像識別等人工智能技術的實際應用,構成了遠程授信的技術基礎。

人臉識別用於金融行業身份認證

不過,在人臉識別領域,目前人工智能並不完美。

林元慶告訴記者,百度大腦所用的深度學習的方法,可以從海量的數據里面學到的是共性,但如果說一個人嘴邊長了一顆痣,機器學習就比較難,因為這不是共性。對於那些比較獨特的、個性化的特征,目前人工智能還沒有很好的利用。

再如識別“貓”,就算是3歲的小孩,貓擺出不同的姿勢,各種各樣的貓都能夠很好地識別。而機器如果實現精確的識別,後面需要非常海量的數據訓練,可能是成千上萬的數據。訓練的結果還不一定正確,下一次碰到姿勢不一樣的貓,有可能又識別錯。“雖然我們人工智能技術過去幾年取得了長足的進步,但是識別還是一個非常難的事情。”

 

PermaLink: https://articles.zkiz.com/?id=231247

Next Page

ZKIZ Archives @ 2019