格靈深瞳下一步要專心去做的事,是如何做到專業化、產品化、讓產品落地。
看過《疑犯追蹤》的人,是否對其中的人工智能嘆為觀止?那麽,像劇中那樣能夠讓設備做到深度感知和行為認知,進而發現潛在風險的“天眼”,真能在現實中出現嗎?創業家&i黑馬人工智能系列專題新的一篇,“人工智能創新公司TOP50”榜單參選公司格靈深瞳的“機器之眼”,或許能給你新的啟發。i黑馬與今日頭條-科技聯合出品的“人工智能創新公司TOP50”榜單報名持續進行中,AI領域擁有創新原力的公司,請在文末點擊“閱讀原文”報名,和我們一起喚醒未來!
文丨楊潔
“要了解我們在做什麽,我推薦一部美劇,叫做《疑犯追蹤》。”格靈深瞳聯合創始人、CTO趙勇一本正經地告訴創業家&i黑馬。
這並不是一部簡單的罪案類美劇。除了懸疑外,其中還加入了極強的科技因素:超級AI。這不是影視劇里常見的和人類非要搞出個你死我活的機器“生物”,而是與人類相互學習、協助破案的異國“天網”。它能把國家每個角落的圖像和語音信息整合,自動理解,並把結果深度關聯,匯報出潛在的風險。“這正是我們想做的一件事。”趙勇說。
格靈深瞳從事的是計算機視覺和深度學習的技術研發,它的公司slogan就是一句簡單的話語:“讓計算機看懂世界”。趙勇是美國布朗大學計算機工程系的博士,曾在Google總部研究院擔任研究員,同時,他也是Google Glass早期的核心研發成員。2013年,趙勇創辦了格靈深瞳。目前,公司研發的皓目行為分析儀已經進入5家大型銀行監控系統,威目車輛分析特征識別系統進入某市公安局視頻偵查系統。
這是一家頗有些神秘的公司。據說,其中的員工都是來自海內外名校的學霸,要想加入,比考入哈佛難度還高。而這些“極客”們,辦公的地點,卻是與之形成了極大反差的,頤和園臨河古色古香的一所僻靜的四合院。也就是在這里,趙勇和創業家&i黑馬談到了自己創業的原由,以及格靈深瞳現在的技術發展目標。
*格靈深瞳聯合創始人、CTO趙勇(受訪者供圖)
計算機視覺和深度學習密不可分
2014年,比爾∙蓋茨訪華,除了拜訪政商界之外,還專門來到了剛成立一年的格靈深瞳,並在這里留下一句評論:“IT界的下一個大事件,是計算機視覺與深度學習的結合。”
如今在百度就職的吳恩達博士,曾參與“谷歌大腦”項目的研發。在2012年,谷歌大腦通過學習了上百萬張圖片,從中識別出了“貓”,震驚了世界。吳恩達也因此成為全球深度學習領域的頂尖學者。
格靈深瞳的計算機視覺,也與深度學習密切結合。在這里,機器通過學習設備捕捉到的影像,能夠識別圖像,認知這個世界。
用趙勇的話來說,計算機視覺,簡單來說,就是“用計算機來解決視覺問題”。而深度學習作為機器學習中的一種方法,所對應的,實際上就是算法。“深度學習和計算機視覺現在已經是密不可分的了。當然,這並不是說深度學習能夠解決計算機視覺里的所有問題。”趙勇說。他舉例道,在計算機視覺里,比如幾何類型的問題,比如光學的問題,都有其他的解決方法。像自動駕駛里非常重要的怎麽獲取深度、怎麽測量速度、怎麽測量障礙物等問題,可以通過激光雷達或者超聲波等其他方法解決,這和機器學習並沒有什麽關系。
“但是我們做人臉識別或者圖像等識別時,是和機器學習相關的。如果今機器學習沒有進展到深度學習,那麽我們今天在很多領域的各種指標,還會處於一個非常原始的狀態。”趙勇表示。深度學習和神經網絡,正在幫助格靈深瞳研發出自己的智能設備,讓它們具備識圖能力,並且在安防、自動駕駛和醫療等領域發揮作用。
在趙勇看來,這正是如今人工智能逐漸走向商業化熱潮的一大原因。“人工智能現在已經是第三次浪潮,如果說它前兩次浪潮有什麽區別,我認為,就是技術成熟到了一定程度,更接近實用了,更接近工業界的期待了。機器學習作為一種技能,它已經在不同的領域,如計算機視覺、語音識別的領域,推動它逐漸走向商業化了。現在很多學者離開了實驗室,開始創業,為什麽?因為他們感覺到,這已經可以產品化了。”
*格靈深瞳公司外景(受訪者供圖)
十年之後智能化將不能阻擋
“我們是很幸運的。”趙勇說。在2013年,人工智能並沒有被很多人所了解,計算機視覺更是個大多數人陌生的領域,但是,那年剛剛誕生的格靈深瞳,仍然罩上了一層光環。
格靈深瞳成立三個月後,就獲得了真格基金和聯創策源的聯合天使投資。2014年格靈深瞳宣布,拿到紅杉資本 A 輪數千萬美元的投資。業界也曾流傳,真格基金徐小平和聯創策源創始合夥人馮波對格靈深瞳高估值的傳說。
但是,在趙勇的回憶里,那時還是個艱難的時期。當時O2O還大行其道,技術創業並不被重視,那時趙勇和人講自己的技術語言,基本還沒人聽得懂,“而且沒人在意。很多投資人見到我,只對一個事情感興趣,就是谷歌眼鏡。他們說:你能不能山寨一個谷歌眼鏡,能做的話,我就投你;別再講人工智能,你還沒有搞清楚辦企業和當大學老師的差別。”趙勇對創業家&i黑馬感慨。“當時遭受的主要都是打擊。”
2012年,剛剛見到徐小平時,趙勇曾對他說:“現在是1977年。”那是個人電腦開始逐漸成為主流PC代表的時期。而在趙勇看來,當時人工智能的發展,和那個時代的意義差相仿佛。“或許今天我們不能看出哪個公司會成功,但是我想20年後,當人們回過頭來評價中國最好人工智能公司的時候,一定是這個時期誕生的。”
“誰能成為未來發展最好的公司,往往是要看,誰能挺過最艱難的時候。”趙勇說。這也是他認為自己“幸運”的原因,在投資人的支持下,格靈深瞳堅持了下去。
這是個投資未來的時機。
當初谷歌眼鏡的研發,就是出於探索未來的目的。“未來人和信息連接的入口,到底還是不是手機,這是一個很難辯論的問題。”趙勇說。“當時我們做谷歌眼鏡,也是在暢想,如果有一天有一樣東西能夠代替手機,它會是什麽?是不是有一種設備,你在使用它的時候它就已經在你眼前了,而不需要把你的視線從生活中移開來?”
盡管谷歌眼鏡最終還是沒能獲得成功,但是,語音識別、圖像識別等,正在逐漸成為新的智能生活交互入口的道路之上。隨著算法的進步,大數據的發展,人工智能逐漸站上了風口,盡管人工智能的發展前景仍然無法全面預測,但是智能化,卻已成為大勢所趨。
“紅杉有一個觀點是,所有的公司最後都會變成人工智能公司,我覺得是有道理的。”趙勇說。“我們的家庭,我們的個人信息設備、醫療體系、基礎設施,所有的東西都會越來越智能化。比如說滴滴,它的前半場是O2O公司,下半場一定是人工智能公司。因為日後最核心的競爭就在於如何把交通出行的效率提到最高,而要達到這個目標,光靠人是不行的,它將需要更智能的體系。”
那麽,格靈深瞳涉足的計算機視覺領域,又將會在哪些行業里最先落地爆發呢?安全、汽車、醫療,這是趙勇給出的答案。
格靈深瞳成立之後,首先選擇的行業突破口就是安防。這是因為,大多數安防、監控產品,仍然只是圖像性的,只能做到實時播放、抓取和存儲圖像。
“疑犯追蹤”雖然只是一部影視作品,但卻開啟了可想象的未來。安防產品所需要的,也正是能夠讓設備做到深度感知和行為認知。“如果要我預測的話,三年以內,國內安防的主流產品和頂尖產品,必然是人工智能的。十年之內,國內的攝像頭沒有完成智能化,我是不相信的。我認為,這個程度至少會達到90%以上。海康、大華等國內安防公司,用十年左右完成了國內安防行業的數字化、網絡化,那麽十年後,這個行業將邁進人工智能化。”趙勇說。“自動駕駛也是一樣。特定環境下的自動駕駛汽車,我認為明年就會出現。但如果是能夠在公共道路上行駛的,我認為五六年之內還不太可能出現。但如果是10年之後,如果還是沒有,我會感到很驚訝。”
*格靈深瞳威目車輛特征識別系統(受訪者供圖)
下註安防、汽車和醫療賽道
視頻監控在安防領域已經發揮了重要的作用。“天網”的建立,讓大多數公共場所的行為信息得到了監控。在北京,現在就已經有了超過200萬個攝像頭在各處發揮作用。在現在的監控網絡下,如果有犯罪行為,是很難做到毫無線索遺留。
而在這些數量巨大的攝像頭,攝錄的龐大的數據量中,尋找線索也是一件艱巨的任務。當一個人或物體從一個攝像頭移動到另外一個攝像頭的時候,追蹤其蹤跡,需要將其從其他圖像中,重新識別出來。
格靈深瞳試圖打造的,就是一個利用人工智能去分析線索的系統。格靈深瞳推出了威目視圖大數據系統,包括威目車輛特征識別系統、威目視頻結構化系統、威目視圖大數據分析平臺三部分。威目車輛分析特征識別系統,它能夠做到車輛識別。系統能夠辨識超過3000種車輛,它能夠識別出車型、車款、顏色、車牌、年檢標、遮陽板、紙巾盒、掛件、擺件、安全帶等10大特征。對於上路的無牌車、模糊或故意遮擋車牌的車輛,它可以識別車牌的細分特征,並且實現無論白天或黑夜,以及車頭、車尾均能自動識別。
假想一下這樣的應用場景。當警方提供一張車輛照片,格靈深瞳的威目,可以在交通視頻中,尋找到該車輛的行動軌跡。或者當你提供某種車輛的顏色、車型、尾號等信息,它能夠通過結構化信息搜索,檢測到相關的圖像或視頻信息。
“這輛車駛過,它是什麽顏色的,車牌號碼是什麽,它的年檢標貼了嗎?駕駛人是誰,他有沒有系安全帶,有沒有在開車的時候抽煙或者打電話?我們都可以識別出來。”趙勇說。
同時,威目的視頻結構化系統能夠支持人/車/三輪或二輪車的分類與抓拍,支持車輛和人體的細分特征識別,同時具備人臉識別功能,可以對動態、靜態的人臉進行檢測和識別。
“今天我們可以做到,在幾千個數據庫里面搜索一個人,就像谷歌一樣可以搜索結果,並且有很高的幾率把正確的結果放到比較靠前的位置。”趙勇說。而這樣,如果要檢索一個人的行動軌跡,那麽,以往可能要通過看四五個小時的視頻來尋找,而現在,系統可以把符合特征的人在十幾分鐘內列出。通過人工輔助,確定對象後,通過標簽標出關聯信息,得到這個人的完整活動軌跡。而這,將使得情報檢索的成本大大降低。
安防是格靈深瞳商業化的主要市場。目前,威目車輛識別系統已經在部分地區的公安和交通管理部門開始推廣銷售。
此外,格靈深瞳還推出了皓目人體行為分析系統。“在小範圍內,比如我們幾個人,有沒有打架,有沒有人摔倒,有沒有人在不該接近你的時候接近了你,有沒有人在面對敏感設備時做了什麽事?它可以提供監控分析。”趙勇表示,截止到去年12月份,該系統已經在30多個銀行做了試點,並且在中國目前最大的銀行之一的總行入圍采購名單。
*格靈深瞳皓目行為分析儀(受訪者供圖)
另外,還有一件需要攻克的事情是,如何將監控鏡頭中的圖像清晰地識別出來。“大多數的時候,攝像頭是看不清人臉的。要看清一張臉,在高清攝像頭里,人臉距離攝像頭的距離也必須要在四五米以內才行。”趙勇介紹。例如,當一個人出現在視頻畫面里,20米外,他的臉孔就可能還不到18*18個像素,他的模樣是無法準確辨別出的。如果要解決這個問題,就需要有一個更加高清分辨率的相機。格靈深瞳寄予厚望的人眼攝像機已經研制成功,並計劃在今年十月下旬的北京安博會正式發布,在明年初開始銷售。它采用獨創的像素動態瞬時分配技術,在距離人體50米外,可以達到數億級等效像素,展現清晰人臉。
堅信汽車行業未來將被人工智能顛覆的趙勇,在研發了一年多的無人駕駛之後,認為這是個長長的鏈條,需要引入更多的資源。今年2月,趙勇聯合前英特爾研究院院長吳甘沙、國家智能車未來挑戰賽前冠軍團隊負責人姜巖等一同創辦了馭勢科技,專註於無人駕駛和自動駕駛,為整車廠提供相應方案。“不要急著看產品,時間到了自然會推出。”趙勇笑著回答創業家&i黑馬。
醫療圖像識別同樣是格靈深瞳深入的重點行業。格靈深瞳從消化道窺鏡入手,檢測息肉腺瘤和腫瘤。“現在我能透露的就這麽多了。”趙勇說。
安全、醫療與汽車,“我選擇的方向都是和生命息息相關的。”趙勇說。“不是說娛樂、影視等行業不需要人工智能,而是我要做最重要的需求。尤其是,每一種新興技術,都必須要從2B做起,我們要做的,必須是客戶的剛需。”
所有的高新技術,一開始時,必然是成熟度不高,且只能在專業的監督環境下工作,複雜工作場景是它還不能應付的。“這也就決定了,人工智能最先開始的,必然是企業應用。”趙勇說。“第一,它還很貴;第二,它還並不成熟,只能適應單一的環境,在複雜的環境容易出問題。所以它必須得成為某一個客戶的剛需,人家才會在它不成熟的時候去應用,而這種客戶往往是政府或者是大企業的客戶,它們有的需求太強了,必須這麽做,而且又不差錢。只有等到技術成熟了,價格降低了,它才可能應用到C端。”
在計算機視覺領域,目前已經存在著眾多技術創業公司,其中也不乏明星企業的存在。但趙勇並不擔心,行業競爭將會因此爆發。“整個安防行業那麽大,光視頻這部分每年都有超過1000億的銷售額,在這千億市場里面,智能化占了多少?我覺得連千分之一可能都不到。我們要怎麽每年擴大我們的銷售額?我覺得,這才是我們現階段應該關心的事情。”
而格靈深瞳下一步要專心去做的事,則是如何做到專業化、產品化、讓產品落地。“我們以前是更加偏向算法的公司,所以,我們下一步要考慮的是,未來如何跟產業、跟我們的客戶、跟銷售離得更近一些,把產品設計得離用戶的業務系統更近一些。”趙勇說。
在這個人工智能爆發前夜,i黑馬與今日頭條-科技聯合出品,合作多家業界頂級媒體、投資機構,邀請人工智能領域專家、大咖,從專業、以及產業洞察的角度,一起來評選《人工智能創新公司TOP50》榜單。擁有創新原力的人工智能領域公司,快來報名一起“喚醒未來”!
戳鏈接快速進入報名頁面:http://form.mikecrm.com/mnXP6E
《疑犯追蹤》(影視劇照/圖)
隨著線上大數據和線下物聯網的發展,每個人在線上和線下的行為軌跡,都將被當做數據收集起來,並被人工智能技術所挖掘。數據將成為這個社會最重要的生產要素。
美劇《疑犯追蹤》里,一臺“機器”,通過遍布全球各地的攝像頭,能追蹤到任何一個人的行動軌跡,識別這個人的身份信息和信用情況。這一幕可能離我們不遠了。
今年10月,杭州市政府給這座2200多年歷史的城市,安裝一個人工智能中樞——杭州城市數據大腦。城市大腦的內核采用阿里雲“ET人工智能技術”。
阿里雲研究院專家王子淩告訴南方周末記者,這個城市大腦可以對整個城市進行全局實時分析,自動調配公共資源,修正城市運行中的Bug。城市大腦的目標是讓數據幫助城市來做思考和決策,將杭州打造成一座能夠自我調節、與人類良性互動的城市。
城市大腦計劃的第一步是,將交通、能源、供水等基礎設施全部數據化。王子淩透露說,目前,阿里雲已經跟弘泰水利合作,將水利數據聯網,用來做水庫管理、洪水風險分析和城市內澇預警。
對於數據的未來價值,阿里巴巴創始人馬雲前不久有個形象比喻:過去機器是吃電,以後機器是吃數據。
實際上,互聯網將沒有邊界,隨著線上大數據和線下物聯網的發展,每個人在線上和線下的行為軌跡,都將被當做數據收集起來,並被人工智能技術所挖掘。數據將成為這個社會最重要的生產要素。國家和企業擁有的數據越多,並能挖掘出更多價值應用,其競爭力就越大。
12月21日下午兩點左右,北京望京,高德地圖辦公室6層一個20平米的小房間里,墻上的大屏幕上,顯示著一副北京市實時交通狀況圖。
這張圖上密密麻麻地布滿了一些不斷閃爍和移動的亮點。這些是當時跑在北京城里的車輛抽樣。有的是私家車,有的是網約車,有的是出租車,還有物流車。
這些車輛跑在路上,便繪制成了交通的實時路況圖。一旦一些區域出現異常擁堵,屏幕上就會出現不斷閃爍的紅點。遇到道路嚴重擁堵,用戶會通過手機端上報,交警也通過平臺把這個信息輸送給高德,高德再把這個信息提示給所有附近用戶,並在導航中避開擁堵路段。
過去很多道路上的誘導屏,是通過交管部門在道路上埋線圈的辦法來獲取道路擁堵信息,這個辦法維護成本高。現在高德把自己掌握的交通數據通過雲方式實時共享給交管部門,誘導屏的信息就簡單更多,成本也降低許多。
一位高德工作人員告訴南方周末記者,高德地圖參與了由阿里雲主導的“杭州城市數據大腦”項目。2016年9月,城市大腦交通模塊在蕭山區市心路投入使用。初步試驗數據顯示:通過智能調節紅綠燈,道路車輛通行速度平均提升了3%至5%,在部分路段有11%的提升,真正開始了用大規模數據改善交通的探索。
高德還給交警“賦能”,提供準確快捷的分析平臺,讓交警的工作聯網化、科技化。
“哪里擁堵,不用通過市民的報警,我們的後臺能通過對道路、區域的快速計算,第一時間呈現擁堵的區域和道路並且通過平臺告知給交警,讓交警能更準確地調配力量解決擁堵問題。”上述高德工作人員說,高德把自己的數據開放給了交管部門,這樣能更科學地調配警力,同時可以作為交警的考核參考。
高德還將數據加工,將脫敏的數據分享給其他企業。比如高德可以為一些商圈提供用戶出行分析,並結合其他互聯網公司針對用戶的畫像信息,準確將用戶的出行特點、喜好特點呈現給商圈。商圈根據這些信息,可以更合理安排促銷活動。
“數據的流動、分享和共享,帶來巨大價值,最終實現我為人人,人人為我。”上述高德工作人員說。
很多企業都開始基於大數據和人工智能來建立自己的企業大腦。比如瓜子二手車就有一個瓜子大腦。
瓜子二手車首席技術官張小沛,曾擔任微軟在線廣告團隊首席研發總監,還曾擔任美國知名在線視頻公司Hulu全球副總裁,是大數據和人工智能專家。
她對南方周末記者表示,瓜子大腦掌握了大量車源相關交易數據、價格數據、殘值曲線數據、殘值衰減數據、買家和賣家數據,這些數據正被人工智能技術不斷挖掘出價值。
過去幾百年,人類經歷了三次工業革命。第一次是蒸汽機的發明,第二次是電的發明,第三次是互聯網的發明。每一次工業革命,都是先有技術革命,然後再是應用革命。具體到互聯網行業來說,過去幾十年都在技術革命,但這幾年開始逐步進入應用革命時代。
張小沛預測說,無人車、VR和AR、物聯網、大數據以及人工智能將進入日常生活應用場景。比如在醫療領域,一些小的疾病的診斷和一些化驗工作,將完全被機器取代。不過,心臟手術等疑難雜癥比較複雜,能搜集到的數據沒那麽多,醫生的經驗、想象力和判斷力依然會很重要,手術醫生短期內不太會被機器取代。
此外,大數據還被用來保護跑馬拉松選手。比如,現在市場上已經有一些智能設備,能檢測馬拉松選手的心跳數據,這些數據跟緊急救援機構打通,可以及時識別心臟問題。
未來的競爭將主要是數據的競爭。人們對數據的爭奪,將像今天對石油的爭奪一樣激烈。誰擁有的數據最多,誰能把數據處理得更快,並能挖掘出更多的數據價值,誰就越有競爭力。這一點,對個體、企業和國家來說,都一體適用。
阿里巴巴技術委員會主席王堅在一次公開場合曾說,數據就像石油和煤炭一樣,石油和煤炭是經過幾十億年沈澱下來的太陽的能量,因此企業應該註意對數據的長期沈澱。在王堅看來,數據不是天然有價值的,就像路上的一串腳印,在沒有被數字化、被計算之前,它無法產生價值。但你在網上的“腳印”,被計算後就變的有價值了。
對每個人來說,這意味著需要越來越重視自己在網上的一言一行,因為你在網上的任何交易行為、瀏覽軌跡,都將被互聯網大數據所記錄和分析。這些數據將跟你以後的信用體系相掛鉤。比如你騎共享單車,亂停放的記錄可能影響你以後的征信狀態。
未來一切的數據都將成為信用數據。因此很多人都在討論,數據的產權到底是誰的?如果歸屬個人,那麽能不能出售或者轉讓?數據背後的隱私如何保障?這些問題目前都沒有答案。
張小沛說,到底是平臺擁有數據的產權,還是個人同時也擁有數據產權,這非常值得討論。更值得討論的是,如果平臺獲利了,用什麽樣的方式把數據的價值分享給個人數據擁有者。
此外,未來數據到底是集中在大平臺手里,還是民主化、碎片化集中在不同小玩家手里,這也是業界目前討論比較多的問題。從目前來看,數據發展的趨勢是頭部效應明顯,也就說,大平臺掌握著大多數數據,小平臺的數據積累成本越來越高。
“我個人更希望這些數據民主化。”張小沛說。
中國互聯網行業的基礎設施已經搭建完畢。這些基礎設施包括交易市場、支付、物流、雲計算和大數據等。
可以肯定的是,隨著互聯網的發展,個體總體上會越來越有安全感,社會將更加公平。比如,互聯網保險和互助模式的發展。再比如,中關村很多優秀教師已經在網上授課,一個山區孩子,通過一部聯網手機,也能免費觸及這些中國最優質的教育資源。
天下真的會將沒有難做的生意。因為過去做生意,一靠資金,二靠關系。未來你只需靠數據和技術。一個是生產要素,一個是生產力。
國與國之間的競爭也將進入全新階段。正如王堅所說,龐大的數據量使計算不可能在幾臺機器上完成,一定要在計算中心里的成千上萬臺計算機上完成,這時計算就變成了公共服務。這樣的公共服務就是雲計算。能否隨時調用巨大的計算能力,自然成為企業和國家的核心競爭力。
因為互聯網,地球將變得越來越小。全球買和全球賣的速度會越來越快。用不了幾年,你在網上下單,全球任何一個地方的商品,72小時會送到你手里。如果是中國的商品,24小時甚至八小時內將送到你手里。
隨著大數據被應用到社會治理中去,我們的生活將更加安全。比如,一旦大數據發現某人買了個高壓鍋,又買了一些鋼珠,還買了點火藥,數據系統可能就會提醒公安部門註意這個人。再比如,大數據發現一個人一天內坐了幾十趟公交車,而且每趟車都不同,數據系統可能就提示這個人可能是個小偷。
整個國家的商業搬到了互聯網後,國家的治理也在搬到互聯網上。比如中國政府正在號召官員學網、懂網和用網。目前中國已經認識到互聯網治理和互聯網空間主權宣示的重要性。
可以預見,隨著政府治理模式的提升,需要掌握大數據能力的企業不斷給政府賦能。未來政府從巨頭企業采購公共服務的比例會越來越大。