📖 ZKIZ Archives


“疑犯追蹤”中超牛的機器天眼只是幻想?NO,NO,它正在成為現實!

來源: http://www.iheima.com/zixun/2016/1014/159225.shtml

“疑犯追蹤”中超牛的機器天眼只是幻想?NO,NO,它正在成為現實!
楊潔 楊潔

“疑犯追蹤”中超牛的機器天眼只是幻想?NO,NO,它正在成為現實!

格靈深瞳下一步要專心去做的事,是如何做到專業化、產品化、讓產品落地。

看過《疑犯追蹤》的人,是否對其中的人工智能嘆為觀止?那麽,像劇中那樣能夠讓設備做到深度感知和行為認知,進而發現潛在風險的“天眼”,真能在現實中出現嗎?創業家&i黑馬人工智能系列專題新的一篇,“人工智能創新公司TOP50”榜單參選公司格靈深瞳的“機器之眼”,或許能給你新的啟發。i黑馬與今日頭條-科技聯合出品的“人工智能創新公司TOP50”榜單報名持續進行中,AI領域擁有創新原力的公司,請在文末點擊“閱讀原文”報名,和我們一起喚醒未來!

文丨楊潔

“要了解我們在做什麽,我推薦一部美劇,叫做《疑犯追蹤》。”格靈深瞳聯合創始人、CTO趙勇一本正經地告訴創業家&i黑馬。

這並不是一部簡單的罪案類美劇。除了懸疑外,其中還加入了極強的科技因素:超級AI。這不是影視劇里常見的和人類非要搞出個你死我活的機器“生物”,而是與人類相互學習、協助破案的異國“天網”。它能把國家每個角落的圖像和語音信息整合,自動理解,並把結果深度關聯,匯報出潛在的風險。“這正是我們想做的一件事。”趙勇說。

格靈深瞳從事的是計算機視覺和深度學習的技術研發,它的公司slogan就是一句簡單的話語:“讓計算機看懂世界”。趙勇是美國布朗大學計算機工程系的博士,曾在Google總部研究院擔任研究員,同時,他也是Google Glass早期的核心研發成員。2013年,趙勇創辦了格靈深瞳。目前,公司研發的皓目行為分析儀已經進入5家大型銀行監控系統,威目車輛分析特征識別系統進入某市公安局視頻偵查系統。

這是一家頗有些神秘的公司。據說,其中的員工都是來自海內外名校的學霸,要想加入,比考入哈佛難度還高。而這些“極客”們,辦公的地點,卻是與之形成了極大反差的,頤和園臨河古色古香的一所僻靜的四合院。也就是在這里,趙勇和創業家&i黑馬談到了自己創業的原由,以及格靈深瞳現在的技術發展目標。

640

*格靈深瞳聯合創始人、CTO趙勇(受訪者供圖)

計算機視覺和深度學習密不可分

2014年,比爾∙蓋茨訪華,除了拜訪政商界之外,還專門來到了剛成立一年的格靈深瞳,並在這里留下一句評論:“IT界的下一個大事件,是計算機視覺與深度學習的結合。”

如今在百度就職的吳恩達博士,曾參與“谷歌大腦”項目的研發。在2012年,谷歌大腦通過學習了上百萬張圖片,從中識別出了“貓”,震驚了世界。吳恩達也因此成為全球深度學習領域的頂尖學者。

格靈深瞳的計算機視覺,也與深度學習密切結合。在這里,機器通過學習設備捕捉到的影像,能夠識別圖像,認知這個世界。

用趙勇的話來說,計算機視覺,簡單來說,就是“用計算機來解決視覺問題”。而深度學習作為機器學習中的一種方法,所對應的,實際上就是算法。“深度學習和計算機視覺現在已經是密不可分的了。當然,這並不是說深度學習能夠解決計算機視覺里的所有問題。”趙勇說。他舉例道,在計算機視覺里,比如幾何類型的問題,比如光學的問題,都有其他的解決方法。像自動駕駛里非常重要的怎麽獲取深度、怎麽測量速度、怎麽測量障礙物等問題,可以通過激光雷達或者超聲波等其他方法解決,這和機器學習並沒有什麽關系。

“但是我們做人臉識別或者圖像等識別時,是和機器學習相關的。如果今機器學習沒有進展到深度學習,那麽我們今天在很多領域的各種指標,還會處於一個非常原始的狀態。”趙勇表示。深度學習和神經網絡,正在幫助格靈深瞳研發出自己的智能設備,讓它們具備識圖能力,並且在安防、自動駕駛和醫療等領域發揮作用。

在趙勇看來,這正是如今人工智能逐漸走向商業化熱潮的一大原因。“人工智能現在已經是第三次浪潮,如果說它前兩次浪潮有什麽區別,我認為,就是技術成熟到了一定程度,更接近實用了,更接近工業界的期待了。機器學習作為一種技能,它已經在不同的領域,如計算機視覺、語音識別的領域,推動它逐漸走向商業化了。現在很多學者離開了實驗室,開始創業,為什麽?因為他們感覺到,這已經可以產品化了。”

640

*格靈深瞳公司外景(受訪者供圖)

十年之後智能化將不能阻擋

“我們是很幸運的。”趙勇說。在2013年,人工智能並沒有被很多人所了解,計算機視覺更是個大多數人陌生的領域,但是,那年剛剛誕生的格靈深瞳,仍然罩上了一層光環。

格靈深瞳成立三個月後,就獲得了真格基金和聯創策源的聯合天使投資。2014年格靈深瞳宣布,拿到紅杉資本 A 輪數千萬美元的投資。業界也曾流傳,真格基金徐小平和聯創策源創始合夥人馮波對格靈深瞳高估值的傳說。

但是,在趙勇的回憶里,那時還是個艱難的時期。當時O2O還大行其道,技術創業並不被重視,那時趙勇和人講自己的技術語言,基本還沒人聽得懂,“而且沒人在意。很多投資人見到我,只對一個事情感興趣,就是谷歌眼鏡。他們說:你能不能山寨一個谷歌眼鏡,能做的話,我就投你;別再講人工智能,你還沒有搞清楚辦企業和當大學老師的差別。”趙勇對創業家&i黑馬感慨。“當時遭受的主要都是打擊。”

2012年,剛剛見到徐小平時,趙勇曾對他說:“現在是1977年。”那是個人電腦開始逐漸成為主流PC代表的時期。而在趙勇看來,當時人工智能的發展,和那個時代的意義差相仿佛。“或許今天我們不能看出哪個公司會成功,但是我想20年後,當人們回過頭來評價中國最好人工智能公司的時候,一定是這個時期誕生的。”

“誰能成為未來發展最好的公司,往往是要看,誰能挺過最艱難的時候。”趙勇說。這也是他認為自己“幸運”的原因,在投資人的支持下,格靈深瞳堅持了下去。

這是個投資未來的時機。

當初谷歌眼鏡的研發,就是出於探索未來的目的。“未來人和信息連接的入口,到底還是不是手機,這是一個很難辯論的問題。”趙勇說。“當時我們做谷歌眼鏡,也是在暢想,如果有一天有一樣東西能夠代替手機,它會是什麽?是不是有一種設備,你在使用它的時候它就已經在你眼前了,而不需要把你的視線從生活中移開來?”

盡管谷歌眼鏡最終還是沒能獲得成功,但是,語音識別、圖像識別等,正在逐漸成為新的智能生活交互入口的道路之上。隨著算法的進步,大數據的發展,人工智能逐漸站上了風口,盡管人工智能的發展前景仍然無法全面預測,但是智能化,卻已成為大勢所趨。

“紅杉有一個觀點是,所有的公司最後都會變成人工智能公司,我覺得是有道理的。”趙勇說。“我們的家庭,我們的個人信息設備、醫療體系、基礎設施,所有的東西都會越來越智能化。比如說滴滴,它的前半場是O2O公司,下半場一定是人工智能公司。因為日後最核心的競爭就在於如何把交通出行的效率提到最高,而要達到這個目標,光靠人是不行的,它將需要更智能的體系。”

那麽,格靈深瞳涉足的計算機視覺領域,又將會在哪些行業里最先落地爆發呢?安全、汽車、醫療,這是趙勇給出的答案。

格靈深瞳成立之後,首先選擇的行業突破口就是安防。這是因為,大多數安防、監控產品,仍然只是圖像性的,只能做到實時播放、抓取和存儲圖像。

“疑犯追蹤”雖然只是一部影視作品,但卻開啟了可想象的未來。安防產品所需要的,也正是能夠讓設備做到深度感知和行為認知。“如果要我預測的話,三年以內,國內安防的主流產品和頂尖產品,必然是人工智能的。十年之內,國內的攝像頭沒有完成智能化,我是不相信的。我認為,這個程度至少會達到90%以上。海康、大華等國內安防公司,用十年左右完成了國內安防行業的數字化、網絡化,那麽十年後,這個行業將邁進人工智能化。”趙勇說。“自動駕駛也是一樣。特定環境下的自動駕駛汽車,我認為明年就會出現。但如果是能夠在公共道路上行駛的,我認為五六年之內還不太可能出現。但如果是10年之後,如果還是沒有,我會感到很驚訝。”

640

*格靈深瞳威目車輛特征識別系統(受訪者供圖)

下註安防、汽車和醫療賽道

視頻監控在安防領域已經發揮了重要的作用。“天網”的建立,讓大多數公共場所的行為信息得到了監控。在北京,現在就已經有了超過200萬個攝像頭在各處發揮作用。在現在的監控網絡下,如果有犯罪行為,是很難做到毫無線索遺留。

而在這些數量巨大的攝像頭,攝錄的龐大的數據量中,尋找線索也是一件艱巨的任務。當一個人或物體從一個攝像頭移動到另外一個攝像頭的時候,追蹤其蹤跡,需要將其從其他圖像中,重新識別出來。

格靈深瞳試圖打造的,就是一個利用人工智能去分析線索的系統。格靈深瞳推出了威目視圖大數據系統,包括威目車輛特征識別系統、威目視頻結構化系統、威目視圖大數據分析平臺三部分。威目車輛分析特征識別系統,它能夠做到車輛識別。系統能夠辨識超過3000種車輛,它能夠識別出車型、車款、顏色、車牌、年檢標、遮陽板、紙巾盒、掛件、擺件、安全帶等10大特征。對於上路的無牌車、模糊或故意遮擋車牌的車輛,它可以識別車牌的細分特征,並且實現無論白天或黑夜,以及車頭、車尾均能自動識別。

假想一下這樣的應用場景。當警方提供一張車輛照片,格靈深瞳的威目,可以在交通視頻中,尋找到該車輛的行動軌跡。或者當你提供某種車輛的顏色、車型、尾號等信息,它能夠通過結構化信息搜索,檢測到相關的圖像或視頻信息。

“這輛車駛過,它是什麽顏色的,車牌號碼是什麽,它的年檢標貼了嗎?駕駛人是誰,他有沒有系安全帶,有沒有在開車的時候抽煙或者打電話?我們都可以識別出來。”趙勇說。

同時,威目的視頻結構化系統能夠支持人/車/三輪或二輪車的分類與抓拍,支持車輛和人體的細分特征識別,同時具備人臉識別功能,可以對動態、靜態的人臉進行檢測和識別。

“今天我們可以做到,在幾千個數據庫里面搜索一個人,就像谷歌一樣可以搜索結果,並且有很高的幾率把正確的結果放到比較靠前的位置。”趙勇說。而這樣,如果要檢索一個人的行動軌跡,那麽,以往可能要通過看四五個小時的視頻來尋找,而現在,系統可以把符合特征的人在十幾分鐘內列出。通過人工輔助,確定對象後,通過標簽標出關聯信息,得到這個人的完整活動軌跡。而這,將使得情報檢索的成本大大降低。

安防是格靈深瞳商業化的主要市場。目前,威目車輛識別系統已經在部分地區的公安和交通管理部門開始推廣銷售。

此外,格靈深瞳還推出了皓目人體行為分析系統。“在小範圍內,比如我們幾個人,有沒有打架,有沒有人摔倒,有沒有人在不該接近你的時候接近了你,有沒有人在面對敏感設備時做了什麽事?它可以提供監控分析。”趙勇表示,截止到去年12月份,該系統已經在30多個銀行做了試點,並且在中國目前最大的銀行之一的總行入圍采購名單。

640

*格靈深瞳皓目行為分析儀(受訪者供圖)

另外,還有一件需要攻克的事情是,如何將監控鏡頭中的圖像清晰地識別出來。“大多數的時候,攝像頭是看不清人臉的。要看清一張臉,在高清攝像頭里,人臉距離攝像頭的距離也必須要在四五米以內才行。”趙勇介紹。例如,當一個人出現在視頻畫面里,20米外,他的臉孔就可能還不到18*18個像素,他的模樣是無法準確辨別出的。如果要解決這個問題,就需要有一個更加高清分辨率的相機。格靈深瞳寄予厚望的人眼攝像機已經研制成功,並計劃在今年十月下旬的北京安博會正式發布,在明年初開始銷售。它采用獨創的像素動態瞬時分配技術,在距離人體50米外,可以達到數億級等效像素,展現清晰人臉。

堅信汽車行業未來將被人工智能顛覆的趙勇,在研發了一年多的無人駕駛之後,認為這是個長長的鏈條,需要引入更多的資源。今年2月,趙勇聯合前英特爾研究院院長吳甘沙、國家智能車未來挑戰賽前冠軍團隊負責人姜巖等一同創辦了馭勢科技,專註於無人駕駛和自動駕駛,為整車廠提供相應方案。“不要急著看產品,時間到了自然會推出。”趙勇笑著回答創業家&i黑馬。

醫療圖像識別同樣是格靈深瞳深入的重點行業。格靈深瞳從消化道窺鏡入手,檢測息肉腺瘤和腫瘤。“現在我能透露的就這麽多了。”趙勇說。

安全、醫療與汽車,“我選擇的方向都是和生命息息相關的。”趙勇說。“不是說娛樂、影視等行業不需要人工智能,而是我要做最重要的需求。尤其是,每一種新興技術,都必須要從2B做起,我們要做的,必須是客戶的剛需。”

所有的高新技術,一開始時,必然是成熟度不高,且只能在專業的監督環境下工作,複雜工作場景是它還不能應付的。“這也就決定了,人工智能最先開始的,必然是企業應用。”趙勇說。“第一,它還很貴;第二,它還並不成熟,只能適應單一的環境,在複雜的環境容易出問題。所以它必須得成為某一個客戶的剛需,人家才會在它不成熟的時候去應用,而這種客戶往往是政府或者是大企業的客戶,它們有的需求太強了,必須這麽做,而且又不差錢。只有等到技術成熟了,價格降低了,它才可能應用到C端。”

在計算機視覺領域,目前已經存在著眾多技術創業公司,其中也不乏明星企業的存在。但趙勇並不擔心,行業競爭將會因此爆發。“整個安防行業那麽大,光視頻這部分每年都有超過1000億的銷售額,在這千億市場里面,智能化占了多少?我覺得連千分之一可能都不到。我們要怎麽每年擴大我們的銷售額?我覺得,這才是我們現階段應該關心的事情。”

而格靈深瞳下一步要專心去做的事,則是如何做到專業化、產品化、讓產品落地。“我們以前是更加偏向算法的公司,所以,我們下一步要考慮的是,未來如何跟產業、跟我們的客戶、跟銷售離得更近一些,把產品設計得離用戶的業務系統更近一些。”趙勇說。

在這個人工智能爆發前夜,i黑馬與今日頭條-科技聯合出品,合作多家業界頂級媒體、投資機構,邀請人工智能領域專家、大咖,從專業、以及產業洞察的角度,一起來評選《人工智能創新公司TOP50》榜單。擁有創新原力的人工智能領域公司,快來報名一起“喚醒未來”!

戳鏈接快速進入報名頁面:http://form.mikecrm.com/mnXP6E

格靈深瞳 趙勇 創業 人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=218768

Next Page

ZKIZ Archives @ 2019