你、我都曾使用過顯微鏡,但這台特別不一樣。 結合罕見的近距離擴增實境技術,台大Scope+團隊開拓出一塊未來應用的新天地。 前一秒在手上還是標本,下一秒的鏡頭裡,蝴蝶的翅膀卻開始翩翩飛舞,然而將眼睛移開鏡頭,蝴蝶卻像什麼都沒有發生般,靜靜地躺在顯微鏡底下。 在台灣大學德田館五○五實驗室裡,一台外表看似3D印表機,上頭卻裝了個Oculus Rift顯示器,還放了兩個工業級相機,好像小學生胡亂搭湊的古怪機器──Scope+,就是讓蝴蝶瞬間重生的祕密。 在Oculus、宏達電、索尼掀起的虛擬實境(VR)熱潮如野火般燒向全球時,微軟HoloLens開始出貨的消息,則是再次帶起市場對擴增實境(AR)的關注。事實上,擴增實境的開發難度要比虛擬實境高得多,商機卻也更大。而就在台灣的台大校園內,一個擴增實境界的明日之星Scope+,已經在學術界嶄露頭角。 醫生愛寫程式 跨界讀資工Scope+,是這台古怪機器的名字,也是開發這台機器的團隊名稱。去年三月成軍,Scope+先是在SIGGRAPH(計算機圖形學頂級年度會議)的AR╱VR競賽入圍全球前十強,後來又在人機互動與使用者介面設計領域最頂尖的國際會議UIST上,獲得UIST Best Demo 2015。這座冠軍,意味的是Scope+擊敗了包括迪士尼研究中心、微軟研究院、韓國科學技術院、日本產業綜合研究所等十多個國際頂尖研究機構。 「最強的是麻省理工學院(MIT)多媒體實驗室。」Scope+專案負責人黃宇軒說:「能打敗他們是我們意想不到的!」今年三十六歲的黃宇軒是Scope+的發起者,更是團隊中的靈魂人物,而有趣的是,他目前除了是台大資工博士候選人,同時還是一位眼科執業醫師。 其實早在小學三年級,黃宇軒就已經展現出對資訊的興趣,開始寫程式,而在就讀長庚醫學系大五那年,他和同學組隊參加全國Java程式設計競賽,和無線通訊軟體競賽,更一舉以醫療應用「掌心華陀」,和實境線上遊戲「幻境迷城」,接連拿下亞軍和冠軍。 「那個年代,連『新創』是什麼都不知道。」黃宇軒說,當時還沒想到要把得獎的作品進一步朝商業化發展下去,「如果是現在的氛圍,當時可能就去創業了。」他說。 不過他和資訊的緣分沒有因此中斷。進入眼科實習後,他發現這是一個相當高科技的科別,科裡至少有十三台以上不同類型的檢查儀器。但他也發現,不是所有儀器都能夠把資料送到PACS(醫療影像傳輸系統)。「這不解決,我們眼科會有很大瓶頸,速度沒辦法快。」有資訊底子的他,開始在台大協助眼科專用PACS系統的建置。 過程中他也發現,醫療領域在大眾想像中是一項高科技,實際應用上,卻與最先進的科技有一段距離。而當中最大的問題,來自溝通落差。「資訊人不懂醫師的需求,醫師卻也不知道怎麼幫助資訊人員做得更好。」發現自己有能力作為兩方橋樑的他,對相關醫療資訊系統工作的投入也愈來愈多。 「但做得愈多,(發現)有很多基礎的東西,是我們這種半途出家者缺乏的。」他說:「所以我才會想說,既然這樣,眼科(實習)結束後,再來進修,真正做一些高深的研究。」而Scope+這個案子的原型,正是來自他當初就讀碩士班所提的研究計畫,一個可以幫助醫師進行術前訓練的輔助工具。 協助術前訓練 開發新工具他解釋,在進行白內障手術的過程中,最關鍵也最困難的一個步驟,是要用一個非常細的鑷子,在水晶體表面撕出一個完美的圓圈。在過去,他們能夠依靠的只有醫師的經驗與手感,而他想要改變這樣的情形。 有趣的是,在研發過程中,他發現這項技術的應用,其實不只能用在手術練習,而是比他所預想的還要更廣得多。 想像幾個常見的情景,「解剖課上,當你切開一隻老鼠,想要找出心臟、血管、神經時,旁邊一定得擺著一本書,讓你不時能抬頭對照圖譜。可能老師還得不停地逐桌去親自引導學生。」又或者,「進行電子零件組裝時,旁邊也需要一份電路圖,才能找出如何放置正確的電阻,和正確的腳位。」簡單來說,不論是生物、化學、電子,還是教育用途,這些使用顯微鏡工作的專業人士,總是得不斷重複這樣的動作:抬頭翻書、低頭看顯微鏡,接著再抬頭看書。 而Scope+可以做到的,就是把原本只存在紙本上的資訊,直接加到顯微鏡畫面裡,並且可以同步連網,讓顯微鏡不再只是獨立的一個工具。更進一步,甚至還能發展成專業引導工具,就像在進行手術練習時,醫師不再需要將視線移開顯微鏡,「(藉由擴增實境的即時反饋)我隨時可以知道對或不對。」黃宇軒說。 黃宇軒的指導教授認為,這項技術之所以能在UIST脫穎而出,最重要的是,「他們進入很微小的世界,是很近距離的。」他說,不同於目前市面上看到的擴增實境和虛擬實境主流應用,多是在電影、電玩這類大規模、遠距離的畫面,「Scope+開創的是一個很新奇的眼光,所以特別引人注意。」他認為,台灣要和既有的產業巨擘比拚娛樂市場很困難,但Scope+找到了新的切入點。 短距離擴增實境 超越前人事實上,這也是黃宇軒相當引以為傲的部分,「過去在這麼短的距離做出AR是沒辦法的。」他說:「我們自己設計、自己製作顯微鏡核心模組,才能讓你在正確的視覺,看到真實世界的畫面,這是目前AR、VR都還無法做到的事情。」他還記得,一開始啟動這個計畫時,幾乎找不到相關資料,「就算找到也沒辦法直接用。」他說,以相機這個關鍵零組件為例,他們需要的是提供機器視覺使用的工業等級產品,而他能做的,就是一個一個打電話給光學自動化檢測公會會員,找出最合適的產品 。 而且,要找出適合的零件難,要將軟硬體整合成系統更難。特別是他們在設計上,希望可以做到如同醫師實際執刀時,不須使用雙手,只要利用腳踏板就能進行顯微鏡方向和焦距控制的使用情境,「我們花很久時間才讓它動起來,超乎想像的久。」黃宇軒說。 第一個加入Scope+的台大資訊網路與多媒體研究所碩二生游子杰記得,當時為了趕上參賽截止時間,幾乎每天都忙到凌晨三、四點才離開,然後隔天一早又回到實驗室繼續趕工。而這樣的努力,最終讓他們獲得國際學術界的肯定。 幾次在國際會議做展示時,黃宇軒和他的團隊總是不免會被問及一個問題:「這個產品什麼時候要賣?」他說:「他們都覺得這東西好像已經很完整,快要上市了 。」但黃宇軒直言,這畢竟是一個學術研究計畫,不是以商業為目的開發的專案。 然而他也不否認,計畫開始的目的,就是希望Scope+最終能夠在市場上實際應用,只是他也強調,在此之前,「每一個部分都還要做到更好一點。」而開往下一代產品的引擎,已經啟動。 撰文 / 何佩珊 |
旅遊預定網站Kayak (已由Priceline在二○一二年以十八億美元收購)的共同創辦人保羅•英格利(Paul English),看著他的行事曆。他發現,他開的會與他會見的人,約有九成都與科技圈或非營利組織有關。 英格利想擴大社交圈。於是就在去年萬聖節,在主持一個化妝晚會之後,他駕著他的特斯拉Model S 開始當起優步(Uber )司機。 英格利說,「那天晚上我從午夜開到凌晨兩點收工。大家看到有人化裝成吸血鬼,還駕著一輛特斯拉,都覺得非常有趣。」 載客初體驗 萬聖節當天 扮吸血鬼載客直到今天,英格利仍然每周抽出幾小時空檔,在家鄉波士頓當優步司機,「別人的故事,聽起來總是更加有趣。」英格利在當優步司機的時候,不會為自己準備礦泉水或糖果解渴解饞。 他會準備一本筆記本,針對每一位上車的乘客在本子上記一句話。他還記得很清楚,有一次載了一個來自中國的十三歲女孩。 那女孩正在波士頓探訪幾所中學。她希望在波士頓念中學,能讓她日後比較容易進入麻省理工學院(編按:MIT就在波士頓)就讀。英格利於是告訴她說,自己是麻省理工學院的兼任講師。 英格利說,「她有些不信,說道,你既然在麻省理工學院當講師(沒錯,他還在MIT的史隆管理學院教課),為什麼還要開車?我告訴她,我有很多生活面。」當優步司機的經驗,讓英格利進一步了解如何對「服務經濟」的專業人士評分。 他最新創辦的Lola,就打算聘用旅遊經紀為消費者訂定行程,然後由消費者從一分到五分,為自己這次旅行的經驗打分數。在撰寫這篇稿件時,已經集資一千九百七十萬美元(約六億三千零四十萬元台幣)的Lola即將上市。 學會打分數 督促業務員 提高服務品質在本文截稿時,英格利當優步司機的評分是四.九七。英格利說,「我是好勝心強的人,一直在想,是哪個乘客沒有給我五分滿分?我做錯了什麼?」他之所以要用消費者打分數的辦法建立Lola,原因也就在這裡。 英格利說,「我要我的業務代表有競爭的心。有人替你打分數,你才會想到『我要做得更好』。」英格利最近打算做一種新嘗試。他沉思著說,「我的辦公室隔壁有一間酒吧。我們正在討論,我每逢周一到吧枱當調酒師助理的問題。用這種方式結識新朋友,一定很酷。」而且這麼做還有一個好處:不必擔心別人為你打多少分。 運轉手之練 旅遊業大亨跑去開優步,只為演練新公司的KPI制度 18 億美元 他創辦Kayak公司,以18億美元被購併。 1970萬美元 當司機的經驗,只為開設Lola公司,籌資1970萬美元將上市。 4.97 他當司機的評分4.97,有點懊惱為什麼不是滿分5分。 撰文 / Sheila Marikar 譯者•陳曉夫 |
資本主義的市場競爭是不會激勵大家分享數據、資源和市場的。
1月20日,創新工場董事長兼CEO、創新工場人工智能工程院院長李開複李開複受邀與MIT Media Lab(麻省理工學院媒體實驗室)負責人伊藤穰一,在達沃斯世界經濟論壇閉幕日的“人工智能焦點論壇”上探討人工智能。
隨著人工智能發展的深入,不僅僅只是“職業代替恐慌”這一個問題,李開複和伊藤更深入探討了AI對經濟結構的影響:大型企業壟斷技術和數據,中小企業進入AI領域的難度更大,市場機制如何進行調節?以及對於黑科技的偏見與濫用誤區的問題。以下內容根據現場錄音整理。
對談嘉賓:
李開複博士,創新工場董事長及CEO、創新工場人工智能工程院院長
伊藤穰一(Joi Ito),MIT Media Lab(麻省理工學院媒體實驗室)負責人,曾任Creative Commons CEO、Six Apart日本分公司主席、風險投資公司Neoteny創始人兼CEO
主持人:
蒂姆·布拉德肖(Tim Bradshaw),《金融時報》駐舊金山科技記者
人們的工作必須具備足夠的深度
主持人蒂姆:今年我首次來到達沃斯參與世界經濟論壇,感覺人工智能(Artificial Intelligence,以下簡稱AI)在今年大會已然成為炙手可熱的焦點。現在當人們談及AI和它所引發的生產力進步時,往往會一道談及AI可能引發的倫理和政治議題,甚或爭辯AI的終極價值。我希望今天咱們能換一種觀點來討論AI。
伊藤:我覺得AI確實變的熱門了,這種變化從去年底開始,2016年是非常重要的一年,連許多非計算機領域的科學家都開始提出他們的觀點,而非像過往單純質疑AI。
李開複:的確,如今AI已經被全社會所更廣泛地接受了。人們開始認識到,AI正在為現實生活服務。自2016年初AlphaGo戰勝李世石一役,為大眾揭示了一個無法否認的事實,那就是AI確實能以極高的效能掌握特定垂直領域。AI能夠為我們的生活提供許多超越當前產品與服務水平的解決方案,AI能開始正式為人們提供服務。
AlphaGo VS 李世石
蒂姆:所以,您認為這項變革的動力來自技術領域,還是外在的實體環境?
李開複:我認為它屬於技術引領的變革。數十年來,人們普遍把AI視為一項技術,確實在AI發展的同時,經濟、政治等外在環境也發生了一些改變,但我不認為實體環境的改變和AI技術的發展具有直接相關性。
蒂姆:前不久,IBM與微軟都卷入了一項重大討論,那就是AI技術是否會對人們現有的工作造成威脅,人們是否會因此失業?他們認為,AI的目的是增強人類的智能,而非替代人類。兩位認為上述論點成立嗎?
伊藤:所有事物的價值都需要經過長時間的檢驗,而並非一段短暫時間內的觀察。宏觀角度來看,我們無法否認人們會因“新技術總會導致人們失業”而恐慌,但隨著新技術的發展,某些領域又會誕生新的工作。例如在美國,高中畢業生如果想當護士,就必須就讀社區大學考執照,而AI技術能夠達到護士必須學習的操作流程技能,使得費時且昂貴的職業資格考試變得不那麽重要。護士這一職業還將存在,但將不再受限於繁瑣的操作任務和流程事務,對於想從事護士一行的人來說,這是一大利好。對於許多職業而言,立刻要談立即被AI技術取代還言之尚早。但是顯然,許多工作領域的問題正被解決也正被改變。
主導AI技術研發的各大科技巨頭,如果能為人們樹立一種正確的態度,驅散人們心中對AI技術的恐懼,也將會是一大利好。畢竟人們對AI技術的恐懼,絕大部分來自於對於AI的不解。
要消除恐懼,我們需要在兩個方面努力,其一,是消除人們心中情緒化、非理性的恐慌心理;其二,則是理性解決問題。例如,我們必須對當前的教育體系,以及職業資格認證等體系進行改革,這取決於未來機器發展的速度有多快。
在接下來數十年甚至很長時間內,AI技術都將會不斷發展。但現實是,我們的教育體系和人才市場仍然一成不變。我預見各項既有制度的僵化與缺乏彈性,將成為比AI技術本身更大的阻礙。
李開複:大體上我同意,不過我認為,我們需要更為急迫的喚醒社會集體意識來理解並準備AI時代的到來。
當今時代變革的速度,比以往任何一次工業革命時期都要快。隨著AI技術的不斷完善,越來越多的工作如今開始被AI技術取代。舉例來說,中國有一批AI創業公司正在研究人臉識別,這類技術已能批量辨識20到30萬張人臉,這是一般人類不可能達到的量級和精準度,諸如保安、邊防等從事辨識任務的從業人員,也勢必會被取代。在另外一些領域,AI處理人際和人機關系的能力確實還不如人類,醫療行業是最好的例證,醫療檢測中的某些涉及影像識別的崗位很快也會被AI技術所取代,但那僅僅是醫療專業的一小部分。
曠世科技face++人臉識別自動解鎖
所以大體上來說,人們的工作必須具備足夠的深度,需要讓自己強大到不會輕易被機器所撼動。我不認為現在正在從事這類有足夠深度工作的人們,會輕易被AI取代。
當前有兩項重大的任務等著我們去解決。其一,是思考如何調配未來二十年大量被AI技術替代的工作者;其二,是我們的教育亟待改革。我們需要對我們的子女、下一代子女進行再教育,分析哪些工作不會被輕易替代,而不僅僅去幻想從事目前看似光鮮亮麗的工作。
投身服務業可能是其中一個選擇。我們希望能鼓勵更多人參與人際間的交往互動,建立機器人與人類的交流溝通模式,並不是所有人都能做到這一點,而這些對於服務行業來說至關重要,AI技術能夠使未來的服務業更被人們期待和尊重。
伊藤:日本人對於服務行業的看法就很有意思。日本人認為,服務業是與人打交道的工作。在日本很少有人帶著好萊塢夢,為了將來成為明星而在餐廳打工,他們單純就是喜歡在餐廳工作、熱愛著他們的顧客,這樣的態度完全刷新了我個人對於工作價值的認知。
我們有必要重新設定價值的評價體系。過去我在日本的時候,日本還是一個經濟發展至上的國家。但如今,人們的觀念已經發生了很大轉變。在以前,工作只是為了獲得金錢,而金錢是衡量一個人是否成功的標準。
但如果你基於你對工作技藝的精通程度去評價你是否熱愛這份工作,同時改采你對工作的熱愛程度來衡量成功,那麽很多被歸結為服務行業的職業其實都相當成功,服務本身可能談不上偉大,也不在創造什麽新事物,但這些當下從事的工作讓你明確目標,支撐著你的生活結構,讓你找到人生的意義。
我們應當少關註一點工作產出的經濟效益,而更關註工作的目標和意義。舉例來說,育兒應當是國家GDP的組成部分,而不是像現在這樣只被視為家務,養育下一代對全社會而言至關重要,如果每個父母都能在育兒領域多花些時間,社會將會變得更好。我們在比較人和機器的勞動產出時,多半僅僅用勞動價值和工時長短來衡量人類的產能,卻忽視了工作背後潛在的社會價值。這也是為何許多非計算機領域的科學家自去年起,也開始提出他們的觀點。
李開複:另外一個重點在於,人類的工作進入了一個新的層次。人們在競爭中,將選擇更好的雇主和工作,同時取得工作技能與深度上的提升,逐漸成為各類專業能手和頂尖人才,甚至最後成為特定領域的首席科學家、最有價值的金牌球員、最受饕客追捧的明星大廚等。
但機器也擁有著屬於它的全新定位。我們要做的是去思考在AI時代來臨之際,如何保留一手的經驗,如何為人類提供成長的空間,從而創造更多的就業機會,為人類共同的未來找到更好的解決方案。
蒂姆:那麽隨著AI技術的普及,社會上的職業構成、各類職業對經濟貢獻的性價比會不會隨之改變?例如,一個人周遊世界開另類雜貨鋪,會不會比在辦公室當一名白領賺得多?
伊藤:這正是另一個關乎整體經濟的重要問題。 如果AI真能把整體社會的生產力無限提高到一個極其充沛的程度,那很多人可能根本就不願意繼續從事現在的工作,如今包括政府公務員在內,很多人在崗位上過度勞動,薪水卻巨低無比。這些職業的確需要政策扶持和薪酬相關的補助,才能鼓勵人們考慮選擇那些看似低回報的工作。
古希臘的雅典城邦就是一個例子。當然我們現在沒有那時代的奴隸制,但想象我們處在一個充滿了藝術家、哲學家的社會,那時公民們關心的,會是資源分配是否公平、收入是否均等。這並不意味著我們不再需要工作,否則就太不符合現代的經濟法則。社會仍然需要人類勞動力,但人們將變得更富裕、更能投身內心真正渴求的工作,將會有更多的音樂家能心無旁騖專註他們熱愛的創作、廚師們方能每天精心烹調讓人贊嘆的美食,他們周遭人們的生活體驗,將會因此更為多彩豐富。
蒂姆:說到剛才的音樂家,如今他們掙錢的道路似乎更辛苦了。您覺得該由誰來支付這種額外收入?是政府?還是科技公司?
伊藤:目前的音樂行業,正隨著流媒體技術、更趨完善的數字版權制度蒸蒸日上,可預見的是,數字音樂不會在近期沒落,產業規則和行業規模隨著技術平臺而生了重大變革,整體音樂行業反而是在上升的。但是,我預見音樂產業各種獨家約束制度仍然是個發展瓶頸。上世紀後期,在電視和傳統音頻媒介當道的時候,巨星經濟、高銷量唱片和企業壟斷形成了當時的市場格局。但現在,這種體系已經過於複雜、而且不符合當今以技術平臺為主流的發布體系。
李開複:不僅是音樂行業,其他的行業也存在著明顯的問題。例如,專欄作家和記者們的前途也值得憂慮,他們依循傳統媒體遊戲規則都曾經歷過獲利頗豐的年代,而對於新的技術平臺分發規則、更為AI自動化的媒體模式他們仍未做好準備,記者編輯們的專業地位也需要被重新檢視與定位。未來型的AI技術公司將有機會賺得較高的經濟收益,這些創新公司甚至能和前沿政府緊密合作,共同為未來世界的工作結構和薪酬制度,進行前瞻的規劃和準備。
我們過去專註在培養數理化人才,為了訓練符合上個時代需求的工程師、醫師、會計師、律師等等專業人才,我們已經投資龐大的社會資源,導致很多人打從學習階段其實就開始偏離了他們的核心潛能而毫不自知。在不久的未來,許多工作都能被機器取代,人們將從這種演進中被釋放,真正投入我們擅長、我們熱愛的領域。
未來的“電車難題”
蒂姆:讓我們再來談一下當前AI技術帶來的經濟收益。由於AI技術對於大數據存儲、從業人員技能、輔助設施研發等領域提出了高門檻的要求,是否因而大部分收益都將集中在屈指可數的幾家大型科技公司中?對於其他小型的創業公司,由於缺乏機器、缺乏數據集,AI技術的研發成本無疑是巨大的,您認為AI技術對經濟結構有什麽影響?
李開複:我覺得目前的體系會持續促使大型科技企業不斷發展。他們有能力壟斷資源、壟斷數據,在商業利益和激烈競爭的驅使下,他們會不斷競逐更為精進的技術能力,為公司賺取更大的利益。對於較小企業,進入AI市場的難度的確比移動互聯網時代的創業高出非常多。
我呼籲行業需要大力推動AI生態系的開放性。創新工場北京總部和我們所投的創業公司體系中,已經啟動了全新的AI技術相關研發工作,近期我們成立了人工智能工程院,帶著孵化中國AI生態系的目標投入大量資源,招聘培訓一批年輕工程師入門AI領域,展開可公開數據集的采集和標註,我們也積極尋求在中國和全球資本市場的融資和成長機會。
全球AI競技場上,美國市場有Google、Facebook、微軟,中國市場有百度、騰訊、阿里巴巴等行業巨頭,激烈的市場競爭導致他們的技術極低程度會考慮開放出來,創新工場希望能夠借此成為AI領域開放發展的倡議者和實踐者。
蒂姆:我們之前提到,誰擁有數據上的優勢,誰就擁有敏銳的洞察力和創新能力。那麽非技術型公司什麽時候能夠真正采用AI技術,亦或是只能運用像IBM、Google、微軟等公司的平臺?
伊藤:隨著世界愈發緊密互連,要以“贏家通吃”的玩法去壟斷市場是越來越難。現在,如果某個個體試圖進行壟斷行為,會自動觸發市場機制。市場競爭會形成限制:如果某方采取壟斷動作,對標競爭的另一方會花數百上千萬美元去找到超級優秀的AI博士們來迎頭趕上。現今人才培養的源頭已經到位,但我擔心,當某個企業實現了壟斷甚或做上了寡頭的時候,自然而然能順勢招募AI領域的全球才俊,吸引能夠負擔他們百萬美金酬金的投資人,種種多方因素都正匯聚在一起。市場單方面依賴競爭機制進行調節並不完善,因此,我對開複和創新工場在中國推動的開放做法特別感興趣。
接著我想說下一個經典的“電車難題”,雖然看起來有點偏題,但其實這個跟我們的討論挺相關的。這個研究大概就是詢問人們,如果街上一輛滿載乘客的電車馬上就要撞上一大群人,它應不應該立刻轉向,犧牲車內乘客的生命,還是放任讓車輛撞上人群。結果大多數的人都說,當然應該犧牲車內乘客的生命來保全更大一群人。但如果按照這個標準設計一輛無人駕駛汽車,你們會不會買具備這種人性道德的汽車?我是肯定不買。所以其實這就意味著,當我們只把責任交由市場機制,人們普遍都是自私的。
而且,就像開複所說的一樣,資本主義的市場競爭是不會激勵大家分享數據、資源和市場的。傳統的政府監管方式過去曾經行之有效,但在面對互聯網的開放和動態結構,這種傳統的監管方式將會失效。現在這些AI、比特幣和其他所有領域中的問題,都不是過去十年二十年間學者們研究的題目,而是真正在資本市場能夠快速賺錢的技術。然而相較於開放的互聯網,行業不曾充分在開放場域來探討這些技術衍生的問題和現象,這是我的擔憂所在。
李開複:我們倒是嘗試采用實務並直接一點的方法,用大公司跟大公司來抗衡。比如某巨頭企業說他們能夠提供數百萬美金的資金,另一家巨頭企業便說我們可以提供一個昂貴的開放平臺。我們不知道這個方法是否有效,但畢竟我們都是敢於冒險的資本家,這個策略肯定是值得嘗試的。作為風險投資家,我們理解商場上凡事皆求回報,我們試圖串聯各方利益點,聚合成一條具有共通性的利益鏈條。
蒂姆:現今大家都能看到AI產出已經開始變得極具說服力,那麽投入方面狀況如何?誰在編寫、改進算法,我們又怎麽知道這些算法何時會被使用?AI技術的透明性又如何?市場能否避免AI這樣的黑科技遭受偏見誤區,或者避免AI技術被濫用?
李開複:我覺得目前有些公司采取所謂公開透明的做法,其實是很討喜的宣傳手段。但我也確實擔心,下面這種兩難問題會不會出現:一些公司選擇通過自律或推動立法來限制錯誤發生,但另一些公司不會這麽做。自然而然,比較規範自律的公司由於發展顧慮更為周全,相對發展速度上可能放緩;而較不顧慮錯誤發生的企業,反而可能成為最快速或最成功的那一方?
例如在無人駕駛技術的開發上,Google很小心謹慎,把保護駕乘人員和行人放在了極其重要的位置上,技術不成熟就不推廣;相反,特斯拉的AutoPilot就很激進,會直接把測試版產品拿給公眾進行試驗。然而現在看來,特斯拉造出好無人駕駛車的可能性還要更大一點。所以這個難題對任何規模、任何階段的企業,都是一個道德層面的決策。
伊藤:偏見同樣會影響到產品開發。曾經有某家企業開發面部識別系統的時候,僅用他們自己的工程師作為訓練數據庫的模板,但發布演示產品的時候,這個產品竟然認不出一位黑人女性的臉,正因為他們的工程師全都是白人男性。很多偏見,是你在日常職場中不容易意識到的。
過往許多公司會去搜集信息、理解客戶,然後給出個解決方案。如果要做一個真的對社會有益、解決問題的架構,就只要想著把這個工具做得更好、更有用就可以了。我喜歡舉會計和電子表格的例子,在VisiCalc發布以後,這個蘋果公司自己都不知道該賣給誰的軟件出乎意料獲得會計行業的巨大歡迎,這讓他們欣喜萬分。於是他們在VisiCalc中投入了更多的靈感,VisiCalc 的開發者都沒有設想過它有如此多的可能性。
我們需要的不是企業銷售人員出去收集客戶需求,然後回頭要求工程師做出什麽,我們需要的是賦予人們自己打造這些工具的能力,這不會是目前主導AI領域那些科技巨頭的商業模型和運作方式,反而更可能來自像開複您所投資的實踐型的創業者。
蒂姆:數據和最終的成果歸屬之間是否有條清晰的界限呢?比如說如果某個商業公司使用Google的演算法找到公共部門數據中有利可圖的部分,例如運用某些醫療數據而大賺一筆,會發生什麽?會因為來源是公共數據而把這樣得來的利潤回報給政府呢,還是因為用了Google算法而成為其產品的一部分呢?畢竟沒有公共數據就不會有這一結果,目前這些數據相關的行業規則是如何制定的呢?
李開複:我感覺我們正站在一道門前,正打開去探索一個美麗勇敢的新世界,針對上述問題其實行業還沒有定論,也應該好好充分研究一下這個問題。
伊藤:看來科技巨頭們有一套針對現存數據庫、獲取數據的戰略。Google、Facebook或中國的百度、騰訊當然都會收集大眾的數據、從公共的數據中試圖做出成果。但很顯然個人電子郵件就不是公共數據,想要購買這些數據也是不可能的。也有很多人爭論是算法重要還是數據重要,顯然兩個都十分重要,但不同企業由於其業務屬性的側重,將會有不同的選擇。
蒂姆:我在這星期聽到許多關於人工智能未來是不是真的能帶來巨大收益的相關討論,比如增加稅收,幫助政府能讓所有人都開心地生活還不用工作。你覺得AI能緩解社會焦慮、解決其他情況下可能會出現的不平等問題嗎?它會是我們期待的那個靈丹妙藥嗎?
李開複:應該說這是必然的,在可預見的未來大規模的職業轉移即將發生,人才與人力需要重新部署,在AI驅動的工作形態改變之際,有兩部分我自己特別關註:一是孩童和成人的教育體系,舉例前面提到的音樂家、育兒等都將更能彰顯其價值,目前各項專業教育和技能培訓需要檢視其未來的適切性。二是人們有更充裕的時間來體驗享受更優質的娛樂,娛樂行業比如虛擬現實(Virtual Reality)在未來勢必更為百花齊放。
蒂姆:這是場非常有意義並非常有趣的對談,十分感謝你們參與。
未來,最繞不開的話題就是人工智能了。
本文由機器之心(微信ID: almosthuman2014)授權i黑馬發布。
為了讓機器人按照人類想法行事,它們就得理解我們。很多時候,這意味著不得不做出妥協:教機器學懂得人類語言的玄妙,比如,為它們提供特定任務的具體指令。
但是,如果可以研發出一種類似人類自然延伸的機器人,讓它們可以按照我們的想法自如行動,又會怎麽樣?
麻省理工學院的計算機科學和人工智能實驗室(CSAIL)的團隊和波士頓大學正在攻克這一難題,他們打造出了一種反饋系統,讓人類僅用大腦就可以迅速糾正機器人犯下的錯誤,這款 MIT 研發出的反饋系統能夠讓人類操作者僅通過大腦信號就能實時糾正機器人做出的選擇。
使用腦電圖(EGG)檢測器(用來記錄大腦活動的)輸出的數據,當機器人執行某個目標分類任務時,該系統可以識別出人類是否註意到機器人犯錯了。這一團隊研發的新的機器學習算法能夠幫助系統分類 10 到 30 微秒空間中的腦電波。
盡管該系統當前只能處理相對簡單的二項選擇,但是,這篇論文的資深作者表示,該研究表明,人類有一天能夠以更加充滿直覺的方式控制機器人。
「想象一下你無需輸入命令、按按鈕或口頭命令,就可以迅速告訴機器人做出某個動作。」CSAIL 主任 Daniela Rus 說,「這種高效的解決方案將提升人類監管工廠機器人、無人駕駛汽車以及其它尚未發明技術的能力。」
在該項研究中,團隊使用了一臺「Baxter」人形機器人,該機器人的生產廠商是 Rethink Robotics,其負責人是前 CSAIL 主任,也是 iRobot 的聯合創始人 Rodney Brooks。
這篇論文的作者是波士頓大學(BU)的 PhD candidate Andres F. Salazar-Gomez、CSAIL 的 PhD candidate Joseph DelPreto 和 CSAIL 研究科學家 Stephanie Gil,指導老師為 Rus 和波士頓大學的教授 Frank H. Guenther。該論文已經被將於今年 5 月在新加坡舉辦的 IEEE 機器人與自動化國際會議(ICRA)接收。
通過直覺與機器人互動
在過去,通過 EEG-控制的機器人需要人類以計算機可識別的固定方式進行「思考」。例如,一個操作人員面前有兩束亮光,他必須要看其中一個才能讓機器進行特定工作,因為每一束亮光都與機器人的特定工作任務有關。
這種方法的缺陷在於訓練過程和對人思維活動的建模是非常耗時耗力的,特別是對那些監督導航與構建工作的人來說更是如此,因為這些任務需要高強度的註意力。
Rus 的團隊想把這整個過程變得更自然點。為了實現該目標,他們聚焦於一種稱為「誤差相關電位(error-related potential,ErrP)」的大腦信號,只要我們的大腦意識到了一個錯誤,這種信號就會生成。當機器人給出它打算做哪一種選擇時,該系統就會使用 ErrP 信號來判斷人類是否同意機器的這個決定。
「當你看著這個機器人時,你所需要做的僅僅是在大腦中同意或者反對它正在做的事情就可以了,」Rus 說道,「你不必訓練自己一定要以某種特定方式來思考——我們的機器會來適應你,而不是反過來。」
大腦 ErrP 信號非常微弱,也就是說該系統必須要調整得足夠到位才能讓它既可以分類這些信號又可以配合反饋回路中的人類操作員。除了首要檢測 ErrP 信號外,當系統沒有意識到來自人類的糾錯信號時,團隊也讓機器去偵測所謂的「次要錯誤(secondary errors)」。
「如果機器人不確定自己的決定,它可以觸發一種人類反饋機制來獲得更加準確的答案,」Gil 說道,」這些信號可以非常有效地改善精度,創造一個人機之間持續交流相互決策的對話過程。」
盡管該系統還仍然無法實時識別第二類錯誤信號,但 Gil 預計該模型在能夠識別該信號後可以提升 90% 的精度。
此外,由於 ErrP 信號的強度已被證明可以顯示機器人的錯誤到底有多嚴重,所以,該團隊相信未來的系統可以擴展到更加複雜的多選項任務中去。
Salazar-Gomez 指出,該系統甚至也適用於那些無法進行口語交流的人:像拼寫這樣的任務可以通過一系列離散的二元選擇(discrete binary choices)來完成,Salazar-Gomez 將其比作一種高級版本的眨眼機制,該機制允許中風患者 Jean-Dominique Bauby 可以撰寫自己的回憶錄《潛水鐘與蝴蝶(Le Scaphandre et le Papillon)》。
「該項工作讓我們距開發有效腦控制機器人和假體的目標更近了一步,」弗萊堡大學計算機教授 Wolfram Burgard 說道(他沒有參與此項研究),「考慮到將人類語言翻譯成一種有意義的機器可識別的信號是件異常困難的事情,該領域的工作對於未來的人機協作實在是具有深遠影響。」
該項目的部分資助來自波音公司(Boeing)與美國國家科學基金會(National Science Foundation)。以下是對原論文的摘要介紹:
論文題目:通過 EEG 信號實時糾正機器人所犯的錯(Correcting Robot Mistakes in Real Time Using EEG Signals )
摘要:借由人類合作者大腦活動與機器人進行交流能夠提供一種直接而且快速的反饋回路,對人類合作者來說,這一交流方式簡單而且自然,從而使得根據直覺與機器人互動完成各種任務就不再是夢。這一論文探索了將誤差相關電位(ErrP)應用到閉環機器人控制的方法。ErrP 信號對機器人任務特別有用,因為它們是大腦活動對預期之外誤差做出反應的過程中自然出現的。我們解碼了人類操作員實時控制一臺 Rethink Robotics Baxter 機器人完成一個兩項選擇任務過程中的 ErrP 信號。我們也表明,利用這一閉環機器人任務期間生成的、與潛在誤差相關的次要互動信號能夠大大提升機器人的分類任務表現,這也暗示著新的讓機器人獲取人類反饋的手段。我們完整描述了整個系統的設計和應用,也展現了實時閉環以及開環控制實驗結果,以及對主要(primary)和次要(secondary)ErrP 信號的離線分析。我們使用了一般人群的受試者完成實驗任務,這些受試者之前未經訓練或篩選。因此,這一研究證實了 EGG 為基礎的回路方法的潛力,有望實現無縫的機器人控制,也朝著實時直覺互動這一目標更進了一步。
圖 1:基於實時解碼觀察者的 EEG 信號,機器人被告知它的首個動作是錯誤的,並且它會根據合適的物體類別做出正確選擇
圖 4:系統包含一個主要的實驗控制器、Baxter 機器人、一個 EEG 獲取與分類系統。一個 Arduino 系統轉播控制器和 EEG 系統之間的信息。機械連接開關檢測機械臂動作啟動。
圖 6:識別一次 EEG 數據緩沖中的 ErrP 的各種預處理和分類階段。這個決策會立即影響到機器人的行為,而機器人的行為又會影響到 EEG 信號,從而形成反饋回路的閉環。
原文鏈接:http://news.mit.edu/2017/brain-controlled-robots-0306