1.「這是問題的本質嗎?」
我是在日本京都大學讀的本科和碩士,從大四開始接觸研究,導師是長尾真(Makoto Nagao)教授,方向是自然語言處理。長尾先生在自然語言處理領域做了一系列開創性的工作,在學術界很有影響。他後來成為京都大學校長,現在是日本國會 圖書館館長。長尾先生是我的啟蒙導師,我從他身上學到許多東西,讓我印象深的是他經常強調做本質研究的重要性。在研究例會上,我們向他介紹研究的進展,他 經常會問這樣一個問題:「你覺得這是問題的本質嗎?」當時,我對這一點理解並不很深。後來在自己的研究工作中,越來越體會到它的重要,對問題本質的探索其 實是做科學研究的精髓!
2.什麼是本質的研究
真正的科學研究是探明問題本質的研究,其成果應該有以下幾個特點:
(1)經得起實踐檢驗;
(2)有堅實的理論基礎;
(3)簡單明了;
(4)實用的(僅限於工學)。
因為如此,本質的研究才是有生命力的。
波普爾(Karl Popper)是二十世紀最著名的哲學家、思想家之一,他的「可證偽性(falsifiability)」理論在西方產生了巨大影響。波普爾認為任何學說 要成為科學理論,其必要條件是它必須是可證偽的,也就是說我們可以通過反例來驗證其真偽。「天鵝是白的」這個命題是可證偽的。如果找到一隻黑色的天鵝,這 個命題就會被證明是錯的。「如果我從小開始學鋼琴,現在一定能夠成為一名鋼琴家」,這個命題是不可證偽的,現在的「我」無法重新走一遍人生,也就無法驗證 其真偽。只有經過無數次驗證,不能被推翻的理論才能成為科學。即使是成為科學的理論,某種意義上仍然是假說。萬有引力定律也好,相對論也好,只是目前沒有 被推翻的、現在暫時被大家承認的「假說」。亞里士多德的學說被人們當作真理達一千多年,後來發現它是錯的。誰能保證我們現在堅信的學說將來不被證偽?科學 家的正確態度應該是,不斷試圖推翻自己建立的學說,尋求對自己學說的批評,探究更正確的學說。只有這樣,我們才能不斷接近真理。波普爾的哲學因此被稱為批 判的理性主義。
我們現在談到科學,往往意味著真理。好像科學就是真理,真理就是科學。其實,十八世紀產生於歐洲的科學,即所謂的science,是狹義的科學,僅 指物理、化學、生物等學科。科學是數學化的自然學,工學是數學化的技術學。科學的目的在於探求自然的奧秘,工學的目的在於改變人類的生活。但是,兩者都需 要抽象,都需要建立數學模型。中國歷史上有很多了不起的工匠,完成了長城、大運河、故宮等偉大工程,但是缺的是把技術總結上升為理論的想法。工匠們死了, 他們的手藝也就失傳了。
科學與工學需要抽象,就是說把最核心的概念提取出來,忽略其它要素。在考慮物體運動時,我們把物體看作「質點」,因為這時物體的其它特性都是不重要 的。抽象也意味著一定的近似。做萬有引力實驗的時候,是不可能造出一個只有兩個物體相互吸引,而沒有其它物體干擾的實驗環境的。如果我們要精確地驗證萬有 引力定律,往往發現實驗結果與理論並不完全相符。因為世界錯綜複雜,研究中的近似總是必要的。同時,科學與工學需要數學模型化,只有建立在數學理論基礎上 的科學、工學才具有普遍意義,因為數學是系統的、嚴格的。
本質的東西往往是簡單的。所謂奧卡姆剃刀原理,主張在所有可能解釋現象的理論或模型中簡單的理論或模型是最好的。
愛因斯坦說:「Make everything as simple as possible, but not simpler」(儘量把所有事情變得簡單,以致不能更簡單)。他的 E = m c^2 公式是個典型的例子。為什麼會有奧卡姆剃刀這樣的普遍原理存在,不得而知。從統計機器學習的角度來看,是可以解釋的。複雜模型往往會對已有數據進行很好的 預測,但對未知數據的預則就會有很大誤差,相反,簡單模型對已有數據的預則並不那麼好,但往往擁有更好的推廣能力,對未知數據的預測會更準。
數學、物理、化學、生物等研究不需要考慮實用,但是工學研究是要考慮實用的。這裡有一個笑話:一個醉鬼天黑時在路燈下找東西,別人問他:「你在找什 麼?」他說:「我在找鑰匙。」問:「你在哪裡丟的鑰匙?」答:「那邊。」問:「那為什麼在這邊找?」答:「因為這邊比較亮。」實用研究切忌「在已有的燈光 下找東西」,它必須是因所要解決的問題而驅動的。
抓住本質的研究是有生命力的。波爾茲曼提出了熵的概念,闡明了熱力學第二定律的統計特性,是熱力學的奠基人。但是,最初他提出這個理論的時候,得到 的卻是同行們的猛烈抨擊;大家並不認同他的學說。波爾茲曼晚年憂鬱沮喪,用手槍結束了自己的生命。波爾茲曼長眠於維也納,墓誌銘非常簡單,僅寫著熵的定義 式:S = k log W;但這是對他一生最好的總結。波爾茲曼的生命是短暫的,但他的理論卻是永恆的。
3.如何做本質的研究?
怎樣才能做本質的研究呢?前輩們曾分享過他們的觀點。
胡適提出:大膽的假設,小心的求證。這句話很好地概括了研究的兩個基本步驟。首先要能標新立異,不斷提出新的問題、新的想法。之後,要能對提出的假 說做嚴格的論證或實驗,去偽存真。曾在博文《科學家的小故事》中談到科學家的基本素質,其中包括想像豐富,思想深刻。這兩點是科研工作者必備的,也是科研 工作有別於其他工作的地方,因為只有想像豐富,思想深刻,才能去大膽假設,小心求證。卡耐基·梅隆大學金出武雄(Takeo Kanade)教授著書《像外行一樣思考,像專家一樣實踐》,提出同樣的想法,並給出很多具體實施方案。
笛卡爾提出:懷疑一切。在他的《方法論》中,笛卡爾說: 「我相信的第一個法則是,如果不是確信如此,不承認任何事情為真」(The first law I believed was never to accept anything for true which I did not clearly know to be such. )不能因為是權威人士說的,大家公認的,就一定正確,並不加思索地接受。懷疑一切的態度在研究中是不可缺少的。
有一位日本教授總結了做研究的三階段:守、破、離。對科研工作者,特別是研究生有很好的啟迪作用。研究在於創新,但是上來就否定已有的理論、方法,多半會走彎路,因為你對已有的科研成果理解不夠。應該採取的策略是:
1.守,先假設已有的理論、方法是正確的,謙虛地學習並掌握它們;
2.破,發現已有理論、方法的問題缺點;
3.離,建立自己的新理論、新方法,甚至是全新的理論、方法。
另外,功底紮實也是做好研究的必要條件。
可以看到:做研究不難,做好的研究難!正如開發產品一樣:做產品不難,做好的產品難。
(作者介紹:李航博士,微軟亞洲研究院互聯網搜索與挖掘組高級研究員及主任研究員。日本京都大學電氣工程系畢業,日本東京大學計算機科學博士。研究方向包括信息檢索,自然語言處理,統計機器學習,及數據挖掘。)