ZKIZ Archives


法無定法

何元普,晚清人物,是個讀書人,英法聯軍火燒圓明園時投筆從戎,任北京總理外城巡防,負責保衛京師,被譽為“戎馬書生”。後因在官場發展不如意,42歲左右憤而“劈炮唔撈”,過着財務自由唔駛do的令人艷羨生活,整天跑到寺廟裡與和尚談禪論詩,於是他的文才武功也就變得鮮為人知,反而是他在四川新都寶光寺留下的兩句話,一直被人傳誦至今,就是那副天下名聯:

  世外人法無定法然後知非法法也
  天下事了猶未了何妨以不了了之

池某是在大學寫作班教授印發的notes裡第一次看到這副對聯,頓時把平仄對仗等賞析標準忘記得一乾二淨,而被其超脫的意境深深震動,至今難忘。

上文談到翻譯,真是不敢想像Google translate會把“法無定法”、“非法法也”譯成怎樣的笑話,池某倒是想起一句頗合其意思的英文,“The only rule is no rule”。亦可見擺脫教條主義條條框框的約束、突破傳統的思維限制,是古今中外皆然的人類智慧。

接回上文再從機器翻譯談起,有別於傳統利用語法規則作處理的做法,Google translate是“非法法也”地只使用了一個很簡單的統計語言模型。池某在一篇文章中看到,“事實證明,統計語言模型比任何已知的借助某種規則的解決方法都有效。在Google的中英文自動翻譯中,用的最重要的就是這個統計語言模型。美國標準局(NIST)曾對所有的機器翻譯系統進行評測,Google的系統不僅是全世界最好的,而且高於所有基於規則的系統很多。”

這篇文章的作者為吳軍博士,曾擔任 Google Research的資深研究員,在 Google 主要的貢獻包中日韓搜索算法,Google Anti -Spam的創始人,且是中日韓搜索部門的創始人。吳軍博士曾發表一系列談及以數學方法解決信息學問題的文章,後來集結成《數學之美》一書。


書裡深入淺出地介紹了很多處理海量、複雜信息的奇招妙法,令人嘆為觀止。例如以隱含馬可夫模型(Hidden Markov Model)解決語音識別,又如最有效的新聞分類方法竟是中學的數學知識Cosine Law。而最令小賭徒池某精神為之一振的,是那篇對最大熵(Maximum Entropy)模型的討論。最大熵,名字看起很可怕,原理卻很簡單,就是保留全部的不確定性,將風險降到最小。

解決不確定性,把風險降到最小,是每一個賭徒、投資者難以抗拒的誘惑。然而,雖然數學家早已證明了,對任何一組不自相矛盾的信息,這個最大熵模型不僅存在,還是唯一的,且是以簡單的指數函數形式存在,但要實現最大熵模型卻很複雜,計算量龐大。

吳軍博士寫道,80年代,很有天才的Della Pietra兄弟在IBM對最大熵模型的算法作了很大改進,但90年代初他們就退出了學術界,到金融界大顯身手。他們兩人和很多IBM語音識別的同事一同到了一家當時不大,但現在是世界上最成功的對沖基金公司Renaissance Technologies。“我們知道,決定股票漲落的因素可能有幾十甚至上百種,而最大熵方法恰恰能找到一個同時滿足成千上萬種不同條件的模型。Della Pietra兄弟等科學家在那裡,用最大熵模型和其他一些先進的數學工具對股票預測,獲得了巨大成功。”

池某查了一下網上資料,1989年到2009年間,Renaissance Technologies的大獎章基金平均年回報率高達34%,較同期標普500指數年均回報率高20多個百分點,比索羅斯和巴菲特同期的操盤表現都高出超過10個百分點。即使是在次貸危機爆發的2007年,該基金的回報率仍高達85%。

語音識別、機器翻譯,與股票投資看起來是風馬牛不相及、大纜都扯唔埋的事情,操作方法竟然可以互通使用,算得上是“法無定法”、“非法法也”的最佳印證了。
PermaLink: https://articles.zkiz.com/?id=247421

Next Page

ZKIZ Archives @ 2019