ZKIZ Archives


Zest Finance的中國實驗

2009年9月,一家利用大數據分析來進行信用評分並發放貸款的金融科技公司在美國西岸的洛杉磯成立。這家名為Zest Cash(後演變為Zest Finance)的創業公司恐怕很難想象,多年之後,它會與大洋另一端的中國市場緊密聯系起來。

7月18日,百度宣布了對Zest Finance的最新投資,並未披露具體投資金額和持股比例。而早在2015年6月,京東金融也宣布投資這家公司,並且雙方聯合成立的合資公司也即將開業。

這家為美國傳統的發薪日貸款(Payday Loans)提供在線替代產品而起家的公司,因為利用大數據進行信用評估和風險管理而名聲大噪,它也是第一家真正參與中國市場的美國金融科技公司。

不過,由於目前大數據風控在其獲取數據的合規性、風控模型的有效性方面一直存有爭議,再加上Zest Finance在美國服務的人群、覆蓋的市場並不主流,它的經驗技術能否順利移植中國市場還有待時間的驗證。

進入新市場

10個模型、3500個數據項、70000個變量,這是關於Zest Finance的大數據風控最廣為人知的一組數據。

在銀行信用卡中心工作了十幾年,曾參與過風控管理的京東金融副總裁許淩並不相信傳言。他第一次聽說Zest Finance和上面那組數據是2014年,當時,他與公司其他高管一起在美國考察金融科技公司。

“做模型開發的邏輯是,我們首先會拿一堆用戶數據變量來測試,看看跟違約率的相關性,弱相關的就淘汰,強相關的就留下,最終真正有用的通常不超過20個。”他告訴《第一財經日報》記者。

因為不相信傳言,京東金融團隊在與Zest Finance的核心成員們交流之後打了一個賭:雙方的模型團隊互換到對方公司工作一個月,用同樣的數據,分別搭建模型,在相同的時間里測試一下,如果證明Zest Finance的模型更有效,京東就會展開深入合作。

事實的結果我們已經知曉。2015年6月,京東金融宣布投資Zest Finance,雙方決定聯合成立合資公司,總部設在北京。

根據最初的規劃,這家合資公司將把Zest Finance在大數據挖掘、分析和建模等方面的核心技術進入中國,與京東金融的風控團隊合作,結合中國的數據、中國的市場,嘗試將其技術進行“本土化”落地。

Zest Finance在美國市場主要面向兩類人群,一類是(FICO評分接近或低於500)無法獲得基本的信貸需求的人群,解決他們的無信用評分借貸問題,另一類是信用分數不高而借貸成本高的人群,利用大數據征信降低他們的信貸成本。

對於征信體系、金融體系發展較為完善的美國市場,Zest Finance所覆蓋的人群十分有限。相比之下,個人征信市場剛剛起步、消費金融市場快速崛起的中國無疑蘊藏著更大的商業機會。

近年來,一方面是得益於政策環境和市場環境的變化,另一方面也是受益於風控技術和獲客方式的改進,大數據、雲計算、移動互聯等技術的普及和應用讓消費金融的風控流程大大優化、成本大大降低,獲客也更為容易。

平安證券一份報告預計,假設未來5年我國居民消費支出增速保持在12%左右的水平,居民消費信貸與消費支出比重逐年提升至20%左右,到2020年,我們非住房消費信貸的存量規模將超過9.5萬億(2015年末4.1萬億)。

以Zest Finance合作的京東金融來看,其消費金融業務上線不過兩年多時間,截至2015年末,京東金融的“白條”訂單量較年初增長了約600%。按照許淩的預期,消費金融的業務將在不久後會達到千億規模。

許淩告訴本報記者,京東金融從一開始就采用自動化審貸、大數據風控的方式,不斷訓練機器學習的能力,進行數據模型叠代,但隨著業務規模的快速增加,如何進一步優化個人信用評估和風險定價,挑戰日益增大。

京東希望通過引入Zest Finance的技術和團隊進一步提升其在大數據建模方面的專業能力。據了解,雙方的合作開始後,除了前期派駐技術團隊去對方公司學習和交流外,在合資公司成立後,Zest Finance也將派技術人士常駐中國。

爭議大數據風控

傳統信用評估模型是根據一個人的借貸歷史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況。而大數據風控所采用的數據源則十分廣泛,包括電子商務、社交網絡和搜索行為等都產生了大量的數據。

Zest Finance則篤信“一切數據皆可為信用”。它的數據來源十分豐富,既有傳統信貸征信所采用的決策變量,也有開創性引入的大量非結構化數據,非傳統數據,例如一些網絡數據、社交數據等。

其中傳播最廣也是爭議最大的是Zest Finance甚至將借款人填寫表格時使用大小寫的習慣、在線提交申請之前是否閱讀文字說明等極邊緣的信息作為信用評 價的考量因素。當然,對於這個說法,業內人士普遍認為並不可信。

冰鑒科技CEO顧淩雲在回國前曾領導並開發了Zest Finance前四代風控模型,在他看來,大數據征信的核心並不是對某個變量極其依賴,而是把很多個都只有微小影響的變量通過非線性的算法整合在一起,從而使模型的整體表現更好。

“大數據其實並不一定就是數據量本身大,我們講求的是變量涵蓋的信息緯度要多和均衡,然後才是能夠通過淺度學習和深度學習等多種複雜的算法把這些變量更有效地柔和在一起。”他表示。

許淩認為,數據需要“大”而有用,他列出了三個標準:第一是“大”數據,總量大、覆蓋廣;第二是“厚”數據,大數據是平面的、厚數據是立體的、多維度的。第三是“動”數據,京東體系內每天都在產生巨量的數據,現在京東金融本身也是巨大的數據源。

在他看來,產生“原材料”只是第一步,如何分析和理解數據是第二步。盡管Zest Finance在美國本土所面對的客群、所獲取的數據和國內有很大差異,但其技術、算法、模型卻是可以借鑒的。

許淩認為,實際上,金融的核心是電子信息,與個人掛鉤,需要某種信用背書後,進而形成信用價值去交換一些商品和服務。做大數據就和做菜一樣,擁有數據和信息這樣的原材料並不是最終的優勢。

“對用戶數據的提煉、對數據模型研發以及底層信用評估系統的搭建,去識別用戶潛在的需求和信用風險,這才真正的核心優勢,所以我們更需要一個高水平的‘廚師’團隊。”許淩說。

根據境外媒體報道,與傳統信貸管理業務比,Zest Finance的處理效率提高了將近90%。而在風險控制方面,Zest Finance的模型相比於傳統信用評估模型性能提高了40%。

但這個效果能否在中國市場得以實現,目前尚未可知。事實上,對於大數據風控的效用,業內一直存有爭議。

某金融業高管告訴本報記者,他們也曾對比過不同的風控模型(基於大數據的,以及銀行的風控模型)基於同一批數據的決策結果,其差異微乎其微。而就算是Zest Finance的模型中也加入了大量傳統的金融數據,並非完全依賴非傳統數據。

許淩並不贊同“神化”大數據風控,但對於京東消費金融的體量和增速而言,在利率基本穩定的條件下,哪怕新的風控模型能讓風控效率有微弱的提升也都是一個很大的進步,而目前實測的結果也證明了這一點。

“走出”京東

不管是Zest Finance在中國的合資公司,還是京東自己的消費金融品牌,都在努力“走出”京東。

2015年,京東金融發布“白條+”戰略,開始布局京東外更多生態體系,陸續推出旅遊白條、租房白條、裝修白條、教育白條,並延伸至校園和鄉村的消費金融市場。

與此同時,京東金融還通過投資入股的方式,布局了不少外部場景,例如,首付遊(旅遊分期)、買單俠(藍領分期)、分期樂(大學生分期)、會分期(租房分期)、美利金融(車貸分期)、淘當鋪(實物抵押平臺)等。

類消費信貸產品“出走”京東的背後其實是京東金融大數據模型體系和風控技術的對外輸出。

以京東金融與光大銀行、中信銀行合作的“小白卡”為例,從最開始的用戶申請、到審批,再到貸後管理全程,京東金融的風控模型、監測預警和用戶信用評估結果等向合作銀行開放。

京東金融CEO陳生強在不久前的一次公開發言中再一次提到京東金融定位科技金融,要做開放生態的系統構想。按照這個規劃,未來在技術、產品、用戶、資金、資產等方面的能力輸出將成為京東金融版圖中的重要一環。

在這個大的規劃之下,Zest Finance與京東的這家合資公司也將完全獨立運營,它被定位為一個純技術公司、模型研發公司,完全獨立於京東甚至京東金融之外,連辦公地點也遠離京東的大本營——亦莊。

根據規劃,這家合資公司從前期數據源的獲取,到後期數據和產品的輸出都不會局限於京東一家公司。據了解,目前該合資公司已經接入了不少外部的數據源,其風控模型也在與一些非京東系的企業對接合作。

“盡管京東會予以數據和技術上的支持,但這家合資公司仍需要面對市場化的競爭,即便是在京東金融內部。“我們自己的團隊也在不斷優化風控模型,所以合資公司必須打敗我們的模型才能被采用。”許淩稱。

在許淩看來,消費金融一定是服務於海量的消費者、擁有海量的消費場景,但這一定不是靠人堆起來的,而是高度的集約化、自動化的模型系統來實現規模化,這種規模化的優勢一定在互聯網技術的平臺上。

通過練就強大、高效的技術能力形成企業差異化的競爭優勢,進而連接更大的生態、撬動更大的市場,是這家合資公司、京東金融,以及所有定位於金融科技公司都在努力的方向。

不過,知易行難。Zest Finance的這場中國實驗才剛剛開始。