📖 ZKIZ Archives


以消費金融孵化征信 京東首次披露征信布局戰略

來源: http://www.yicai.com/news/2015/09/4687991.html

以消費金融孵化征信 京東首次披露征信布局戰略

一財網 王瑩 2015-09-18 17:00:00

在2015年9月17日的中國征信領軍者論壇2015上,京東首次披露了京東金融對於征信市場的布局,京東消費金融事業部總經理許淩明確表示,京東正在籌建征信業務。

在隨後接受《第一財經日報》記者專訪的過程中,本報記者發現了一個不同於其他互聯網巨頭以及專註於征信的細分公司所不同的地方,即京東征信從場景出發,由京東消費金融孵化京東征信。“這其中有京東的內在邏輯。”許淩表示,以消費金融事業部總經理的身份來闡述整個京東征信的未來也是基於這一邏輯之上。

一個模型五次叠代

許淩對《第一財經日報》記者透露,目前京東內部剛剛上線了申請評分模型的5.0版本,該版本將單一模型拆分為6個子模型。“目前,已經有1000多個變量在該模型中運行,可對1億用戶完成征信評分。”許淩說。

2015年8月,京東發布了大數據生態系統,此次許淩再次進一步剖析了大數據生態系統內在模型的形成和叠代。

該大數據生態以中國四大發明為命名和主線。其中,“司南”為風險控制模型體系,囊括了申請評分模型、欺詐評分模型、套現識別模型、交易監測模型、催收評分模型等十幾個模型;“火藥”為量化運營模型體系,從價格敏感度模型、用戶活躍度模型、消費購買力模型到信貸需求潛力模型等;“活字”為用戶洞察模型體系,通過這套體系可以實現識別、發掘、認識用戶,從個人資產評估、身份特征畫像、履約歷史的評估、用戶行為偏好甚至用戶關系網絡的構建,支撐起對用戶的畫像和社交關系構建。基於這三大模型體系,京東征信還構建了“造紙”大數據征信體系。

許淩對《第一財經日報》記者表示,每一個模型都經過了多次叠代。以司南風控模型體系中的評分模型為例,已經叠代5次,目前投入使用的是5.0版本。

2014年1月份,該模型以銀行經典邏輯回歸模型問世,當時支持20個變量,覆蓋京東用戶達500萬;2014年6月,對邏輯回歸模型進行升級,推出2.0版本,引入30個變量,可覆蓋京東用戶2000萬;2014年9月,將邏輯回歸模型升級至隨機森林模型,此時支持的變量最高可達100個,覆蓋客群至1200萬;2015年6月,京東投資基於機器學習算法的美國大數據分析公司ZestFinance,同時,成立名為JD-ZestFinance Gaia的合資公司,聯合後,該模型引入了懲罰回歸等多類回歸模型,單一模型的變量已突破500個,用戶覆蓋量達到6000萬。目前正在運行的是5.0版本。

京東金融也透露了其打造信用評分產品“白熱度”,依托大數據征信,目前已經完成了超過一億的用戶評分,未來白熱度將從身份特征畫像、個人用戶評估、履約歷史評價、關系網絡評估、網絡行為偏好及信用風險預測六個維度刻畫用戶。

征信的邊界和三要素

做好一件事的前提是弄明白這是一件怎樣的事。

征信不僅僅可以稱之為互聯網金融的基礎,甚至可以看做金融業態的基礎。在經歷了2014年、2015年屢次被稱為該領域元年的征信被越來越多人提及,同時,也有越來越多的人擠入這一行業,紛紛要求分一杯羹。

可以發現,聲音頻出的征信市場,大量的人將風控、信用和征信混為一談。“這其中有很明確的邊界,有不一樣的做事模式。”許淩說。

在許淩看來,通俗來理解就是,風控更多是擋住壞人,信用管理則是獲得風險定價後從壞人里找到好人,征信則是底層基礎,幫助企業做風險經營行為時,識別用戶的本質,因此在更多時候規避而不去考慮其本身的定價問題。

在征信行業,數據是十分重要的變量,有了數據要進一步思考,如何將數據變成信息,最終將信息變成決策。征信的本質是識別用戶的真假,對用戶進行正確刻劃,而非考慮其好壞。好壞而產生的違約概率是每家企業在經營信用的過程中制定不同的風險偏好和定價策略。

許淩表示,如果想要加入征信行業,應該具備數據、技術和時間三大要素。

數據要素應該具備大數據、厚數據和動數據三個特點。許淩進一步對《第一財經日報》記者解釋道,所謂大數據就是數據量大,樣本量足夠大,但是大並不足夠,刻畫、識別一個人需要足夠深刻的數據維度,因此數據需要“厚”。

舉例來看,某用戶在電商平臺購買彩電,其購買的產品是國產的還是進口的,是高檔品牌中的低端產品,還是低端價位中的高端產品,這些維度都可將個人的生活、信息刻畫出來。

此外,數據還要“動”起來。“假設我現在擁有一億人的數據,但是這些數據是十年前的,對於現代來說沒有任何意義。”許淩表示,當前社會經濟變革飛速,只有數據準確、及時反映征信對象最客觀的狀態才具有意義。

第二個要素是技術,技術要素涉及模型和科技兩個層面。落實到團隊層面,在做征信開發過程中更多人將這個團隊稱之為“碼農”,其實在碼農之下有一層被稱之為“數農”的群體,即將大量的數據進行清洗和歸集;在“碼農”之上還有一層“模王”,做模型策略,制定模型的建模理論、技術路線和策略。

第三個要素就是時間。“征信行業一定要關註時間要素,因為這個要素意味著行業進入者的投入期非常長,無論是投入數據還是技術都非常大。”許淩對《第一財經日報》記者表示,“長期”不僅僅體現在投入層面,還體現在回報期上,所以不能夠用短期的商業利益去看待征信的發展和未來的投入。“此外,征信更多還是一個社會誠信和責任。”許淩說。

編輯:聶偉柱

更多精彩內容
關註第一財經網微信號
PermaLink: https://articles.zkiz.com/?id=161067

Next Page

ZKIZ Archives @ 2019