3月21日-22日,第十二屆中國(guó)城市商業(yè)銀行信息化發(fā)展創(chuàng)新座談會(huì)在廈門隆重召開。本次座談會(huì)以“融合、創(chuàng)新、共享”為主題,來自人民銀行分支機(jī)構(gòu)、全國(guó)性商業(yè)銀行,城市商業(yè)銀行、民營(yíng)銀行、部分農(nóng)信社(農(nóng)商銀行)、金融科技公司等機(jī)構(gòu)600余名代表齊聚一堂,共同探討金融科技的前沿技術(shù)和創(chuàng)新實(shí)踐。DataCanvas九章云極受邀出席此次盛會(huì)。
中國(guó)互聯(lián)網(wǎng)金融協(xié)會(huì)會(huì)長(zhǎng)李東榮,中國(guó)人民銀行科技司司長(zhǎng)李偉出席會(huì)議并發(fā)表主題演講;中國(guó)人民銀行廈門市中心支行行長(zhǎng)王彥青,廈門國(guó)際銀行副總裁兼中國(guó)境內(nèi)總經(jīng)理黃大慶,城市商業(yè)銀行資金清算中心主任陳曉平,中國(guó)金融電子化公司總經(jīng)理、《金融電子化》雜志社社長(zhǎng)張永福分別致歡迎辭。DataCanvas九章云極售前副總裁周曉凌受邀在本次座談會(huì)上發(fā)表題為《新金融時(shí)代的數(shù)據(jù)科學(xué)應(yīng)用價(jià)值》的精彩演講。

(DataCanvas九章云極售前副總裁周曉凌)
周曉凌說,在數(shù)據(jù)分析的發(fā)展過程中,以往強(qiáng)調(diào)的“洞見藝術(shù)”和“挖掘藝術(shù)”分別轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)化的科學(xué)組件和科學(xué)過程,數(shù)據(jù)科學(xué)這門獨(dú)立的學(xué)科也就應(yīng)運(yùn)而生。不管是數(shù)據(jù)分析從藝術(shù)化到標(biāo)準(zhǔn)化的衍變,還是市場(chǎng)上流行的邏輯數(shù)據(jù)倉庫(LDW),其目的都是通過提高已知數(shù)據(jù)分析效率,解決現(xiàn)有問題、預(yù)測(cè)未來結(jié)果。
機(jī)器學(xué)習(xí)平臺(tái)建模,直擊建模效率痛點(diǎn)
以商業(yè)銀行數(shù)據(jù)工程平臺(tái)為例,數(shù)據(jù)在平臺(tái)上需要經(jīng)過數(shù)據(jù)源收集、采集整合、加工存儲(chǔ)、分析計(jì)算、數(shù)據(jù)服務(wù)、模型服務(wù)等環(huán)節(jié),其中模型服務(wù)環(huán)節(jié)的落地痛點(diǎn)尤為突出。傳統(tǒng)的建模方式是由數(shù)據(jù)科學(xué)家結(jié)合業(yè)務(wù)知識(shí)和數(shù)據(jù)科學(xué)經(jīng)驗(yàn)人為建模,甚至被稱為“藝術(shù)”。
這種建模方式對(duì)建模者的知識(shí)要求和依賴性較高,同時(shí)由于建模過程中需運(yùn)用多種數(shù)據(jù)加工方式、多種特征處理方式以及多種模型選用和模型訓(xùn)練,巨大的工作量導(dǎo)致建模時(shí)間很長(zhǎng),且結(jié)果不穩(wěn)定,模型能力落地也就困難重重。

在DataCanvas數(shù)據(jù)科學(xué)平臺(tái)上,通過將寬表加工、特征工程、模型訓(xùn)練三個(gè)階段自動(dòng)化處理,建模效率實(shí)現(xiàn)飛躍提升。寬表加工能夠?qū)崿F(xiàn)自動(dòng)數(shù)據(jù)清洗、自動(dòng)表關(guān)聯(lián)、自動(dòng)類型識(shí)別、自動(dòng)分布檢測(cè)和自動(dòng)相關(guān)性檢測(cè);特征工程能夠?qū)崿F(xiàn)自動(dòng)特征選擇、數(shù)據(jù)集特征抽取、自動(dòng)基礎(chǔ)特征衍生和自動(dòng)高維特征衍生;模型訓(xùn)練則能實(shí)現(xiàn)自動(dòng)模型選擇、自動(dòng)模型組合、自動(dòng)超參數(shù)優(yōu)化、自動(dòng)結(jié)構(gòu)搜索和自動(dòng)模型評(píng)估等。
“三位一體”、高可用、可解釋,實(shí)現(xiàn)模型資產(chǎn)儲(chǔ)備
除此之外,DataCanvas數(shù)據(jù)科學(xué)平臺(tái)還具備“三位一體”建模功能。面向數(shù)據(jù)科學(xué)家的編碼建模,面向IT工程師的拖拽式建模和面向業(yè)務(wù)人員的自動(dòng)機(jī)器學(xué)習(xí)建模,三種建模方式在同一平臺(tái)都可使用。不同知識(shí)背景的用戶不僅可以在平臺(tái)上擇需選用建模方式,還可以與團(tuán)隊(duì)成員相互協(xié)作、加速建模。
由于DataCanvas數(shù)據(jù)科學(xué)平臺(tái)的白盒算法和流程透明的特性,平臺(tái)上輸出的數(shù)據(jù)模型具備極強(qiáng)的可解釋性和高可用性??山忉屝?,意為每條決策都能夠被模型自動(dòng)解釋說明,讓模型更易解讀、更易理解;高可用性則意味著模型能夠?qū)嶋H解決用戶難題,能夠投入到業(yè)務(wù)中使用。
在提高建模效率、降低建模成本的同時(shí),數(shù)據(jù)模型也成為了可傳承的模型資產(chǎn),讓銀行實(shí)現(xiàn)模型能力積累。
基于場(chǎng)景的自動(dòng)機(jī)器學(xué)習(xí),率先實(shí)現(xiàn)決策自動(dòng)化
盡管寬表加工、特征工程、模型訓(xùn)練三個(gè)階段實(shí)現(xiàn)了自動(dòng)化處理,但將金融行業(yè)的龐雜數(shù)據(jù)全部自動(dòng)化處理仍然是不可能完成的任務(wù)。為了加速模型落地、迅速提升銀行業(yè)務(wù)市場(chǎng)競(jìng)爭(zhēng)力,DataCanvas數(shù)據(jù)科學(xué)平臺(tái)選擇從業(yè)務(wù)場(chǎng)景出發(fā),通過對(duì)某個(gè)場(chǎng)景的深入分析,定向?qū)崿F(xiàn)此場(chǎng)景所需數(shù)據(jù)的寬表加工、特征工程和模型開發(fā),直接加速此場(chǎng)景的模型落地。
自動(dòng)機(jī)器學(xué)習(xí)建模成果,最終以決策形式服務(wù)于使用者,如在線產(chǎn)品推薦、客戶流失預(yù)警、客戶畫像分析等。目前,DataCanvas已落地精準(zhǔn)營(yíng)銷、信貸風(fēng)控、流失預(yù)警、量化投研、智能運(yùn)維、客戶畫像、運(yùn)營(yíng)優(yōu)化等業(yè)務(wù)場(chǎng)景。

2019年,數(shù)據(jù)科學(xué)平臺(tái)迎來了從小范圍試點(diǎn)到大規(guī)模應(yīng)用的市場(chǎng)節(jié)點(diǎn)。DataCanvas數(shù)據(jù)科學(xué)平臺(tái)將發(fā)揮既有優(yōu)勢(shì),繼續(xù)深耕金融業(yè)務(wù)場(chǎng)景,為金融客戶的業(yè)務(wù)提升帶來更多價(jià)值,實(shí)力賦能金融企業(yè)AI建設(shè),引領(lǐng)新金融時(shí)代!