2020年,我國(guó)數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到39.2萬(wàn)億元,占GDP比重為38.6%,目前位居于世界第二,其增速是GDP的三倍以上。
這一組數(shù)據(jù)來(lái)自于中國(guó)信息研究院發(fā)布的《中國(guó)數(shù)字經(jīng)濟(jì)發(fā)展白皮書(shū)(2021)》。按前述所言,可毫不夸張地說(shuō),數(shù)字經(jīng)濟(jì)時(shí)代已然到來(lái),成經(jīng)濟(jì)增長(zhǎng)的主要?jiǎng)恿Α?/p>
不過(guò),數(shù)字經(jīng)濟(jì)要想行穩(wěn)致遠(yuǎn),核心前提是維護(hù)好安全這一“基石”。畢竟虛擬數(shù)字世界不斷擴(kuò)張之時(shí),現(xiàn)實(shí)生活中存在著泄露個(gè)人隱私的風(fēng)險(xiǎn)。
且于9月1月實(shí)施的《數(shù)據(jù)安全法》中明確,“鼓勵(lì)數(shù)據(jù)要依法合理有效利用,保障數(shù)據(jù)依法有序自由流動(dòng),促進(jìn)以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟(jì)發(fā)展。”
而在科技賦能金融數(shù)字化轉(zhuǎn)型過(guò)程中,金融機(jī)構(gòu)如何在保護(hù)個(gè)人隱私的前提下推動(dòng)數(shù)據(jù)間協(xié)作?這成為擺在行業(yè)面前的一道坎。
值得一提的是,對(duì)于解決“數(shù)據(jù)孤島”的難題,在行業(yè)普遍認(rèn)知中,聯(lián)邦學(xué)習(xí)技術(shù)成為有力的“武器”。
挖掘“跨域”數(shù)據(jù)價(jià)值
近些年,越來(lái)越多的企業(yè)意識(shí)到數(shù)據(jù)分析的重要性。在大數(shù)據(jù)“喂養(yǎng)”下,人工智能得以快速發(fā)展。換言之,深度學(xué)習(xí)的代表——人工智能之所以應(yīng)用到各行各業(yè),離不開(kāi)數(shù)據(jù)支持。
不過(guò),企業(yè)若不想囿于私域數(shù)據(jù),被限制在“一隅”,且又要滿足數(shù)據(jù)合規(guī)問(wèn)題的話,需要采用聯(lián)邦學(xué)習(xí)技術(shù),方能挖掘“跨域”數(shù)據(jù)價(jià)值。
而所謂的“聯(lián)邦學(xué)習(xí)”是一種分布式機(jī)器學(xué)習(xí)技術(shù),在不交換數(shù)據(jù)樣本的情況下,在多個(gè)分散的邊緣設(shè)備和服務(wù)器上訓(xùn)練算法,以達(dá)到在數(shù)據(jù)“可用不可見(jiàn)”的基礎(chǔ)上進(jìn)行安全聯(lián)合建模。
簡(jiǎn)單來(lái)說(shuō),聯(lián)邦學(xué)習(xí)具有眾籌和協(xié)作之意,搭建的系統(tǒng)具有聚合功能,其在推動(dòng)數(shù)據(jù)融合,解決“數(shù)據(jù)孤島”難題上,釋放更多數(shù)據(jù)動(dòng)能。
于企業(yè)而言,除私域數(shù)據(jù)之外,其還可將多維度的外域數(shù)據(jù)作為參考,并以此為基礎(chǔ)做出更為準(zhǔn)確的決策。
且目前,聯(lián)邦學(xué)習(xí)已在醫(yī)療、金融、物聯(lián)網(wǎng)等領(lǐng)域有所應(yīng)用。
其中,醫(yī)療行業(yè)中,國(guó)內(nèi)三甲醫(yī)院保存的醫(yī)療數(shù)據(jù)量非??捎^,可涉及隱私問(wèn)題,科技公司想要直接采集多家醫(yī)院的數(shù)據(jù)用于訓(xùn)練并不現(xiàn)實(shí)。而聯(lián)邦學(xué)習(xí)解決人們最為關(guān)心的隱私安全問(wèn)題,醫(yī)療機(jī)構(gòu)也才能放心將醫(yī)療數(shù)據(jù)用于AI訓(xùn)練,突破了隱私的圍城。
另外,聯(lián)邦學(xué)習(xí)已在金融行業(yè)中一些關(guān)鍵領(lǐng)域上取得了進(jìn)展,聯(lián)合反洗錢(qián)建模、聯(lián)合信貸風(fēng)控建模、聯(lián)合權(quán)益定價(jià)建模、聯(lián)合客戶價(jià)值建模等。
提升金融機(jī)構(gòu)運(yùn)營(yíng)、風(fēng)控效率
以薩摩耶?dāng)?shù)科為例,作為與眾多流量方、金融機(jī)構(gòu)有著業(yè)務(wù)往來(lái)的公司,其充分利用自身與合作方優(yōu)勢(shì),可對(duì)獲客、運(yùn)營(yíng)、風(fēng)控等效果提升有顯著幫助。
基于業(yè)界的開(kāi)源聯(lián)邦學(xué)習(xí)框架Fate,薩摩耶?dāng)?shù)科構(gòu)建起了聯(lián)邦學(xué)習(xí) 平臺(tái)。該平臺(tái)上各個(gè)參與方信息保留在本地,不泄露隱私也不違反法規(guī)。且在聯(lián)邦學(xué)習(xí)的體系下,各個(gè)參與者的身份和地位相同,建模效果與將整個(gè)數(shù)據(jù)集中放在一起的建模效果相同。
此外,該平臺(tái)將聯(lián)邦學(xué)習(xí)集成到了薩摩耶?dāng)?shù)科AI平臺(tái),可以更容易地實(shí)現(xiàn)聯(lián)邦模型的訓(xùn)練、上線以及模型管理等功能,使聯(lián)邦學(xué)習(xí)更簡(jiǎn)單易用。兩者結(jié)合后還獲得了可視化聯(lián)邦拖拽建模、模型管理及模型監(jiān)控。
具體來(lái)講,薩摩耶?dāng)?shù)科AI平臺(tái)統(tǒng)一了從特征工程、算法建模、模型訓(xùn)練、模型評(píng)估、模型發(fā)布等全流程,實(shí)現(xiàn)界面配置,便于模型的統(tǒng)一管理和維護(hù),節(jié)省模型從訓(xùn)練到發(fā)布的上線周期。同時(shí),參考了業(yè)界主流AI平臺(tái)設(shè)計(jì)思想,用組件化開(kāi)發(fā)實(shí)現(xiàn)各個(gè)業(yè)務(wù)功能流程,做到自定義可配置可擴(kuò)展,同時(shí)也用Kubernetes實(shí)現(xiàn)容器化彈性快速部署。
且薩摩耶?dāng)?shù)科的AI平臺(tái)還具有私有化、開(kāi)放性、組件化的算法庫(kù)、代碼和組件相互轉(zhuǎn)換、進(jìn)行自定義預(yù)處理、靈活定制不同模型的監(jiān)控指標(biāo)、支持Spark、TensorFlow等分布式框架、自動(dòng)機(jī)器學(xué)習(xí)功能(AutoML)、跨平臺(tái)(Windows、Linux)使用、線上線下統(tǒng)一特征管理等亮點(diǎn)。
值得一提的是,開(kāi)源版聯(lián)邦學(xué)習(xí)Fate提供了豐富的縱向與橫向開(kāi)源算法及優(yōu)秀的調(diào)度Fate_Flow,可在易用性上給用戶造成很大的影響,即使用者在使用開(kāi)源版幾個(gè)月后仍不能熟悉和快速地使用Fate進(jìn)行聯(lián)合建模。
而聯(lián)邦學(xué)習(xí)算法集成到薩摩耶?dāng)?shù)科AI平臺(tái)主要從兩個(gè)方面入手:一是改進(jìn)Fate易用性,從上傳數(shù)據(jù)、訓(xùn)練模型到在線預(yù)測(cè)上線模型三大主要階段,通過(guò)簡(jiǎn)單前端操作一鍵執(zhí)行,并且對(duì)訓(xùn)練模型這個(gè)主要的模塊進(jìn)行前端拖拽建模,在線預(yù)測(cè)模塊進(jìn)行一鍵發(fā)布、停止、跑批等功能,并和薩摩耶?dāng)?shù)科AI平臺(tái)保持一致。
聯(lián)邦學(xué)習(xí)集成到薩摩耶?dāng)?shù)科AI平臺(tái)的第二階段,將開(kāi)發(fā)自動(dòng)建模平臺(tái)AUTOMAN算法聯(lián)邦化,目前Fate聯(lián)邦學(xué)習(xí)的算法是一些常用算法組件,相比AUTOMAN在風(fēng)控建模方面的算法還是相對(duì)較少,后面將部分AUTOMAN算法進(jìn)行聯(lián)邦化,并集成到AI平臺(tái)。
據(jù)了解,薩摩耶?dāng)?shù)科旗下的AUTOMAN自動(dòng)建模平臺(tái)是將人工智能應(yīng)用在模型設(shè)計(jì)領(lǐng)域,使模型開(kāi)發(fā)周期減少60%-80%,最短可在1周內(nèi)完成千萬(wàn)級(jí)樣本建模任務(wù),極大地縮短原始樣本與經(jīng)營(yíng)決策的距離,實(shí)現(xiàn)整體降本增效。
未來(lái),薩摩耶?dāng)?shù)科聯(lián)邦學(xué)習(xí) 平臺(tái)將實(shí)現(xiàn)AUTOMAN自動(dòng)建模平臺(tái)的聯(lián)邦化,以此提供更加豐富的模型。同時(shí),結(jié)合使用聯(lián)邦學(xué)習(xí)商業(yè)版FDN技術(shù)支持軟件,提供更多模型維度,使得模型準(zhǔn)確度大幅提升。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。