來源 | 中國貿(mào)易金融網(wǎng)
編輯 | 橙子同學(xué)
6月21日,公司金融2024發(fā)展論壇暨產(chǎn)業(yè)數(shù)字金融展望在武漢隆重召開。上海恒生聚源數(shù)據(jù)服務(wù)有限公司總經(jīng)理吳震操以“數(shù)據(jù)資產(chǎn)在產(chǎn)業(yè)金融的應(yīng)用”為主題,在大會上發(fā)表了精彩演講。
上海恒生聚源數(shù)據(jù)服務(wù)有限公司總經(jīng)理 吳震操
以下為演講全文,有刪節(jié):
各位嘉賓、各位領(lǐng)導(dǎo),大家下午好!今天討論了熱門話題——產(chǎn)業(yè)金融的數(shù)字化。在這部分內(nèi)容里,我想重點闡述三個關(guān)鍵詞:產(chǎn)業(yè)金融的數(shù)字化、數(shù)據(jù)資產(chǎn),以及大模型在金融行業(yè),特別是銀行業(yè)的應(yīng)用落地。
在開始之前,請允許我簡要介紹一下恒生聚源。作為國內(nèi)最早涉足金融數(shù)據(jù)領(lǐng)域的廠商之一,自2000年成立以來,恒生聚源始終致力于金融大數(shù)據(jù)的探索與實踐。我們不僅是國內(nèi)最早開發(fā)金融大模型的廠商之一,而且目前通過數(shù)據(jù)智能技術(shù),為一級市場、二級市場的金融機構(gòu)提供全方位的數(shù)據(jù)服務(wù),已經(jīng)覆蓋了超過900家的銀行、券商、資管、私募等機構(gòu)。
接下來,我將以科技金融為例,分享我們在產(chǎn)業(yè)金融數(shù)字化過程中的一些思考和實踐經(jīng)驗。自從國家數(shù)據(jù)局推出“數(shù)據(jù)二十條”以來,其中的一些關(guān)鍵內(nèi)容對整個金融行業(yè)產(chǎn)生了深遠(yuǎn)的影響。
第一點,是關(guān)于公共數(shù)據(jù)的授權(quán)和合規(guī)使用。在公司經(jīng)營過程中,往往需要大量的數(shù)據(jù)來進(jìn)行市場營銷和風(fēng)險控制。如果政府不開放這些數(shù)據(jù),那么并非所有機構(gòu)和市場主體都能享受到這種便利。為此,國家數(shù)據(jù)局在今年將采取更加積極的措施,以推動整個公共數(shù)據(jù)的運營,確保數(shù)據(jù)能夠更廣泛地服務(wù)于各行業(yè)的需求;
第二點,關(guān)于整個企業(yè)自身的數(shù)據(jù)確權(quán)、授權(quán)以及數(shù)據(jù)資產(chǎn)納入財務(wù)報表的問題,我認(rèn)為這是行業(yè)發(fā)展的必然趨勢。特別是對于銀行而言,由于銀行業(yè)態(tài)的多樣性,其數(shù)據(jù)資源也相當(dāng)豐富。數(shù)據(jù)資產(chǎn)的入表對于每一家銀行而言,都將產(chǎn)生深遠(yuǎn)的影響。因此,我誠摯地希望各位領(lǐng)導(dǎo)在日常工作中能夠深入思考這一問題。數(shù)據(jù)入表不僅將影響我們傳統(tǒng)的三張財務(wù)報表,更將對我們未來在資產(chǎn)授信等方面的決策產(chǎn)生重大作用。
產(chǎn)業(yè)金融的數(shù)字化
當(dāng)前的大環(huán)境無需贅言,大家日常都在討論利率下行、利差收窄,企業(yè)信貸增速下降等話題。銀行業(yè)凈息差正在縮小 ,而不良貸款的余額卻在攀升,盡管好消息是不良貸款占比在逐漸降低。
銀行面臨的一大挑戰(zhàn)是金融脫媒,它分流了眾多客戶的融資需求。為了應(yīng)對這一挑戰(zhàn),我們總結(jié)出了五個策略:首先是“廣”,即更廣泛地覆蓋客戶群體,追求差異化;其次是“精”,即精準(zhǔn)地進(jìn)行客戶營銷;再次是“深”,即深化客戶場景經(jīng)營;然后是“穩(wěn)”,即保持穩(wěn)健的風(fēng)控能力;最后是“高”,即真正為客戶提供高價值的服務(wù)。
泰隆銀行在這方面的實踐已經(jīng)為我們樹立了典范,過去我在銀行領(lǐng)域也參與了許多數(shù)字化項目,深知差異化策略在頭部銀行中的重要性?,F(xiàn)在,面臨的問題是如何獲取、使用這些數(shù)據(jù),并通過這些數(shù)據(jù)構(gòu)建的差異化能力。
以產(chǎn)業(yè)金融為例,如果想篩選出優(yōu)秀的科創(chuàng)企業(yè),僅憑企業(yè)工商數(shù)據(jù)或行業(yè)產(chǎn)業(yè)鏈數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。需要綜合各種數(shù)據(jù),深入挖掘企業(yè)在行業(yè)和區(qū)域中的位置,以實現(xiàn)更精準(zhǔn)的獲客。
如今,隨著數(shù)據(jù)的重要性日益凸顯,數(shù)字化轉(zhuǎn)型成為了一個熱門話題。我認(rèn)為,數(shù)字化轉(zhuǎn)型的核心是客戶價值驅(qū)動,它建立在業(yè)務(wù)系統(tǒng)信息化的基礎(chǔ)之上,依賴于一個強大的數(shù)據(jù)平臺。這個平臺承載著所有基礎(chǔ)數(shù)據(jù),包括大量內(nèi)部數(shù)據(jù)和海量外部數(shù)據(jù)。
智能平臺在這個過程中扮演了重要角色。通過數(shù)據(jù)和業(yè)務(wù)系統(tǒng)的緊密結(jié)合,以及高效的數(shù)據(jù)運營,希望實現(xiàn)“先知、先覺、先行”的數(shù)字化轉(zhuǎn)型目標(biāo)。這意味著我們將利用數(shù)據(jù)來預(yù)測市場趨勢,提前感知客戶需求,并迅速采取行動以滿足這些需求。
數(shù)據(jù)資產(chǎn)化的實踐
關(guān)于數(shù)據(jù)生命周期在行內(nèi)的應(yīng)用以及數(shù)據(jù)資產(chǎn)化的實踐,可以總結(jié)如下:首先,數(shù)據(jù)資源化是起點。我們擁有大量的基礎(chǔ)數(shù)據(jù)、外購數(shù)據(jù)以及多年積累的用戶數(shù)據(jù)和信用數(shù)據(jù)。這些數(shù)據(jù)需要被資源化,即進(jìn)行整合、建模,以便有效利用;接下來是數(shù)據(jù)產(chǎn)品化。通過對這些數(shù)據(jù)進(jìn)行加工和鏈接,將其轉(zhuǎn)化為能夠?qū)嶋H應(yīng)用的數(shù)據(jù)產(chǎn)品;進(jìn)一步,追求數(shù)據(jù)智能化。結(jié)合當(dāng)前的人工智能技術(shù),使數(shù)據(jù)產(chǎn)品實現(xiàn)智能化,提升數(shù)據(jù)的應(yīng)用價值。
當(dāng)數(shù)據(jù)資產(chǎn)需要入表時,重點在于有價值的數(shù)據(jù)資產(chǎn)化。實踐中發(fā)現(xiàn),可交易的數(shù)據(jù)更容易實現(xiàn)資產(chǎn)化。如果數(shù)據(jù)無法進(jìn)行交易,其資產(chǎn)化價值在當(dāng)前環(huán)境下值得進(jìn)一步探討。
在產(chǎn)業(yè)金融中如何更好地利用這些數(shù)據(jù)資產(chǎn)?在公司金融的常規(guī)流程中,依賴大量的數(shù)據(jù)供給,包括宏觀數(shù)據(jù)、中觀行業(yè)數(shù)據(jù)、產(chǎn)業(yè)數(shù)據(jù)、微觀企業(yè)自身數(shù)據(jù),以及國家和政府部門的公共數(shù)據(jù)等。這些數(shù)據(jù)和平臺是連接產(chǎn)業(yè)金融中各個業(yè)務(wù)系統(tǒng)和環(huán)節(jié)的關(guān)鍵。產(chǎn)業(yè)金融目前面臨的主要挑戰(zhàn)之一是各個環(huán)節(jié)的分立和機構(gòu)的割裂。為了解決這個問題,數(shù)據(jù)產(chǎn)品和數(shù)據(jù)應(yīng)用成為連接各個系統(tǒng)和業(yè)務(wù)環(huán)節(jié),乃至上下游的關(guān)鍵。
在營銷獲客方面,最大的挑戰(zhàn)是大量數(shù)據(jù)分析。以科創(chuàng)企業(yè)為例,我們需要深入分析不同產(chǎn)業(yè)鏈、上下游的數(shù)據(jù),并結(jié)合知識產(chǎn)權(quán)、信用資質(zhì)、國家獎勵、股權(quán)融資等信息,來準(zhǔn)確判斷企業(yè)是否符合我們的投資方向。
然而,當(dāng)前產(chǎn)業(yè)鏈數(shù)據(jù)和企業(yè)信息的豐富度及分析水平還存在較大的差距。為了解決這個問題,恒生聚源從公開數(shù)據(jù)和公共數(shù)據(jù)的角度出發(fā),研究如何構(gòu)建宏觀、中觀、微觀層面與產(chǎn)品和產(chǎn)業(yè)的結(jié)合,通過幾十年的研究,構(gòu)建了行業(yè)產(chǎn)品分類、主題產(chǎn)業(yè)鏈以及多種另類數(shù)據(jù),幫助大家更好地洞察所關(guān)注的產(chǎn)業(yè)。根據(jù)不同行業(yè)的產(chǎn)業(yè)研究,并進(jìn)行名單挖掘,以更好地支持產(chǎn)業(yè)金融的發(fā)展。
恒生聚源曾為金融機構(gòu)及央企構(gòu)建科創(chuàng)金融平臺,專注于能源產(chǎn)業(yè)鏈。在尚未普及大模型的時代,我們運用人工智能NLP技術(shù)協(xié)助金融機構(gòu)深入剖析產(chǎn)業(yè)鏈,構(gòu)建完善的標(biāo)簽體系及業(yè)務(wù)洞察機制,以提升篩選和獲客效率。
在風(fēng)控領(lǐng)域,也面臨了諸多挑戰(zhàn)。市場輿情信息繁雜,聚源監(jiān)控的輿情來源超過20萬個,每日需處理海量數(shù)據(jù)。然而,輿情中的噪音眾多,信息分散且缺乏關(guān)聯(lián),導(dǎo)致需要大量人力物力進(jìn)行打標(biāo)和分析。更為關(guān)鍵的是,這些輿情信息與當(dāng)前持倉、放貸、用戶畫像等難以實時關(guān)聯(lián)。對此,我們深刻體會到:
首先,輿情發(fā)掘需深入且精準(zhǔn)。盡管當(dāng)前大部分輿情已由機器處理,但即使運用大模型,仍有不少輿情處理不夠精確,仍需大量人工介入。
其次,通過違規(guī)及監(jiān)管處罰信息,能夠洞察到監(jiān)管機構(gòu)對企業(yè)的動態(tài)。同時,風(fēng)險預(yù)警模型、經(jīng)營風(fēng)險模型、財務(wù)粉飾模型、現(xiàn)金流周轉(zhuǎn)等,均是多年來與行業(yè)內(nèi)研究團(tuán)隊共同積累的寶貴經(jīng)驗。
此外,恒生聚源還為某股份制銀行打造了投行產(chǎn)業(yè)分析決策系統(tǒng),該系統(tǒng)融合了宏觀、中觀、微觀數(shù)據(jù)以及我們的投研體系,結(jié)合市場運行和風(fēng)險預(yù)警分析,為投行部提供投資并購的決策支持。
面對IT和信息科技部的挑戰(zhàn),海量數(shù)據(jù)與外部咨詢的雜亂性、內(nèi)部數(shù)據(jù)的孤島化等問題不容忽視。其中,數(shù)據(jù)的民主化尤為關(guān)鍵。我們倡導(dǎo)數(shù)據(jù)的集中建設(shè),無論采用何種形式的數(shù)據(jù)中臺,數(shù)據(jù)的集中、模型的抽取與治理都至關(guān)重要。通過統(tǒng)一建模,可以更精準(zhǔn)地使用數(shù)據(jù),將客戶信息與業(yè)務(wù)緊密關(guān)聯(lián)。
在數(shù)據(jù)民主化方面,建議在內(nèi)部除了支持業(yè)務(wù)系統(tǒng)、購買外部咨詢和構(gòu)建管理駕駛艙外,還應(yīng)讓行內(nèi)人員能夠隨時隨地訪問和使用數(shù)據(jù)。無論是在手機、平板還是電腦上,都能方便地抽取和處理數(shù)據(jù),直接賦能日常工作。
最后,關(guān)于資產(chǎn)入表的數(shù)據(jù)問題,恒生聚源也面臨著迫切的需求。以自身為例,過去20多年里積累 了PB 級別的數(shù)據(jù) ,每年投入上億資金進(jìn)行處理。這些數(shù)據(jù)對于在座的各位領(lǐng)導(dǎo)和嘉賓來說可能只是日常應(yīng)用數(shù)據(jù)的一部分。因此,在數(shù)據(jù)資產(chǎn)入表的過程中,深感哪些數(shù)據(jù)可以入表、如何入表等問題的重要性。
主要分為以下三類:
第一類是外購數(shù)據(jù)。對于外購的產(chǎn)業(yè)鏈上下游、市場咨詢、交易類數(shù)據(jù),由于其交易成本清晰、交易時間明確,估值相對容易。這類數(shù)據(jù)如同購買的機器一樣,可以直接作為數(shù)據(jù)資產(chǎn)的一部分。
第二類是內(nèi)部數(shù)據(jù)。內(nèi)部數(shù)據(jù)的處理則更具挑戰(zhàn)性。內(nèi)部數(shù)據(jù)往往涉及敏感信息,特別是銀行和金融機構(gòu)中的企業(yè)信息和儲戶信息,這些數(shù)據(jù)的交易受到嚴(yán)格限制。因此,在內(nèi)部數(shù)據(jù)入表的過程中,需明確其應(yīng)用價值和場景,并充分考慮數(shù)據(jù)的敏感度。我建議,在數(shù)據(jù)入表時,應(yīng)以可交易的數(shù)據(jù)為先,并采用成本法進(jìn)行分?jǐn)偂?/p>
第三類是行內(nèi)創(chuàng)新數(shù)據(jù)產(chǎn)品。這類產(chǎn)品結(jié)合了數(shù)據(jù)、模型和業(yè)務(wù)邏輯,相對容易采用收益法或市場法進(jìn)行估值。關(guān)于入表的數(shù)據(jù)資產(chǎn)如何運用,主要有兩類方式:一是集團(tuán)內(nèi)部的共享,但面臨的最大挑戰(zhàn)是合規(guī)性。在一個金融控股集團(tuán)內(nèi)部,不同部門可能受到不同監(jiān)管機構(gòu)的監(jiān)管,這需要在數(shù)據(jù)共享時格外注意。二是通過數(shù)據(jù)交易所進(jìn)行場內(nèi)交易或通過類似恒生聚源這樣的數(shù)據(jù)服務(wù)商進(jìn)行場外交易,以實現(xiàn)金融機構(gòu)數(shù)據(jù)資產(chǎn)的變現(xiàn)。
大模型在金融行業(yè)的落地應(yīng)用
首先分享關(guān)于大模型結(jié)論——大模型正逐步成為新一代的超級計算機和超級入口。當(dāng)前,大模型的核心在于其規(guī)模法則,這一點在斯坦福的AI調(diào)研報告中得到了充分體現(xiàn)。報告顯示,隨著訓(xùn)練量的增加和模型規(guī)模的擴大,效果也隨之提升。然而,這也帶來了對算力需求的急劇增長。有趣的是,如果按照當(dāng)前大模型的訓(xùn)練消耗速度,預(yù)計到2026年左右,世界上高質(zhì)量的公開語料數(shù)據(jù)將面臨枯竭,而到2030年左右,可能就沒有更多的數(shù)據(jù)可以供給大模型進(jìn)行訓(xùn)練了。這凸顯了私域數(shù)據(jù)在大模型發(fā)展中的重要性,也是我們實現(xiàn)大模型落地的關(guān)鍵。
那么大模型在金融行業(yè)落地會有哪些體現(xiàn)呢?一個通用大模型在金融行業(yè)內(nèi)部的應(yīng)用,除了模型本身,更依賴于數(shù)據(jù)資產(chǎn)。最初級的應(yīng)用形式可能是對話生成,如ChatGPT,但隨著技術(shù)的發(fā)展,大模型的應(yīng)用已經(jīng)擴展到了更廣泛的領(lǐng)域,如Copilot ,以及我們自己在投研領(lǐng)域的實踐。更進(jìn)一步,大模型將作為代理,與業(yè)務(wù)系統(tǒng)和數(shù)據(jù)深度融合。
在恒生聚源,基于自己的實踐,對于部署私域大模型給出了一些建議。首先,選擇合適的基座模型或開源模型是基礎(chǔ)。其次,準(zhǔn)備好語料,包括預(yù)訓(xùn)練語料、微調(diào)語料和強化學(xué)習(xí)語料。同時,我們要認(rèn)識到,一個模型是遠(yuǎn)遠(yuǎn)不夠的,更重要的是構(gòu)建一整套模型中間件,如自然語言處理、搜索引擎、向量數(shù)據(jù)庫、企業(yè)知識庫和外部搜索引擎的接口。
關(guān)于大模型的應(yīng)用,我認(rèn)為它更多地用于處理文本和提高內(nèi)部效率,而不是進(jìn)行復(fù)雜的決策。在短期內(nèi)(2-3年),大模型可能還無法達(dá)到復(fù)雜的思維水平。在金融行業(yè)中,大模型可以用于智能客服、營銷和風(fēng)控合規(guī)等領(lǐng)域,但不適合直接用于交易決策。
大模型在恒生聚源的具體應(yīng)用。有一款產(chǎn)品定位為Copilot ,為投研、研究人員、分析師和投行等行業(yè)人員提供輔助工具。它可以進(jìn)行問答、同業(yè)比對、會議速記、自動寫作和文檔生成等功能。這些功能在日常工作中可以大大節(jié)省時間和精力。例如,我們已成功將大模型應(yīng)用于一個城商行的同業(yè)研究平臺,通過結(jié)合行內(nèi)數(shù)據(jù),實現(xiàn)了數(shù)據(jù)報告的高效生成。
生成式AI展現(xiàn)出強烈的馬太效應(yīng),即強者愈強。在通用模型領(lǐng)域,金融機構(gòu)無需投入過多精力去開發(fā)通用大模型,因為最終可能難以與百度、阿里或國際上的OpenAI等巨頭競爭。然而,在垂直領(lǐng)域的大模型應(yīng)用上,并非簡單地將通用大模型拿來即用。垂直領(lǐng)域的成功落地需要那些既懂業(yè)務(wù)又擁有數(shù)據(jù)的垂直模型廠商來協(xié)助行業(yè)實現(xiàn)B端的實際應(yīng)用。
在整個大模型落地的過程中,數(shù)據(jù)的重要性不言而喻,特別是對于金融機構(gòu)而言,自身的私域數(shù)據(jù)更是至關(guān)重要。因此,我們必須妥善處理好自己的數(shù)據(jù)資產(chǎn),做好數(shù)據(jù)治理工作。
近期,蘋果推出的Apple Intelligence也預(yù)示著端上輕量模型的迅速崛起,但“云+端”的計算模式仍將保持其主導(dǎo)地位。
隨著智能代理技術(shù)的不斷發(fā)展,大模型將與業(yè)務(wù)系統(tǒng)更加緊密地結(jié)合。很快,我們將看到大模型在操作系統(tǒng)、打通數(shù)據(jù)資產(chǎn)、傳統(tǒng)模型以及業(yè)務(wù)壁壘方面發(fā)揮巨大作用。這一天將會很快到來。
展望未來,AI的發(fā)展將如何演變?中國銀行業(yè)協(xié)會首席信息官高峰提到了大模型與知識圖譜的結(jié)合。大模型代表了一類人工智能的發(fā)展方向,即連接主義,它基于深度卷積模型的算法,模擬人腦的工作方式。而知識圖譜則體現(xiàn)了另一種典型的專家規(guī)則方法,通過構(gòu)建實體和關(guān)系網(wǎng)絡(luò)來精確定位內(nèi)容。我期待有一天,連接主義和符號主義能夠相互融合,甚至連接主義能夠自行推導(dǎo)出符號主義,使大模型能夠進(jìn)行公式推理。當(dāng)這一天到來時,相信大模型將能夠為我們完成許多現(xiàn)在仍需人工處理的任務(wù)。
以上是我今天的匯報內(nèi)容。
謝謝大家!