導(dǎo)語(yǔ):在眾多被賦能的行業(yè)中,AI+投研,成為了一個(gè)炙手可熱的賽道。
準(zhǔn)確預(yù)測(cè)未來(lái),并在關(guān)鍵時(shí)刻扼住命運(yùn)的咽喉,做出正確的決定。
這是無(wú)數(shù)人夢(mèng)寐以求的情景。
得益于算法的進(jìn)步,這樣的現(xiàn)實(shí),正離人類正越來(lái)越近。
2012年,美國(guó)康涅狄格大學(xué)生態(tài)學(xué)和數(shù)學(xué)教授彼得·圖爾欽(Peter Turchin)在《和平研究雜志》上發(fā)表了一篇研究論文,提出一個(gè)不祥的預(yù)測(cè):美國(guó)將在2020年迎來(lái)社會(huì)動(dòng)蕩的“高峰”。
結(jié)果,美國(guó)真在2020年迎來(lái)了“大亂”。
疫情、種族沖突、金融危機(jī),將整個(gè)社會(huì)攪成了一鍋粥。
那這位叫圖爾欽的教授,為何預(yù)測(cè)得這么準(zhǔn)?
原因就在于,他本人是一個(gè)“數(shù)據(jù)史學(xué)”的忠誠(chéng)信徒。
所謂“數(shù)據(jù)史學(xué)”,簡(jiǎn)單來(lái)說(shuō),就是搜集歷史上的各種關(guān)鍵數(shù)據(jù),如人口、收入水平、暴力事件的頻次等等,之后通過(guò)大數(shù)據(jù)+機(jī)器學(xué)習(xí)的方式,對(duì)其進(jìn)行建模、分析,從中預(yù)測(cè)出未來(lái)的趨勢(shì)。
用這樣的分析方式,圖爾欽甚至算出,平均50年,美國(guó)就會(huì)經(jīng)歷一次“動(dòng)亂周期”。
除了用來(lái)分析“天下興亡”之外,這樣的技術(shù)思路,也擴(kuò)展了一個(gè)需求龐大的賽道——機(jī)器(AI)數(shù)據(jù)分析。
根據(jù)MarketsandMarkets的報(bào)告,全球機(jī)器數(shù)據(jù)分析市場(chǎng)規(guī)模在2020年達(dá)到了14.8億美元,預(yù)計(jì)到2025年將增長(zhǎng)至45.4億美元,期間年復(fù)合增長(zhǎng)率(CAGR)為28.3%。
而在眾多被賦能的行業(yè)中,AI+投研,成為了一個(gè)炙手可熱的賽道。
數(shù)據(jù)煉金術(shù)
2023年至今,全市場(chǎng)一共開了52,400場(chǎng)投研會(huì)議,差不多每天200場(chǎng)。在信息爆炸的年代,信息降噪、提純成為投研人士的新剛需。
為此,在互聯(lián)網(wǎng)時(shí)代的早期,就有不少投研機(jī)構(gòu)、平臺(tái)開始用數(shù)據(jù)模型的方式,來(lái)分析龐雜的金融數(shù)據(jù)。
其中,最著名的就是彭博社推出的Bloomberg Terminal(彭博終端),這是一個(gè)為金融專業(yè)人士提供實(shí)時(shí)金融數(shù)據(jù)、新聞和分析的平臺(tái)。
通過(guò)預(yù)構(gòu)建的金融模型和指標(biāo),例如財(cái)務(wù)比率、估值模型、風(fēng)險(xiǎn)分析模型,以及各種圖表和可視化工具,Bloomberg Terminal可以分析來(lái)自300多個(gè)交易所和500多個(gè)數(shù)據(jù)提供商的數(shù)據(jù),從而幫助投資者實(shí)時(shí)了解市場(chǎng)動(dòng)態(tài),制定投資策略。
除此之外,S&P Capital IQ也是基于類似的技術(shù)思路研發(fā)的分析工具。
在提供了各種預(yù)制的財(cái)務(wù)模型模板,例如貼現(xiàn)現(xiàn)金流(DCF)模型、比較公司分析模型之外,用戶還可以利用插件直接在Excel中調(diào)用S&P Capital IQ的數(shù)據(jù),利用Excel的公式和功能進(jìn)行深入的財(cái)務(wù)分析。
從功能和分析方式上來(lái)說(shuō),這些平臺(tái)大多都是以預(yù)設(shè)的模型、算法,結(jié)合財(cái)務(wù)報(bào)表、歷史交易數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),對(duì)金融市場(chǎng)的走向進(jìn)行分析。
盡管這些終端都在努力整合、處理大量金融數(shù)據(jù),但在技術(shù)層面上,其仍存在著各種局限,而其中最大的局限之一,就是對(duì)非結(jié)構(gòu)化數(shù)據(jù)(如新聞、研究報(bào)告等)相對(duì)薄弱的處理能力。
對(duì)于金融數(shù)據(jù)來(lái)說(shuō),結(jié)構(gòu)性的數(shù)據(jù)(如財(cái)務(wù)報(bào)表、交易記錄等),只是浮在海面上的一小層冰山。而更多的非結(jié)構(gòu)性文本(新聞、社交網(wǎng)絡(luò)信息),才是隱藏在海面之下的,價(jià)值更大的冰山。
這是因?yàn)椋S著互聯(lián)網(wǎng)的不斷普及,大量的文本信息被生成并存儲(chǔ)在網(wǎng)絡(luò)空間中。
根據(jù)皮尤研究中心(Pew Research Center)的一項(xiàng)研究,從2008年到2018年,全球金融新聞報(bào)道的數(shù)量增長(zhǎng)了約40%。這些報(bào)道涵蓋了股票、債券、外匯等各種市場(chǎng)動(dòng)態(tài)。
然而,想要挖掘這些文本數(shù)據(jù)組成的“金山”,就需要運(yùn)用如自然語(yǔ)言處理、大數(shù)據(jù)分析等先進(jìn)的技術(shù),才能從非結(jié)構(gòu)性的文本中,提取有價(jià)值的信息。
為此,不少以自然語(yǔ)言處理技術(shù)(NLP)為核心的投研AI紛紛涌現(xiàn),由此開啟了金融數(shù)據(jù)分析的一個(gè)新階段。
化簡(jiǎn)為繁
當(dāng)下的大模型+金融賽道,入局者甚多。
然而,在NLP技術(shù)沒有絕對(duì)性差距的情況下,要想在以自然語(yǔ)言處理技術(shù)為核心的投研AI中脫穎而出,高質(zhì)量、多樣化且實(shí)時(shí)更新的金融數(shù)據(jù)源,就成了競(jìng)爭(zhēng)中的關(guān)鍵。
因?yàn)閿?shù)據(jù)的質(zhì)量和多樣性,將直接影響到分析結(jié)果的準(zhǔn)確性和可靠性。
而在這方面,熵簡(jiǎn)科技,試圖站到行業(yè)的前列。
“熵”是熱力學(xué)中描述系統(tǒng)混亂、無(wú)序的程度。
“熵簡(jiǎn)” 寓意以技術(shù)手段簡(jiǎn)化業(yè)務(wù)數(shù)據(jù)的復(fù)雜度,用“化繁為簡(jiǎn)”的方式,幫助用戶在數(shù)據(jù)中獲得洞察。
而其研發(fā)的新一代智能引擎AlphaEngine,就是這種理念的最佳體現(xiàn)。
AlphaEngine不僅聚合了海量?jī)?yōu)質(zhì)商業(yè)情報(bào)數(shù)據(jù)源,內(nèi)涵三大商業(yè)數(shù)據(jù)庫(kù),并且深度融合AI能力,能夠幫助用戶在海量數(shù)據(jù)中快速獲取洞察。
具體來(lái)說(shuō),AlphaEngine內(nèi)涵的三大商業(yè)數(shù)據(jù)庫(kù),分別是會(huì)議紀(jì)要數(shù)據(jù)庫(kù)、研究報(bào)告數(shù)據(jù)庫(kù)、行業(yè)經(jīng)濟(jì)數(shù)據(jù)庫(kù)。
其中的會(huì)議紀(jì)要數(shù)據(jù)庫(kù),不僅會(huì)提供全面的會(huì)議紀(jì)要數(shù)據(jù)庫(kù),包括主流券商電話會(huì)議、調(diào)研會(huì)議紀(jì)要、專家訪談紀(jì)要等一手研究資料。
而研究報(bào)告數(shù)據(jù)庫(kù),則了涵蓋主流券商研報(bào)、產(chǎn)業(yè)咨詢報(bào)告、外資券商研究報(bào)告等專業(yè)投研資料。具有多種篩選器,方便用戶定位所需資料。
同時(shí),為了使用戶在大量數(shù)據(jù)中,高效找到需要的信息,AlphaEngine提供了多種篩選器,通過(guò)使用高效的信息檢索技術(shù)和數(shù)據(jù)挖掘方法,使用戶能夠輕松地在大量數(shù)據(jù)中找到所需資料。
在AlphaEngine中,以NLP技術(shù)為核心的生成式AI,被用于文本預(yù)處理、查詢處理、語(yǔ)義理解等環(huán)節(jié)。通過(guò)使用NLP技術(shù),AlphaEngine能夠更好地理解用戶查詢和文檔內(nèi)容,從而提高信息檢索的準(zhǔn)確性和效率。
而在文本摘要、總結(jié)方面,熵簡(jiǎn)科技通過(guò)FinGPT大模型,實(shí)現(xiàn)了自動(dòng)化生成AI摘要,從而讓用戶能方便、快速地獲取會(huì)議中的關(guān)鍵信息。
在瀏覽行業(yè)報(bào)告時(shí),AlphaEngine內(nèi)嵌的生成式AI,會(huì)自動(dòng)將報(bào)告中的要點(diǎn)、關(guān)鍵信息進(jìn)行總結(jié)、提煉,在節(jié)約了用戶視角的同時(shí),從而讓用戶在整體上對(duì)報(bào)告的核心內(nèi)容有了清晰的認(rèn)知。
除此之外,針對(duì)一些較為重要的會(huì)議、演講,AlphaEngine也能將會(huì)議錄音轉(zhuǎn)錄成文本,并且形成會(huì)議摘要,并支持定位播放及摘要溯源功能,方便用戶快速獲取會(huì)議關(guān)鍵信息。
AlphaEngine除了提供三方海量會(huì)議紀(jì)要外,也可以用于構(gòu)建屬于自己的AI知識(shí)庫(kù)。
在【知識(shí)庫(kù)】模塊中,可以整理任何類型的研究資料,大模型會(huì)自動(dòng)進(jìn)行音頻轉(zhuǎn)寫及全文摘要,包括但不限于PDF、Office文檔、音頻、視頻等格式的文件。
也可以對(duì)任意資料進(jìn)行提問(wèn),讓大模型根據(jù)資料中的信息做出專業(yè)解答。
對(duì)于手機(jī)上發(fā)現(xiàn)的優(yōu)質(zhì)研究資料,只需把這篇文章轉(zhuǎn)發(fā)到微信助手,AlphaEngine會(huì)將文章自動(dòng)同步至知識(shí)庫(kù)中存檔,可以在【個(gè)人中心】-【微信助手】中進(jìn)行設(shè)置。
上述的技術(shù)特點(diǎn),展現(xiàn)了熵簡(jiǎn)在處理非結(jié)構(gòu)性金融數(shù)據(jù)時(shí)的巨大優(yōu)勢(shì)。
隨著生成式AI的重大進(jìn)展和衍生應(yīng)用帶來(lái)的領(lǐng)域拓寬,可以想見,未來(lái)熵簡(jiǎn)也將在AI+數(shù)據(jù)分析的賽道上,研發(fā)出更多有價(jià)值的技術(shù)或產(chǎn)品。
而這種基于AI的數(shù)據(jù)分析技術(shù),也是當(dāng)下處于飛速變化中的社會(huì)所期待和需要的。
畢竟,在劃時(shí)代的機(jī)遇來(lái)臨時(shí),唯有敏銳地捕捉變化,洞察先機(jī),才能找到在新時(shí)代的生存發(fā)展之道。
-
AI
+關(guān)注
關(guān)注
87文章
31493瀏覽量
270182 -
數(shù)據(jù)模型
+關(guān)注
關(guān)注
0文章
49瀏覽量
10059 -
生成式AI
+關(guān)注
關(guān)注
0文章
514瀏覽量
536
原文標(biāo)題:生成式AI,如何從研究里“掘金”?
文章出處:【微信號(hào):alpworks,微信公眾號(hào):阿爾法工場(chǎng)研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論