8月20日,全球知名數(shù)據(jù)與AI公司Databricks正式對(duì)外發(fā)布公告,宣布公司正推進(jìn)一輪規(guī)模超10億美元的K輪融資,目前相關(guān)各方已簽署投資條款清單。此次融資對(duì)應(yīng)的公司估值將突破1000億美元(約合人民幣7179.1億元)。在全球未上市的初創(chuàng)企業(yè)中,公認(rèn)估值超千億美元的玩家包括SpaceX、OpenAI以及字節(jié)跳動(dòng);此外,馬斯克旗下的人工智能公司在年初與社交媒體平臺(tái)X完成重組后,其合并融資對(duì)應(yīng)的估值也已突破千億。而Databricks此次融資的完成,將使其成功躋身千億美元獨(dú)角獸陣營,成為全球第五家估值超千億的獨(dú)角獸企業(yè)。
Databricks及其開源大模型觀點(diǎn)
Databricks成立于201年,始終聚焦于打造數(shù)據(jù)與人工智能深度融合的統(tǒng)一平臺(tái),是“湖倉一體”數(shù)據(jù)庫架構(gòu)的開創(chuàng)者,而這一架構(gòu)正是Data+AI戰(zhàn)略落地的關(guān)鍵技術(shù)支撐。其數(shù)據(jù)智能平臺(tái)構(gòu)建于開放的湖倉架構(gòu)之上,為數(shù)據(jù)及治理工作提供了統(tǒng)一的技術(shù)底座,并結(jié)合針對(duì)企業(yè)的獨(dú)特特性優(yōu)化的人工智能模型,形成了強(qiáng)大的技術(shù)合力。
Databricks產(chǎn)品包括三大模塊,全方位滿足企業(yè)在數(shù)據(jù)處理、AI應(yīng)用開發(fā)及數(shù)據(jù)管理等多方面復(fù)雜需求:
數(shù)據(jù)湖倉:涵蓋Delta Lake等核心組件,實(shí)現(xiàn)高效的數(shù)據(jù)存儲(chǔ)與管理,支持大規(guī)模數(shù)據(jù)的實(shí)時(shí)處理與分析,為企業(yè)的數(shù)據(jù)流轉(zhuǎn)提供堅(jiān)實(shí)基礎(chǔ);
AI工具:旗下MLflow專注于機(jī)器學(xué)習(xí)生命周期管理,從模型的開發(fā)、部署到跟蹤,為企業(yè)提供便捷高效的全流程支持,助力企業(yè)輕松推進(jìn)AI模型的落地應(yīng)用;
數(shù)據(jù)工具:包含了如Unity Catalog等產(chǎn)品,具備強(qiáng)大的數(shù)據(jù)治理和元數(shù)據(jù)服務(wù),全方位確保數(shù)據(jù)的安全性、合規(guī)性,同時(shí)促進(jìn)數(shù)據(jù)的高效發(fā)現(xiàn)與使用,讓數(shù)據(jù)發(fā)揮最大價(jià)值。
Databricks洞察到開源大模型正走向商品化的趨勢。而其自身強(qiáng)大的AI功能,為這一趨勢注入了強(qiáng)大動(dòng)力。在模型訓(xùn)練加速方面,Databricks的分布式計(jì)算架構(gòu)能夠充分利用大規(guī)模集群資源,顯著縮短開源大模型的訓(xùn)練周期。在模型部署與管理上,Databricks提供的一站式解決方案,能幫助企業(yè)輕松將開源大模型部署到不同的生產(chǎn)環(huán)境中,無論是云端還是本地服務(wù)器,都能確保模型穩(wěn)定運(yùn)行。同時(shí),通過其直觀的界面,企業(yè)可以實(shí)時(shí)監(jiān)控模型的性能指標(biāo),如響應(yīng)時(shí)間、準(zhǔn)確率等。一旦發(fā)現(xiàn)模型在實(shí)際應(yīng)用中出現(xiàn)偏差,可立即在Databricks平臺(tái)上進(jìn)行優(yōu)化調(diào)整,保證模型在各種業(yè)務(wù)場景下持續(xù)高效運(yùn)行,增強(qiáng)了開源大模型作為商品的可靠性與穩(wěn)定性。
Databricks以數(shù)據(jù)為基石,以人工智能為引擎,實(shí)現(xiàn)了從ETL到數(shù)據(jù)倉庫再到AI的全數(shù)據(jù)鏈路。由數(shù)據(jù)智能引擎(Data Intelligence Engine)幫助企業(yè)高效整合和處理大規(guī)模數(shù)據(jù),將海量數(shù)據(jù)轉(zhuǎn)化為AI模型可直接利用的優(yōu)質(zhì)“燃料”,廣泛應(yīng)用于數(shù)據(jù)工程與AI模型訓(xùn)練的協(xié)同、數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)的融合、AI應(yīng)用的快速落地等場景。目前,超過60%的財(cái)富500強(qiáng)企業(yè)都在借助Databricks的數(shù)據(jù)與AI融合平臺(tái),讓數(shù)據(jù)更好地驅(qū)動(dòng)AI創(chuàng)新,同時(shí)通過AI反哺數(shù)據(jù)價(jià)值的深度挖掘。
“可信數(shù)據(jù)+AI模型”賽道的中國開拓者:拓?cái)?shù)派DataCS
拓?cái)?shù)派作為浙江省準(zhǔn)獨(dú)角獸、未來獨(dú)角獸企業(yè),憑借“數(shù)據(jù)+模型”基礎(chǔ)AI的核心技術(shù)優(yōu)勢與阿里云、DeepSeek等頭部企業(yè)共同入選“杭州基礎(chǔ)AI十八羅漢”。作為來自中國的全自主可控的準(zhǔn)獨(dú)角獸,拓?cái)?shù)派是“可信數(shù)據(jù)+AI模型”賽道的另外一個(gè)開拓者,在數(shù)據(jù)計(jì)算相關(guān)領(lǐng)域與Databricks在技術(shù)視野和商業(yè)價(jià)值上有很多不謀而合的行業(yè)趨勢共識(shí)。
在產(chǎn)品體系上,拓?cái)?shù)派旗下大模型數(shù)據(jù)計(jì)算系統(tǒng)πDataCS(簡稱DataCS)創(chuàng)新性構(gòu)建了平行的可信數(shù)據(jù)空間與計(jì)算空間,向上提供垂類模型全生命周期和智能體開發(fā)的工具鏈體系,向下實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)和算力的智能化調(diào)度,有效破解數(shù)據(jù)孤島和算力煙囪難題,助力企業(yè)加速數(shù)據(jù)與模型的融合,為私域大模型和智能體AI的落地提供強(qiáng)大支撐。
四大計(jì)算引擎提供連續(xù)動(dòng)力
從數(shù)據(jù)底座架構(gòu)來看,DataCS與Databricks高度相似。類似Databricks的數(shù)據(jù)智能引擎,DataCS由四大計(jì)算引擎提供連續(xù)動(dòng)力,分別是:支持傳統(tǒng)BI分析的虛擬數(shù)倉引擎、專為模型語料庫優(yōu)化的向量計(jì)算引擎、模型結(jié)合私域數(shù)據(jù)的連續(xù)訓(xùn)練引擎,以及模型在異構(gòu)算力下的推理引擎,為BI/大數(shù)據(jù)分析、私域垂類模型的連續(xù)訓(xùn)練、垂類智能體的開發(fā)和打造等應(yīng)用場景提供支撐。其中,DataCS虛擬數(shù)倉引擎PieCloudDB可無縫對(duì)接三方數(shù)據(jù)和數(shù)據(jù)分析引擎,以滿足湖倉一體、數(shù)據(jù)湖等場景需求,并原生支持?jǐn)?shù)據(jù)要素流轉(zhuǎn),滿足私域客戶對(duì)數(shù)據(jù)隱私和控制權(quán)的高要求。而Databricks則以其Databricks Lakehouse Platform為核心,也融合數(shù)據(jù)倉庫與數(shù)據(jù)湖優(yōu)勢,提供數(shù)據(jù)處理、分析和機(jī)器學(xué)習(xí)服務(wù),涵蓋了數(shù)據(jù)全鏈路開發(fā)。
主動(dòng)元數(shù)據(jù)無縫訪問可信數(shù)據(jù)空間
DataCS獨(dú)創(chuàng)的簡墨主動(dòng)元數(shù)據(jù),提供了與Databricks的Unity Catalog類似的統(tǒng)一元數(shù)據(jù)存儲(chǔ)和管理功能。該系統(tǒng)可無縫訪問可信數(shù)據(jù)空間,快速整合不同數(shù)據(jù)系統(tǒng)的多樣化數(shù)據(jù)(如結(jié)構(gòu)化、時(shí)序、時(shí)空、表格、日志、圖像等),統(tǒng)一數(shù)據(jù)目錄以便數(shù)據(jù)發(fā)現(xiàn)。此外,簡墨主動(dòng)元數(shù)據(jù)還內(nèi)置數(shù)據(jù)觸發(fā)機(jī)制,打通私域數(shù)據(jù)和公域模型的協(xié)同鏈路,讓模型主動(dòng)理解多模態(tài)數(shù)據(jù)價(jià)值,持續(xù)生成私域?qū)僬J(rèn)知智能,增強(qiáng)智能體的分析和落地,助力企業(yè)和政府打造自己專屬的智能體工場。
拓?cái)?shù)派深耕私域模型和智能體及其對(duì)應(yīng)的數(shù)據(jù)計(jì)算底座,目前客戶多為500強(qiáng)核心央國企。
DataCS已在中國船舶、中國電子和中國航信等國家核心央企承擔(dān)智能體和垂類模型核心底座。并在多地政府落地異構(gòu)算力和可信數(shù)據(jù)管理平臺(tái),并成功投產(chǎn)交通、社會(huì)治理等智能體。在東吳證券、廣發(fā)證券等金融機(jī)構(gòu)作為垂類模型智能體開發(fā)平臺(tái),成功投產(chǎn)了秀才GPT和數(shù)字人等智能體。
拓?cái)?shù)派的全自主可控特性,使其在國內(nèi)私域數(shù)據(jù)服務(wù)領(lǐng)域筑起堅(jiān)實(shí)壁壘,如同Databricks在美國市場憑借技術(shù)創(chuàng)新和市場拓展占據(jù)重要地位一樣。二者雖處于不同的市場環(huán)境,但都通過掌握核心技術(shù)和服務(wù)能力,為各自區(qū)域的客戶提供定制化、安全可靠的數(shù)據(jù)解決方案,成為推動(dòng)私域數(shù)據(jù)服務(wù)發(fā)展的重要力量。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。