在國(guó)內(nèi)政策引導(dǎo)、企業(yè)產(chǎn)業(yè)智能升級(jí)的原生需求和疫情等多重因素作用下,中國(guó)的人工智能產(chǎn)業(yè)化應(yīng)用在過(guò)去的5年間呈現(xiàn)出無(wú)可比擬的增長(zhǎng)速度。2020年的中國(guó)人工智能軟件市場(chǎng)規(guī)模已經(jīng)超過(guò)了230億元人民幣,即便在疫情等外部因素考驗(yàn)下,仍舊迎來(lái)了平穩(wěn)的增長(zhǎng)。然而隨著應(yīng)用市場(chǎng)的下沉,市場(chǎng)上仍舊缺乏普惠的AI工具,即便在企業(yè)擁有相關(guān)開(kāi)發(fā)、建模人才的情況下,AI科學(xué)家和業(yè)務(wù)人員之間仍舊存在技術(shù)鴻溝。他們習(xí)慣使用各自的平臺(tái)和工具進(jìn)行數(shù)據(jù)分析或建模工作,這些數(shù)據(jù)資產(chǎn)被分散在企業(yè)各個(gè)角落,造成了模型的重復(fù)構(gòu)建和資源的孤島林立。而這些人才無(wú)法在同一個(gè)AI平臺(tái)上一起協(xié)作,發(fā)揮出他們各自的優(yōu)勢(shì)能力,這是AI落地目前面臨最大的挑戰(zhàn)?! ?/p>
企業(yè) AI 落地,到底難在哪里
企業(yè)在涉及到人工智能業(yè)務(wù)時(shí),其研發(fā)流程需經(jīng)歷從明確業(yè)務(wù)問(wèn)題->數(shù)據(jù)采集及清洗->特征工程->模型訓(xùn)練及打包->模型評(píng)估及驗(yàn)證->模型部署及上線->A/B test,以及模型監(jiān)控和迭代的工作流程。整個(gè)鏈條非常長(zhǎng),容易涉及到多個(gè)平臺(tái)間的切換。在任何環(huán)節(jié)出現(xiàn)功能短板或缺失,都會(huì)影響模型的開(kāi)發(fā)效率和開(kāi)發(fā)質(zhì)量,或?qū)е履P蜔o(wú)法及時(shí)在實(shí)際業(yè)務(wù)當(dāng)中部署應(yīng)用。
AI模型研發(fā)流程
在AI建模全生命周期中,涉及到企業(yè)內(nèi)各類(lèi)角色的協(xié)作,如:行業(yè)/領(lǐng)域?qū)<摇?shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、開(kāi)發(fā)者/DevOps專(zhuān)家等等。這些角色均有各自擅長(zhǎng)的技能,可以為AI建模的某些流程貢獻(xiàn)智慧,如行業(yè)/領(lǐng)域?qū)<覍?duì)業(yè)務(wù)有深入洞見(jiàn),擅長(zhǎng)通過(guò)數(shù)據(jù)構(gòu)建業(yè)務(wù)模型;數(shù)據(jù)科學(xué)家擅長(zhǎng)數(shù)據(jù)分析、特征加工、ML模型開(kāi)發(fā)及測(cè)試;數(shù)據(jù)工程師擅長(zhǎng)進(jìn)行數(shù)據(jù)收集、數(shù)據(jù)治理和數(shù)據(jù)加工;開(kāi)發(fā)者/DevOps專(zhuān)家擅長(zhǎng)軟件工具及基礎(chǔ)設(shè)施的構(gòu)建與維護(hù),幫助數(shù)據(jù)科學(xué)家將ML模型轉(zhuǎn)化為實(shí)際生產(chǎn)力。
AI相關(guān)人才技能地圖
這些角色由于專(zhuān)業(yè)背景和職能的不同,都習(xí)慣使用各自的平臺(tái)或工具推進(jìn)工作,在流程銜接方面會(huì)存在大量重復(fù)性數(shù)據(jù)、環(huán)境適配工作,造成AI模型開(kāi)發(fā)的周期大大拉長(zhǎng),且無(wú)法進(jìn)行數(shù)據(jù)、模型等資源的統(tǒng)一管理和資產(chǎn)沉淀?! ?/p>
星 環(huán)科技 推出 Sophon MLOps——
模型落地和 AI 協(xié)作的加速器
為解決AI落地難的問(wèn)題,星環(huán)科技的AI團(tuán)隊(duì)從用戶(hù)需求端出發(fā),傾力研發(fā)了一款基于云原生架構(gòu)的企業(yè)級(jí)AI能力運(yùn)營(yíng)平臺(tái)Sophon MLOps,助推AI模型落地,幫助各種相關(guān)角色使用同一個(gè)平臺(tái)進(jìn)行模型構(gòu)建和流程緊密協(xié)作,并且為AI落地的每一環(huán)流程進(jìn)行了優(yōu)化,為所有使用者提供便捷的體驗(yàn)。
MLOps與DevOps類(lèi)似,是機(jī)器學(xué)習(xí)過(guò)程管理的實(shí)踐性方法論。MLOps平臺(tái)為用戶(hù)串聯(lián)起了從模型設(shè)計(jì)、開(kāi)發(fā)到運(yùn)營(yíng)的全生命周期,并提供自動(dòng)化的功能,有效提高各環(huán)節(jié)的工作效率。
MLOps的定義
對(duì)于各用戶(hù)角色而言,都能憑借Sophon Base基礎(chǔ)建模平臺(tái)及MLOps運(yùn)維平臺(tái)提供的個(gè)性化功能,獲得不同工作環(huán)節(jié)上的效率提升,比如:為業(yè)務(wù)分析人員提供了低代碼功能,封裝了200多個(gè)算子可供點(diǎn)擊使用;為數(shù)據(jù)科學(xué)家提供了高性能的分布式模型開(kāi)發(fā)&訓(xùn)練環(huán)境及在線Notebook功能,方便其進(jìn)行數(shù)據(jù)探索、特征工程及模型構(gòu)建工作;為數(shù)據(jù)工程師提供了方便的模型打包、上架和調(diào)試功能,方便其快速將模型上架到實(shí)際生產(chǎn)環(huán)境;為前臺(tái)業(yè)務(wù)人員提供了API調(diào)用、A/B test及報(bào)告生成功能,方便其快速獲取結(jié)果數(shù)據(jù),并及時(shí)查看不同模型對(duì)業(yè)務(wù)的實(shí)際效果,并可以發(fā)送到數(shù)據(jù)科學(xué)家手中,進(jìn)行后續(xù)的模型迭代和調(diào)優(yōu)工作。
功能示例:
1 、支持多個(gè)模型的復(fù)雜推理圖構(gòu)建
Sophon MLOps支持統(tǒng)一納管XGBoost、MLflow、TensorFlow、PyTorch、Scikit-learn等多種訓(xùn)練框架的模型,以及Sophon Base中通過(guò)可視化建模和編程式建模訓(xùn)練得到的模型。按模型推理邏輯,圖形化搭建服務(wù)推理圖,并統(tǒng)一應(yīng)用模型文件。
2、快速配置資源參數(shù),支持灰度發(fā)布
平臺(tái)支持快速配置CPU、內(nèi)存、GPU等服務(wù)資源參數(shù),并將推理圖打包為服務(wù)鏡像,發(fā)布為在線服務(wù),且可配置服務(wù)彈性伸縮策略。服務(wù)部署支持灰度發(fā)布,可根據(jù)實(shí)際需要靈活配置流量分配比例。
3、服務(wù)上線后的測(cè)試
對(duì)于已發(fā)布上線的模型服務(wù),通過(guò)API接口對(duì)接上游業(yè)務(wù)系統(tǒng)數(shù)據(jù),實(shí)現(xiàn)模型實(shí)時(shí)預(yù)測(cè)。
4 、服務(wù)監(jiān)控(查看運(yùn)行狀態(tài)、訪問(wèn)量、響應(yīng)時(shí)間、訪問(wèn)記錄等)
平臺(tái)支持運(yùn)維人員統(tǒng)一監(jiān)控模型運(yùn)行狀態(tài),控制生產(chǎn)環(huán)境風(fēng)險(xiǎn),并多維度評(píng)估模型預(yù)測(cè)效果,為持續(xù)迭代模型提供參考。
5 、自動(dòng)生成模型性能評(píng)估報(bào)告(支持 A/B test 對(duì)比報(bào)告)
支持模型性能評(píng)估報(bào)告查看、一鍵下載等功能,并支持選擇多個(gè)模型進(jìn)行A/B test對(duì)比報(bào)告快速生成,幫助決策者對(duì)模型優(yōu)劣進(jìn)行基于量化性能指標(biāo)的決策。
6 、模型服務(wù)審計(jì)功能
支持以單個(gè)服務(wù)維度查看的模型服務(wù)運(yùn)行狀態(tài)的審計(jì)功能。
模型資產(chǎn)方面,Sophon MLOps提供了用戶(hù)完整的統(tǒng)計(jì)大屏,對(duì)于現(xiàn)有模型數(shù)量、運(yùn)行狀態(tài)、服務(wù)推理、模型評(píng)估、操作審計(jì)、節(jié)點(diǎn)情況一目了然。企業(yè)所有的AI相關(guān)的模型資產(chǎn)均可匯聚到MLOps進(jìn)行統(tǒng)一的納管、運(yùn)維、監(jiān)控和應(yīng)用,真正做到了AI維度上的打通。
MLOps用戶(hù)大屏
云原生方面,Sophon MLOps基于云原生設(shè)計(jì),提供容器云、微服務(wù)的架構(gòu),方便用戶(hù)對(duì)服務(wù)/應(yīng)用進(jìn)行自動(dòng)、快速部署和調(diào)度,對(duì)集群進(jìn)行方便的運(yùn)維和安全管控。
流程管理方面,由于Sophon MLOps支持從數(shù)據(jù)集到模型開(kāi)發(fā)、模型訓(xùn)練到模型上線的全過(guò)程,所有角色進(jìn)行的逐一環(huán)節(jié)操作在平臺(tái)上均有記錄留存。一旦模型上線之后出現(xiàn)問(wèn)題,可以根據(jù)模型服務(wù)回溯到模型版本和模型訓(xùn)練的過(guò)程到訓(xùn)練數(shù)據(jù)集,可以實(shí)現(xiàn)“發(fā)現(xiàn)問(wèn)題,快速追溯”。
兼容性方面,Sophon MLOps提供了強(qiáng)大的兼容性和可擴(kuò)展性,其AI能力在未來(lái)會(huì)不斷延伸。Sophon MLOps兼容最新的開(kāi)源算法框架、平臺(tái)及基礎(chǔ)設(shè)施,并與TDH、Sophon Base、Slipstream(數(shù)據(jù)實(shí)時(shí)接入)、FIDE(實(shí)時(shí)智能決策)高度兼容。數(shù)據(jù)類(lèi)型方面,除了結(jié)構(gòu)化數(shù)據(jù)建模之外,還支持圖譜分析及計(jì)算機(jī)視覺(jué)等延伸功能。用戶(hù)無(wú)需擔(dān)心一旦有新的開(kāi)源計(jì)算框架或運(yùn)行環(huán)境出現(xiàn),現(xiàn)有平臺(tái)不支持不兼容等問(wèn)題。
Sophon MLOps功能架構(gòu)
Sophon MLOps打通了AI的全生命周期,為企業(yè)的各類(lèi)用戶(hù)角色搭建了統(tǒng)一的AI協(xié)作平臺(tái)。對(duì)于企業(yè)而言,MLOps規(guī)?;晒芾砹硕嘣串悩?gòu)的機(jī)器學(xué)習(xí)模型,并提供高效且保障隱私安全的模型推理、監(jiān)控預(yù)警及性能評(píng)估服務(wù);對(duì)用戶(hù)而言,能感受到操作上的快捷,AI應(yīng)用與部署更是如虎添翼。
未來(lái),MLOps將繼續(xù)迭代更加豐富的功能,賦能企業(yè)AI更快、更好地落地。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。