打造智慧園區(qū) 助力企業(yè)上云
400-008-2859/span>
關(guān)注微信公眾號(hào)"龍智造工業(yè)云"
了解更多動(dòng)態(tài)
發(fā)布時(shí)間:2024-12-25 09:47:44
《數(shù)字化轉(zhuǎn)型》2024年第1期刊發(fā)卡奧斯物聯(lián)科技股份有限公司董事長(zhǎng)兼總經(jīng)理陳錄城等署名文章《智能工業(yè)時(shí)代:工業(yè)場(chǎng)景下的 AI 大模型體系架構(gòu)與應(yīng)用探索》,全文為您分享如下:
智能工業(yè)時(shí)代:工業(yè)場(chǎng)景下的 AI 大模型體系架構(gòu)與應(yīng)用探索
自工業(yè)革命以來(lái),工業(yè)生產(chǎn)先后經(jīng)歷了機(jī)械化、電氣化、自動(dòng)化、信息化的演進(jìn),正從數(shù)字化向智能化邁進(jìn),人工智能技術(shù)是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,AI 大模型以其強(qiáng)大的學(xué)習(xí)計(jì)算能力掀開了人工智能通用化的序幕,持續(xù)加速產(chǎn)業(yè)升級(jí)和高質(zhì)量發(fā)展,成為推動(dòng)我國(guó)工業(yè)智能化的關(guān)鍵因素和數(shù)字經(jīng)濟(jì)發(fā)展的重要引擎。
工業(yè)大模型,特指在工業(yè)領(lǐng)域設(shè)計(jì)和應(yīng)用的、具有大量參數(shù)的人工智能模型,它們通過(guò)深度學(xué)習(xí)和海量數(shù)據(jù)分析,為工業(yè)自動(dòng)化、智能化提供了強(qiáng)大的算法支持和決策輔助。工業(yè) 4.0 的浪潮帶來(lái)了對(duì)智能制造前所未有的需求,工業(yè)大模型作為這一轉(zhuǎn)型過(guò)程中的核心驅(qū)動(dòng)力,其創(chuàng)新應(yīng)用正成為學(xué)術(shù)界和工業(yè)界關(guān)注的焦點(diǎn)。它們不僅能夠提升生產(chǎn)效率,降低運(yùn)營(yíng)成本,還能夠促進(jìn)新產(chǎn)品的快速開發(fā),提高市場(chǎng)響應(yīng)速度。過(guò)去,人工智能在工業(yè)領(lǐng)域的應(yīng)用往往受限于特定任務(wù),僅能根據(jù)已有數(shù)據(jù)進(jìn)行預(yù)測(cè)或推斷,實(shí)現(xiàn)質(zhì)量檢測(cè)、預(yù)測(cè)性維護(hù)等單一功能;現(xiàn)在,工業(yè)大模型憑借卓越的理解能力、生成能力和泛化能力,能夠深度理解工業(yè)特定領(lǐng)域的復(fù)雜問(wèn)題,處理海量數(shù)據(jù),并從中挖掘背后的規(guī)律和模式,推動(dòng)工業(yè)生產(chǎn)走向自適應(yīng)、自決策、自執(zhí)行。從機(jī)械制造到供應(yīng)鏈管理,從產(chǎn)品研發(fā)設(shè)計(jì)、生產(chǎn)制造到運(yùn)維服務(wù),工業(yè)大模型的應(yīng)用正在不斷拓展,其影響力逐漸滲透到工業(yè)生產(chǎn)的每一個(gè)環(huán)節(jié)。
卡奧斯基于海爾集團(tuán) 40 年的制造業(yè)經(jīng)驗(yàn),自主研發(fā)了國(guó)內(nèi)首個(gè)以工業(yè)互聯(lián)網(wǎng)平臺(tái)為底座的多模態(tài)大模型——COSMO-GPT 工業(yè)大模型,具備工業(yè)知識(shí)問(wèn)答、工業(yè)代碼生成、工業(yè)文本生成和工業(yè)理解計(jì)算等核心能力,已經(jīng)在智能柔性裝配、服裝輔助設(shè)計(jì)和注塑機(jī)工藝參數(shù)優(yōu)化等場(chǎng)景落地應(yīng)用,并取得顯著成效。本文首先對(duì)既有文獻(xiàn)進(jìn)行梳理,回顧了工業(yè)大模型的發(fā)展現(xiàn)狀;其次深入探討了工業(yè)大模型三種典型的構(gòu)建模式;最后詳細(xì)闡述了以工業(yè)互聯(lián)網(wǎng)平臺(tái)為數(shù)字底座的 COSMO-GPT 工業(yè)大模型總體架構(gòu)、核心能力和創(chuàng)新實(shí)踐探索。
一、工業(yè)大模型的發(fā)展現(xiàn)狀
顧名思義,AI 大模型指具有大量參數(shù)和復(fù)雜結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò)模型,是大數(shù)據(jù)、大算力和強(qiáng)算法結(jié)合的產(chǎn)物,是凝聚了大數(shù)據(jù)內(nèi)在精華的隱式知識(shí)庫(kù)。隨著算力的不斷提升以及大規(guī)模數(shù)據(jù)集的持續(xù)豐富,大批科技公司和學(xué)術(shù)機(jī)構(gòu)開始構(gòu)建擁有數(shù)以億計(jì)甚至數(shù)千億參數(shù)的神經(jīng)網(wǎng)絡(luò)。大模型的概念是相對(duì)以前專用的小模型而言的,大模型擁有更多的參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)(更多的隱藏層),可以更好地捕捉數(shù)據(jù)中的復(fù)雜模式,學(xué)習(xí)更高層次的抽象特征,從而在各類任務(wù)處理上擁有更好的性能和更出色的表現(xiàn)能力。
使用通用數(shù)據(jù)集訓(xùn)練得到的 AI 大模型雖然具有強(qiáng)大的自然語(yǔ)言理解與生成能力,但由于缺乏特定行業(yè)的數(shù)據(jù)和知識(shí),在處理特定工業(yè)任務(wù)時(shí),往往難以理解細(xì)分領(lǐng)域的專業(yè)術(shù)語(yǔ)和約束規(guī)則,輸出的解決方案無(wú)法滿足工業(yè)實(shí)際應(yīng)用的要求。此外,AI 大模型在應(yīng)用于工業(yè)場(chǎng)景時(shí)往往需要接入企業(yè)的信息系統(tǒng),由于缺乏企業(yè)業(yè)務(wù)流程、數(shù)據(jù)結(jié)構(gòu)、運(yùn)營(yíng)模式等方面的數(shù)據(jù)和知識(shí),生成的解決方案無(wú)法匹配特定企業(yè)的實(shí)際需求。
近幾年來(lái),為了使 AI 大模型深度適配工業(yè)場(chǎng)景,學(xué)術(shù)界和產(chǎn)業(yè)界開展了大量的研究工作,也取得了比較豐碩的成果。豐田汽車基于計(jì)算機(jī)輔助工程的優(yōu)化理論,開發(fā)了專為車輛設(shè)計(jì)師服務(wù)的工業(yè)大模型,可以將工程約束條件融入設(shè)計(jì)流程,根據(jù)文本提示生成的設(shè)計(jì)草圖自動(dòng)優(yōu)化了風(fēng)阻、底盤高度等關(guān)鍵工程參數(shù)。Back2CAD 公 司 在 OpenAI 和 Amazon AWS 等 的支持下開發(fā)了 CADGPTTM 大模型,具有 CAD項(xiàng)目輔助、文檔生成、代碼生成、虛擬助手功能。西門子開發(fā)的 Siemens Industrial Copilot 可迅速生成并優(yōu)化仿真代碼,將原來(lái)長(zhǎng)達(dá)數(shù)周的仿真任務(wù)縮短至數(shù)小時(shí)甚至數(shù)分鐘。Vanti 公司開發(fā)的工業(yè)大模型 Manufacturing COPILOT 可以融合來(lái)自企業(yè)資源計(jì)劃(Enterprise Resource Planning,ERP)、制造執(zhí)行系統(tǒng)(Manufacturing Execution System,MES)等不同信息系統(tǒng)的異構(gòu)數(shù)據(jù),借助可視化技術(shù),以自然語(yǔ)言對(duì)話的方式與用戶交互,將數(shù)據(jù)分析處理過(guò)程轉(zhuǎn)換為易于理解的、可操作的圖形化敘述,實(shí)現(xiàn)輔助決策。山東能源集團(tuán)、華為以及云鼎科技聯(lián)合發(fā)布的盤古礦山大模型是全球首個(gè)應(yīng)用于能源行業(yè)的工業(yè)大模型,原先需要工人下礦井逐個(gè)檢查的卸壓工程規(guī)范性驗(yàn)證操作,現(xiàn)在坐在辦公室里就能完成。深信服發(fā)布的安全 GPT 大模型基于海量流量、代碼、安全日志等特定安全領(lǐng)域數(shù)據(jù),實(shí)現(xiàn)了高精準(zhǔn)的攻擊流量檢測(cè)和解讀,能夠有效檢測(cè) Web 0day 漏洞、高度對(duì)抗的混淆、協(xié)議繞過(guò)等高級(jí)威脅。北京航空航天大學(xué)團(tuán)隊(duì)打造的工業(yè)大模型 AIGC 引擎具有工業(yè)仿真系統(tǒng)代碼生成、工業(yè)數(shù)字孿生場(chǎng)景生成、機(jī)器操控指令生成、生產(chǎn)工藝生成等多項(xiàng)功能。
總的來(lái)看,當(dāng)前 AI 大模型在工業(yè)領(lǐng)域的應(yīng)用可以歸結(jié)為兩個(gè)方向:一是使模型具備更強(qiáng)的泛化能力,提升小樣本訓(xùn)練效果,使其可以遷移至更多應(yīng)用場(chǎng)景,主要應(yīng)用場(chǎng)景有視覺(jué)檢測(cè)、質(zhì)量控制、原材料檢測(cè)、環(huán)境感知、AGV自主導(dǎo)航等;二是作為工業(yè)應(yīng)用的入口,以自然語(yǔ)言對(duì)話的方式生成工業(yè)領(lǐng)域的文字、圖像等內(nèi)容,降低工業(yè)應(yīng)用的使用門檻,主要應(yīng)用場(chǎng)景有生產(chǎn)報(bào)表生成、控制代碼生成、設(shè)備監(jiān)控、生產(chǎn)調(diào)度等。
二、工業(yè)大模型的構(gòu)建模式
由于缺乏對(duì)工業(yè)細(xì)分領(lǐng)域知識(shí)的理解,基于大規(guī)模通用數(shù)據(jù)集訓(xùn)練得到的通用大模型往往無(wú)法直接生成滿足工業(yè)特定任務(wù)要求的解決方案,因此,為了使 AI 大模型能夠真正賦能工業(yè)智能化發(fā)展,必須構(gòu)建專業(yè)的工業(yè)大模型,目前主要存在三種構(gòu)建模式:預(yù)訓(xùn)練模式、微調(diào)模式和檢索增強(qiáng)生成模式。
(一)預(yù)訓(xùn)練模式
預(yù)訓(xùn)練模式是指按照通用大模型的構(gòu)建方法,收集大量無(wú)標(biāo)注的工業(yè)數(shù)據(jù)集和通用數(shù)據(jù)集,使用 Transformer 等架構(gòu)重新訓(xùn)練模型,學(xué)習(xí)工業(yè)數(shù)據(jù)集中的通用特征和知識(shí),使模型能夠從容應(yīng)對(duì)行業(yè)的具體問(wèn)題。這種模式的優(yōu)點(diǎn)是工業(yè)大模型具備廣泛的工業(yè)通用知識(shí),可以最大程度地滿足各類工業(yè)場(chǎng)景的需求。此模式缺點(diǎn)也同樣明顯,高質(zhì)量工業(yè)數(shù)據(jù)的收集、大量的訓(xùn)練時(shí)間、對(duì)龐大算力資源的占用、電力消耗以及其他相關(guān)開銷,導(dǎo)致預(yù)訓(xùn)練大型模型的成本高昂,可達(dá)數(shù)百萬(wàn)美元,甚至更高,只有大型科技公司或研究機(jī)構(gòu)才有能力承擔(dān),普通的企業(yè)或個(gè)人很難負(fù)擔(dān)得起。
(二)微調(diào)模式
微調(diào)模式是指在一個(gè)已經(jīng)預(yù)訓(xùn)練好的基礎(chǔ)大模型的基礎(chǔ)上,利用特定工業(yè)場(chǎng)景已經(jīng)標(biāo)注好的針對(duì)特定任務(wù)的高質(zhì)量數(shù)據(jù)集對(duì)大模型進(jìn)行架構(gòu)調(diào)整(例如添加特定的輸出層)和參數(shù)優(yōu)化,從而使其學(xué)習(xí)到工業(yè)細(xì)分領(lǐng)域的知識(shí),能夠完成特定的工業(yè)任務(wù)。在微調(diào)過(guò)程中,通常會(huì)選擇凍結(jié)大模型的底層參數(shù),以保留其在預(yù)訓(xùn)練階段學(xué)習(xí)到的通用知識(shí),只更新模型的頂層或新添加的適配器層,以學(xué)習(xí)特定任務(wù)的特征。微調(diào)模式能夠合理利用預(yù)訓(xùn)練基礎(chǔ)大模型的廣泛知識(shí),通過(guò)微調(diào)使其能夠適應(yīng)特定的任務(wù)需求,減少?gòu)念^開始訓(xùn)練所需的時(shí)間和資源,并且對(duì)數(shù)據(jù)量的要求更低,單個(gè)任務(wù)的微調(diào)通常只需要幾千至上萬(wàn)條工業(yè)數(shù)據(jù),但要求所用的數(shù)據(jù)已被標(biāo)注。
(三)檢索增強(qiáng)生成模式
檢索增強(qiáng)生成模式是指為已經(jīng)預(yù)訓(xùn)練好的基礎(chǔ)大模型外掛一個(gè)它能理解的行業(yè)知識(shí)庫(kù)(通常為向量數(shù)據(jù)庫(kù)),在不改變?cè)竽P蛥?shù)的情況下,使其能夠在生成響應(yīng)之前引用訓(xùn)練數(shù)據(jù)集之外的權(quán)威知識(shí),從而快速接入工業(yè)細(xì)分領(lǐng)域的信息,實(shí)現(xiàn)特定工業(yè)場(chǎng)景的知識(shí)問(wèn)答和內(nèi)容生成。在沒(méi)有檢索增強(qiáng)生成前,大模型接受用戶輸入,并根據(jù)預(yù)訓(xùn)練過(guò)程中學(xué)習(xí)到的知識(shí)創(chuàng)建響應(yīng)結(jié)果。檢索增強(qiáng)生成允許大模型動(dòng)態(tài)地訪問(wèn)和利用大量的外部信息,其工作過(guò)程如圖 1 所示。檢索增強(qiáng)生成為大模型添加了一個(gè)信息檢索組件,這個(gè)組件會(huì)將用戶輸入轉(zhuǎn)換為向量表示,并于外部行業(yè)知識(shí)庫(kù)中執(zhí)行相關(guān)性搜索,檢索與之相關(guān)的文檔或信息片段,這些文檔或信息片段不僅提供了上下文背景,還擴(kuò)展了模型對(duì)特定領(lǐng)域或話題的理解,大模型根據(jù)接收的這些文檔或信息片段以及用戶的原始輸入來(lái)生成答案。這種模式的優(yōu)勢(shì)是無(wú)需進(jìn)行額外訓(xùn)練,只需構(gòu)建和接入權(quán)威的行業(yè)知識(shí)庫(kù),就能快速利用現(xiàn)有的基礎(chǔ)大模型實(shí)現(xiàn)對(duì)工業(yè)領(lǐng)域知識(shí)的理解和應(yīng)用,后續(xù)大模型的更新和維護(hù)也僅局限于信息檢索組件和行業(yè)知識(shí)庫(kù)的迭代。但與預(yù)訓(xùn)練模式和微調(diào)模式相比,這種模式的泛化能力和穩(wěn)定性要差,可能無(wú)法充分適應(yīng)工業(yè)場(chǎng)景的需求。
三、基于工業(yè)互聯(lián)網(wǎng)平臺(tái)的工業(yè)大模型通用體系架構(gòu)
在工業(yè)大模型的開發(fā)實(shí)踐中,預(yù)訓(xùn)練、微調(diào)以及檢索增強(qiáng)生成構(gòu)建模式構(gòu)成了一套豐富而靈活的框架體系,鑒于不同工業(yè)場(chǎng)景對(duì)模型性能、效率及可解釋性等方面的多樣化需求,綜合采用上述多種構(gòu)建方式已成為一種趨勢(shì)。卡奧斯基于海爾集團(tuán) 40 年的制造業(yè)經(jīng)驗(yàn),以多個(gè)開源通用大模型為基礎(chǔ),在微調(diào)的同時(shí)融入檢索增強(qiáng)生成機(jī)制,自主研發(fā)了國(guó)內(nèi)首個(gè)以工業(yè)互聯(lián)網(wǎng)平臺(tái)為數(shù)字底座的多模態(tài)大模型——COSMO-GPT 工業(yè)大模型(見圖 2),其總體架構(gòu)可以概括為“1+1+N”,即 1 個(gè)數(shù)字底座、1個(gè)能力引擎和N 個(gè)應(yīng)用場(chǎng)景。
(一)數(shù)字底座
數(shù)據(jù)質(zhì)量直接決定了工業(yè)大模型的性能,如果輸入的數(shù)據(jù)存在噪聲或代表性不強(qiáng),必將使模型的推理能力下降,若數(shù)據(jù)類型單一,還可能增加過(guò)擬合的風(fēng)險(xiǎn)。因此,無(wú)論是采用預(yù)訓(xùn)練模式、微調(diào)模式,還是檢索增強(qiáng)生成模式,想要得到泛化能力強(qiáng)、準(zhǔn)確性高的工業(yè)大模型,都必須先獲得高質(zhì)量的工業(yè)數(shù)據(jù)集。工業(yè)互聯(lián)網(wǎng)平臺(tái)作為數(shù)字底座,可以提供工業(yè)設(shè)備接入、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)集成等能力,為工業(yè)大模型的預(yù)訓(xùn)練、微調(diào)和檢索增強(qiáng)生成奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。以卡奧斯 COSMOPlat 工業(yè)互聯(lián)網(wǎng)平臺(tái)為例,該平臺(tái)已鏈接企業(yè) 90 萬(wàn)家,服務(wù)企業(yè) 16 萬(wàn)家,平臺(tái)的現(xiàn)代工業(yè)數(shù)據(jù)棧能夠高效采集來(lái)自企業(yè)工業(yè)軟件、信息系統(tǒng)、傳感器和生產(chǎn)設(shè)備等的海量異構(gòu)數(shù)據(jù),并進(jìn)行實(shí)時(shí)數(shù)據(jù)清洗、融合、分析和標(biāo)注,目前已建立工業(yè)數(shù)據(jù)集 562 個(gè),其中有效數(shù)據(jù) 300 余萬(wàn)條。
(二)能力引擎
基于工業(yè)互聯(lián)網(wǎng)平臺(tái),卡奧斯積累了 3900余個(gè)用于研發(fā)設(shè)計(jì)、生產(chǎn)制造、服務(wù)管理等環(huán)節(jié)的工業(yè)機(jī)理模型,200 余個(gè)用于故障診斷、路徑規(guī)劃、生產(chǎn)調(diào)度、質(zhì)量控制等場(chǎng)景的專家算法,以及大量工業(yè)知識(shí)圖譜、專用詞典、行業(yè)標(biāo)準(zhǔn)、發(fā)明專利等,并基于這些內(nèi)容建立了面向工業(yè)細(xì)分領(lǐng)域的行業(yè)知識(shí)庫(kù),為大模型的檢索增強(qiáng)生成提供了有力支撐,這使得 COSMO-GPT 工業(yè)大模型具備了五大核心能力:一是工業(yè)知識(shí)問(wèn)答,針對(duì)特定工業(yè)場(chǎng)景中的知識(shí)點(diǎn)進(jìn)行信息查詢和問(wèn)題解答,包括注塑機(jī)、工業(yè)機(jī)器人、機(jī)床等生產(chǎn)設(shè)備的操作知識(shí),工業(yè)生產(chǎn)和加工的標(biāo)準(zhǔn)操作流程,設(shè)備故障原因分析和維修建議,工業(yè)環(huán)境中的安全規(guī)范,材料、組件和產(chǎn)品的技術(shù)規(guī)格等;二是工業(yè)代碼生成,包括工業(yè)設(shè)備的控制代碼、PLC 等控制器的控制代碼、工業(yè)機(jī)器人路徑規(guī)劃和動(dòng)作序列代碼、數(shù)字孿生和仿真代碼、數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(SCADA)使用的腳本、用于數(shù)據(jù)處理和分析的代碼等;三是工業(yè)文本生成,包括技術(shù)手冊(cè)、操作規(guī)程、維護(hù)指南等技術(shù)文檔,生產(chǎn)報(bào)告、質(zhì)量分析報(bào)告、設(shè)備運(yùn)行報(bào)告、故障診斷說(shuō)明等分析報(bào)告,安全教育、操作指南等員工培訓(xùn)材料,團(tuán)隊(duì)協(xié)作記錄、會(huì)議紀(jì)要、交接班報(bào)告等溝通文檔,設(shè)計(jì)規(guī)格說(shuō)明等設(shè)計(jì)文檔等;四是工業(yè)理解計(jì)算,包括物料齊套檢查、設(shè)備物料選型、訂單延期推算、產(chǎn)品不良率統(tǒng)計(jì)分析等;五是工業(yè)多模態(tài),支持文本、圖像、語(yǔ)音等多種類型的工業(yè)數(shù)據(jù),增強(qiáng)工業(yè)信息理解和推理能力。
(三)應(yīng)用場(chǎng)景
通過(guò)模型即服務(wù)的部署架構(gòu),COSMO-GPT工業(yè)大模型可以面向不同行業(yè)、不同需求,為用戶提供輕量化、定制化的解決方案,實(shí)現(xiàn)從交互設(shè)計(jì)、虛擬仿真、網(wǎng)絡(luò)協(xié)同、柔性生產(chǎn)到智能服務(wù)全生命周期的智能化升級(jí),助力從場(chǎng)景、企業(yè)、園區(qū)、行業(yè)到城市的數(shù)字化轉(zhuǎn)型,打造矩陣式賦能新范式。
四、COSMO-GPT 工業(yè)大模型的應(yīng)用實(shí)踐
COSMO-GPT 工業(yè)大模型的工業(yè)知識(shí)問(wèn)答、工業(yè)代碼生成、工業(yè)文本生成、工業(yè)理解計(jì)算和工業(yè)多模態(tài)等能力已在交互設(shè)計(jì)、虛擬仿真、網(wǎng)絡(luò)協(xié)同、柔性生產(chǎn)和智慧服務(wù)等多個(gè)環(huán)節(jié)進(jìn)行應(yīng)用探索。
(一)智能柔性裝配
隨著生活水平的不斷提高,消費(fèi)者對(duì)產(chǎn)品的需求趨向于個(gè)性化、多樣化。為了獲得市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì),家電、汽車等制造行業(yè)紛紛改變?cè)瓉?lái)單一化、規(guī)模化、整體化的生產(chǎn)模式,向大規(guī)模個(gè)性化定制生產(chǎn)轉(zhuǎn)型,多品種、小批量訂單日益增多。但由于生產(chǎn)線缺乏動(dòng)態(tài)調(diào)整和快速重構(gòu)能力,多品種、小批量產(chǎn)品的混線生產(chǎn)帶來(lái)了模具、工裝夾具等的頻繁更換和機(jī)器參數(shù)、控制程序等的頻繁調(diào)整,生產(chǎn)換型時(shí)間長(zhǎng),產(chǎn)品總裝工序 80% 以上的操作依賴人工,生產(chǎn)效率低。
COSMO-GPT 工業(yè)大模型可用于家電產(chǎn)品的裝配場(chǎng)景,實(shí)現(xiàn)智能柔性裝配,降低多品種、小批量訂單的生產(chǎn)成本,縮短交付周期。智能柔性裝配系統(tǒng)的工作原理如圖 3 所示,系統(tǒng)利用射頻識(shí)別技術(shù)獲取訂單信息,判斷待生產(chǎn)對(duì)象是否為新產(chǎn)品。對(duì)于新產(chǎn)品,多模態(tài)大模型利用 CAD 數(shù)字模型等設(shè)計(jì)數(shù)據(jù)、上游生產(chǎn)任務(wù)數(shù)據(jù)和裝配工藝知識(shí)圖譜,生成零部件裝配工藝步驟,每個(gè)工藝步驟的操作流程則由機(jī)器人技能模型生成,通過(guò)數(shù)字仿真模型對(duì)軌跡柔順性、抓取精度和作業(yè)節(jié)拍等進(jìn)行驗(yàn)證和優(yōu)化(見圖 4),并由人工調(diào)整工序和軌跡錯(cuò)誤,從而生成最優(yōu)裝配方案;對(duì)于既有產(chǎn)品,則直接從工序庫(kù)中調(diào)用既有裝配方案。在執(zhí)行環(huán)節(jié),系統(tǒng)融合 3D 相機(jī)、力傳感器、設(shè)備運(yùn)行數(shù)據(jù)和工藝參數(shù)數(shù)據(jù)對(duì)工況進(jìn)行實(shí)時(shí)判斷,對(duì)裝配過(guò)程進(jìn)行動(dòng)態(tài)調(diào)整,已經(jīng)驗(yàn)證并執(zhí)行過(guò)的裝配將被存儲(chǔ),用于下一次生產(chǎn)調(diào)用。當(dāng)前,對(duì)于冰箱產(chǎn)品,已實(shí)現(xiàn)亞毫米級(jí)的精準(zhǔn)裝配,整機(jī)裝配效率提高 42%。
(二)服裝輔助設(shè)計(jì)
服裝是個(gè)性化、多樣化、時(shí)尚化特征最為突出的產(chǎn)品之一,隨著消費(fèi)者個(gè)性化定制需求的日益增長(zhǎng),新品的設(shè)計(jì)和生產(chǎn)周期必須控制在幾周甚至幾天以內(nèi),給設(shè)計(jì)師帶來(lái)了沉重的工作負(fù)擔(dān)。服裝的創(chuàng)意和概念往往是整個(gè)設(shè)計(jì)過(guò)程的瓶頸,消耗了設(shè)計(jì)師大量的精力和時(shí)間。
COSMO-GPT 工業(yè)大模型能夠應(yīng)用于服裝的概念設(shè)計(jì),實(shí)現(xiàn)服裝輔助設(shè)計(jì)平臺(tái)的搭建,該平臺(tái)可以通過(guò)用戶描述和參考圖樣快速為設(shè)計(jì)師提供設(shè)計(jì)方案,實(shí)現(xiàn)從概念描述到概念設(shè)計(jì)成果的快速產(chǎn)出(如圖 5)。平臺(tái)的內(nèi)部運(yùn)行原理如圖 6 所示:第一步,提示詞生成器以用戶簡(jiǎn)單輸入的關(guān)鍵詞為基礎(chǔ),在行業(yè)知識(shí)圖譜中檢索出備選關(guān)鍵詞,用戶對(duì)備選關(guān)鍵詞進(jìn)行選擇,從而篩選出最匹配用戶需求的精確關(guān)鍵詞;第二步,大模型接收精確關(guān)鍵詞,從基于過(guò)往典型設(shè)計(jì)案例、業(yè)界優(yōu)秀設(shè)計(jì)案例等內(nèi)容構(gòu)建的設(shè)計(jì)知識(shí)向量數(shù)據(jù)庫(kù)中檢索相匹配的行業(yè)知識(shí),并生成多個(gè)候選設(shè)計(jì)方案;第三步,用戶從候選方案中選出最滿意的設(shè)計(jì)方案,并可以通過(guò)圖像算法對(duì)設(shè)計(jì)圖進(jìn)行修改調(diào)整或利用大模型的能力對(duì)設(shè)計(jì)圖進(jìn)行局部重繪;第四步,輸出設(shè)計(jì)方案和設(shè)計(jì)圖。通過(guò)服裝輔助設(shè)計(jì)平臺(tái),設(shè)計(jì)師可以根據(jù)用戶需求輸出服裝風(fēng)格、配色、材質(zhì)、配飾等文字信息,一次生成多張效果圖,完成款式設(shè)計(jì);可以通過(guò)局部繪制蒙版的方式實(shí)現(xiàn)對(duì)服裝配飾的添加、修改和對(duì)面料的替換;可以在不更改服裝款式的前提下,僅對(duì)服裝顏色進(jìn)行修改。此外,支持根據(jù)用戶上傳的參考圖片,一次生成多張類似風(fēng)格的效果圖。通過(guò)工業(yè)大模型賦能,平臺(tái)已經(jīng)支持外套、半身裙、連衣裙、T 恤、馬面裙和衛(wèi)衣共 6 種服裝品類的設(shè)計(jì),可以將設(shè)計(jì)師的設(shè)計(jì)效率提升 40% 以上。
(三)注塑機(jī)工藝參數(shù)優(yōu)化
注塑成型是一種重要的加工方式,廣泛應(yīng)用于航天、醫(yī)療、汽車、家電等制造行業(yè),我國(guó)超過(guò) 80% 的工程塑料都是采用注塑成型工藝生產(chǎn)的。注塑機(jī)是注塑成型的核心設(shè)備,也是國(guó)內(nèi)市場(chǎng)規(guī)模占比最大的塑料機(jī)械裝備。我國(guó)塑料生產(chǎn)的年耗電量約為三峽發(fā)電站一整年的發(fā)電量,而注塑成型的電耗在整個(gè)塑料生產(chǎn)過(guò)程中的占比超過(guò) 60%,因此降低注塑加工的電耗是工業(yè)領(lǐng)域節(jié)能研究的一大熱點(diǎn)。注塑成型工藝過(guò)程復(fù)雜,涉及 400 余個(gè)數(shù)據(jù)點(diǎn)位和注射壓力、保壓壓力、注射速度、熔體溫度、冷卻時(shí)間等 100 余個(gè)可調(diào)工藝參數(shù),傳統(tǒng)的參數(shù)調(diào)節(jié)依賴人工試模,調(diào)試周期長(zhǎng),且難以達(dá)到最佳配比,導(dǎo)致注塑機(jī)經(jīng)常處于非最優(yōu)運(yùn)行狀態(tài),電耗居高不下。
應(yīng)用 COSMO-GPT 工業(yè)大模型(如圖 7 所示), 工 人 以 文 字、 語(yǔ) 音、 圖 片、CAD 圖 紙等方式與系統(tǒng)交互,多模態(tài)大模型準(zhǔn)確識(shí)別用戶意圖,從用戶輸入中提取注塑件結(jié)構(gòu)參數(shù)、注塑機(jī)功能參數(shù)等關(guān)鍵參數(shù)信息,并調(diào)用基于高質(zhì)量注塑數(shù)據(jù)集和極度梯度提升樹、粒子群等算法訓(xùn)練的工藝參數(shù)推薦專家模型,專家模型通過(guò)計(jì)算輸出最佳工藝參數(shù),大模型接收工藝參數(shù),并結(jié)合注塑機(jī)工藝參數(shù)配置界面,生成最佳工藝參數(shù)配置方案。依托工業(yè)大模型,即使沒(méi)有專業(yè)知識(shí)的普通工人也能快速完成注塑機(jī)的參數(shù)優(yōu)化調(diào)節(jié)工作,減少了對(duì)高技能工匠的依賴,節(jié)省了用人成本和培訓(xùn)成本。基于COSMO-GPT 工業(yè)大模型,已經(jīng)能夠?qū)④嚿硗鈿げ考?nèi)飾部件以及洗衣機(jī)外筒部件等復(fù)雜注塑件的試模周期由近百次縮短至 2 次,產(chǎn)品質(zhì)量合格率由 92% 提升至 97%,單臺(tái)注塑機(jī)的平均能耗降低 10%。五、結(jié)論與展望
海爾基于多年的制造業(yè)經(jīng)驗(yàn)和數(shù)據(jù)積累,以工業(yè)互聯(lián)網(wǎng)平臺(tái)為數(shù)字底座,構(gòu)建了高質(zhì)量的工業(yè)數(shù)據(jù)庫(kù)和行業(yè)知識(shí)庫(kù),并在多個(gè)開源通用大模型的基礎(chǔ)上,結(jié)合微調(diào)模式和檢索增強(qiáng)生成模式,自主研發(fā)了具備工業(yè)知識(shí)問(wèn)答、工業(yè)代碼生成、工業(yè)文本生成、工業(yè)理解計(jì)算和工業(yè)多模態(tài)五大核心能力的COSMO-GPT 工業(yè)大模型。在家電產(chǎn)品的裝配場(chǎng)景,通過(guò)生成零部件裝配序列和機(jī)器人控制代碼,實(shí)現(xiàn)了智能柔性裝配,冰箱產(chǎn)品的整機(jī)裝配效率提高了42%;在服裝輔助設(shè)計(jì)場(chǎng)景,通過(guò)文本輸入和圖像輸入,可快速為設(shè)計(jì)師提供設(shè)計(jì)方案,實(shí)現(xiàn)從概念描述到概念設(shè)計(jì)成果的快速產(chǎn)出,設(shè)計(jì)效率提升了 40% 以上;在注塑機(jī)工藝參數(shù)優(yōu)化場(chǎng)景,可為沒(méi)有專業(yè)知識(shí)的普通工人快速推薦注塑機(jī)的最佳工藝參數(shù),復(fù)雜注塑件的試模周期由近百次縮短至 2 次,單臺(tái)注塑機(jī)的平均能耗降低了 10%。COSMO-GPT 工業(yè)大模型的創(chuàng)新應(yīng)用可以顯著提升企業(yè)生產(chǎn)效率,降低運(yùn)營(yíng)成本,為 AI 大模型在工業(yè)領(lǐng)域的全面推廣和深度應(yīng)用提供重要參考和啟示。
資助項(xiàng)目:
泰山產(chǎn)業(yè)領(lǐng)軍人才工程專項(xiàng)經(jīng)費(fèi)資助(tscx202306029);國(guó)家自然科學(xué)基金青年基金(62303272);山東省自然科學(xué)基金青年基金(ZR2022QF038);山東省博士后創(chuàng)新項(xiàng)目(SDCX-ZG-202203036);青島市博士后創(chuàng)新項(xiàng)目(QDBSH20240102160)。
作者介紹
陳錄城,卡奧斯物聯(lián)科技股份有限公司董事長(zhǎng)兼總經(jīng)理,卡奧斯工業(yè)智能研究院院長(zhǎng),正高級(jí)工程師,碩士,研究方向:工業(yè)互聯(lián)網(wǎng)、智能制造、大規(guī)模個(gè)性化定制模式與應(yīng)用;
楊振發(fā),卡奧斯工業(yè)智能研究院高級(jí)技術(shù)經(jīng)理,博士,主要研究方向:工業(yè)智能理論與關(guān)鍵技術(shù)、大規(guī)模個(gè)性化定制基礎(chǔ)理論;
魯效平(通信作者),卡奧斯物聯(lián)科技股份有限公司技術(shù)總監(jiān),博士,正高級(jí)工程師,研究方向:工業(yè)互聯(lián)網(wǎng)、人工智能、智能制造、大規(guī)模個(gè)性化定制理論;電子郵箱:luxiaoping@haier.com;
盛國(guó)軍,卡奧斯物聯(lián)股份科技有限公司CTO,主要研究方向:工業(yè)互聯(lián)網(wǎng)、人工智能、大數(shù)據(jù);
秦承剛,卡奧斯工業(yè)智能研究院執(zhí)行院長(zhǎng),博士,主要研究方向:工業(yè)互聯(lián)網(wǎng)操作系統(tǒng)、工業(yè)大數(shù)據(jù)、系統(tǒng)安全;
王超,卡奧斯工業(yè)智能研究院正高級(jí)工程師,博士,主要研究方向:工業(yè)互聯(lián)網(wǎng)、數(shù)字孿生、智能制造;
王朋靜,卡奧斯工業(yè)智能研究院工程師,主要研究方向:工業(yè)互聯(lián)網(wǎng)、工業(yè)智能。