首頁 > 互聯網 > 正文

    世界觀察:大模型在工業領域探索仍處于初級階段

    2023-07-06 08:53:31來源:人民郵電報  


    【資料圖】

    圖片來源:中國工業互聯網研究院

    近日,中國工業互聯網研究院(以下簡稱“工聯院”)針對人工智能大模型在中文工業領域的應用性能、技術架構、標準體系進行系統性評測,并發布系列報告。評測對象涵蓋GPT-4、GPT-3.5、文心一言、ChatGLM等國內外具有代表性的頭部大模型。

    本次工業知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。評測結果顯示,GPT-4表現最佳。國內頭部大模型表現亮眼,整體與GPT-3.5相當。其中百度文心一言在國內大模型中排名第一。

    在客觀題方面,GPT-4與文心一言表現優于其他大模型。但評測結果也同時指出,大模型在準確率方面有較大的提升空間。在主觀題方面,國內大模型的基礎能力、語句能力與GPT-4接近,概括能力、邏輯能力與GPT-4存在一定差距。

    評測數據集由工業領域八大行業的相關數據構成。包括電子設備制造業、裝備制造業、鋼鐵行業、采礦行業、電力行業、石化化工行業、建材行業和紡織行業。工聯院根據工業經驗,結合外部數據源,按行業構建行業知識測試集。

    從行業維度看,大模型在八個行業知識問答能力上差異明顯,個別行業需進一步優化提升。其中,電子、裝備行業評價指數較高,紡織、采礦行業綜合評價指數相對較低。

    分析大模型落地垂直行業痛點,豐富特定行業專業知識。雖然國內大模型在本次評測中表現較好,甚至在部分行業評分優于GPT-3.5,但工聯院評測報告指出,國內外通用大模型在工業知識問答領域探索仍處于初級階段,國內大模型與GPT-4有差距,行業間的泛化能力有待加強。對此,工聯院評測報告給出的建議是進一步豐富相關專業領域的數據訓練集,進行專業化的微調。 

    標簽:

    相關閱讀

    相關詞

    推薦閱讀

    亚洲视频一区在线观看| 国产成人精品曰本亚洲79ren| 久久久久无码专区亚洲av| 亚洲精品无码日韩国产不卡av| 亚洲一卡2卡3卡4卡乱码 在线| 亚洲国产精品综合福利专区| 亚洲黄网在线观看| 老汉色老汉首页a亚洲| 亚洲一区二区三区高清| 亚洲国产综合专区电影在线| 五月天网站亚洲小说| 亚洲爆乳精品无码一区二区三区| 久久久久国产成人精品亚洲午夜| 亚洲人成色77777在线观看大| 亚洲av再在线观看| 亚洲乱码中文字幕综合234| 亚洲区日韩区无码区| 久久青青草原亚洲av无码| 国产亚洲av人片在线观看| 亚洲尤码不卡AV麻豆| 亚洲国产精品无码久久久秋霞2 | 中国亚洲呦女专区| 亚洲综合在线一区二区三区| 亚洲精品动漫免费二区| 亚洲aⅴ无码专区在线观看春色| 亚洲av成人无码网站…| gogo全球高清大胆亚洲| 亚洲欧洲久久av| 亚洲国产综合无码一区| 久久久久亚洲AV成人无码网站| 亚洲人成在线电影| 亚洲av无码久久忘忧草| 亚洲午夜福利在线视频| 亚洲a∨国产av综合av下载| 亚洲A∨午夜成人片精品网站 | 亚洲XX00视频| 国产AV无码专区亚洲AWWW| 国产成A人亚洲精V品无码性色| 久久久久亚洲精品美女| 亚洲欧洲日韩综合| 亚洲色成人四虎在线观看|