首頁 > 互聯網 > 正文

    世界觀察:大模型在工業領域探索仍處于初級階段

    2023-07-06 08:53:31來源:人民郵電報  


    【資料圖】

    圖片來源:中國工業互聯網研究院

    近日,中國工業互聯網研究院(以下簡稱“工聯院”)針對人工智能大模型在中文工業領域的應用性能、技術架構、標準體系進行系統性評測,并發布系列報告。評測對象涵蓋GPT-4、GPT-3.5、文心一言、ChatGLM等國內外具有代表性的頭部大模型。

    本次工業知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。評測結果顯示,GPT-4表現最佳。國內頭部大模型表現亮眼,整體與GPT-3.5相當。其中百度文心一言在國內大模型中排名第一。

    在客觀題方面,GPT-4與文心一言表現優于其他大模型。但評測結果也同時指出,大模型在準確率方面有較大的提升空間。在主觀題方面,國內大模型的基礎能力、語句能力與GPT-4接近,概括能力、邏輯能力與GPT-4存在一定差距。

    評測數據集由工業領域八大行業的相關數據構成。包括電子設備制造業、裝備制造業、鋼鐵行業、采礦行業、電力行業、石化化工行業、建材行業和紡織行業。工聯院根據工業經驗,結合外部數據源,按行業構建行業知識測試集。

    從行業維度看,大模型在八個行業知識問答能力上差異明顯,個別行業需進一步優化提升。其中,電子、裝備行業評價指數較高,紡織、采礦行業綜合評價指數相對較低。

    分析大模型落地垂直行業痛點,豐富特定行業專業知識。雖然國內大模型在本次評測中表現較好,甚至在部分行業評分優于GPT-3.5,但工聯院評測報告指出,國內外通用大模型在工業知識問答領域探索仍處于初級階段,國內大模型與GPT-4有差距,行業間的泛化能力有待加強。對此,工聯院評測報告給出的建議是進一步豐富相關專業領域的數據訓練集,進行專業化的微調。 

    標簽:

    相關閱讀

    相關詞

    推薦閱讀

    亚洲乱码精品久久久久..| 亚洲色一色噜一噜噜噜| 久久精品国产亚洲网站| 在线A亚洲老鸭窝天堂| 亚洲无线一二三四区手机| 亚洲AV无码之日韩精品| 欧洲亚洲综合一区二区三区| 久久人午夜亚洲精品无码区| 亚洲va中文字幕| 国产精品亚洲综合一区在线观看| 亚洲精品第一国产综合亚AV| 亚洲欧美日韩中文二区| 亚洲youwu永久无码精品 | 亚洲欧洲免费无码| 亚洲色大成网站www永久网站| 亚洲日韩精品国产3区| 亚洲av永久无码精品网址| 蜜桃传媒一区二区亚洲AV| 成a人片亚洲日本久久| 亚洲国产精品丝袜在线观看| 久久精品国产亚洲精品| 亚洲女同成av人片在线观看| 亚洲精品一品区二品区三品区| 亚洲国产精品国自产拍AV| 亚洲AV日韩精品久久久久| 亚洲制服中文字幕第一区| 亚洲无线一二三四区| 亚洲日本va在线观看| 亚洲人成色777777精品| 国产成人亚洲综合a∨| 国产91精品一区二区麻豆亚洲| 亚洲色成人网站WWW永久| 亚洲AV永久无码精品| 中文字幕亚洲综合精品一区| 亚洲人成伊人成综合网久久| 亚洲日韩AV一区二区三区中文| 久久精品国产亚洲av天美18| 国产a v无码专区亚洲av| 亚洲成a人片在线观看无码| 91亚洲精品第一综合不卡播放| 亚洲三级视频在线|