隨著ChatGPT的快速進化吸引了全球網(wǎng)友的眼球,國內(nèi)廠商也紛紛表示將推出相似的產(chǎn)品。
而在這段時間,隨著“文心一言”開啟測試,除百度外的多家廠商也開啟了AI模型產(chǎn)品的內(nèi)測,希望可以提供更有競爭力的產(chǎn)品,搶占AI領(lǐng)域市場。
就在今日,鈦媒體從華為內(nèi)部獨家獲悉,華為公司將發(fā)布一款直接對標(biāo)ChatGPT的多模態(tài)千億級大模型產(chǎn)品,名為“盤古Chat”。
據(jù)介紹,盤古大模型于2020年11月在華為云內(nèi)部立項成功。這款“盤古Chat ”預(yù)計將于今年7月7日舉行的華為云開發(fā)者大會 (HDC.Cloud 2023) 上對外發(fā)布以及內(nèi)測,產(chǎn)品主要面向To B/G政企端客戶。
根據(jù)華為公布的一份論文數(shù)據(jù)顯示,華為盤古PanGu-Σ大模型參數(shù)最多為1.085萬億,基于華為自研的MindSpore框架開發(fā)。整體來看,PanGu-Σ大模型在對話方面可能已接近GPT-3.5的水平。
據(jù)之前的介紹可知,華為盤古大模型于2021年4月正式對外發(fā)布,后來又在2022年4月升級到2.0版本。目前,AI大模型中的NLP大模型、CV大模型以及科學(xué)計算大模型(氣象大模型)均已被標(biāo)記為即將上線狀態(tài)。
據(jù)介紹,這是首個千億參數(shù)中文預(yù)訓(xùn)練大模型,CV大模型則首次達到30億參數(shù)。盤古CV大模型業(yè)界最大CV大模型、首次實現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學(xué)習(xí)能力上的業(yè)界第一;盤古氣象大模型提供秒級天氣預(yù)報;紫東.太初是全球首個圖、文、音三模態(tài)大模型。
對于盤古大模型定位,華為內(nèi)部團隊確立了三項最關(guān)鍵的核心設(shè)計原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強,能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
華為云官網(wǎng)顯示,盤古大模型由NLP大模型、CV大模型、多模態(tài)大模型、科學(xué)計算大模型等多個大模型構(gòu)成,通過模型泛化,解決傳統(tǒng)AI作坊式開發(fā)模式下不能解決的AI規(guī)模化、產(chǎn)業(yè)化難題,可以支持多種自然語言處理任務(wù),包括文本生成、文本分類、問答系統(tǒng)等等。
具體的話,盤古NLP大模型首次使用Encoder-Decoder架構(gòu),兼顧NLP大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。
盤古CV大模型是首次實現(xiàn)模型按需抽取的業(yè)界最大CV大模型,首次實現(xiàn)兼顧判別與生成能力,基于模型大小和運行速度需求,自適應(yīng)抽取不同規(guī)模模型,AI應(yīng)用開發(fā)快速落地。
盤古氣象大模型提供秒級天氣預(yù)報,借助創(chuàng)新的3DEST網(wǎng)絡(luò)結(jié)構(gòu)以及分層時間聚合算法,在氣象預(yù)報的關(guān)鍵要素和常用時間范圍上精度均超過當(dāng)前最先進的預(yù)報方法,速度相比傳統(tǒng)方法提升1000倍以上。
簡單來說,此次即將發(fā)布的盤古Chat基于盤古大模型而來,但盤古模型并不局限于一個小分類,對盤古感興趣的小伙伴可以保持關(guān)注。
本文標(biāo)題: 華為7月7日將發(fā)布“盤古Chat”多模態(tài)千億級大模型?
本文地址: http://www.eat023.com/brand/news-98156d37ae.html
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權(quán)所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com