【行業(yè)紀要】盤古大模型專家交流會議紀要0327:焦點簡訊
2023-03-27 19:32:40 來源:雪球網(wǎng) 小 中
【更多紀要關(guān)注:賽道掘金】
盤古大模型主要由五個模型組成,最領(lǐng)先的是 CV(機器視覺),然后是 NLP(自然語言處理),然后還有多模態(tài)、科學計算、語音,這 5 個方向的發(fā)展成熟是完全不一樣的。當前大家熱議的 ChatGPT 是在NLP 領(lǐng)域,百度的文心一言和它比較相似,但和盤古大模型是不太一樣的。
(資料圖片)
盤古大模型的初衷主要是服務 B 段的客戶,聚焦比較成熟的 CV 領(lǐng)域。在 NLP 領(lǐng)域還比較薄弱,生成性的最多能做一些個封閉場景下的客服,語義理解相關(guān)的可以做一些輿情的管控、法律司法文書的理解、審計文書的理解,但是輸出性的、內(nèi)容生成性的,盤古大模型之前沒有將其作為一個發(fā)展的重點。
公司能夠找到的高價值數(shù)字化賦能的場景主要是以視覺為主,所以這就是盤古大模型更多的研發(fā)項目主要是圍繞著這一塊來展開的原因。NLP 反正力度不大,最主要的一個邏輯還是商業(yè)驅(qū)動力不足。公司一開始做 AI 就沒把 2C 作為一個重點。
大模型的訓練成本確實很高,GPT-3 訓練一次的成本可能在 1200 萬人民幣,GPT-3 出現(xiàn)之后也給了業(yè)界一個很大的啟示,是否還要繼續(xù)這樣“暴力美學”地走下去。現(xiàn)在學界有一些觀點,大模型在現(xiàn)在的參數(shù)基礎(chǔ)上再指數(shù)級增加對模型的性能邊際效應已經(jīng)減弱了,那么這就需要一些降本的方法:
Open AI 的團隊做的比較好的一件事情就是做精準高質(zhì)量的標注(RLHF)。
專家所在的公司有一個非常重要的發(fā)展方向是做小樣本訓練,通過自監(jiān)督的方法通多更少的標注數(shù)據(jù)來做訓練。
盤古大模型的三層架構(gòu)也能在結(jié)構(gòu)上實現(xiàn)降本。L0 層是通識性的大模型,具備魯棒性和泛化性。
L1 是行業(yè)大模型(例如煤礦、電網(wǎng))、L2 是針對具體場景的自動化工作流的部署模型。成本方面,大模型訓練好了之后不用再重復訓練,只需在 L1 和 L2 上做適應性訓練,成本關(guān)系是上一層的5-10%。
HW 認為應用場景比較成熟和豐富的領(lǐng)域是值得為其去開發(fā) L1,例如電力行業(yè)(無人機輸電線巡檢)、制造業(yè)的質(zhì)檢(機器替代人眼質(zhì)檢)、鐵路故障隱患的監(jiān)測等等。機器視覺是一個相對封閉的場景,也是純參數(shù)驅(qū)動的,標注數(shù)據(jù)的成本也不是很高。目前盤古大模型的工業(yè)質(zhì)檢主要應用在消費電子領(lǐng)域,最早應用在了公司的南方工廠。未來如果能有更大幅度的降本,對行業(yè)將產(chǎn)生更大的顛覆。
HW 目前 AI 的研發(fā),主要包括全棧全場景兩個方面的制作,一個是 HIAI,一個是 EI,HW 公司自己的能力是能夠做到端到端的,從硬件到軟件,從場景到營銷,基本上都可以使用自己的產(chǎn)品,特別大的合作商沒有。
HW 在半導體供應鏈上,戰(zhàn)投了好幾家公司,幫助公司補足半導體先進支撐的一些能力。公司在算力支撐等方面需要一些合作,HW 有一些地方政府支持的項目。
HW 的軟件產(chǎn)品在行業(yè)化溢出的時候,有幾種類型的公司是比較重要的。一個是軟件開發(fā)的外包公司,HW 開發(fā)力度、開發(fā)工作量比較大的環(huán)節(jié)都是用了大量的外包。另外一個是行業(yè)數(shù)字化的 EI,HW 之前釋放了 MetaERP,像外包交付的漢德、賽意等公司的能力是 HW 不具備的,HW 一定會通過這些公司的生態(tài)來完成業(yè)務。這里邊有一個核心的商業(yè)邏輯,是 HW 要盡少減少自己去做交付,主要是因為現(xiàn)在的人效不達標,而且人力成本達到了一年 10 萬人 70 多萬人民幣,所以很多毛細血管級別的交付,HW 需要依靠生態(tài)鏈來完成,第三在半導體的生態(tài)上也是需要與這些生態(tài)中的供應商側(cè)的公司供貨給 HW。
首先 HW 公司歷史上基本上新的趨勢很少是很快就追上來,公司發(fā)展 30 多年,基本上沒有做到過先發(fā)。在任何領(lǐng)域,HW 公司基本上都是做到的后發(fā)制人。包括手機、云和汽車。所以這個領(lǐng)域HW 肯定不會很快。
ChatGPT 面向更多的是 ToC 端的屬性。目前 HW 正在研究這個項目,但是這是一個集團級的項目,通常做出決定會比較緩慢,一兩年內(nèi)不太會出來。HW 在 AI 商業(yè)化研究是一直持續(xù)存在的,公司以前一直非常不看好。公司盡力地完成 AI 工程化、AI 產(chǎn)品化,公司認為這是商業(yè)化不得不走的路線,如果采用高度項目制,一切項目制用 AI 去做,成本很高,不容易掙錢,因為人力成本非常高,然后項目制不可復制,因此 HW 才選擇了面向行業(yè)的 CV 大模型。
ChatGPT 發(fā)布后,它對商業(yè)化帶來了很多的思考,因為它天生的商業(yè)化屬性非常高。ToB 直接賣API,ToC 因為生產(chǎn)內(nèi)容是直接嵌套的,而且是中國人擅長的商業(yè)化路徑,可以編輯廣告、電商。
但 HW 不會立馬進入到這個 ChatGPT 類的 AIGC 細分賽道,也沒有任何的項目,戰(zhàn)略研究都才剛剛開始。
HW做了很多技術(shù)方向側(cè)的研討,公司現(xiàn)在也有一些判斷,即中國很難在短期內(nèi)出一個達到ChatGPT同等效果的產(chǎn)品。中國的發(fā)展方向,無論是這些大廠還是創(chuàng)業(yè)的公司,專家認為他們真正要做到
商業(yè)化閉環(huán)或者商業(yè)成功有個核心,需要做支持相對封閉的一個單場景,這樣成功率會比較高。以及訓練和維護的成本還是需要進一步的壓低,不然的話這個業(yè)務基本還是聚焦在這些特別大的公司手中。
專家認為現(xiàn)在的難度已經(jīng)非常大了。
ChatGPT 發(fā)布后立馬就是 GPT4.0,首先它的數(shù)據(jù)源頭的很廣,
第二它的數(shù)據(jù)前期的標注的質(zhì)量也非常的好,再加上它現(xiàn)在已經(jīng)是完全多模態(tài)多語種了,其實現(xiàn)在的優(yōu)勢還是挺大的。
國內(nèi)現(xiàn)在趕出來的產(chǎn)品還是不太行的。而 OpenAI 的產(chǎn)品一直是邊用邊學,接受越來越多全球使用者的反饋,通過人類反饋幫助他提升和進步。
但專家認為 ChatGPT 的局限性是在于完整的做到某些場景的商業(yè)化閉環(huán)。ChatGPT 的信息生產(chǎn)模式是 generated content,它的信息不準確,它的事實基礎(chǔ)不可信、不可靠,所以 ChatGPT 很難在一些需要事實基礎(chǔ)比較準確的商業(yè)產(chǎn)品上完成閉環(huán)。第二個 ChatGPT 有一個很領(lǐng)先的屬性,它的前后文是有連續(xù)性的,根據(jù)前后文來聊天,每一個問題不是獨立存在的,而是有關(guān)聯(lián)的。但它有個 bug 是前后文的邏輯關(guān)系并沒有能夠做到很好的連接。在邏輯問題上可能會出一些錯誤。
公司現(xiàn)在判斷 ChatGPT 未來立馬會改變的場景其實是企服軟件,對企服軟件的嵌套只是非常初級的方式,未來 ChatGPT 也許會重新定義生產(chǎn)力以及辦公工作相關(guān)的企服場景,公司現(xiàn)在在分析未來是不是所有的企服軟件都會基于 ChatGPT 來開發(fā),以及 ChatGPT 能不能重構(gòu)企服軟件的交付模式。
公司認為中國要追存在幾個必要條件,首先場景必須是多模態(tài),第二是數(shù)據(jù)量不能再爆發(fā)式增長,GPT 已經(jīng)達到 1700 多億了,如果再存在量級上的增長,也許不能帶來這個性能本質(zhì)上的提升。
成本的控制需要通過一些技術(shù)手段來限制語言的樣本量。這個完整的商業(yè)模式可能需要 ChatGPT在全球范圍內(nèi)的帶領(lǐng)來探索。專家有一個預判,中國的這些創(chuàng)業(yè)公司做出來的產(chǎn)品都可能是局限于某個或者某一些場景的,這些產(chǎn)品反而能夠獲得商業(yè)上的成功。HW 為什么要做產(chǎn)業(yè)級、行業(yè)級的 CV 應用,這個也是 HW 根據(jù)公司的能力限制和公司的商業(yè)模式做出來的一個選擇。
$常山北明(SZ000158)$$拓維信息(SZ002261)$$三六零(SH601360)$
關(guān)鍵詞:
相關(guān)文章
- 【行業(yè)紀要】盤古大模型專家交流會議紀要0327:焦點簡訊
- 熱訊:殲20突然現(xiàn)身美戰(zhàn)略轟炸機身邊,中國“隱身技術(shù)”嚇壞美軍
- 今日浮虧3W,今年虧損3W,總資產(chǎn)502.2W
- 福萊特玻璃:2022年全年凈利21.73億元
- 萬盛股份:2022年凈利同比降55.7% 擬10派2元
- 晶方科技:擬計劃由晶方光電出資270萬歐元
- 萬向錢潮:2022年凈利同比增17.86% 擬10派2.7元|全球即時
- 世界滾動:吉林高速:控股子公司中標約5.26億元工程施工項目
- 天天速讀:長遠鋰科:與Axens就后續(xù)在雙方三元正極材料領(lǐng)域進行合作
- 環(huán)球觀熱點:工信部:推動鋰電、鈉電、氫燃料電池、液流電池、超級電容器等新型蓄能電池及關(guān)鍵材料產(chǎn)業(yè)高質(zhì)量發(fā)展
- 【當前熱聞】浙商銀行:2022年凈利同比增7.67% 擬10派2.1元
- 看熱訊:ST摩登:控股股東擬被動減持公司股份不超713萬股
- 云天化:擬與云天化集團、昭通發(fā)展集團和鎮(zhèn)雄工投簽訂合資合同_天天頭條
- 杭州車牌最低成交價跌至1萬
- 中國太保壽險蔡強:壽險轉(zhuǎn)型符合管理層預期_天天觀察
- 中國太保壽險董事長潘艷紅:壽險轉(zhuǎn)型落地最大的挑戰(zhàn)來自時間約束_當前熱門
- 為什么加倉新能源?我們的回答
- 【世界新視野】國家開發(fā)銀行設(shè)立農(nóng)田建設(shè)專項貸款
- 贛鋒鋰業(yè):與錫林郭勒盟行政公署簽署戰(zhàn)略框架合作協(xié)議|天天聚看點
- 最終敲定!FDIC:第一公民銀行接手硅谷銀行所有存貸款_天天動態(tài)
- 世界播報:滬深300、中證500、恒生指數(shù)、標普500、納指100、恒生指數(shù)、創(chuàng)業(yè)板等核心指數(shù)估值水平:(2023年3月27日)
- 山煤國際河曲舊縣露天煤業(yè)煤質(zhì)分析|天天看點
- 回來了!:全球觀速訊
- 首屆“虹人匯”虹橋國際人力資源服務產(chǎn)業(yè)博覽會啟動
- 普利制藥:注射用泮托拉唑鈉獲法國和意大利上市許可:焦點快播
- 新湖中寶:控股子公司擬減持宏華數(shù)科不超4%股份 快訊
- 天天最新:長江健康:子公司注射用伏立康唑獲藥品注冊證書
- 震有科技:與中國五冶集團有限公司簽署《工程物資購銷合同》
- 廣匯汽車:一季度凈利同比預降7.02%-22.02%
- 環(huán)球看熱訊:方直科技:2022年凈利同比增2.02% 擬10轉(zhuǎn)5派0.4元
熱文推薦
排行推薦

萬盛股份:2022年凈利同比降55.7% 擬10派2元

晶方科技:擬計劃由晶方光電出資270萬歐元

萬向錢潮:2022年凈利同比增17.86% 擬10派2.7元|全球即時
