當前位置：首頁 > 股市 >

世界滾動:小羊駝：訓(xùn)練成本僅300美元的斯坦福開源模型，適合創(chuàng)業(yè)公司打造自己的AI模型2023-04-13 10:59:55 | 編輯：admin | 來源：阿爾法工場

導(dǎo)語：小羊駝的邏輯叫“知識蒸餾”，即通過將大型模型的知識轉(zhuǎn)移到小型模型中，從而快速達到想要的模型質(zhì)量，同時減少計算成本。

不久前，斯坦福公開了一個名為 Alpaca 的新模型。（俗稱“羊駝”）它使用了 GPT3.5 生成的 52k 個指令訓(xùn)練，訓(xùn)練費用只花了 500 美元，但是性能可以與 GPT-3.5 相媲美。

然而由于使用了 GPT3.5 的指令數(shù)據(jù)，使用條款禁止開發(fā)與 OpenAI 競爭的模型，因此 AIpaca 禁止了商用。

【資料圖】

而近日，斯坦福學(xué)者與 CMU、UC 伯克利等人合作推出了一個全新的模型——Vicuna，它有 130 億個參數(shù)，俗稱“小羊駝”。 初步評估小羊駝

其實 Vicuna 說白了就是一款新的“ChatGPT”，它和 Google Bard、ChatGPT 還有 New Bing 都一樣，都是聊天機器人（Chatbots）。

初步評估上，Vicuna-13B 達到了 ChatGPT 能力的 92%；幾乎要比 Google Bard 更強；同時遠遠甩開其他模型，如 LLaMA 和它的前輩——斯坦福的 Alpaca。

而訓(xùn)練 Vicuna-13B 的成本是僅僅 300 美元?？赡苓€沒有屏幕前的你游戲顯卡的價格高。

Vicuna 在推出后面臨的一個問題是，自己的模型質(zhì)量究竟如何。顯然作為學(xué)術(shù)機構(gòu)沒辦法像大公司養(yǎng)著幾百上千的測試團隊進行大量測試，于是他們另辟蹊徑——既然人力太貴，那就用剛剛推出的 GPT-4 來評測嘛。

具體操作上，他們提出了一個評估框架。設(shè)計了九大主題下共計八十條測試問題，然后把由其他模型和自家 Vicuna 的回答交給 GPT-4 進行評估（“哪個虛擬助理的回答更好”）。

驚人的是在這八十個問題的評估上，Vicuna 已經(jīng)能微微贏下 Google 重注的 Bard，更是把自己的“祖父模型”LLaMA-13B、AIpaca-13B 殺得片甲不留。

盡管問題的勝出數(shù)量上比不過 ChatGPT，但以 10 分制的角度切入，Vicuna 也已經(jīng)實現(xiàn)了 ChatGPT 超過 90%的質(zhì)量。

不得不說，“羊駝”AIpaca用 GPT-3.5 生成的指令訓(xùn)練模型，而“小羊駝”Vicuna在此基礎(chǔ)上又用 GPT-4 評估模型，斯坦福他們是懂人工智能的。

進入Vicuna主頁，不必注冊登錄；直接輸入想要的內(nèi)容，然后等待Vicuna為你生成。全程一分鐘，行云流水絲毫不卡頓。

作為大語言模型，中英文自然是通吃。

“知識蒸餾”

ChatGPT 訓(xùn)練費用高企甚至一次訓(xùn)練就要接近上億美金，然而 Vicuna 只花了 300 美元。從效果上看就達到了 GPT3.5 質(zhì)量的 90%。這是怎么做到的？

其實Vicuna的邏輯在人工智能領(lǐng)域叫做“知識蒸餾”（knowledge distillation），即通過將大型模型的知識轉(zhuǎn)移到小型模型中，從而快速達到想要的模型質(zhì)量，同時減少計算成本。

通常，大型模型（即“Teacher”）會生成訓(xùn)練數(shù)據(jù)，小型模型（即“Student”）則使用這些數(shù)據(jù)來學(xué)習(xí)大型模型的知識和能力。

通過這種方式，小型模型可以在自己的場景下獲得大型模型90%甚至99%的能力，這意味著，可用于生成模型的領(lǐng)域?qū)⒊手笖?shù)級增長。

在Vicuna公布的訓(xùn)練過程里，一開始，開發(fā)團隊是從 ShareGPT （與 ChatGPT 對話內(nèi)容的UGC網(wǎng)站）上收集了七萬條對話。這恰恰是“知識蒸餾”里最重要的“訓(xùn)練數(shù)據(jù)”。

而訓(xùn)練方法上則是選擇了在“羊駝”AIpaca（成本已降低至500美元）上優(yōu)化。

這兩個最重要的環(huán)節(jié)就使得Vicuna同時在訓(xùn)練成本和訓(xùn)練質(zhì)量上均有突出優(yōu)勢。

而理論上你也可以花300美元租云計算資源然后訓(xùn)練出你的“小羊駝”。 全華人團隊

一個小插曲是，作者在撰寫稿件搜集資料時，看到小羊駝的開發(fā)團隊不禁虎軀一震。

包括 Wei-Lin Chiang、Zhuohan Li、Zi Lin、Ying Sheng、Zhanghao Wu、Hao Zhang、Lianmin Zheng、Siyuan Zhuang 和 Yonghao Zhuang，這學(xué)生團隊是清一色的全員華人，不免讓人感慨。

總結(jié)：遍地AI的世界就在眼前

從本質(zhì)上來說，ChatGPT這種大語言模型就是通過燒錢燒算力燒數(shù)據(jù)達到"大力出奇跡"的效果。

而這也帶來了一個問題，即這樣的大語言模型燒錢的程度會讓很多小公司望而卻步，只能加入霸權(quán)壟斷的圈子。

而對于像小紅書/B站這樣不上不下的公司，既承擔不起自己訓(xùn)練大模型的成本，也不愿意將自己內(nèi)容池的數(shù)據(jù)拱手讓人，其實是陷入蠻尷尬的境地。

Vicuna展現(xiàn)了另一種可能性，即通過“知識蒸餾”的方式，以極低的價格復(fù)刻大語言模型90%甚至99%的能力。

而這就意味著哪怕是剛剛創(chuàng)業(yè)的小公司也完全負擔得起一個獨屬于自己體系的AI的訓(xùn)練成本。

換句話說，ChatGPT拉開了AI落地的序幕，而Vicuna告訴我們，遍地AI的世界也許就在眼前。

關(guān)鍵詞

分享到：收藏

上一篇：百利科技：自2017年公司業(yè)務(wù)延伸至新能源領(lǐng)域，公司一直致力于新能源裝備和新型材料的工藝研發(fā)和儲備最后一頁下一篇：

推薦內(nèi)容

世界滾動:小羊駝：訓(xùn)練成本僅300美元的斯坦福開源模型，適合...
不久前，斯坦福公開了一個名為Alpaca的新模型。（俗稱“羊駝”）它使用了GPT3 5生成的52k個指令訓(xùn)練，訓(xùn)練費用只花了500美元，但是性能可以與G
百利科技：自2017年公司業(yè)務(wù)延伸至新能源領(lǐng)域，公司一直致力...
百利科技(603959)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
永安林業(yè)：公司未收到控股股東、間接控股股東相關(guān)文件、來函等
永安林業(yè)(000663)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
環(huán)球熱門:海豚一般是什么顏色？海豚生活的水域溫度一般是多少？
比亞迪海豚芝士黃和貝貝灰對比？比亞迪海豚芝士黃和貝貝灰，個人覺得芝士黃看著更年輕一些，灰色顯得老氣一些，可能這個車本來就是設(shè)計出來偏
5斤至6斤蠶絲被價格是多少？羅恩蠶絲被怎么樣？環(huán)球簡訊
羅恩蠶絲被價格？蠶絲被200元左右一斤。一般在100元斤以下的價格你就別看了，那是很假的被子110-120的被子是機制棉的被子，但不是好蠶絲，一
日本化妝品牌有哪些？化妝品哪個牌子好？
中高端護膚品前十的品牌？一、法國Lancome(蘭蔻)始于1935年法國,歐萊雅集團旗下,全球高端化妝品品牌,含苞欲放的玫瑰被譽為品牌標記,蘭蔻系列香
關(guān)于巨蟒的傳說有哪些？蛇有什么寓意？-環(huán)球觀察
蛇的神話傳說？1、修蛇是中國古代神話傳說中的巨蛇，也叫做巴蛇，體長達到180米、頭部藍色、身體黑色。修蛇居住在洞庭湖一帶，吞吃過往的動物
變形金剛4為什么換了主角？變形金剛中四大金剛都是誰？_每日訊息
變形金剛4里有哪些汽車人？指揮官:擎天柱、補天士的補天士、退役領(lǐng)袖鈦師傅·鈦師傅、副官鐵皮·艾恩希德、救護車醫(yī)生棘輪、科學(xué)家杰克·威爾
全球微資訊！宏源藥業(yè)：公司主要生產(chǎn)硝基咪唑類抗菌藥物及洛...
宏源藥業(yè)(301246)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
電連技術(shù)：截至2023年4月10日，公司的股東戶數(shù)為17707戶世界新視野
電連技術(shù)(300679)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
良信股份：感謝提問。公司從2022年開始聚焦歸一化、數(shù)字化、...
良信股份(002706)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
關(guān)注：碳酸鋰大跌下的電池企業(yè)樣本：大干快上的億緯鋰能
電池級碳酸鋰價格跌破20萬元噸大關(guān)。
精進電動：整車的噪音問題是一個非常復(fù)雜的問題，涉及到整車...
精進電動(688280)04月11日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
長江健康：公司2022年年度報告將于2023年4月20日披露
長江健康(002435)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
深夜，又有A股公司爆雷…-環(huán)球關(guān)注
又一知名A股公司爆雷了。
芯能科技：根據(jù)相關(guān)規(guī)則，除定期報告對應(yīng)時點以外的股東人數(shù)...
芯能科技(603105)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
青松股份：（1）公司與化妝品品牌客戶簽訂的代加工合同大部分...
青松股份(300132)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
信科移動：公司主業(yè)聚焦移動通信網(wǎng)絡(luò)設(shè)備及技術(shù)服務(wù)領(lǐng)域，不...
信科移動(688387)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
【熱聞】上海艾錄：公司各類包裝業(yè)務(wù)中暫不涉及AI等人工智能技術(shù)
上海艾錄(301062)04月13日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
全球熱議:銅牛信息：公司與華為公司有業(yè)務(wù)層面合作
銅牛信息(300895)03月05日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
ST遠程：公司近期股東人數(shù)變化幅度不大
ST遠程(002692)04月06日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
湯臣倍?。盒袠I(yè)內(nèi)各公司的銷售布局、渠道結(jié)構(gòu)、品牌和品類矩...
湯臣倍健(300146)04月01日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
又見救命藥被壟斷！津藥藥業(yè)兩年三次被罰過億-天天新資訊
天津藥業(yè)集團旗下上市公司津藥藥業(yè)（600488）又雙叒因為壟斷藥價，第三次受到反壟斷處罰，兩年里累計罰款金額超1億。
環(huán)球微動態(tài)丨貴州輪胎：公司股價受宏觀環(huán)境、行業(yè)發(fā)展、公司...
貴州輪胎(000589)04月12日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
斯達半導(dǎo)：4月10日至4月11日公司高管湯藝減持公司股份合計9萬...
證券之星訊，根據(jù)4月12日市場公開信息、上市公司公告及交易所披露數(shù)據(jù)整理，斯達半導(dǎo)（603290）最新董監(jiān)高及相關(guān)人員股份變動情況：2023年4月1
快資訊丨國藥現(xiàn)代：4月7日公司高管李顯林增持公司股份合計1400股
證券之星訊，根據(jù)4月12日市場公開信息、上市公司公告及交易所披露數(shù)據(jù)整理，國藥現(xiàn)代（600420）最新董監(jiān)高及相關(guān)人員股份變動情況：2023年4月7
江波龍：截至2023年4月10日，公司股東總戶數(shù)27,946戶（含信用...
江波龍(301308)04月12日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
嶺南股份：股價漲跌波動受政策、行業(yè)、資本市場等諸多因素影響
嶺南股份(002717)04月12日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
磁谷科技：產(chǎn)品節(jié)能率受所替代的原有產(chǎn)品類型、用戶工況等因...
磁谷科技(688448)04月12日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
武商集團：公司旗下購物中心的電影院是公司大客戶
武商集團(000501)04月11日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。