12 月 6 日,谷歌宣布推出其認(rèn)為規(guī)模最大、功能最強(qiáng)大的人工智能模型 Gemini。
谷歌首席執(zhí)行官皮查伊表示,Gemini 1.0 是目前為止谷歌能力最強(qiáng)的通用人工智能模型,Gemini 是原生多模態(tài)打造,是谷歌通往 Gemini 模型時(shí)代的第一步。

據(jù)介紹,Gemini 1.0 是谷歌籌備了一年之久的 GPT4 真正競(jìng)品,將包括三種不同的套件:Gemini Ultra、Gemini Pro 和 Gemini Nano。其中 Ultra 的能力最強(qiáng),復(fù)雜度最高,能夠處理最為困難的任務(wù);Pro 能力稍弱,可以用來(lái)處理多任務(wù);Nano 則更注重于端側(cè)的處理能力。
和市面上現(xiàn)有大模型相比,Gemini 從一開(kāi)始就被創(chuàng)建為多模態(tài)的模型。因?yàn)閺淖畛醯念A(yù)訓(xùn)練數(shù)據(jù)開(kāi)始,Gemini 就在針對(duì)不同模態(tài)的模型進(jìn)行訓(xùn)練,這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。在靈活度上,從數(shù)據(jù)中心到移動(dòng)設(shè)備上,它都能夠運(yùn)行。

谷歌表示,對(duì) Gemini 模型進(jìn)行了嚴(yán)格的測(cè)試,并評(píng)估了它們?cè)诟鞣N任務(wù)中的表現(xiàn)。從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,在被大型語(yǔ)言模型(LLM)研究和開(kāi)發(fā)中廣泛使用的 32 項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra 的性能有 30 項(xiàng)都超過(guò)了目前最先進(jìn)的水平。
在權(quán)威 MMMU 基準(zhǔn)測(cè)試中,Gemini Ultra 獲得了 59.4% 的 SOTA 分?jǐn)?shù)。作為對(duì)比,人類專家的得分率為 89.8%,GPT4 得分率為 86.4%。但是谷歌并沒(méi)有透露 Ultra 和 Pro 版本的具體參數(shù)規(guī)模。

此外,谷歌還基于 Gemini 模型開(kāi)發(fā)了專業(yè)的代碼模型 AlphaCode 2。與前一代相比,AlphaCode 2 的性能提升了至少 50% 以上。
谷歌表示計(jì)劃通過(guò)谷歌云將 Gemini 授權(quán)給客戶,供他們?cè)谧约旱膽?yīng)用程序中使用。從12 月 13 日開(kāi)始,開(kāi)發(fā)者和企業(yè)客戶可以通過(guò) Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 訪問(wèn) Gemini Pro。來(lái)源:新浪VR