x5
五星好評(píng)
Gemini是谷歌DeepMind團(tuán)隊(duì)基于2012年啟動(dòng)的人工智能研究計(jì)劃開(kāi)發(fā)的多模態(tài)大模型,為應(yīng)對(duì)ChatGPT挑戰(zhàn),谷歌于2023年1月促使聯(lián)合創(chuàng)始人回歸并加速AI開(kāi)發(fā),歷經(jīng)PaLM、PaLM 2(2023年5月發(fā)布)等迭代階段,于2023年12月6日正式發(fā)布。
該模型基于Transformer架構(gòu),采用原生多模態(tài)設(shè)計(jì),支持文本、圖像、音頻、視頻及代碼的聯(lián)合處理。初代Gemini 1.0包含Ultra(復(fù)雜任務(wù))、Pro(通用場(chǎng)景)和Nano(移動(dòng)端)三個(gè)版本,自2023年12月13日起通過(guò)Google AI Studio和Vertex AI平臺(tái)向開(kāi)發(fā)者開(kāi)放API。
2024年2月,谷歌將旗下聊天機(jī)器人Bard更名為Gemini,推出Advanced版本,并發(fā)布Gemini 1.5。2024年12月,谷歌發(fā)布Gemini 2.0。2025年3月新增Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式發(fā)布Gemini 3。模型生態(tài)整合至谷歌搜索、廣告系統(tǒng)、Chrome瀏覽器、智能家居及Android Auto車(chē)載系統(tǒng),并在圖像生成、編程輔助、長(zhǎng)文本分析等場(chǎng)景廣泛應(yīng)用。