免責聲明:本站所有資訊僅代表作者個人觀點,不構成任何投資理財建議。

Google 新 AI Gemin 是什麼?怎么用?會超過 ChatGPT 嗎?

責任編輯:第一剑 來源:btcc 時間:2023-12-06

繼今年 2 月推出大型語言模型 (LLM) 聊天機器人 Bard 後, Google 又將發表一個新的對話式人工智慧 (AI) 軟體 Gemin。據外媒報道,Gemin 已經向一小部分開發者、企業提供前期版本進行測試,正式上線後有望成為市場上最先進、OpenAI 旗下 GPT-4 模型的頭號競爭對手之一。

那麼,Google Gemin 是什麼?有什麼功能?它能否超越 ChatGPT,扭轉 AI 戰局呢?

Google 新 AI Gemin 是什麼?

Gemini 由 Google 的 DeepMind 部門開發的下一代 AI 模型,和之前推出的 Bard 一樣,Google Gemin 同樣是一個 LLM 集合,可以接收不同模態的輸入:例如文本、圖像、音訊… 等,也可以和 ChatGPT 一樣可以生成文本、翻譯語言、編寫不同類型的創意內容(例如詩歌、程式碼、腳本、音樂作品、電子信件…等)。

此外,Gemini 據悉是 Google 第一個能處理文字、圖片、影片等不同資料的多模態模型,可望幫助軟體工程師據提示需求產生程式碼,加速軟體開發。

Google 執行長 Sundar Picha 此前表示,Gemini 是從頭開始創建的,旨在實現多模式、高效的工具和 API 整合,並實現未來創新,例如記憶和規劃。該模型顯示出「令人印象深刻的多模式能力」,這是該公司之前開發的模型中所沒有的。

Pichai 在接受專訪時也表示,像 Bard 這樣的 AI 聊天機器人「不是最終狀態」,而是通向更先進聊天機器人的航點。Gemini 和未來的迭代最終將成為「令人難以置信的通用個人助理」,融入人們日常生活的旅行、工作和娛樂等領域。

早在今年 6 月就有消息傳出,Google 正在研發語言模型 Gemini。據《Information》15 日報導,Google 已經向一小部分公司開放了 Gemini 的早期版本,讓外部開發人員能夠訪問這個 AI 新模型。給企業測試的是較大版本的 Gemini,完整版更接近 GPT-4 規模。Google 還計劃未來通過旗下雲端服務 Google Cloud Vertex AI 平台,向企業提供 Gemini 這個新模型 。Gemini 模型正式發表很快就來。

Google Gemin 怎麼用?

就能力而言,Gemin 是真正的遊戲規則改變者。它可以執行比 GPT-4 等其他大型語言模型更加多樣化和復雜的廣泛任務。

以下是Gemin可以處理的一些任務:

多模態問答:Gemini 可以根據多種類型的數據回答問題。例如,它可以使用關聯圖像或影片中的信息回答有關文本文檔的問題。

總結:Gemin可​​以總結長篇文本、音頻或影片內容。這對於快速理解文檔、講座或會議錄音的要點很有用。

翻譯:Gemini 可以翻譯不同語言之間的內容。但與傳統翻譯模型不同的是,它還可以在不同數據類型之間進行翻譯。例如,它可以將文本描述轉換為圖像或 3D 模型。

生成:Gemini 可以生成各種格式的內容。這包括寫論文、創作圖像、創作音樂等等。

推理:也許 Gemin 最令人印象深刻的能力是它的推理能力。它可以結合來自不同數據類型和任務的信息來做出假設並得出結論。這使其成為解決問題和決策任務的強大工具。

Google Gemin 和 GPT-4 有何區別?會超過 ChatGPT 嗎?

GPT-4 和 Gemini 都是開創性的人工智能模型,但它們有一些關鍵的區別,使它們與眾不同。

1、GPT-4

GPT-4 由 OpenAI 開發,是一個擁有多達萬億參數的大型語言模型。它旨在理解和生成自然語言,使其對於涉及文本的任務非常強大。然而,GPT-4 主要是基於文本的模型。它旨在處理涉及文本數據的任務,例如撰寫論文、回答問題或翻譯語言。

2、Gemini

另一方面,谷歌開發的 Gemini 是一個多模態智能網路。這意味著它旨在同時處理多種類型的數據和任務。Gemini 可以處理文本、圖像、音頻、影片、3D 模型,甚至圖形。這使得 Gemini 比 GPT-4 更加通用,因為它可以處理更廣泛的任務和數據類型。

而且,Gemini 不僅僅是一個單一的模型,而是一個模型網路。這種網路架構使 Gemini 能夠處理各種各樣的任務,而無需為每一項任務建立專門的模型。網路中的不同模型進行協作、共享信息並相互學習,使 Gemini 成為一個極其多功能且強大的人工智能工具。

就尺寸和復雜性而言,谷歌表示 Gemini 有四種尺寸:Gecko、Otter、Bison 和 Unicorn。他們沒有給我們每個尺寸的確切參數數量,但根據一些提示,我們可以猜測 Unicorn 是最大的,並且在參數方面可能與 GPT-4 類似。

3、Gemin 會超過 ChatGPT 嗎?

據半導體研究公司 SemiAnalysis 在 8 月底報導,他們認為想擁有強大的 AI 算力,就需掌握更多高階運算晶片,而 Google 是少數能擁有比 OpenAI 更多 GPU 繪圖處理器 (GPU)和算力的競爭者,推測將推推出的 Gemini 將比 OpenAI 的 GPT-4 強上五倍。當時曾遭 OpenAI 執行長 Sam Altman 駁斥為 Google 的行銷素材。

雖然現在還無法驗證 Gemini 的真正實力,但可以預期 Google 的加入對於 OpenAI 來說仍是一股不可小看的競爭壓力。

Google聯合創始人Sergey Brin加入戰局引注目

Google大腦和 DeepMind 團隊的幾位前成員目前正在研究 Gemini,包括Google高級研究員 Paul Barham 和 DeepMind 的 Tom Hennigan。然而,最引人注目的團隊成員可能是Google聯合創始人Sergey Brin。 據悉,透過與公司的研究人員合作,Brin正越來越多地參與Google的AI戰略,並經常出現在這家搜尋引擎巨頭的總部。

隨著AI戰越演激烈,Google兩位創始人的參與非常關鍵。自公司發布紅色警戒後,Brin對公司AI工作的參與就顯著加深。現任和前任Google員工也表示,Brin的參與不只反映他對AI的熱情,也顯示Google正在打的是一場硬戰。

Google用YouTube 影片內容訓練 Gemini

與其他機器學習模型類似,Gemini 分析文本和圖像列以識別模式並提供特定問題的答案。 消息人士透露,Google一直在使用 YouTube 影片內容訓練 Gemini。不過,該公司的律師也正在密切關注培訓期間使用的材料,確保其不會侵犯受版權保護的數據。

Google 秋季推新款 AI 模型 Gemini

據了解,Google 預計將在今年秋季推出新款 AI 模型 Gemini。在 Gemini 計畫中,Google 整合 Google Brain 和 DeepMind 的資源,旨在打造更強大、更全面的大型語言模型(LLMs)。Google 共同創辦人 Sergey Brin 也加入了本次開發過程。

Gemini 將能精通處理各種類型的輸入(包括文本、圖像和影音),生成文本、影片、音頻、音樂和圖像等形式的輸出,也具備邏輯推理能力及促進跨語言翻譯的能力。Gemini 的推出可能對 ChatGPT 的地位造成不小威脅,而這都會是讓 OpenAI 備感壓力的來源。

從多方面來看,Gemini 是把 Google 的優勢充分發揮到這場 AI 戰局之中。畢竟,Google 擁有深厚的研究人才和多年的 LLMs 建模和訓練經驗,而且不得不提,Google 擁有獨特數據資源,這可能使 Gemini 模型在數據品質、數量和多樣性方面有機會勝過競爭對手。

Gemini 模型的巨大優勢,在於採用 Google 大量獨有的數據資源

這些 Google 獨有的數據資源,包括 YouTube 影片、Google 圖書、搜索索引,以及 Google Scholar 中的科學、醫學和技術方面的學術研究資料等,都可能成為 LLMs 模型訓練的數據來源。

有了模型基礎,Google 有機會推出基於 Gemini 的新 AI 聊天機器人服務,或者將現有的 Bard 聊天機器人服務升級為 Gemini 模型。

Gemini 的上線,也可能對 GCP 雲端服務模式產生影響,藉由這個主要管道對企業客戶提供 Gemini 相關功能,引入新的商機。另外,也有機會為企業生產力應用程式(例如 Google Docs 和 Slides)提供支援,以及分析圖表、甚至用語音控制軟體的功能。

相關文章
X