Grok Vision 功能推出,現在iOS版本聊天機器人可以邊「看見」現實世界邊跟你聊天

ydfz.cn / /html/index.html

xAI 推出 Grok Vision,讓聊天機器人「看見」現實世界Dd1b705700c4d4b46d37454adc593abe

由馬斯克創立的人工智慧公司 xAI,於本週二正式宣布推出全新功能 Grok Vision,讓旗下 AI 聊天機器人 Grok 能夠透過相機「看見」現實中的物品、文字與標誌,並即時回應使用者的提問。

Grok Vision:AI 的「視覺能力」初登場

Grok Vision 可透過 iOS 裝置的 Grok 應用程式啟用,用戶只需將手機對準商品、標籤、文件或其他實體物件,便可向 Grok 詢問相關資訊。這項功能讓聊天機器人的應用場景更貼近生活,例如識別菜單、閱讀說明書、解釋 QR code 標誌等。

GROK CAN SEE WHAT YOU SEE—LITERALLY

Grok’s voice mode comes with camera access, letting users point their phone at something and ask, “What am I looking at?”

The Vision feature on iOS allows the chatbot to analyze real-world objects, text, and environments through your… https://t.co/cmtINP8yp6 pic.twitter.com/N1b6pcYZOi

— Mario Nawfal (@MarioNawfal) April 20, 2025

這功能其實有點類似Google Lens的AI版,Grok Vision 可以隨著鏡頭的變化跟你互動。其實仔細想想這功能與自動駕駛的視覺功能似乎有點像,畢竟同家族特斯拉的自動駕駛功能已經發展那麼久了,視覺功能是Grok的強項也該是意料之中。

實測在國內版本也已經可以用,只要點選左下方的攝影機按鈕,你就可以用對話問他問題。

除了用語音回答外,也會有文字的紀錄,只是無論是語音或是文字都充滿了「中國腔」。

目前 Android 用戶尚未能使用 Grok Vision,xAI 表示尚在開發中。

多語音輸出、即時搜尋功能同步上線

除視覺功能外,xAI 也同步為 Android 用戶推出兩項新功能:

  • 多語言語音輸出支援

  • Grok 語音模式下的即時搜尋功能

不過,這兩項服務僅限訂閱 每月 30 美元的 SuperGrok 套餐 的用戶使用。雖然 Grok 基礎版已具備基本對話與搜尋功能,但要享受完整體驗,仍需付費升級。

Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.

Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5

— Ebby Amir (@ebbyamir) April 22, 2025

Grok 穩步升級,功能快速擴展

xAI 近期持續為 Grok 擴充功能。本月稍早,Grok 增加了「記憶系統」,可根據使用者過去的對話內容提供更具脈絡性的回答。此外,xAI 還推出「工作空間」創作工具,讓使用者可透過 Grok 協助撰寫文件或打造簡易應用程式。

這些新功能讓 Grok 不僅僅是聊天機器人,更朝向「多模態 AI 助理」的方向發展。

 

加入T客邦Facebook粉絲團

/html/index.html / Back