阅读疯子

阅读视图

发现新文章,点击刷新页面。

蘋果14年來最嚴重產品洩漏?M4版MacBook還沒發,疑似真品開箱資訊、影片滿天飛

作者 Qbitai
可能是蘋果14年來最嚴重產品洩漏,或是最大的騙局Ea932cab9054f69e594d4ec2f1bef877

搭載M4晶片的14英吋MacBook Pro,雖然還沒發佈,但它的照片和視訊已經在網上傳得鋪天蓋地了。

多數的資訊,都來自Youtube上俄羅斯頻道Romancev768的最新影片。影片中拆了個規格M4晶片的14英吋MacBook Pro的盒子,16GB RAM,512GB 儲存。

無獨有偶。

上週,推特平台上就已經有了搭載M4晶片的最新蘋果電腦的劇透照片了。

蘋果14年來最嚴重產品洩漏?M4版MacBook還沒發,疑似真品開箱資訊、影片滿天飛

只不過當時評論區普遍質疑,懷疑這是在P圖搞詐騙。不過,現在彭博社著名科技記者Mark Gurman,也證實了M4 MacBook的存在。搭載M4晶片的14英吋MacBook Pro及將要發佈。

不過當然,這還是無法證明俄羅斯影片中的東西是真品。

疑似自蘋果倉庫洩漏

來詳細看一下,目前疑似洩漏出的M4 Mac是啥規格。

這個14英吋的MacBook Pro,搭載了M4晶片,具有10核CPU和10核GPU、16GB RAM、512GB儲存。

這意味著MacBook Pro系列的最低RAM,將從基礎的8GB翻倍到16GB(之前就有過這樣的傳聞)。

蘋果14年來最嚴重產品洩漏?M4版MacBook還沒發,疑似真品開箱資訊、影片滿天飛

影片中的MacBook Pro搭配了3個Thunderbolt 4連接埠

而當前的14英吋MacBook Pro僅配備了2個Thunderbolt 4連接埠

蘋果14年來最嚴重產品洩漏?M4版MacBook還沒發,疑似真品開箱資訊、影片滿天飛

整體外觀顏色是深空黑(space black)。

這14英吋MacBook Pro的顏色新選項,目前的基礎型號只有太空灰和銀色兩個色號。

此外,在設計方面,14英吋MacBook Pro似乎沒有明顯的變化。

那麼問題來了,這麼多14英吋MacBook Pro,在未發佈前就被曝光在大眾眼前,如果是真的,到底是從哪裡洩漏的?

沒有人回答得上來。蘋果官方目前也尚未給出任何解釋。

不過,推特上那位洩密者@ShrimpApplePro 後來補充說,在一個私人的FaceBook群組裡,未發佈的14英吋MacBook Pro已經在偷偷出售了

並且還不是一台——有人說自己手裡有足足200台這東西!

因此,合理猜測這次的洩漏源頭是蘋果倉庫。

蘋果14年來最嚴重產品洩漏?M4版MacBook還沒發,疑似真品開箱資訊、影片滿天飛

如果一切屬實,這當是蘋果歷史上第二嚴重的產品洩漏事件。

第一嚴重的洩漏事件發生在iPhone 4上市前。

2010年,蘋果公司一位叫老鮑的員工在加州一家酒吧慶祝自己的27歲生日,不慎把iPhone 4原型機遺落在酒吧凳子上。

然後那個被蘋果視為絕密的原型機被一個年輕小夥撿到,然後轉手賣給了科技媒體Gizmodo……

iPhone 4是蘋果最富傳奇色彩的機型,原型機就這麼水靈靈落到科技媒體手裡,賈伯斯震怒。

這次最嚴重的洩密事件發生後了,蘋果公司以盜竊罪起訴了小布,同時也提告了Gizmodo的編輯。

目前,這到底是蘋果歷史上最嚴重的產品洩露事件,或是最大的騙局?蘋果對此次M4 Mac的洩密事件還沒有回應。

 

 

 

加入T客邦Facebook粉絲團

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

作者 Qbitai
2個AI,用真人般的語音和口吻,圍繞檔案內容激情討論,最後總結陳詞。就是一個完全由AI生成的Podcast。02678b86aee3a90f52550165d6f06521

最近來自Google的實驗性AI產品,Notebook LM吸引相當多人的注意,這個背後由Google現在最強大的模型Gemini 1.5 Pro提供支援的服務,甚至獲得AI大神Andrej Karpathy強烈推薦,甚至預言這個AI服務,有可能開啟和ChatGPT一樣大的機會。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

文章目錄

最近這服務要多火就有多火,全因上線了一項新功能——上傳檔案(文字、音訊、影片),AI不僅能幫忙用文字提煉要點,還可以通過音訊概述(Audio Overview)功能,把檔案轉換成AI生成的對話,根據文件內容進行討論。

2個AI,用真人般的語音和口吻,圍繞檔案內容激情討論,最後總結陳詞。就是一個完全由AI生成的Podcast。

這真的很酷!

而且不是Karpathy一個人在誇。逛了下網路上幾大平台,網友們對Notebook LM普遍都是好評。AI界的KOL@elvis也在Karpathy評論留言:

「卡神稱這“讓人想起ChatGPT時刻”,絕對不是誇大其詞!

真正讓多種模型聯合工作,會解鎖Notebook LM這樣獨特的內容格式和使用者體驗。」

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

Notebook LM怎麼玩?

玩法很簡單,打開官方頁面,登入Google帳號後,拖曳上傳需要處理的檔案就好了。

檔案可以是Google文件,可以是網站和視訊連結,甚至乾脆貼上一大段文字都可以。支援上傳50個檔案,每個檔案內容上限500000個單詞。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

這裡我們上傳了OpenAI o1的System Card文件,接下來就可以選擇需要建立的內容。

內建支援問答、小測驗、目錄、時間線、摘要等文字版功能,以及兩個主持人的深度對話音訊內容。

如果有更個性化的需求也可以自己敲prompt。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

我們嘗試用中文提問,結果AI是可以理解的。很可惜的是Notebook LM不支援用中文回答,即使刻意要求也不行。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

選擇建立音訊的話,視文件長度需要等待幾分鐘到十幾分鐘。

NotebookLM的背景

NotebookLM由Gemini 1.5 Pro來支援,也就是Google家目前旗艦級大型語言模型。

Gemini 1.5 Pro支援超長128k上下文,這是能解讀長文件的基礎。

在最近的一次升級中,Gemini 1.5 Pro數學和推理能力還反超OpenAI o1預覽版。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

好了,剛才生成的音訊也處理完畢,英語好的朋友可以來聽聽看。

英語沒那麼好的朋友,也可以看看套上AI轉寫、翻譯出來的AI文字版,感受一下。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

單純的上傳文件,生成內容,還只是Notebook的實用玩法之一。

還有人介紹了學生上課錄音,回家用AI整理重點的玩法,也廣受好評。

(不是自己不聽課了的意思)

具體來說,可以遵循以下步驟:、

  • 上課時用手機錄音;
  • 上課期間不需要用電腦,只需(紙筆)記下簡短的重點;
  • (下課後)把錄音和筆記掃描上傳到NotebookLM,讓它根據錄音細節擴寫筆記。
  • 另外,還可以每週建立一份對所學內容重點的複習音訊。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

與單純「聊天」不同的AI互動範式

其實,NotebookLM並不是出道即爆火。

早在去年5月的Google I/O大會上它就已經出現了,不過那個時候,作為AI筆記計畫的它還叫Project Tailwind。到了去年7月,NotebookLM它才改成現在的名字。

起初,只支援美國局部地區的使用者食用;功能也還是圍繞著基礎的Chat模式展開。

NotebookLM自動生成文件指南(來自Google官網)

到了這個月11號,NotebookLM突然宣佈面向全球玩家開放,並且新增了重磅功能,音訊概述

Google給的官方介紹是這樣的:

「新的音訊概述功能,可以一鍵將文件、幻燈片、圖表等轉化為引人入勝的討論。」

因為互動形式很新、AI語音逼真、討論起來真的很像真人Podcast播客,大家一下就玩嗨了。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

到這兩天,Notebook LM不僅已經能夠把Youtube視訊作為輸入,還已經支援超100種語言。現在,AI大神的公開稱讚,更為Notebook LM的熱度「火上加油」。

如Karpathy所說,Notebook LM爆火最主要的原因,是它提供了一種與單純Chat不同的互動範式。Notebook LM消除了大型語言模型的兩大享受障礙:

第一點,聊天其實挺難的。

有些人在日常生活中跟人交流都費盡心力,更別提要和Chatbot聊天,還得不停提問、追問。

NotebookLM好就好在,生成的Podcast對話中,其中有一方就會處於提問、引導角色。我們把文件、音視訊放進去,等待生成,聽AI根據檔案閒聊是了。

第二點,閱讀不是件容易的事。

資訊爆炸的碎片化時代,挑個舒服的姿勢,或者開車時候聽別人討論我需要的東西,比自己費勁吧啦擱那兒看容易得多。——哪怕看的是AI已經幫我們總結出來的凝練版本。

目前Notebook LM的兩大缺點

本著精益求精的精神,也有網友表示了對Notebook LM更上一層樓的期待。

Hyperbolic Labs的聯創兼CTO Yuchen Jin試玩過後,總結了兩個侷限性:

一個是它「看不到」,也就是沒法處理文件內的圖片資訊。不過背後的Gemini是多模態的嘛,相比Notebook LM長眼睛不會太晚。

另一個是使用者無法引導AI Podcast的內容

Yuchen Jin喂給它兩條推文,它就生成了近13分鐘的音訊內容,但它預設聽眾是一般受眾,所以講了很多很基本的概念。如果能指定生成播客的目標群體,或者談論主題、方向、角度,那真的是棒上加棒。

One More Thing

說時遲那時快,也有開發者搞出開源版的NotebookLM了!

不過暫時只能給它PDF檔案。

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

 

參考連結:

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/Yuchenj_UW/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

加入T客邦Facebook粉絲團

GitHub開源的Deep-Live-Cam專案爆紅:至今最即時成熟的直播換臉技術、一張照片就能變身名人

作者 Qbitai
AI換臉項目Deep-Live-Cam一夜爆火 只需一張照片變身馬斯克上直播08b54870a959c5f17ba5898e3d239010

AI 換臉已經不是什麼大新聞,就算是影片也不再可以完全被信任。不過,現在就算是直播,最近也淪陷了。最近,一個 GitHub 上的專案突然爆紅起來:Deep-Live-Cam,這就是只要一張他人的照片,就能實現在直播流中的即時換臉,而且效果優秀。

關注AI相關新聞的科技作者 MatthewBerman ,最近他就利用這個專案,僅用一張馬斯克的圖片生成了直播串流內容,測試了暗光條件和點光源的條件——常規情況下較難處理的場景,但是 Deep-Live-Cam 的表現都非常絲滑,暗光條件下的甚至更像馬斯克了。甚至他戴著眼鏡這一點,也幾乎沒有影響生成的效果。

#1 trending github repo right now looks INSANE

Single image to live stream deep fake.

Look at that quality!!

It's called Deep-Live-Cam (link in replies) pic.twitter.com/VgtnJ1LKRM

— MatthewBerman (@MatthewBerman) August 9, 2024

在測試下的留言中,大家的反應最多的是:「知道這一天早晚會來,但沒想到來的這麼快!」

Deep-Live-Cam專案內容是什麼?

Deep-Live-Cam 現在在 GitHub 上完全開源,在 CPU 上運行,可以使用 NVIDIA CUDA、Apple Silicon(CoreML)、DirectML(Windows)、OpenVINO(Intel)進行 GPU 加速。

發佈者 hacksider 提供了詳盡的安裝方法,目前 GitHub 上已經有接近 6 千標星。

GitHub開源的Deep-Live-Cam專案爆紅:至今最即時成熟的直播換臉技術、一張照片就能變身名人

目前國外已經有了不少測試教學,YouTuber Fahd Mirza 直接發佈了按步安裝的影片教學。

安裝完成之後,只需要選擇一張圖片,一個影片,就能輸出一個 DeepFake 的影片——影片中他錄製了一段說話的視訊,AI 換臉成愛因斯坦。

而最下方選中 Live 的按鈕,就能輸出一個直播資料流。

他還進行了兩個極限測試,一個是老虎照片的換臉,軟體提示沒有找到老虎照片上的臉。另一個是瑪麗蓮夢露的換臉。

GitHub開源的Deep-Live-Cam專案爆紅:至今最即時成熟的直播換臉技術、一張照片就能變身名人

換臉效果不錯,不過因為他的臉部周圍有一圈白鬍子,AI 保留了這一特徵,讓人臉意外地稍稍有點不自然。

 

Deep-Live-Cam 並不是第一個能夠做到即時 AI 換臉的工具。今年年初,Deep Face Live,也已經做到了 AI 即時換臉輸出直播流。

不過 Deep Face Live 效果更好的模式,仍然主打用更多的資料對想要換的人臉進行建模後生成即時換臉,單張圖片生成的效果不如建模生成的效果。

而 Deep-Live-Cam 中,可以看到單張照片生成的 AI 換臉,在皮膚質感、嘴巴牙齒的動作,這些難點的生成上,都已經相當自然。在操作上,Deep-Live-Cam 的介面也十分簡潔,對比 Deep Face Live,看起來普通人上手更容易。因此,此次也受到了更多的關注。

換臉直播?電信詐騙?

AI 即時換臉會帶來什麼?

一部分人歡欣雀躍。不想用自己的臉直播的人,終於找到了一條出路!

更多的人想到了詐騙等應用的可能性:結合 AI 語音技術——在過去一年內已經發展地相當不錯,再配合一個和臉差不多的身體,即時模擬他人進行詐騙操作的成本前所未有地低。 

AI 換臉有沒有可能會被用來生成犯罪證據?

我在法庭上觀看一個時長 4 分 23 秒的超逼真 AI 犯罪錄影,但我並沒有犯罪。

而人類最後的堡壘,或者不是人類,而是 AI。

當人類對於 AI 換臉的水平真假難辨之後,人類最終可能要依靠 AI 來分辨視訊/直播到底是人類出鏡還是 AI 出鏡。

Intel 公司,之前曾經推出過 DeepFake 檢測器 FakeCatcher,通過檢測血流來判斷虛假的人臉視訊。當血液流經我們的身體時,血管會以非常微妙的方式改變顏色,人眼很難察覺這些變化,但使用光密度測量法(PPG)可以進行檢測。

AI 影片本身也有一些只有機器能識別出的浮水印,其實目前大部分 AI 換臉詐騙是可以被識別的。

令人幸運的是,我們實際所在的現實世界仍然好於虛擬世界,最先進的 AI 即時換臉技術仍然是開放原始碼的。作為普通人,起碼也能迅速提醒身邊的不關注科技的人,AI 換臉技術的最新進展。

 

 

加入T客邦Facebook粉絲團

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

作者 Qbitai
現在的AI美女充斥網路,你是不是也覺得難辨真假?不過,現在似乎有破解AI美女的辦法了。D0b6cda995a95571d146f8c9d5371f56

現在的AI美女充斥網路,你是不是也覺得難辨真假?不過,現在似乎有破解AI美女的辦法了。

國外網友發現了一種「AI照妖鏡」,在照妖鏡的直視之下AI 美女全變鬼。來看看他們現形的「獠牙」。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

而背後的技巧很簡單,只要找到一個可以調整圖像飽和度的工具,然後把圖像飽和度拉滿,AI 人像的牙齒就會變得非常詭異,邊界模糊不清。整體圖片的顏色也正常,麥克風部分更是奇怪。

對比真實人類照片,則應該是這樣的。牙齒是清晰的,圖片色塊都是均勻一致的。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

人人都能拿著照片去試試,就算是AI 生成影片中的某一幀,也難逃此大法。不漏牙的照片也會暴露問題。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

哪裡可以用這個工具?

你可以到以下的網址去試試,這是有網友利用Claude寫出來的,用AI來治AI。

https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46

為了測試這個網站是否真的能辨識AI美女,我們用Copilot生成了其它的女性圖片。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

來看看第一張照片,光是這樣看起來其實相當不錯吧!

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

接下來就來實戰吧!

步驟1:連到這個網址後,點選左邊的「選擇檔案」來把要測試的檔案上傳。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

步驟2:上傳圖片上去後,把下面的飽和度拉到200%。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

步驟3:現在拉動圖片中間的滑桿,你就可以看出是否有什麼奇怪的地方了。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

 

 

 

 

AI進化太快,人類快跟不上

最近 AI 人像太逼真又引發了不小討論,比如一組大火的「TED 演講者」,其實沒有一個是真人。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

不只是人臉難以區分,就連之前 AI 的弱點 —— 寫字,現在都能完全以假亂真。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

更關鍵的是,生成這樣的 AI 人像,成本也不高。低至 5 分鐘、每 20 秒 1.5 美元(人民幣 10 塊左右)的價格即可搞定。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

 

AI的進化這麼快,光憑人類的眼睛應該已經無法分辨了。

彙總來看,調整飽和度或許是目前最快速辨別的方法。AI 群像照在這種方法下暴露得更加徹底。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

不過它有一個問題。如果圖像用 JPEG 演算法壓縮過後,該方法可能失效。

比如確定這張照片是真人照片。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

但是由於畫質壓縮以及光線等問題,人物牙齒也有點模糊。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

所以網友們還列出了更多分辨人像是否是 AI 合成的方法。

第一種方法,簡單說就是依靠人類的知識判斷。

由於 AI 學習圖像的方式和人類並不一致,難免無法 100% 掌握人類視角下的視覺資訊。造成的結果就是,AI 生成的圖片常常包含與現實世界不符之處,這就為圖像的鑑別提供了著手之處。

用開頭的這張圖片作為例子。

從整體上看,人物的皮膚過於光滑,看不到任何的毛孔,這種過於完美的特徵反而增加了不真實感。

當然這種“不真實感”並不完全等同於“造假”,畢竟經過磨皮處理的圖片同樣看不到毛孔。但這也並非唯一的判斷因素,AI 在圖片中留下的與常識的出入也未必只有一處。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

實際上,這張圖只要稍微看以下細節,就能看到一個比較明顯的特徵 —— 胸牌上方掛鉤奇特的連接方式

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

還有在高飽和度模式下露出破綻的麥克風,放大之後直接用肉眼也能看出端倪。

更為隱蔽的是,頭髮末端有幾根毛髮的位置很不合理,但這樣的特徵,恐怕要擁有列文虎克等級的視力才能看到了。

不過,隨著生成技術的進步,能夠找到的特徵越來越隱蔽,也是一個無法避免的趨勢。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

還有一種方法是看文字,雖然 AI 在字型的刻畫上正逐漸克服“鬼畫符”的問題,但正確地渲染出有正確實際含義的文字還存在一些困難。

 

除了這些物體本身的細節,還有光線、陰影等資訊也可以用來判斷真偽。

這張圖片是從一段視訊當中提取的,在它所在的視訊當中還有這樣的一幀。在麥克風右側的位置,有一片十分詭異的陰影,這片陰影對應的是人物的一隻手,顯然 AI 在這裡處理得有所欠缺。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

說到影片,由於涉及前後內容一致性,AI 倒是比在靜態圖像中更容易露出雞腳馬腳。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

還有一些特徵不算“常識錯誤”,但也體現出了 AI 在生成圖像時的一些偏好。

比如這四張圖,都是 AI 合成的“普通人”(average people),有沒有發現什麼共同之處?

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

有網友表示,這四張圖裡的人,沒有一個是笑臉,這點似乎就體現了 AI 生圖的某種特徵。

不過,「AI合成的人不會笑」針對這幾張圖而言確實如此,但這樣的判斷方式很難形成系統,畢竟不同的 AI 繪圖工具,特點也都不盡相同。

總之,為了應對逐漸進步的 AI,一方面可以加大觀察細節的力度,一方面還可以引入像拉高飽和度這樣的圖像處理技術。

但如果這樣的量變積累得越來越多,肉眼判斷也會越來越困難,圖像飽和度可能也有被 AI 攻破的一天。所以人們也在轉變思路,想到了「以模制模」的方法,用 AI 生成的圖片訓練檢測模型,從圖像中分析更多特徵。

比如 AI 生成的圖像在頻譜、噪聲分佈等方面存在許多特點,這些特點依靠肉眼無法捕捉,但 AI 卻能看得很清楚。

當然,也不排除檢測方法落後、跟不上模型變化,甚至模型開發者專門進行對抗性開發的可能。比如前文一直在討論的這張圖片,某 AI 檢測工具認為它是 AI 合成的機率只有 2%。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

但 AI 造假和 AI 檢測之間的博弈過程,本身就是一場“貓鼠遊戲”。

所以在檢測之外,可能還需要模型的開發者也負起一些責任,例如給 AI 生成的圖片打上隱形浮水印,讓 AI 造假無處遁形。

AI 魔高一尺

值得一提的是,如上引發恐慌的 AI 人像,不少都是由最近爆火的 Flux 生成 / 參與製作。甚至大家已經開始默認,效果太好難以分辨的,就是 Flux 做的。

它由 Stable Diffusion 原班人馬打造,發佈才 10 天就在網路上掀起軒然大波。

這些精美的假 TED 演講照片,都是出自它手。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

還有人用 Flux 和 Gen-3 一起做出了精美的護膚品廣告。以及多角度的各種合成效果。它很好解決了 AI 畫手、AI 生成圖片中文字等問題。

這直接導致現在人類區分 AI 畫圖,不能再直接看手和文字了,只能盯著蛛絲馬跡猜。

想要判斷你看到的美女是否AI生成?利用「飽和度照妖鏡」拉一下就可以現形

Flux 應該是在手部、文字等指標上加強了訓練。這也意味著,如果當下的 AI 繼續在紋理細節、色彩等方面下功夫訓練,等到下一代 AI 畫圖模型出來時,人類的辨認方法可能又要失效了……

而且 Flux 還是開源、筆電上可運行的。不少人現在已經在 Forget Midjourney 了。

從 Stable Diffusion 到 Flux,用了 2 年。從「威爾史密斯吃麵條」到「Tedx 演講者」,用了 1 年。

真不知道以後為了分辨 AI 生成,人類得想出哪些歪招了……

參考連結:

 

 

加入T客邦Facebook粉絲團

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

作者 Qbitai
AI 地理位置辨識技術:隱私安全警示與技術挑戰Eab5d72e981d6482b184d44d0d2f3db3

有點恐怖。現在,AI 只需隨意一張照片,就能知道你在哪裡,而且是可以精確到經緯度的那種!

例如,下面這張隨便到不能再隨便的自拍,你能猜到小姐姐在哪裡嗎?這事交給現在的 AI 來處理,它只需要「看」一眼,就能把照片裡的資訊通通扒出來。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

美國,加利福尼亞州,舊金山機場洗手間,93號登機口附近……

坐標:37.6189° N,122.3744° W

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

再如下面這張照片,AI根據湖的特徵、樹木和背景中的山脈,就匹配到了瑪麗湖,同樣是給出了精準的坐標:

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

至於這個 AI 工具,則是最近由一位俄羅斯駭客所推出,名叫 GeoSpy,號稱是可以根據照片裡的各種細節做分析來判斷地理位置。

包括光線、植物、建築風格、天氣,並將它們與大量街景/地理照片進行對比,據說也用到了地理空間視覺大語言模型的技術。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

而 GeoSpy 的功能,像極了先前一款基於 Google 地圖的遊戲 GeoGuessr——

遊戲中會展示一張街景圖,然後玩家要從地圖上找到它的坐標位置;給出答案與正確坐標越近,分數越高。

之前也有一位國外網友憑藉只需看 0.1 秒街景,就能在世界地圖上快速鎖定位置而在網路上躥紅。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

果不其然,史丹佛電腦系學生 Andrew Gao 在嘗試了 GeoSpy 之後,就開始向他喊話了:「你要失業嘍~」

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

不過也有 GeoGuessr 的職業玩家坐不住了,站出來表示不服:申請一戰!

人類 vs AI

這位挑戰者,名叫做 Gavin(下文我們簡稱「G 哥」),是一位正在參與 GeoGuessr 2024 世界盃的職業選手。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

G 哥把他跟 AI 線上對壘的情況上傳到了網上。

規則和 GeoGuessr 一致,還是看圖猜位置。

在第一輪對決中,G 哥憑藉抓到了馬路道邊上土耳其樣式柱子的細節,判斷這張圖可能是在土耳其附近。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

結果顯示,這張圖裡的位置確實是在土耳其附近,但距離精準的位置還差 241km。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

接下來就輪到 GeoSpy 這個 AI 選手登場了。

G 哥處理的方式是將截圖「餵」給 AI,在靜候了片刻之後,GeoSpy 就給出了結果。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

國家:土耳其

經緯度:39.998923, 32.607491

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

然後 G 哥在地圖中搜尋這個經緯度,再跟 GeoGuessr 的「標準答案」做比較:

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

第一輪的結果可以說是讓 G 哥大受震驚,GeoSpy 給出的位置比他的更近……來看下 G 哥當時的表情:

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

在接下來的「火拚」中,G 哥變得更加仔細,都湊近螢幕去捕捉細節了。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

G 哥這次給出的答案是蘇門答臘島,但實際的結果卻不是很理想,距離「標準答案」足足 703km。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

到了 GeoSpy 這邊,雖然大致位置都是在印尼,但這次給出的位置就沒有那麼準確了。不過比起 G 哥給出的答案,距離上卻還是 AI 的答案更近些,這使得 G 哥開始有點無語了……

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

在接下來的比試中,即便 G 哥把猜測距離壓縮了 86km,但 GeoSpy 給出的結果又是更接近於「標準答案」。

G 哥此時已經開始掩面了:

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

在最後一輪 battle 中,G 哥直接說出:

人類必須反將 AI 一軍。

然後 G 哥把頭埋得更深了,當他捕捉到圖中路邊有文字時,臉上露出了得意的笑容:

這局穩了,AI 它不識字的。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

G 哥的結果是,距離標準答案 134km。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

不過令 G 哥萬萬沒想到的是,GeoSpy,它!識!字!

這張照片是在波蘭拍攝的,因為建築物上寫著「Abet」,這是一家波蘭公司。

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

然而 G 哥還是覺得這把有希望,因為他發現 GeoSpy 只能定位到城市。

所以這把如果 AI 給出的坐標是「標準答案」旁邊的城市「華沙」,那麼 G 哥就贏了。

結果還真是……G 哥也是露出了久違的笑容,並驕傲地說:AI 永遠不會打敗人類!

(Emmmm……G 哥,你非要這麼算的話……也行。)

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

G 哥在下一輪的比拚中,將地圖範圍縮小到了自己的老家——芝加哥。

這次在自己的地盤上,G 哥的表現非常勇猛,有距離「標準答案」僅 2m 和 4m 的成績。

不過 AI 這邊也是非常精準,起碼在看圖描述的過程中可以精確地說出周邊的地址,這也讓 G 哥著實捏了一把汗。

但在地圖上搜 AI 給出的坐標的時候,卻比文字描述的地點遠一些了,有的甚至還定位到了海上。

……

最後,G 哥在與 AI 交鋒了數次之後感慨道:這次體驗非常有趣並且讓人印象深刻。但我也害怕這樣的技術在未來 5 年後會迭代到什麼樣的程度。

AI也會頻頻翻車

其實在剛才 G 哥體驗的過程,我們就能發現 GeoSpy 也存在一定的 bug。

例如它更傾向於把地點定位到某個城市,以及給出的經緯度坐標會跟文字描述的地點有偏差。

網友們在實際體驗過後也有類似的感覺。

以至於許多人開始懷疑這個 GeoSpy 到底是不是憑藉所謂的「地理空間視覺大語言模型」技術。

畢竟現在每張照片的背後就會有大量且豐富的資訊:

GeoSpy:這個 AI 看一眼照片就能定位你在哪裡,位置精確到經緯度

但無論如何,這件事情倒是給我們敲了一個警鐘——

技術的發展雖然日新月異,但我們也要時刻警惕資料安全的問題;平常一定要注意,不然一不小心就可能被開盒。

 

 

加入T客邦Facebook粉絲團
❌