阅读疯子

阅读视图

发现新文章,点击刷新页面。

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

作者 36Kr
LeCun批評o1根本不像研究,Noam Brown回懟:已發表的研究都是廢話4619f064c57cd34a1bd399e51964d768

圖靈獎三巨頭之一 Yann LeCun 又和別人吵起來了,這次是 Noam Brown。

Noam Brown 為 OpenAI o1 模型的核心貢獻者之一,此前他是 Meta FAIR 的一員,主導了曾火遍一時的 CICERO 項目,在 2023 年 6 月加入 OpenAI。

這次吵架的內容就是圍繞 o1 展開的。眾所周知,從 AI 步入新的階段以來,OpenAI 一直選擇了閉源,o1 的發佈也不例外。

這也引來了廣大網友的吐槽,乾脆叫 CloseAI 算了,反觀 Meta,在開源領域就做的很好,o1 的發佈,更是將這一爭論進行了升級。

面對廣大網友的吐槽,OpenAI 顯然是知道的。就在前兩天 Noam 發了一條消息:「我們這些參與 o1 的人聽到,外界聲稱 OpenAI 降低了研究的優先順序,聽到這些消息我們感覺很奇怪。我向大家保證,事實恰恰相反。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

對於這一說法,Yann LeCun 不滿意了,直接跑到評論區開砲「如果你們不能(公開)談論它,那就不是研究。」

Noam Brown 顯然對 LeCun 的回答不是很滿意,回擊表示:(無需談論,)有時一幅圖勝過千言萬語。在 Noam Brown 引用的這張圖裡,上面還配了一段文字「o1 經過 RL 訓練,在通過私有思維鏈做出反應之前會先進行思考。思考的時間越長,它在推理任務上的表現就越好。這為擴展開闢了一個新的維度。我們不再受預訓練的瓶頸限制。我們現在也可以擴展推理計算了。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

更進一步的,Noam Brown 表示在 OpenAI 發佈的這篇部落格文章中,他們分享了大量的資訊,包括 CoT 的內容,Noam Brown 表示這些資訊非常具有啟發性。(為了讓大家更好的瞭解 o1)上週,他還在加州大學柏克萊分校就 o1 模型進行了一次演講。

Noam 言外之意就是,你看 OpenAI 也是會介紹技術相關的內容的,OpenAI 並不是大家認為的對技術避而不談。

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

對於這一說法,顯然 LeCun 很不滿意:「我很抱歉 Noam,但部落格文章與技術論文相比,遠遠達不到可復現性、方法論以及與最新技術的公正比較等標準。當你們在壓力下開發新技術以產生短期產品影響時,你們只需盡快建構你認為最有可能發揮作用的東西。如果它足夠好,你就部署它。你們可能不在乎它是否真的具有新奇的創新,是否真的超越了最先進的技術,或者它是否是一個糟糕的臨時解決方案,或者從長遠來看是否是正確的選擇。你們可以自欺欺人地認為這是自切片面包以來最好的東西,只要你的老闆和產品人員也能被欺騙。但你知道研究不是這樣的。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

Noam 反駁道「我認為恰恰相反。坦白說,很多已經發表的研究說的都是廢話,作者只需要欺騙 3 位審稿人和一位 AC。但當你發佈一個數百萬人使用的東西時,你不能只是發佈欺騙自己、老闆和產品人員的產品,使用者會有自己的決定。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

隨後,哈佛大學電腦科學教授 Boaz Barak(資料顯示,從 2024 年 1 月開始,Barak 離開哈佛大學前往 OpenAI 工作一年)表示:「我認為你們倆的觀點都很好。o1 背後的研究絕對具有創新性,草莓團隊已經完成了驚人的工作和想法,OpenAI 正在改變人們擴展新人工智慧系統的方式。

雖然我們發表了部落格文章,Noam 也做了相關演講,但從純粹加速科學進步的角度來看,如果能夠發佈所有的細節,開源所有的程式碼和權重,那就更好了。然而,正如我們部落格中所說,我們還有其他考慮,包括競爭壓力和安全因素,因此目前還不宜這樣做。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

對此,LeCun 認為 OpenAI 不公佈技術細節,出於競爭壓力的考量還是可信的,但他絕不相信 OpenAI 是為了安全。

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

至此,這段 battle 告一段落。但大家討論的熱情居高不下。

「對於一家擁有數百名高級專家的非營利組織怎麼可能每年只發表很少的論文?我認為自 2021 年以來,OpenAI 每年只有 2-3 篇論文?OpenAI 是過去 20 年來最不開放的前沿科技公司。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

還有網友表示「雖然這是一項很酷的研究,但我同意 Yann 的觀點 —— 不符合研究標準,因為 OpenAI 沒有發表論文、進行同行評審或研究的可復現性。OpenAI 在 GPT-3 之前發表了很棒的研究,之後就是讓人懷疑的部落格文章和炒作(例如 Sora)。我希望 OpenAI 能推動研究團隊和管理層再次發表文章,如果有真正新穎的東西,就申請專利。如果 OpenAI 能發表文章,那麼其影響力會更大;這幾年 OpenAI 的閉源真是令人失望。」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

最後,還有網友靈魂一問:那他們(Ilya Sutskever、Mira Murati 等)為什麼都離開了?

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

「人才流失如此之快的原因到底是什麼?」

AI大神LeCun批評OpenAI o1沒公開論文、不開源根本不能說是「研究」,OpenAI:使用者會自己決定

 

 

 

 

加入T客邦Facebook粉絲團

特斯拉發表無人駕駛計程車CyberCab、價格不到台幣百萬元,但馬斯克的大餅多久能實現?

作者 36Kr
特斯拉正式發表Robotaxi 與馬斯克畫下的大餅Dc2c525d469d675891792340c739f454

原定於10月11日上午10點的特斯拉“We, Robot”發佈會,在延後了幾乎一個小時後姍姍來遲。在這次發佈會上,特斯拉Robotaxi無人駕駛計程車正式發佈,該車命名為CyberCab,外形與CyberTruck相似,採用了兩座和蝶翼式車門,並不配備方向盤和踏板,帶有感應充電功能,這與此前市場傳出的消息相吻合。

特斯拉發表無人駕駛計程車CyberCab、價格不到台幣百萬元,但馬斯克的大餅多久能實現?

特斯拉CEO馬斯克在發佈會上稱,CyberCab的車輛量產之後消費者能以低於 3 萬美元的價格購買到這台車(不到台幣百萬元),並將於2026年投入生產,在2027年前大規模鋪開。當下CyberCab的營運成本仍較高,約為1美元每英里,未來將降至0.2美元每英里左右。未來特斯拉還將推出CyberCab 2。

除CyberCab外,特斯拉還發佈了無人駕駛貨運車RoboVan(無人駕駛廂式貨車),可承載20人以及運貨。RoboVan出行成本可以大幅降低,每英里約10~15美分。

特斯拉發表無人駕駛計程車CyberCab、價格不到台幣百萬元,但馬斯克的大餅多久能實現?

不過,此次發佈會內容還是以馬斯克畫的“餅”為主,對於Robotaxi何時能夠提供服務、收費標準、全球各大市場推出計畫、盈利拐點、發生安全事故如何處理等市場關心的“乾貨”問題,特斯拉在此次發佈會上並未具體提及。

Robotaxi對特斯拉單個公司和整個自動駕駛行業都意義重大。從2009年Google設立自動駕駛部門起,整個自動駕駛產業目標無非就是實現無人駕駛,並且打造出一個可盈利的商業模式,但期間無人駕駛概念遭受了眾多質疑,如果特斯拉此次能夠真正成功,無疑將給上述行業目標帶來曙光。

 

馬斯克也在Robotaxi發佈之前,一直為其造勢,稱「這將是特斯拉自發佈Model 3後最重要的一天」。但餅畫得好,特斯拉Robotaxi仍面臨很多難題,最突出的莫過於安全、監管和盈利模式,真正的自動駕駛L5的實現或許仍任重道遠。

特斯拉Robotaxi到底是什麼?

與人類駕駛不同的是,擁有完全自動駕駛能力的車可以24小時不間斷運行。特斯拉Robotaxi車隊車輛的一大來源便是特斯拉自有車輛,即上述提到的CyberCab和RoboVan。這些車輛的營運依賴特斯拉的全自動駕駛(FSD)軟體。

對於Robotaxi的自動駕駛能力,馬斯克曾稱,其他企業所擁有的需要高精地圖的本地化解決方案,是非常脆弱的,所以他們擴展員工的能力有限。特斯拉採用的是一種通用解決方案,適用於任何地方,甚至可以在另一個地球上工作。

除了自有車輛外,特斯拉Robotaxi車隊車輛的一個重要來源便是,現有車主的空閒特斯拉車輛。馬斯克說,車主僅需要一次軟體(FSD完全自動駕駛)更新,便可將其車輛加入Robotaxi車隊。此次特斯拉Robotaxi的發佈會現場,除CyberCab外,還展出了多輛無人駕駛的Model Y。

根據馬斯克此前在今年第二季度財報電話會上透露的資訊,特斯拉車主可以選擇讓其車輛被特斯拉Robotaxi車隊使用,或者取消使用並把它帶回來。車輛可以一直被車隊使用,或被車隊使用一段時間,然後特斯拉會和車主分享收入。與每週僅平均使用十個小時相比,這些車輛可以實現每週50到60個小時的高效利用。

馬斯克曾表示,消費者只要打開特斯拉的應用程式,召喚車輛,Robotaxi就會把其送到指定地方,而且費用和公車差不多。

商業營運模式是什麼?

在特斯拉的設想中,整個Robotaxi項目的營運也隨著車輛的來源不同分為兩大塊,一塊是針對車主提供車輛的模式,特斯拉將採取Airbnb相似的營運模式,即特斯拉只作為無人駕駛計程車的平台服務商,從每個Robotaxi訂單中獲得分成,大部分的訂單收入仍歸車主所有。

另一塊則是特斯拉自有車輛的收入,這種模式更類似於Uber的商業模式。這種模式需要特斯拉嚴格控制自有車輛的成本,以更快實現盈利。馬斯克在此次發佈會上也直言,當下CyberCab的營運成本仍較高,約為1美元每英里,隨著CyberCab的大規模鋪開,營運成本未來有望降至0.2美元每英里。

在馬斯克看來,特斯拉Robotaxi前期的規模效應主要依賴現有特斯拉車主車輛的加入。他在今年第二季度財報電話會議上稱,雖然可能有一些人不願意讓自己的車輛參與,但他認為大多數人會願意,這將帶來即時的規模效應。上述兩種來源的車輛,可以幫助特斯拉Robotaxi車隊很快能擁有700萬、1000萬甚至最終數千萬輛能夠進行自動駕駛的車輛。

總體而言,特斯拉Robotaxi的營運和盈利模式會是Airbnb和Uber的結合。

在Robotaxi逐步取代現有傳統計程車和網約車的巨大市場藍海預期下,方舟投資基金首席執行長凱茜·伍德日前在接受媒體採訪時表示,對於特斯拉而言,在未來5~10年,Robotaxi業務將是一個4兆~5兆美元的收入機會。這是一種SaaS(軟體即服務)模式,毛利率高達80%以上。

監管問題如何解決?

對於特斯拉Robotaxi而言,安全和監管問題幾乎相輔相成。理論上,特斯拉提供Robotaxi服務的前提是FSD(完全自動駕駛能力)被批准在無人監管的情況下使用,而FSD獲得監管機構許可則需要證明一點,即無人駕駛的FSD比人類駕駛實際上更安全。

特斯拉相關高層在今年第二季度財報電話會議上說:「Robotaxi的實際部署時間取決於技術進步和監管部門的批准。」

「我們期望可以很快實現完全無人監督的FSD。」馬斯克在此次發佈會上表示。為加速Robotaxi的落地,特斯拉正在推動FSD在全球各大市場獲得監管許可。馬斯克此前說,如果企業擁有大量資料,比如數十億英里的行駛資料,這些資料表明在未來,無人駕駛比人類更安全,那麼監管機構就很難阻礙Robotaxi的發展。特斯拉將請求歐洲、中國和其他國家的監管機構批准特斯拉的FSD監督版,並有可能在今年年底前獲得批准。

「如果到2025年底特斯拉還沒開始Robotaxi營運,我會感到震驚。」馬斯克在今年第二季度財報會上表示。

隨著特斯拉Robotaxi的問世,該賽道熱度也不斷升溫。不過,相比馬斯克畫餅的樂觀,市場上也出現了其他聲音。天風國際分析師郭明錤日前發文稱,供應鏈調查顯示,特斯拉Robotaxi預計要到2027年第一季度才能量產,自己相信特斯拉已具備製造Robotaxi所需的硬體設計、生產能力,但量產時間意味著FSD可能也要到2026年後才能達到L4等級。在無人駕駛計程車趨勢到來之前,可能需要更多耐心,但這一趨勢無疑是令人期待的。

 

 

 

加入T客邦Facebook粉絲團

30多年前的Windows 3.1立大功?美國航空仍依賴古董級系統,急需80億美元升級

作者 36Kr
30+年前的Windows 3.1立大功?被曝依賴「古董級」系統,美國航空急需80億美元升級613b912261f58b8cfc1c51f0857b677e

在全球航空運輸行業中,技術的更新換代無疑是確保安全與效率的關鍵——然而,近期美國政府問責辦公室(GAO)發表了一份讓許多航空旅客都感到緊張的報告:FAA的空中交通管制(ATC)系統不僅數量龐大,而且大部分已經過時,急需技術更新。

報告顯示,在 FAA 的 138 個 ATC 系統中,有 51 個系統因缺乏零組件、資金短缺以及缺少技術更新資金而處於不可持續狀態,還有 54 個系統被描述為「可能不可持續」狀態。

FAA 處理程序落後,全部更新要等到2030年

去年,由於一次關鍵檔案的意外刪除導致美國空域關閉,FAA 因此進行了營運風險評估,以評估 ATC 系統的可持續性。但 GAO 在報告中指出,FAA 在現代化最關鍵和高風險系統方面的進展依然緩慢。

根據 FAA 的歷史,早在 1982 年,該機構便發佈了第一份綜合性計畫,旨在改善空中交通管制服務。然而,這些計畫的實施始終面臨著資金、管理和技術等多重挑戰。GAO 指出,FAA 的政策對於尚未設定成本、進度和性能基準的項目幾乎沒有監督要求,導致項目整體進展緩慢,平均需要四年以上的時間來建立基準。

據悉,FAA 共計提出了 64 項現代化投資計畫,想要改善 105 個不可持續和可能不可持續的系統,但 GAO 發現大多數關鍵系統的現代化處理程序依舊處於停滯狀態,超過一半的系統都處於「不可持續」狀態:其中有 58 個系統對國家空域的安全和效率至關重要,更有 17 個系統被認為具有關鍵操作影響。

然而,FAA 卻在現代化這些關鍵系統方面舉步維艱——這些系統不僅不可持續,其現代化計畫可能需延至 2030 年或更晚才能完成,甚至有一些項目預計將在 10-13 年後完成。更加糟糕的是,對於其他需要現代化的系統,FAA 也還沒有具體的更新計畫,其中三個系統至少已有 30 年的歷史了。

顯然,這種狀況不僅對 FAA 自身構成挑戰,也對全美航空運輸的安全性造成了潛在風險。面對老舊系統帶來的挑戰,FAA 表示需要 80 億美元進行現代化更新。

FAA 在聲明中指出,這筆資金將用於更新老舊的空中交通設施和雷達基礎設施,以提升國家空域系統(NAS)的安全性和效率。FAA 局長 Michael Whitaker 在國會聽證會上提到,該機構的設施多年來面臨投資不足的問題,許多設施的平均使用年限已超過 60 年,甚至高達 70 年。

儘管 FAA 意識到更新的迫切性,但現實卻是,當前 90% 的設施預算用於維護而非新系統,這意味著在未來很長一段時間內,FAA 仍需依賴那些老舊的系統運作。

Windows 3.1,老舊系統的意外優勢?

不過在某些情況下,一些航空公司卻因依賴老舊作業系統而意外躲避了現代技術帶來的故障。

例如在最近的一次全球 IT 故障中,CrowdStrike 更新導致大量 Windows 電腦出現藍色畫面當機(BSoD)錯誤,影響了多個行業的營運,其中聯合航空、達美航空和美國航空等公司因無法應對 CrowdStrike 的更新問題,導致數千航班被迫取消。但當時美國第四大航空公司西南航空,卻因仍在使用 Windows 3.1 而成功避免了這一問題。

Windows 3.1 這款作業系統自 1992 年發佈,而微軟早在 2001 年就停止了對其的支援。在全球藍色畫面事件之前,西南航空經常因其過時的系統而受到批評,但因為 Windows 3.1,西南航空(及其客戶)免受了大多數其他航空公司所經歷的壓力——儘管這一老舊系統常常被人調侃,但在這次危機中,它反而成為了西南航空的「保護傘」。

換句話說,儘管西南航空的技術裝置顯得落後,但正是這種落後讓其在 IT 故障中保持了正常營運。甚至還有網友調侃,西南航空或許應該考慮將作業系統升級到 Windows XP,因為雖然 XP 也不再接收更新,但其相對較新,且可以相容 Windows 3.1 的軟體。

這種矛盾的局面讓人不禁思考:在追求高科技的今天,老舊技術是否也有其存在的合理性?

有網友提到,「如果這些系統今天仍在運行,那就證明了它們的設計、製造和程式有多麼出色」;「如果這些系統能夠正常工作,而且從邏輯上講還能繼續工作,而問題在於缺少硬體元件,那麼最便宜的解決方案可能就是(重新)開始製造這些古董,也許可以用現代機器人技術實現大部分製造過程的自動化。 」

不過也有許多人認為,雖然西南航空的例子展示了老舊系統在某些情況下的倖存者能力,但長遠來看,航空公司仍需面對系統升級的迫切需求:隨著新技術的不斷發展,老舊系統將難以與新裝置相容,進而影響營運效率和安全性。此外,老舊系統也往往無法滿足現代航空營運的需求。

總體來說,隨著新的安全標準和效率要求不斷提高,老舊系統無法適應這些變化,最終可能導致營運能力下降和故障頻發。另外 GAO 也明確指出,FAA 對不可持續系統的依賴,可能會引發航空安全隱患。

參考連結:techspottheregistertechradar 

 

加入T客邦Facebook粉絲團

三星財報發佈後罕見為業績不佳道歉,董事長李在鎔親口否認要把晶圓代工拆分傳言

作者 36Kr
三星罕見為業績不佳道歉,董事長李在鎔稱無意剝離代工業務5d048881b0a855b80bf23f0bbed6700f

全球最大記憶體晶片製造商三星於週二公佈了其第三季度令人失望的初步業績報告,並行布了一封篇幅較長的致歉信,罕見地承認自己正在努力應對潛在的危機。同時,該公司董事長李在鎔表示,無意剝離晶片設計與代工業務。

業績不及預期 相關負責人罕見公開道歉

三星新上任的晶片業務負責人Jun Young-hyun在聲明中指出,該公司將深入審視其組織文化和工作流程。他強調:「我們將把重心放在強化長期競爭力上,而非依賴短期應對措施,現在正是對我們的一次重大考驗。」

作為全球最大的記憶體及智慧型手機製造商,三星公佈的第三季度初步業績顯示,營業利潤約為9.1兆韓元(約合68億美元),遠低於市場預期的11.5兆韓元(約合85.4億美元)。該公司歸因於與績效獎金撥備相關的一次性成本影響了收益。同時,其營收為79兆韓元(約合587億美元),也未能達到81.57兆韓元(約合605億美元)的預期值。三星計畫在本月稍後時間提供包含淨收入和部門細分的完整財務報表。

Jun Young-hyun表示:「外界已經對我們的技術競爭力產生擔憂,有人甚至提及三星正面臨危機。作為企業領航者,我們對此負有全部責任。」

三星公司股價在週二首爾早盤一度下滑1.8%。鑑於三星在關鍵市場表現乏力,其股價今年已累計下跌超過20%。

在用於人工智慧開發且與NVIDIA處理器配套的記憶體晶片領域,三星落後於競爭對手SK海力士。而在外包定製晶片生產方面,其與台積電的競爭也幾乎沒有進展。

鑑於三星晶片部門近期遭遇的種種挑戰,分析師已顯著調低了對該公司的股價預期。麥格理於9月25日發佈的報告中,不僅將三星的投資評級從「增持」調整為「中性」,還大幅削減了其目標股價,從原先的12.5萬韓元直降至6.4萬韓元。

三星目前需要奮力追趕SK海力士,後者已經率先生產出與NVIDIA人工智慧加速器相匹配的高頻寬儲存晶片。相比之下,三星在推進其最先進的HBM(高頻寬記憶體)技術方面卻遭遇了審批延遲的困境。今年,三星出人意料地更換了晶片業務負責人,Jun Young-hyun直言不諱地指出,公司必須徹底變革職場文化,否則將陷入難以自拔的惡性循環。

三星的業績表現不僅未能跟上人工智慧領域其他股票的步伐,也落後於韓國綜合股價指數的整體表現。作為全球裁員計畫的一部分,三星已在東南亞、澳洲及紐西蘭等地啟動了裁員行動。事實上,三星過去也曾有過裁員先例,這主要是因為它一直在努力應對儲存晶片市場的週期性波動。

董事長親口稱無意剝離代工業務

分析師指出,受需求疲軟影響,三星為其他客戶提供的晶片設計與製造服務每年蒙受數十億美元的虧損,這對全球最大儲存晶片製造商的整體業績構成了拖累。為了降低對儲存晶片業務的依賴,三星一直在積極向邏輯晶片設計及晶片代工製造領域擴張。

早在2019年,李在鎔便提出了他的願景,即在2030年之前超越台積電,成為全球最大的晶片代工製造商。為此,三星已宣佈在韓國和美國投資建設新工廠,並斥資數十億美元用於發展晶片代工業務。然而,據多位知情人士透露,三星在爭取大訂單以充分利用新增產能方面一直困難重重。

當被問及三星是否有意分拆晶片製造業務(即代工業務)或其系統LSI邏輯晶片設計業務時,李在鎔明確表示:「我們致力於業務的擴展,不考慮分拆。」但他也承認,三星在德州泰勒市新建的晶片工廠正面臨諸多挑戰,他說:「由於(某些)外部環境的變化和選舉因素,這項工作確實有些艱難。」

三星於今年4月份宣佈延後了其在泰勒市晶片工廠的生產計畫,從原定的2024年底延期至2026年,並表示將根據客戶需求分階段推進項目營運。這一決定凸顯了三星在趕超台積電時所面臨的嚴峻挑戰,台積電憑藉其蘋果、NVIDIA等重量級客戶而穩居領先地位。

去年,三星代工和LSI業務的營運虧損達3.18兆韓元(約合24億美元),分析師預計今年這兩項業務的虧損將達到2.08兆韓元(約合15億美元)。

曾在三星任職的尚明大學系統半導體工程教授李鐘煥指出:「從理論上講,將代工業務分拆出來有助於三星贏得客戶的信任,並使其能夠更專注於該領域的發展。」但他也強調,獨立營運的代工部門可能會面臨更大的生存挑戰,因為它可能會失去來自儲存晶片業務的財務支援。

 

 

 

加入T客邦Facebook粉絲團

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案

作者 36Kr
什麼樣的紙最容易劃破手指?科學家試了試921d0d0ba6338639451317c9362c7032

每個人多少可能都有被紙張偷襲手指的經驗,通常是翻書或整理檔案時,你以為手指皮膚和書頁紙張只會有蜻蜓點水般的一面之緣,但直至感到指尖隱隱作痛,你才見手指上那道傷口。

不過,有趣的是,平常你就算故意用紙去劃手,很多時候也劃不破。

這引起了丹麥技術大學(Technical University of Denmark)幾位物理學家的興趣,他們開始查閱研究論文,想知道什麼樣的紙,用什麼樣的方式,最容易劃破手指。

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案

 

太厚太薄都不行

但他們卻發現,這麼有趣的問題竟然沒有人研究過?!好吧,既然查閱不到相關的研究,他們就自己研究!

他們找來了不同厚度的紙,嘗試用各種角度去切手指,想看看怎樣才最容易切出傷口。不過鑑於這幾位物理學家都不太願意貢獻自己的手指,他們實驗中用的「手指」其實是用矽膠製作的模型。 

他們觀察到,在相同的切割角度下,當紙很厚時,切割時只能讓矽膠凹陷下去,但不能成功切開矽膠;

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案


而當其它條件保持不變,換用薄一點的紙時,就能夠切開矽膠了——但紙也不是越薄就越好;

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案

因為當他們換用更薄的紙時,紙不僅沒能切開矽膠,還把自己給壓彎了。

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案


此外,他們還測試了不同切割角度下,紙切破矽膠手指的難易程度。結果發現,切割時紙和矽膠表面的夾角越小,越容易切開口子。

總結一下就是:紙的切割角度越小越容易切開矽膠;但在給定切割角度下,紙太厚或太薄都切不開矽膠。 

為什麼會出現這樣的變化趨勢呢,最容易切開手指的厚度和角度又是多少呢?

越薄越“鋒利”?

首先我們來探究一下,為什麼在相同切割角度下,相對薄一點的紙更容易切開皮膚。

便於理解的解釋是——紙越薄就越“鋒利”。在切割皮膚時,紙施加給皮膚的所有力都集中在紙和皮膚間的接觸表面上。而紙越薄,它與皮膚間的接觸面積就越小,因此施加相同的力時,皮膚在單位面積上所受的力會更大,即“應力”(stress,σ=F/s)更大。

紙向皮膚施加的應力會有兩種作用,一是讓皮膚表面向下凹陷形變,二是將接觸面兩邊的皮膚向兩側拉扯。

紙劃矽膠的物理模型(圖片來源:原論文)

當向兩側拉扯皮膚的應力(即“剪下應力” shear stress——應力在與皮膚表面切向的份量)超過皮膚的承受範圍時(取決於皮膚的楊氏模量和斷裂硬度),皮膚就會被撕裂開(發生塑性形變),即被紙切開了。

而前文說到,紙越薄,應力越大,顯然更容易超過皮膚的承受範圍,從而切開皮膚。此外,切割角度越小,應力在皮膚表面切向的份量“剪下應力”就越大,也更容易切開皮膚。

切割角度與紙的厚度對紙是否能切開皮膚的影響(圖片來源:原論文)

那為什麼當紙過薄的時候,又切不開皮膚了呢?

太薄也不行

紙太薄,它就過於柔弱了。

薄度多少的紙才最容易劃破手指?這篇科學論文為「最危險的紙」找到了答案

在以上的分析中,我們其實假定紙是不會形變的,但在開頭的實驗中我們可以看到,過於薄的紙,在切割過程中會發生彎曲——這是因為太薄的紙強度較低,自身承受不了切開皮膚所需的應力。

這在工程力學上叫做“屈曲”或“壓曲”(buckling),即柱子或橫樑等結構在承受過大的壓縮負荷時,突然彎曲或形變的情況。

材料發生屈曲(圖片來源:Mircalla22 (talk)- Public Domain)

在實際生活的應用中,工程師在工程設計時必須仔細考慮屈曲問題,以確保結構保持安全和穩定,尤其是在多載情況下。

天太熱,鐵軌受熱膨脹發生屈曲(圖片來源:Railpedia.nl - CC BY-SA 3.0)

而對於過薄的紙,它們在達到能切開皮膚所需的應力之前就發生了屈曲,因此不足以切開皮膚。

通俗點說,紙能不能切開皮膚,實際上是看在應力增加的過程中,紙和皮膚誰先達到承受極限——先達到皮膚的極限就可以成功切開皮膚,先達到紙的承受極限就會讓紙發生屈曲。

“最危險”的紙

越薄的紙越鋒利,但也更容易達到自身發生屈曲的極限。而當一張紙能夠給皮膚的最大應力,剛剛能夠切開皮膚,又剛剛不至於發生屈曲時,這種厚度的紙就是最容易劃傷手指的紙。於是這幾位物理學家算了算,厚度 65 微米的紙就剛好滿足這個條件。

他們還算出,在真實生活中, 65 微米厚的紙能成功切開手指的可能性為 21%,換句話說,如果你翻閱的紙厚度剛好為 65 微米,那麼平均這種紙每劃過你的手指五次,就有一次成功劃傷手指,好危險!

那麼我們生活中什麼紙的厚度最接近 65 微米呢?許多點陣印表機(dot matrix printer)用紙的厚度就剛好是 65 微米,此外,很多報紙的厚度也差不多。

一種點陣印表機(圖片來源:Nakamura2828 at us.wikipedia - CC BY-SA 3.0)

但作為科研人員,這幾位物理學家專門指出:兩大學術期刊《 科學》( Science,55 微米)和《自然》(Nature,49 微米)厚度很接近 65 微米,也十分危險!

找到“最危險”的紙之後,這幾位科學家還專門通過 3D 列印,製作了一種刀架,可以把 65 微米厚的紙當成刀片使用(3D 列印資料已上傳,可自行下載 ),據說切蔬菜雞肉啥的賊輕鬆! 

他們已經將該研究過程整理成論文,發表在了期刊《物理評論 e》(Physical Review E)上,感興趣可以去讀一讀。

參考文獻

[1]https://journals.aps.org/pre/accepted/aa072Kc5A071ae0708c39799a466b7d26e3ac2a0e#abstract

[2]https://github.com/Jensen-Lab/PhysicsOfPaperCuts/tree/main

 

 

加入T客邦Facebook粉絲團

OpenAI不是只有ChatGPT這個產品:九大產品繁雜難以管理、使用者眼花繚亂,還有經費問題要解決

作者 36Kr
OpenAI的新挑戰:九大產品繁雜難以管理,使用者眼花繚亂1df1fbdcbaa0bc934269f1a1e829f171

據Supervised報導,雖然OpenAI的最新模型o1在性能上有了顯著提升,但它也給該公司帶來了一個潛在的新挑戰:產品組合繁雜。

OpenAI的最新產品o1和o1-mini,實際上讓使用者和客戶在性能和成本之間做出了權衡:你可以選擇等待更長時間,並暫時支付更多費用,但輸出結果應該會好得多。它不是那種可以插入呼叫中心的應用程式介面(API),但它確實為這家已經覆蓋了一系列細分市場(除了沒有“一個幾乎無所不能的產品”)的公司填補了一種新的細分市場。

o1的應用情境基本上是“你需要稍微思考一下”的問題。美國雲服務管理平台Box CEO亞倫·列維(Aaron Levie)給出了一個極好的企業應用情境,即需要找到合同中一個非常具體的參數——例如,合同的最終簽署日期,也就是合同實際生效的日期。這是一個真正“需要稍微思考一下”的問題,在一個原本簡單的問題上增加了一層複雜性,人們可能在不同的日子簽署了合同。

這對於OpenAI來說也是一種相對較新的應用情境。在過去,OpenAI可能需要呼叫一系列很長的API,並請求模型以提示調整或檢索增強生成(RAG)的形式完成所需任務。相反,整個過程可能會被壓縮成一兩次呼叫,從而簡化某些架構。OpenAI已經經歷了一種“SaaS化”的過程,在這一過程中,OpenAI逐漸成熟,成為一家真正的企業。

OpenAI產品組合日益複雜

隨著OpenAI逐漸發展成為一個真正的企業,其產品組合(或稱為模型組合)日益複雜,OpenAI正面臨著公司產品組合繁雜的挑戰。產品組合越龐大,管理難度就越大,處於這一階段的公司面臨的最大挑戰就是如何避免產品組合變得繁雜,難以向使用者傳達價值。而且隨著模型品質的不斷提高,任何微小的分心都可能導致OpenAI被其他前沿模型公司超越。

Supervised總結了OpenAI現在非常龐大的API組合,共有9個產品:

1、GPT-4o:一個多模態、昂貴(雖然也沒能倖免於降價影響)的模型,應該是通用型的好產品。

2、GPT-4o mini:GPT-4o的削弱版本,旨在作為其主力模型GPT-3.5 Turbo的繼任者,以滿足大量更簡單的應用情境。

上述模型的微調版本,可滿足企業的特定需求,儘管它們通過API提供,這可能會讓一些更注重安全性的公司望而卻步。

3、o1:一個以速度和價格為代價換取品質的模型,允許它有更多時間對答案進行“推理”。基本上就是需要“停下來想一想”的問題。

4、o1-mini:就像4o mini一樣,是o1的削弱版本,設計用於……同樣的“停下來想一想”的問題,但我們可以假設它確實能解決一系列問題。

5、Whisper:可以說是市場上最好的語音轉文字模型,可以肯定的是,它是為生成OpenAI所需的訓練資料而建構的。

6、文字嵌入:算不上最好的嵌入產品,但其優勢通常在於它與其他OpenAI產品一起提供,從而減少了採購的麻煩。

7、文字轉語音:假設延遲正常,你可以將其應用到類似呼叫中心里的API。它有普通和高解析兩個版本的API。

8、高級語音助手:一個技術奇蹟般的產品,它可以讓你在ChatGPT內進行主動對話,儘管其應用情境仍然不太明確。

9、ChatGPT:OpenAI將上述所有內容“產品化”,集合到一個前端企業友好型的包裝中。

在此期間,Meta開始顯示出更多的混亂,它在幾乎每一個類別中都發佈了更新的模型。不過Meta這些模型是開放原始碼的,並為一系列非常不同的產品提供支援,儘管它們存在於同一個“桶”中。通過o1,OpenAI本質上是在再次嘗試建立新的類別,但同時也冒著產品組合繁雜的風險。

OpenAI和其競爭對手的產品定價

下面對比了OpenAI和其競爭對手的產品定價:

OpenAI不是只有ChatGPT這個產品:九大產品繁雜難以管理、使用者眼花繚亂,還有經費問題要解決

OpenAl的產品在價格和用途上存在差異(圖源:X)

這些費用可能遠未達到o1發佈一段時間後的水平。OpenAI已經開始逐步增加速率限制,最近o1-preview從每週30個增加到50個,o1-mini從每週50個增加到每天50個。

OpenAI不是只有ChatGPT這個產品:九大產品繁雜難以管理、使用者眼花繚亂,還有經費問題要解決

OpenAI在社群平台X上分享道,將逐步增加o1-preview和o1-mini的速率限制(圖源:Supervised)

雖然OpenAI的吸引力一直在於便利、價格和性能之間的某個最佳平衡點,但其繁雜的產品組合無疑既是挑戰也是機遇。該文章作者馬修·林利(Matthew Lynley)嚴重懷疑價格不會一直這麼高,因為其下一個GPT模型遲早會準備好。但就目前而言,它至少在試圖籌集巨額資金的時候,開發者擁有了一些價格較高的產品當作談判籌碼。

然而,這裡的挑戰與任何成熟企業隨時間開始面臨的挑戰相同:產品繁雜。雖然OpenAI在技術上以API和ChatGPT的形式擁有“兩個”產品,但這些產品都有大量的分支,服務於非常廣泛的應用情境。這些API也遠遠超出了聊天補全和文字生成的範圍,包括了各種各樣的模態。而它的語音產品看似是ChatGPT“驚豔”的部分,其實可能是其產品組合中最尷尬的部分。

從初創公司走向企業的必經之路

產品繁雜在創業領域是一個公認的問題,如果你還能稱OpenAI為一家初創公司的話。隨著初創公司的成熟,其使用者和客戶群的不斷擴大,它必須有方向性地發展,更少的產品滿足更多客戶的需求,而不是為每個人建構一切。或者更簡潔地說,做幾件事,但都要做好。

提供如此廣泛的應用情境,讓OpenAI能夠將使用者引導到某種穩定狀態,在這種狀態下,它不一定賺錢,但至少不會虧本。

在API方面,傳統的做法是將使用者推向其主力模型(特別是微調版本),但對於ChatGPT而言,這一點就不太清楚了。

雖然新模型在ChatGPT中是有速率限制的,但這也是OpenAI除了API之外極其重要的業務部分。據The Information報導,OpenAI COO布拉德·萊特卡普(Brad Lightcap)告訴員工,OpenAI擁有超過1000萬名ChatGPT的付費訂閱使用者,另外還有100萬名企業訂閱使用者。(彭博社此前曾報導,OpenAI有100萬名ChatGPT的企業訂閱使用者。)

當然,我們可以做很多粗略的計算,但都會得出相同的結論:除了API之外,ChatGPT的企業業務現在和將來都會是OpenAI業務的重要組成部分。

但ChatGPT帶來的收入並不會像API那樣,直接隨著o1的使用而增長。無論是通過API還是ChatGPT內部運行o1,實際運行它的成本可能會隨著預訓練計算資源轉向推理而發生變化。

幸運的是,OpenAI在這一領域已經有了很多進展。業內人士目前額外關注的一種方法是蒙特卡洛樹搜尋(Monte Carlo Tree Search),它可以減少生成高品質結果所需的計算量。蒸餾(distillation)是另一種“縮小”大模型的方法,隨著人們的興趣轉向管理高性能模型的推理成本,蒸餾法也獲得了很大的發展。 (蒸餾是一種機器學習模型壓縮方法,它用於將大型模型的知識遷移到較小的模型中。)

“這就是甜點,將傳統預測性機器學習的策略與現代技術相結合。”模型開發商和平台h2o的聯合創始人兼CEO斯里·安巴蒂(Sri Ambati)告訴馬修,“樹狀搜尋是一個絕對的天才技巧,它是一種非常容易實現的目標,與大語言模型的卓越性相結合。”

在與專家和知情人士交談的交談中,最常提到的另一點是諾姆·布朗(Noam Brown)在OpenAI的工作。布朗被廣泛認為是博弈論領域的頂尖專家,許多人都想知道他的工作將如何應用到OpenAI的產品中。布朗還是一篇論文的共同作者,該論文部分研究了蒙特卡洛樹搜尋在開發類人代理中的應用。

OpenAI面臨成本挑戰

OpenAI的API面臨的挑戰是,根據最近與大多數企業和平台的情況,在為情境建構AI應用時,成本是第一或第二重要的考慮因素。但OpenAI已經表現出逐漸降低價格以保持競爭力的意願。

此外,ChatGPT的企業業務似乎是OpenAI業務的主要驅動力,這也很說明問題,因為所有這些開發基本上都是為該企業套件服務的。對於那些在管理和成本方面有更高要求的公司來說,使用現成的廉價產品在公司內部開發定製產品的做法越來越有吸引力。

有一種憤世嫉俗的觀點認為,OpenAI試圖說:“嘿,看,我們還在創造非常先進的東西,別忽視我們的融資號召。”

然而,這種觀點的另一面是,根據CNBC的報導,OpenAI似乎已經獲得了一輪超額認購的巨額融資,已經成長為一家更適合企業產品的公司。現在,OpenAI只需要確保其在銷售電話中不會用龐大的產品組合迷惑企業。

 

 

 

加入T客邦Facebook粉絲團

Nature新研究指出大模型越大越愛胡說八道,GPT、Llama都一樣逃不過「腦霧」問題

作者 36Kr
Nature新研究:大模型越大,越愛胡說八道Fe2a5aef76be93756dfde4e744b4ee2f

國際頂尖科學學術期刊Nature(《自然》)9月25日刊登了一篇有關AI大模型“腦霧”現象的研究。一個來自西班牙的研究團隊發現,幾個參數量更大、版本更新的AI大模型,誤答比例超60%。

其研究對象OpenAI的GPT大模型、Meta的Llama大模型,以及Hugging Face參與創立的AI研究組織BigScience,推出的BLOOM大模型。

“腦霧”通常用來描述一種大腦功能下降的狀態,可能導致人們短暫出現一些認知功能障礙。在AI界,“腦霧”二字用來類比AI系統在處理某些任務時,會間歇性地失靈,使得生成結果精準性和響應效率都低於正常水準。

這3家主流人工智慧(AI)大模型的產品不斷升級。據研究資料顯示,經過最佳化後的AI大模型雖然基本上做到有問必答,但遇到超綱的問題時會錯答、亂答,而不是像以前那樣逃避回答。這大幅削弱了AI大模型的可信度。

與此同時,該研究還發現使用者難以分辨這些AI回答的真實性,可能會錯信AI聊天機器人的說法,以至於被混淆視聽。

這項研究的論文標題為《參數量更大且學習能力更強的大語言模型的可靠性降低(Larger and more instructable language models become less reliable)》,作者包括Lexin Zhou,Wout Schellaert,Fernando Martínez-Plumed,Yael Moros-Daval,Cèsar Ferri和José Hernández-Orallo。

Nature新研究指出大模型越大越愛胡說八道,GPT、Llama都一樣逃不過「腦霧」問題

論文地址:https://www.nature.com/articles/d41586-024-03137-3

GPT-4等AI大模型,升級後“腦霧”卻更嚴重了

José Hernández-Orallo是一位AI行業的資深人士,也是這篇論文的作者之一。據他介紹,該研究團隊選擇了3個有代表性的AI大模型作為研究對象,分別是OpenAI的GPT,Meta的Llama,以及由美國AI研究組織BigScience研發的開源模型BLOOM。研究範圍包括這些AI大模型的早期原始版本和經過最佳化的版本。

研究人員對這些AI大模型開展了數千次測試。其測試內容涵蓋算術、字謎、地理和科學等領域的問題。同時,他們還設定了諸如“將列表內容按字母順序排列”的任務,以評估AI大模型的資訊轉化能力。

除此之外,他們還參考人們的主觀感受來區分提問難度。例如,人們普遍認為,一些有關加拿大多倫多的問題,比一些有關墨西哥的冷門小鎮Akil的問題更簡單易答。

從測試結果可以得知,AI大模型的參數量越大、版本越新,其回答的精準度越高,但隨著問題難度逐步增加,其回答的精準度有所下降。這大致與研究人員的預期相符。

然而,研究人員發現這些主流的AI聊天機器人即使經過最佳化,遇到無法回答的問題時還是會傾向於生成錯誤答案,而不是直接承認不清楚、不知道。

在面對非常難的問題時,AI大模型選擇不回答可能是一個明智之舉。不過,研究人員在測試的AI大模型中,並未發現明顯的迴避提問的趨勢。相反地,GPT-4等AI大模型幾乎回答了所有提問。

事實上,這些經過最佳化的AI大模型版本,反而誤答的情況更嚴重。在所有誤答和不答的情況中,幾個經過微調的版本給出錯誤答案的比例甚至超過了60%。

與此同時,研究人員還發現AI大模型面對簡單的提問,有時也會出現“腦霧”現象。這也意味著,使用者使用這些AI大模型時不存在所謂的“安全操作範圍”,無法確保AI給出的答案是對的。

可能有10%到40%的使用者,聽信了AI大模型生成的錯誤言論

除了AI大模型本身“犯迷糊”,該研究還發現,人們通常也難以發現AI回答中的錯誤。

為了測試人們是否能自己發現AI的“腦霧”行為,研究人員讓人們隨機判斷這些回答是正確的、錯誤的、還是逃避回答。

然而事實上,無論這些問題的難度如何,人們經常誤判,將不精準的答案當作正確答案。測試結果顯示,人們誤判的頻率大約介於10%到40%。

Hernández-Orallo稱:“人類自身無法有效監督這些AI大模型的演化。”他認為,使用者日常可能會過分高估和信任AI聊天機器人的能力,而這會帶來危險的後果。

解決之道:超過範圍一律答“不知道”

Hernández-Orallo提議,AI開發者應著重提升AI大模型在處理簡單問題時的整體表現,並且引導AI聊天機器人拒絕回答一些較為困難的問題,從而讓使用者更容易判斷,在哪些情況下AI助手是值得信賴的。人們要懂得在哪個範圍內適合使用AI,而在哪個範圍內AI助手難以勝任工作。

他進一步解釋道,雖然訓練AI聊天機器人處理複雜問題的能力,不僅表面上令人印象深刻,還能在排行榜上有不錯的競爭力,但有時並不管用。

OpenAI最新的o1大模型給他留下了深刻的印象。但他發現,儘管該模型可以執行兩個非常大的數字的乘法運算指令,但是它給出了一個錯誤的答案。

在Hernández-Orallo看來,這個問題可以通過設定一個閾值上線來解決,當AI聊天機器人遇到超出這個閾值的複雜問題,直接回覆“我不知道”就好。

AI大模型越來越擅長不懂裝懂,用觀點而非事實作答

AI大語言模型(LLM)在回答問題時會犯錯,或者出現“腦霧”的情況,已經引起了很多人的注意。

來自西班牙瓦倫西亞AI研究所的Hernández-Orallo及其同事共同研究了,AI大模型不斷迭代最佳化後,其“腦霧”現像是如何隨之變化的。

這裡AI大模型的最佳化包括更大的參數量或決策節點、使用了更多的訓練資料、消耗了更多的算力等情況。該研究團隊還跟蹤分析了AI大模型出現“腦霧”的頻率高低,是否與人們所認為的問題難度相匹配,以及是否與人們發現AI回答錯誤的頻率相對應。

該研究團隊發現,採用強化學習等方式人為微調後的AI大模型版本,其生成答案的精準度整體上有所提高。但似乎不能高興得太早,這些AI大模型的錯誤率也在同步增加。

研究發現一些原本AI大模型選擇“逃避回答”的問題,過去會用“我不知道”或者轉移話題來解決,但現在更多是通過給出一個錯誤答案來應付。這使得這些AI大模型出現“腦霧”情況的比例增加,反而變得更加不可靠。

Hernández-Orallo稱:“現在這些AI大模型基本上有問必答,這意味著生成更多正確答案的同時,錯誤答案卻也更多了。”換句話說,當聊天的話題超出了一個AI聊天機器人現有的知識儲備,它輸出觀點的傾向比過去更明顯。

在英國格拉斯哥大學(the University of Glasgow)攻讀科學與技術專業的哲學家Mike Hicks,將這種“腦霧”現象稱為“胡扯”,即這些AI大模型越來越擅長不懂裝懂。

針對專業領域微調的AI聊天機器人,“腦霧”頻率有效降低

現在已有部分AI大模型採取了與設定閾值類似的方法。它們遇到超出知識範圍的問題後,會回答“我不知道”,或者“我沒有足夠的資訊來解答這個問題”。

哥倫比亞南卡羅來納大學(the University of South Carolina)的電腦科學家Vipula Rawte稱,基本上所有AI開發者都致力於減少AI大模型的“腦霧”現象,有時還會特意最佳化這一點。包括醫學用途在內,一些針對專業領域設計的AI聊天機器人,其回答機制通常更嚴謹,以免它們亂答超綱問題。

然而,Vipula Rawte也補充說,如果AI開發者想要銷售通用的AI聊天機器人,那麼這種更保守的回答機制,一般情況下不是他們會選擇的賣點。

 

 

加入T客邦Facebook粉絲團

台積電為了提升CoWoS封裝業務產能,不斷買廠建廠、目標是每月8萬片

作者 36Kr
由於CoWoS需求旺盛,台積電還持續在全台尋覓適合的擴廠據點。D25d002366b1491458dad32eed23cc25

為滿足AI伺服器先進封裝的產能需求,台積電正在摩拳擦掌。在七月的財報會議上,台積電董事長魏哲家也在回應分析師有關先進封裝的CoWoS產能緊張的議題時提到,

 人工智慧火爆帶動了CoWoS需求,台積電CoWoS需求非常強,台積電持續擴增2025-2026年希望達到供需平衡。今年產能超過翻倍成長,公司也非常努力地在擴充產能。

為了踐行這個目標,台積電封裝正在不斷買廠、建廠以加速擴產。

買廠,建廠,台積電擴產不停

在台積電的封裝擴張路線上,早前購入的群創南科4廠,廠房代號為AP8廠區會是公司封裝發展的一個明智選擇。因為通過這單交易,將省去須以年計的環評階段,這也公司預計能在明年下半年將該工廠投產。據台媒表示,該廠的未來產能比竹南先進封裝廠大9倍,且將納入晶圓代工與3D IC。

今年8月中旬,台積電宣佈斥資171.4億新台幣,購入群創位在南科的5.5代LCD面板廠,該廠原本為記憶體大廠美光屬意,一直到台積電、群創重訊公佈廠房交易訊息,外界才知道台積電已經搶先一步。

供應鏈透露,台積電會購入群創南科4廠的最主要原因,就是省去以年計算的環評步驟,與嘉義的先進封裝廠不同,只要進行廠內改裝工程,不到1年機台進駐後就可以投產。

裝置端業者指出在廠房交易案確定後,台積電就針對AP8廠啟動建廠計畫,目標在2025年下半年投產,相關的機台裝置製造訂單同步進行,預期明年4月陸續交機,約1季的試產,下半年投產並不難。

由於AP8廠的規模比竹南先進封裝廠大9倍,供應鏈認為不會只有先進封裝的CoWoS產能,未來先進製程的晶圓代工、扇出型封裝以及3D IC等產線都有可能會進駐。

除了買下工廠,台積電之前的建廠也在穩步推進。

今年五月,進駐嘉義科學園區的台積電CoWoS先進封裝廠正是動工,但在施工過程中挖到了疑似遺址,現依據文資法進行相關處理,外界關切該廠進展。但台灣方面表示,預計文資法相關清理工作將於今年10月完成,台積電嘉科先進封裝廠規劃明年第3季裝機不受影響。

目標是2025年每月達8萬片

根據先前規劃,台積電將在嘉義設2座CoWoS先進封裝廠,原計畫2028年量產。具體到工藝方面,據報導,這個廠主要以系統整合單晶片(SoIC)為主,台積電也較看好3D封裝,目前客戶包括晶片大廠超微(AMD)MI300外,至2026年客戶有望進一步提升。

而由於CoWoS需求旺盛,台積電還持續在全台尋覓適合的擴廠據點,早前規劃的銅鑼廠遭遇水土方面問題,而嘉義第一座廠則暫時卡關(挖到遺址),著眼長期龐大需求,驅使台積電需要提早尋求更多匹配的地點。先前媒體報導,雲林縣長張麗善指出,縣府已自主啟動“虎尾產業園區計畫”,在所在位置緊鄰中科虎尾園區,面積約29.75 公頃的情況下,全力爭取台積電落腳設廠。

但最近有消息指出,除近期購買的南科週遭土地,台積電建廠廠址決定捨棄雲林轉往屏東。台積電表示,設廠地點選擇有諸多考量因素,不排除任何可能性。在今年年初,甚至還有消息透露,晶圓代工龍頭台積電正考慮在日本建立先進封裝廠,這足以看到這項封裝技術的受歡迎程度。

美系法人預估,台積電的CoWoS月產能到年底可能超過3.2萬片,若加上協力廠商有機會逼近4萬片,到2025年底月產能約在7萬片上下。

摩根士丹利最新報告指出,台積電(TSM)由於終端客戶對AI的需求持續增長,決定提前擴大 CoWoS 產能。CoWoS 技術對 AI 與高效能計算至關重要,能有效提升運算效能。最關鍵的是,台積電的大客戶輝達(NVDA)的強烈需求促使其將原本 2026 年擴充至每月 8 萬片的目標提前到 2025 年底達成。為達此目標,台積電計劃將新購置的群創廠房(代號AP8)投入生產,以加速擴產進度。

台積電營運、先進封裝技術暨服務副總何軍在半導體展時也透露,預期CoWoS先進封裝產能在2022至2026年,年復合成長率達到50%以上,到2026年仍會持續擴產,以往3至5年蓋一個廠,現在已縮短到2年內就要蓋好,以滿足客戶需求。

DIGITIMES研究中心在八月中發表的《AI晶片特別報告》中指出,先進封裝成長力道更勝先進製程,在先進封裝領域,AI晶片高度仰賴台積電CoWoS封裝技術,因此台積電2023~2028年CoWoS產能擴充CAGR將超過50%,而2023~2028年晶圓代工產業5nm以下先進製程擴充年均復合成長率將達23%。

在產能大幅提升的同時,台積電也在更新換代公司的封裝技術,以求為客戶提供更多的支援。

封裝技術的持續升級

在最近為北美客戶舉辦的研討會上,台積電公佈了晶片封裝和尖端光學互連技術的雄心勃勃的路線圖。這些進步可能會在未來幾年掀起計算性能的浪潮。

首先是台積電自家的晶片封裝技術,台積電將其命名為“CoWoS”(晶圓基板上的晶片),它本質上是典型小晶片設計的增強版,其中多個較小的晶片內建到一個封裝中。但台積電正在將其提升到令人難以置信的規模和複雜性的新水準。

當前的 CoWoS 換代支援中介層(矽基層)的尺寸高達曝光中使用的典型光罩的 3.3 倍。但到 2026 年,台積電的“CoWoS_L”將使其尺寸增加到大約 5.5 倍的掩模尺寸,為更大的邏輯晶片和多達 12 個 HBM 記憶體堆疊留出空間。而僅僅一年後的 2027 年,CoWoS 將發展到令人瞠目結舌的 8 倍甚至更大。

我們談論的是內建封裝,面積達 6,864 平方公分,比一張信用卡大得多。這些 CoWoS 龐然大物可以整合四個堆疊邏輯晶片以及十幾個 HBM4 記憶體堆疊和額外的 I/O 晶片。

 

 

加入T客邦Facebook粉絲團

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

作者 36Kr
RTX 5090的功耗也來到了驚人的600W,相較於4090的450W,依然是33%的提升。1934fe5fecd05305d06c53bd0aa46aad

隨著一大波爆料的放出,老黃的RTX 50系顯示卡,似乎距離我們更近了!

最近,NVIDIA次世代旗艦級顯示卡RTX 5090,以及RTX5080的規格,又有新洩露了!相比上一代4090,RTX 5090的CUDA核心數來到了21760個,提升33%。顯卡記憶體採用全新的GDDR7架構,容量重磅升級至32GB、頻寬重回512 位元,均提升33%。

一波升級下來,RTX 5090的功耗也來到了驚人的600W,相較於4090的450W,依然是33%的提升。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

然而,RTX 5080的升級就乏善可陳了。

CUDA核心數為10752個,比4080提升11%,比4080 SUPER提升5%。

顯卡記憶體容量和頻寬均沒有提升,依然是16GB、256 bit。

功耗倒是達到了400W,提升了25%。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

下面,讓我們具體來看一下,目前已知的資訊都有哪些。

RTX 5090規格

首先是旗艦級的GeForce RTX 5090。

據Kopite7kimi透露,RTX 5090預計將採用PG144/145-SKU30 PCB設計,並搭載GB202-300-A1 GPU核心。

其中,5090將啟用總共192個SM(流式多處理器)中的170個,CUDA核心數為21760個,而不是全部的24,576個。

這意味著核心數量有11.4%的縮減,比例略高於RTX 4090相對於其完整AD102晶片的11.1%縮減。

值得注意的是,這種核心數量的縮減是高階GPU常見的做法,目的是為了最佳化良品率和性能。

視訊記憶體方面,RTX 5090更是展現出了驚人的性能——全新的32 GB GDDR7視訊記憶體,重回巔峰的512 bit位寬,以及高達1.792至2.00 TB/s的頻寬。

功耗方面,RTX 5090的TBP(總板卡功率)額定值將達到600W。

有趣的是,雖然TBP來到了600W,但NVIDIA很可能會在官方Founders Edition(創始人版)上,繼續沿用雙槽位散熱器設計。

這意味著相比前代產品,新一代顯示卡在散熱效率方面會有顯著提升。

據瞭解,Blackwell改採用的N4P工藝節點,比起上一代Ada改採用的N4隻有微小的升級。因此網友們紛紛猜測,這代創始版顯示卡很可能會是某種“液冷野獸”。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

RTX 5080規格

接下來,是再次喜提網友吐槽的xx80系列——RTX 5080。

RTX 5080顯示卡將基於PG144/147-SKU45 PCB設計,並採用GB203-400-A1 GPU晶片。

從命名不難看出,5080將使用完整的GB203 GPU晶片,擁有84個SM(流式多處理器)和10,752個CUDA核心。

別看數值不小,但與RTX 5090相比,直接就是一個腰斬(不到50%)。而此前RTX 4090和RTX 4080的差異為40%。

除此之外,RTX 5080的視訊記憶體組態也同樣減半——容量16 GB,位寬256 bit,預計視訊記憶體頻寬將在896 GB/s到1024 GB/s之間。

RTX 5080的TBP(總板卡功率)額定值將達到400W,比前代產品的功耗上限提高了25%。

綜上來看,RTX 5090和RTX 5080之間的整體性能差距將會非常顯著。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

網友:堪稱4080變4070 Ti的復刻

隨著規格的洩露,討論最為激烈的話題就是5090高達600W的功耗和5080令人失望的16 GB視訊記憶體規格了。

要知道,和RTX 4090差距還沒這麼大的4080,就已經是80系列產品中價值表現最差的之一了。直到“SUPER”版本推出之後,這個情況才略有改善。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

但RTX 5080被如此閹割或許也不完全是個壞事。

有網友表示,如果80和90之間留下的空間夠大,沒準能成功誘惑AMD重新殺入高階GPU市場。

還有一個24GB版本?

還別說,就在上述規格洩露不久,RTX 5080很快就有了新的爆料。

據知名硬體論壇Chiphell的著名成員Polymorph透露,NVIDIA可能會推出24 GB版本RTX 5080。

值得注意的是,Polymorph此前曾洩露過GA102“Ampere”GPU核心的首圖,揭示過RTX 40系列顯示卡的組態,並詳細介紹過RX 6000“RDNA 2”GPU的規格,因此這個爆料應該也具有較高的可信度。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

目前有兩種可能的方式來實現24 GBNVIDIAGeForce RTX 5080顯示卡。

第一種,也是最不可能的方式,是NVIDIA使用GB202 GPU核心,這將支援38位元記憶體匯流排和24 GB顯卡記憶體組態。

另一種更可能的路徑,就是使用GDDR7技術的3 GB顯卡記憶體模組了。

此前的2 GB模組可以實現32 GB和16 GB顯卡記憶體容量。但如果使用3 GB模組,RTX 5080就可以達到24 GB顯卡記憶體容量,同時保持相同的PCB設計、核心規格以及256位元記憶體匯流排組態。

不過,由於GDDR7採用了全新的架構,想要實現更高的記憶體速度和更大的容量,還需要等製造工藝達到足夠成熟的水平才行。

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

新卡已經送測?

相比這些規格參數,更令人激動的消息是——第一批RTX 50系列GPU,據稱已經被送往測試實驗室了!

最近,網友Harukaze5719在貨運清單中發現了幾種RTX 50 GPU組態,主要涉及16 GB RTX 5080型號:

699-1G144-0030-TS1(RTX 5090)

699-1G144-0050-TS1

699-1G144-0045-TS1(RTX 5080)

691-1G145-2030-TS1(RTX 5090)

699-1G147-0070-TS1

699-1G147-0050-TS1

699-1G147-0045-EB1(RTX 5080)

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

NVIDIA RTX 5090規格洩露:21760個CUDA核心、內建32GB顯卡記憶體、功耗達600W

不過,我們仍然無法確切地知道這些顯示卡會在何時面世。

畢竟,老黃沒有理由非得在2024年發佈RTX 50系列——它既沒有競爭對手,RTX 40系列的表現也依然強勁。

 

 

 

 

加入T客邦Facebook粉絲團

Google支付27億美元給新創公司Character.AI,只為了讓4年前負氣出走的AI大佬回來主導Gemini

作者 36Kr
科技公司為了招募到頂尖人才不惜花下重金。在這方面,Google已經讓其他公司望塵莫及。89ef631ac27c0703fc6f8903d60a366c

在AI時代,科技公司為了招募到頂尖人才不惜花下重金。在這方面,Google已經讓其他公司望塵莫及。

諾姆·沙澤爾(Noam Shazeer)在2000年加入Google,成為該公司最早的幾百名員工之一。沙澤爾因其在對話應用程式語言模型(LaMDA) 方面的工作,引發了AI熱潮而聞名,但Google後來以擔心安全和公平為由,拒絕發布他開發出來的聊天機器人Meena,沙澤爾2021年離開Google,自創Character.AI公司。

Character.AI 儘管擁有超過 2000 萬月活躍用戶,但這家新創公司在服務貨幣化和控制用戶行為方面面臨挑戰。

現在Google的Gemini正在與其它AI公司的產品競爭,正是用人之際。根據《華爾街日報》報導,Google向Character.AI開出一張約27億美元(約864億台幣)的支票,官方說法是這筆錢是為了獲得Character的技術授權,但條件之一是要沙澤爾同意回Google工作。

在Google內部,普遍認為讓沙澤爾回來才是Google同意支付這筆高昂許可費用的主要原因。

作為交易的一部分,沙澤爾從他持有的Character.AI股份中獲利數億美元。對於一位既沒有出售公司,也沒有讓公司上市的創始人來說,這筆收益頗為豐厚。這位48歲的工程師現在成為Google AI技術的三位領導者之一,負責為其最強大的AI聊天機器人Gemini開發下一個版本。

Shazeer 能否幫助 Google 奪回 AI 王冠?

不過,這筆交易也讓沙澤爾陷入了矽谷的一場爭論之中。「沙澤爾顯然是這個領域的傑出人才,但他真的比其他人優秀20倍嗎?」史丹佛大學AI實驗室主任克里斯托弗·曼寧(Christopher Manning)表示。

雖然沙澤爾重返Google對公司來說是一次重大勝利,但人們懷疑他的影響力是否足以克服Google面臨的挑戰。 Shazeer 在 Character.AI 的工作主要集中在利基市場的對話式人工智慧上,這可能與Google主導企業和消費者人工智慧產品的更廣泛野心並不完全一致。

沙澤爾的技術實力是不可否認的。他對聊天機器人的理解可能會為Google的人工智慧產品帶來有意義的進步,特別是在提高 Gemini 模型的功能方面。然而,人工智慧專家認為,Google的困境不僅僅是技術缺陷。可擴展性、策略性失誤以及比競爭對手更快地將研究商業化的能力等問題仍然是重大障礙。

此外,雖然沙澤爾對人工智慧的貢獻是革命性的,但市場格局已經改變了。 OpenAI 和 Anthropic 不僅發展速度更快,而且還獲得了更多投資和市場份額。沙澤爾的回歸雖然有價值,但可能不會成為遊戲規則改變者,特別是因為它面臨的競爭對手不僅在創新,而且正在重塑人工智慧產業。

 

 

加入T客邦Facebook粉絲團

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

作者 36Kr
AI美女佔領小紅書,卷翻真人女網紅2ea925bded8926bb2ede76577ea00410

先考考各位的眼力:下面的圖是真人還是 AI,你能分辨出來嗎? 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

答案是:AI,AI,全是AI! 

根據中國某AI社群中流出的一份群聊記錄,一位網友表示他用文生圖模型生成 AI 美女圖片,然後「用帳號矩陣管理軟體,養了1327個小紅書帳號,直接把小紅書給屠版了」。 

而且小紅書不僅識別不出來,還給他推流了……

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

01 驚豔的 FLUX 模型

群聊記錄裡的網友介紹,他所用的AI文生圖工具是 FLUX 。

FLUX是一款人工智慧圖像生成模型,在八月份已經在爆紅過了一波。

 

 

當時在 X(原Twitter)上熱議的,是網友製作的TEDx AI講師。

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

 

 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

以上圖片均為 FLUX 生成

FLUX 背後的主創團隊是來自 Stable Diffusion 原班人馬打造的黑森林實驗室(BlackForestLabs),2024年8月1日正式宣佈成立。 

核心成員包括3月宣佈從 Stability AI 出走的 Robin Rombach,是 Stable Diffusion 的兩個創始人之一。 

作為一款開源模型,FLUX 可以使用 ComfyUI 進行本地部署,快速搭建工作流,進行圖像生成。 此外,官方也提供了線上體驗的網址,可以點選下面連結自己試試: 

https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev 

AI熟女帳號很賺錢

不過,生成這麼逼真的人類圖片後,除了搞黃色,還能拿來幹嘛呢?這位網友開發了新思路:批次養成AI美女帳號,然後再賣給商家。

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

 

而網友在小紅書逛了一圈後,仔細一看,似乎不難發現很多疑似AI美女帳號。 而且這些帳號,多半都自稱自己已經40多歲,但是容貌卻看上去像是20歲。

比如下面這個小紅書帳號,聲稱自己41歲,但依然保持著年輕的美貌。 並在介紹中稱自己是河北石家莊人,畢業於清華大學。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

她的筆記平均有幾百人點讚,最高的一條達到了上萬點讚。但仔細觀察會發現,「她」的每條筆記妝造和笑容都是一樣的,幾乎沒有變化。 

有人翻到她早期發表的影片,有一股濃濃的AI味: 微笑很緩慢,眨眼只眨了一半,拍攝的機位也沒有過多變化。 而且「她」發表的影片都只有幾秒鐘,再長的沒有了,更像一張動圖而不是影片,非常符合目前AI生成影片的時間長度。 

即便如此,「她」的影片仍擁有近三千點讚與六百多的收藏,還有很多人在評論區驚呼“太美了”。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

在最新的筆記中,「她」開始帶貨,稱自己四十歲還不老,是因為吃了復合生物素和xxx護肝片。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

原來還能這麼玩的啊...... 

另一個小紅書帳號「柳嫣」,其面容與上面這個帳號酷似,不說,「她」每條筆記的妝造和面容也是一樣的,沒太多變化;也自稱是40歲的阿姨,通過努力保養才能變得這麼美。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

看來,似乎AI熟女的錢比較好賺?或是因為其它年齡層的女性喜歡的東西,可能目前就不是那麼適合AI帳號來表達?

還有個帳號「如煙大帝」,只發女生戴著口罩和穿絲襪的圖片,就這樣每條筆記也有百餘個點讚。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

評論區已經有人說是AI美腿了,但同樣有人在問絲襪連結: 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

真人美女越來越像AI,AI美女越來越像真人

這種利用人工智慧(AI)和深度學習技術,生成高度逼真但虛假的影片、圖像等內容的技術,被稱為“深度偽造”(Deepfake)。

如何辨別你在看到的美女,是真人而不是深度偽造的?

答案很有可能是:沒有辦法。

懂得如何寫提示詞的人,他們調教 FLUX 生成的圖片就很難分辨出真假。

而且,真實的女網紅們,都熟稔傳說中的「亞洲四大邪術」:日本的化妝術,韓國的整容術,泰國的變性術和中國的P圖術。

她們的照片,本身看起來就很AI。

比如下面這兩張照片,你能分辨哪張是真人哪張是AI嗎?

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

答案是,第一張是AI,第二張是真人。 

如果不是因為第二張的帳號裡分享了她的日常生活Vlog,素顏出鏡講她的一天怎麼化妝、去了哪裡和玩了什麼,還真的無法判別是真人還是AI。 

這是一個恐怖的現象:單從圖片上看, 真人美女越來越像AI,AI美女越來越像真人。

而這也是合乎邏輯的:如果模型用來訓練的資料本身就是小仙女們精心P過的照片,那生成的圖片自然也會越來越像原本的照片。 

至於影片,FLUX 背後的團隊 Black Forest Labs 已經宣佈即將推出文字生成影片模型。 

小紅書上40歲大媽看上去像18歲的「不老」秘密:並非比別人更努力、而是她們根本不是人

這意味著,他們未來可能將與 OpenAI 的 Sora、Runway 的 Gen-3 Alpha 等產生競爭。 以現在 AI 技術進步的速度,恐怕不需要多久,你我已經分辨不出真假了。 

 

加入T客邦Facebook粉絲團

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

作者 36Kr
AI、社區、帶貨 YouTube 平台要“變天”了C00246b5ce435779b612e550c2d2e7ff

作為全球最大的影片平台之一,YouTube 擁有超過 26 億使用者,差不多是地球三分之一人口的數量。它影響著全球流行文化,也創造了一個內容經濟生態系統,讓數百萬影片博主在上面分享數百億美元的內容收益。與此同時,面對各類串流媒體、短影片平台的競爭,YouTube 一直在研究、模仿各種功能,試圖讓使用者在 YouTube 上停留更多時間。

在紐約週三舉行的“Made on YouTube”大會上,YouTube 宣佈了一系列新功能,包括 AI 生成影片、粉絲社群、直播打賞等等,似乎要把Google的技術、以及海內外已經流行了好幾年的社群平台功能,通通融進 YouTube。

現在,為了永續和生存,Youtube 想做的,已經不止是一家影片平台。

Google AI深入Youtube

去年,YouTube 已經推出了 Dream Screen,可以讓創作者通過自然語言提示,在 YouTube Shorts 中生成影片背景。這僅僅只是開始。

YouTube 宣佈,今年晚些時候,要開始將Google DeepMind 最強大的 AI 影片生成模型 Veo 內建到 YouTube Shorts 的 Dream Screen 里。

在上,Google推出了 Veo 影片生成模型,與 OpenAI 的 Sora 以及 Pika、Runway 和 Irreverent Labs 等影片生成模型展開競爭。

有了 Veo,YouTube 創作者可以生成影片背景,或給 YouTube Shorts 生成六秒鐘的獨立影片短片。

其關鍵優勢之一是編輯和重混先前生成的素材的能力。當創作者選擇“建立”並輸入提示時,Dream Screen 將生成四張圖像。然後,他們選擇一張照片並將其轉化為影片。

據稱,這一新功能將幫助創作者為他們的影片新增過渡情境,從而實現更流暢的轉換並將整個故事串聯起來。例如,創作者可以在觀光影片的開頭加入紐約市天際線等情境,以增加更多背景資訊。

不過,值得注意的是,這些創作將使用  DeepMind 的 SynthID 技術進行水印標記,並新增明確的標籤,告知觀眾這是由AI 生成的。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

 

除了影片之外,YouTube 的創作者工具 YouTube Studio 也將在各個方面融入 AI。

YouTube 首席產品長表示,YouTube Studio 的靈感標籤頁將有所升級,加入一個由生成式 AI 驅動的“腦力激盪助手”,給創作者提供建議,包括影片創意、標題、縮圖和大綱,並匹配創作者的相應風格

據其稱,明年還將引入一個新快捷方式,讓創作者可以從熱門評論、其他影片或者自己的目錄等地方,直接前往靈感標籤頁。

YouTube Studio 中的評論區管理也升級成“社群中心”,新增了 AI 回覆建議功能,該功能類似於 Gmail 上的建議回覆,意圖是加深粉絲互動,據稱還可以匹配創作者的相應風格,以便創作者儘可能多地回覆觀眾,AI 還將幫創作者篩選好的評論。未來據說還要推出其他省時工具,包括」社群聚光燈“和”觀眾指標」等。

對於Google來說,在其影片平台 YouTube 中整合自己的 AI 工具,可以鼓勵創作者使用其 AI,而不是其他熱門平台,比如 OpenAI 的 ChatGPT。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

另外,YouTube 還推出了“自動配音工具”,該工具可以給影片生成不同語言的翻譯音軌,目前僅有一小部分創作者受邀測試,“未來幾個月”此功能將擴展到數十萬創作者,支援的語言數量也會擴大,從西班牙語和葡萄牙語到法語、義大利語等,意圖是讓創作者的內容找到全球受眾。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

據稱,YouTube 正在測試“表達性語音”功能,能夠將創作者的語氣、語調和環境聲音轉移到配音中,創造更自然的體驗。

請粉絲加入社群和影片“炒作”

為了提高使用者黏性、使用時間和參與感,YouTube 還專門推出了“社群”功能——每個頻道的創作者都可以建立一個社群,使用者粉絲不再只是觀眾,他們可以在裡面發佈自己的帖子

YouTube 的高層還把這一功能概念包裝了一下,將其稱為創作者頻道的“專屬Internet角落”,認為這一功能將是討論影片、分享粉絲內容、與志趣相投的人建立聯絡的充滿活力的“歸屬感的中心”。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

YouTube 的社群設計主管舉了一些受邀測試的前期社群案例。比如,在一個健身社群中,女性們可以分享她們的個人健身照片,記錄自己的進展,提出問題,建立一個支援性的社群,彼此鼓勵實現目標。

在一個烹飪社群中,創作者正在挑戰參與者嘗試新食譜,社群成員則以照片展示自己的作品,分享成功與失誤,並集思廣益討論創作者下一個影片應該烘焙什麼。

此外還有眾多遊戲社群。YouTube 這一功能雖然並不新鮮,但可能會被視為對其他社群平台的挑戰。

例如,Discord 在美國等地區是一個流行的社群聊天平台,廣泛用於遊戲、教育和社群活動。許多創作者在 YouTube 上發佈影片,但實際上卻選擇在其他平台與粉絲和觀眾互動,其中就包括 Discord。

有了 YouTube 的“社群”,使用者能直接在平台上互動,這樣一來,創作者或許就不再需要使用 Discord、WhatsApp、 subreddit 或 Facebook 群組了

但這一功能是否能如實現預期,尚待觀察。這些互動對一些創作者來說可能會加重負擔,最具風險的是複雜的稽核問題,因為要面臨大量粉絲在頻道中發佈自己的內容。

目前,YouTube 的“社群”功能並未全面鋪開,僅在移動裝置上的一小部分創作者及其粉絲進行測試,YouTube 計畫在今年與更多創作者進行測試,然後在 2025 年初擴展到更多頻道。

在社群功能之外,同樣是為了增加使用者參與感,又或者是為了換個法子變現,YouTube 還推出了“Hype”功能——這個詞有“大肆宣傳、炒作”的意思,粉絲可以點選這個新的按鈕來支持新人創作者,比普通的按讚更有份量,每個使用者每週只有三次免費“Hype”機會,多了要交錢,據稱一次可能是 2 美元,創作者也會獲得一筆獎金

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

YouTube 擁有海量創作者,但目前平台上出現的一個問題是,對於那些有專注粉絲群體但規模較小的創作者來說,吸引新的觀眾往往是一道難關,平台也不想簡單地調整演算法影響到大頻道。

鑑於此,獲得最多“Hype”點數的影片有個好處,就是會在 YouTube 設定的前 100 個影片排行榜上展示曝光,抵達更多的新觀眾,獲得的 Hype 越多,排名越高,並獲得特別徽章,“向所有人展示它們是粉絲的最愛”。

這一功能據稱還是為了扶持新人創作者,一個影片只有在上線的前 7 天,且頻道訂閱者少於 50 萬,才有被“Hype”的資格,而且頻道訂閱者越少,權重越高。

值得注意的一個資料是,300 萬開通收益的 YouTube 創作者中,有超過 100 萬都是“老博主”,他們早在十年之前就建立了自己的頻道,藉著強者恆強的演算法推薦機制,這些大頻道佔據著平台上的大部分流量,新人創作者要脫穎而出比以往更難。

“我們聽到了關於小頻道無法與擁有更多訂閱者的大頻道競爭上榜的擔憂。因此,我們新增了『新人創作者獎勵』,以幫助較小的創作者,平衡競爭環境。”YouTube 的產品經理稱。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

另外,YouTube 稱,給影片加 Hype 不會影響使用者的傳統的 YouTube 推薦演算法和搜尋結果。但 被 Hype 的影片會有自己的篩選分區和特定主題的排行榜,並將開始出現在推薦的新部分中。YouTube 還計畫為每個使用者個性化 Hype 部分。

更多賺錢管道:直播打賞、購物、電視

根據 YouTube 資料,截止 2024 年 8 月,平台上面已經有 300 萬個頻道開通了盈利,其中約有 70 萬個開通盈利的頻道是過去三年內創立的。

YouTube 的首席產品官聲稱,要給創作者“實現財務自由”提供持久的機會。據其披露,YouTube 的合作夥伴計畫支付的報酬“比任何其他創作者平台都要多”,具體資料是,在過去的三年中,YouTube 已向創作者、藝術家和媒體公司支付了 700 億美元

想在 YouTube 上賺錢的人並不少。目前 YouTube 創作者的變現方式包括廣告收益分成、粉絲資助、品牌交易等。YouTube 現在還在探索更多的變現花樣。

為了增加創作者的變現方式,YouTube 宣佈在美國地區的豎屏直播中推出“Jewels”禮物功能,讓觀眾用數字商品進行即時互動,表達興奮,簡言之就是直播打賞。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

與蝦皮合作擴展購物業務

與此同時,YouTube 還宣佈要擴大在該平台上購物的業務。據稱,目前有 25 萬創作者加入了 YouTube 購物聯盟計畫,可以理解為創作者開店或當買手,創作者可以與粉絲分享他們喜歡的產品,並行展他們的業務。

YouTube 購物聯盟計畫目前在美國和韓國地區提供,YouTube 稱將與 Shopee 展開合作,將該計畫擴展到印度尼西亞,並在“接下來的幾週內”擴展到泰國和越南

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

另外,為了在客廳的電視螢幕能與 Netflix、Max 和 Disney+ 等串流媒體平台對打,改進電視使用者的觀看體驗,YouTube 還計畫對電視應用進行改版,仿照一些串流媒體平台的介面設計,允許創作者將影片節目內容組織稱“季”和“集”,並增加電影式的“沉浸式預覽”,讓使用者導航到創作者的頁面時將自動播放等。

這樣的話,YouTube 創作者的電視頁面感覺就像 Netflix 或 Max 上的節目頁面一樣,這成為 YouTube 與主要串流媒體服務競爭的一個策略

此外,YouTube 還給TV上的應用程式推了一些小功能,包括從影片描述中的連結生成二維碼,目的是提高互動性,以及更顯眼的訂閱功能等。

據 YouTube 稱,其沉浸式預覽、二維碼連結和新的訂閱功能將於今年推出,而劇集和季節功能將從 2025 年開始逐步推出。

YouTube 老品牌要「變天」了:加入AI生成、自動配音功能,可以直播打賞、還要與蝦皮合作推廣帶貨購物

之所以重視電視體驗,是 YouTube 看到了資料:依靠電視獲得大部分收入的創作者數量同比增長了 30%。在過去三年中,在電視端獲得大部分觀看時間的創作者數量增加了 400% 以上。這歸功於 YouTube 電視應用程式的普及,以及廣告商願意為通過電視接觸消費者支付的高額費用。

另據尼爾森的資料,YouTube 今年 8 月份佔據了聯網電視裝置觀看量的 10.6%,而 Netflix 為 7.9%,Prime Video 為 3.1%(其他所有平台均低於 3%)。

YouTube 的電視業務,在海外已經非常龐大,使用者甚至會在電視上刷 YouTube Shorts 的短影片。在這種情境下,傳統的電視購物若要藉著串流媒體的電視應用復甦,也並非完全不可能。

從剛剛結束的 YouTube 發佈會來看,這個Google旗下的中長影片霸主,一方面將母公司的AI 能力加入到平台之中,借助大型語言模型持續降低影片創作門檻;另一方面,開闢 Hype 這樣抬高“粉絲權重”的方式為新人 UP 主打開上升通道;同時,在變現和粉絲營運上引入電商和群聊模式,試圖追趕對手,補齊此前的短板。

可以看出,YouTube 短期內的目標是補齊社群、即時通訊和電商能力,壓制對手;長期則加強 AI 這條暗線,為後續內容的持續爆發做準備。

 

 

加入T客邦Facebook粉絲團

烏克蘭民眾進口報廢特斯拉電動車,只為取出電池用來準備過冬

作者 36Kr
「一輛舊的特斯拉汽車,包括運費在內,將近1萬美元。你可以把它變成12組電池,還可以賣零件」29cca126717c4cc46dd410647da4d2fc

一輛電動車可以用來幹什麼?相信所有人的第一反應都是用來開。不過在如今的烏克蘭,電動車的作用似乎更多地重點在於前兩個字:「電動」。

電動車產業昔日在調侃電池在其供應鏈中的重要性時,常常會將電動汽車比作是裝有輪子的電池組。雖然這種說法在不少人看來略顯誇張,但今年以來持續飽受斷電困擾的烏克蘭人,眼下卻似乎真正做到了「眼中無車、唯有電池」……

在基輔郊區的一個小車庫,一群機械師近來正在對一輛破舊的特斯拉汽車進行拆卸。不過,這些人並沒有試圖去修好這輛車,而只是忙著拆卸出它的電池,希望用它來為當地的企業和家庭供電。

他們的工作——把一輛廢棄的特斯拉變成十幾台家用電池系統,是近來時常面臨停電問題的烏克蘭企業和家庭,絞盡腦汁所能想出的應對措施之一。

根據烏克蘭總統上月的說法,自去年冬季以來,俄羅斯對烏方能源設施的襲擊,已經摧毀了烏克蘭一半的發電能力。澤連斯基當時在柏林舉行的一場會議上稱,「(烏克蘭)已經有900萬千瓦發電能力被摧毀。去年冬天的用電峰值是1800萬千瓦。所以,現在其中一半(發電能力)不復存在了。」

嚴重的電力緊缺,已迫使烏克蘭電力公司在全國範圍內實施滾動停電,一些烏克蘭家庭和企業在一天中的停電事件甚至長達20小時。

大量企業被迫作出調整。在基輔各地,一旦停電,停放在商店和咖啡館外面的柴油發電機就會隆隆作響,首都的許多家庭也陸續開始將家用電器接入家中的充電電池系統中。

特斯拉報廢車的另類妙用

現年30歲的Oleksandr Bentsa,在這段電力緊張時期,就意識到他手頭有一個潛在的解決方案。

多年來,這位商人一直在美國的保險拍賣會上購買撞毀的特斯拉,並將它們進口到烏克蘭,由他的機械師們進行修復和轉售。而在今年春天烏克蘭國內停電現象日益嚴重之後,他開始意識到自己的生意有了新用途。Bentsa找到了能夠從事危險工作的電工,將回收的特斯拉電池改造成了多個可充電系統。

「一輛舊的特斯拉汽車,包括運費在內,將近1萬美元。你可以把它變成12組電池,還可以賣零件,」Bentsa表示。他將自己的品牌命名為「烏克蘭自主系統」(Ukrainian Autonomous Systems)。

據悉,這樣生產出來的每個系統電池容量為5千瓦時,足夠基輔一間普通公寓的照明和電氣裝置使用10小時——當然,不能使用那些特別耗能的電器,如空調。

Bentsa目前正以成本價將一些電池系統賣給軍隊,不過大多數客戶都是平民。過去兩個月,需求從幾乎為零一路飆升,Bentsa預計隨著冬季的出現,需求還會增加。

「我們現在看到的只是一小部分。到了冬天,問題會變得非常嚴重,」Bentsa稱。

 烏克蘭民眾進口報廢特斯拉電動車,只為取出電池用來準備過冬

電力危機恐持續

一些分析人士也表示,烏克蘭民眾在俄烏衝突真正結束前,很可能仍將持續面臨斷電困擾。

基輔智庫拉祖姆科夫中心(Razumkov Center)的能源專家Volodymyr Omelchenko表示,一些關鍵的核電和熱電機組預計將在下個月修復完成後重新上線,這將令停電情況有所緩解。上週的熱浪消退後,電網的壓力也將有所緩解。

但修復工作可能仍只能讓消費者的電力供應,恢復到每天保障至少12小時,而未來的戰事可能會對電力供應造成進一步的損害。

疲於應對能源危機,顯然也已經推高了烏克蘭全國企業的成本。對於一些企業來說,額外的能源成本使得本已處於懸崖邊緣的商業盈利模式變為了虧損。停電也導致部分物流中斷,消費者也因為冰箱時常無法使用,而減少了對易腐壞食品的購買。

在基輔,城市停電時交通訊號燈會熄滅,行人夜間過馬路時會舉起開著閃光燈的手機,以便司機能夠看到他們。餐館則制定了「停電菜單」,顯示停電時可以烹飪哪些菜餚。

基輔市議會議員兼市長顧問Dmytro Bilotserkovets表示,「當前的形勢很嚴峻。在電力緊張期間,燃油的公共汽車越來越多地取代無軌電車和有軌電車等電動公共交通工具。」他補充說,「現在最重要的是儘可能地刺激可再生能源的使用。」

 

 

加入T客邦Facebook粉絲團

傳小米也將推出自研手機處理器:採用台積電4nm製程、表現接近兩年前的驍龍8 Gen1

作者 36Kr
傳小米2025年推出自研手機SoC,採用台積電4nm工藝D687a0220037336a92bbe909df57d447

雖然小米自研晶片的傳言一直都有,而先前甚至有消息指小米由於高昂的成本,已經放棄自研手機處理器,但最新爆料顯示,這個項目還在進行中且快有結果了。

據中國的爆料人士@heyitsyogesh 稱,小米方面或許在2025年推出自研手機晶片,這顆SoC晶片預計是小米與紫光展銳共同研發。

據爆料人士@heyitsyogesh 稱,小米方面或許在2025年推出自研手機晶片,這顆SoC晶片預計是小米與紫光展銳共同研發的,包括一個Arm Cortex-X3超大核、三個Cortex-A715中核以及四個Cortex-A510小核的八核CPU組態,將採用台積電4nm N4P工藝節點製造;GPU方面,可能採用Imagination IMG CXT 48-1536。

傳小米也將推出自研手機處理器:採用台積電4nm製程、表現接近兩年前的驍龍8 Gen1

關於5G數據晶片方案,小米可能會選擇外掛聯發科或紫光展銳的5G數據晶片。不過鑑於供應鏈安全、成本控制,以及現任小米集團高級副總裁的曾學忠曾是紫光展銳CEO的經歷,選擇紫光展銳的5G數據晶片的可能性似乎略高一些。

預計新款SoC將有著驍龍8 Gen1等級的性能表現,大概是2-3年前旗艦晶片的水準。雖然與最新一代旗艦晶片存在代差,落後於2nm約三代左右(中間還隔著N3E、N3P),但台積電的4nm“N4P”工藝依然足夠先進,因為驍龍8 Gen 3正是採用了這項工藝。

爆料者並未說明這款晶片的型號名稱,但從以往的消息來看,可能是“玄戒”或沿用之前的“澎湃”。

自研晶片傳言沒停過

早在2017年,小米就推出了採用28nm工藝的自研澎湃S1晶片,4大核+4小核的設計,最高主頻2.2GHz。這款晶片成功應用於小米5C手機中,然而由於這款晶片由於孱弱的基帶能力(不支援聯通的3G、4G網路制式,也不支援電信的所有網路制式),並沒有在市場上獲得成功。

隨後,澎湃S2研發也遭遇了多次流片失敗,使得小米暫時放棄了手機SoC的研發,只是推出手機影像(澎湃C系列ISP)、電源管理(澎湃P系列PMIC)等相關晶片。

自研晶片是一項需要長期、大量資金及人力投入,且風險極高的複雜工程。小米CEO雷軍曾表示,做晶片10億人民幣只是起跑線,可能10年時間才有結果。這無疑是一場“九死一生”豪賭,但小米顯然已經做好了充分準備。

從市場定位來看,如果小米自研的5G晶片能夠成功上市並應用於小米或Redmi品牌中高階機型中,將有助於提升小米產品的競爭力並降低對高通、聯發科等外部晶片廠商的依賴。

一位高通高層此前曾暗示,即將推出的驍龍8 Gen 4比驍龍8 Gen 3更貴,而且高通可能會向其合作夥伴收取使用其下一代5G基帶的溢價。小米每年的智慧型手機出貨量約為1.5億台,面對這些避不開的費用,友商華為、蘋果和三星都採用了自研晶片的策略,小米也迫切需要採取行動來減少降低成本。

爆料者稱,預計這款自研處理器的出貨量可能並不會很高,但考慮到成本及供應鏈穩定性,小米選擇這一策略無疑是明智之舉。

此前7月份就曾有傳聞稱,小米旗下晶片設計子公司玄戒設計的手機SoC已經流片,基於4nm/5nm工藝。雖然爆料者稱小米可能在2025年推出這款晶片,但業內人士認為,中國國產手機SoC進入4nm的時間點,應該不會早於2026年。

還有一款無按鍵概念手機,內部代號朱雀

除了自研5G晶片外,小米還在研發一款代號為“朱雀”的無按鍵概念手機。這款概念手機預計將於2025年上半年推出,其機身側邊沒有任何物理按鍵,而是採用了手勢控制、邊緣壓敏或語音命令的組合來進行替代。這一設計不僅顛覆了傳統手機的操作方式,也為使用者帶來了更加便捷、智慧的互動體驗。

據悉,小米朱雀概念機將採用螢幕下鏡頭方案,並搭載驍龍8+ Gen4處理器的高頻版本。這意味著該機的發佈時間將大致確定在2025年6月之後。

在此之前,小米曾推出過採用環繞螢幕設計的小米MIX Alpha概念機,其設計十分驚豔,但最終沒有進行量產。

 

 

加入T客邦Facebook粉絲團

Google搜尋引入AI Overviews讓傳統網站陷入絕境:被迫共享資料,還是等死?

作者 36Kr
Google AI Overviews讓網站陷入絕境:共享資料,還是等死?Be2ff506e059c1dbdd5672be7147e763

Google已在其搜尋頁面頂端展示基於人工智慧生成的便捷答案:AI Overviews,直接幫用戶搜尋的內容摘要總結,這可能導致使用者無需點選原始內容來源網站,對於傳統網站來說,等於直接截斷了他們的流量。

Google AI Overviews:誰來為網站的內容買單?

然而,許多網站所有者表示,他們無法阻止Google的人工智慧對其內容進行摘要,因為Google用於生成這些人工智慧答案的網頁抓取工具與常規搜尋引擎的抓取工具相同。如果選擇遮蔽Google,也會妨礙網站被使用者發現。

Google在搜尋領域佔據主導地位,這為其在人工智慧領域的競爭帶來了顯著優勢。搜尋初創公司和出版商均認為,當前的競爭環境對它們不公平。出版商面臨嚴峻的抉擇:要麼提供內容支援人工智慧模型(這可能削弱其網站的重要性),要麼放棄Google搜尋這個主要流量來源。

新聞網站Talking Points Memo的出版人喬·拉加佐(Joe Ragazzo)指出:「這對相關企業而言,無異於生死攸關的抉擇。兩種選擇都不利:要麼退出競爭,立即面臨生存危機;要麼與Google合作,雖然暫時存活,但最終也難逃被淘汰的命運。」

Google表示,其搜尋結果頂部展示的AI Overviews摘要,是其持續提升資訊品質和為出版商及其他企業拓展機遇的長期戰略的一部分。

Google發言人在聲明中表示:「Google每天向全球網站輸送數十億次點選,我們致力於維護並深化這一長期的價值交換關係。通過AI Overviews,使用者體驗得到了提升,他們回到搜尋引擎的頻率更高,這為內容的發現創造了新的機遇。」

自創立以來,Google便通過Googlebot爬蟲抓取數以百萬計的網站內容,建構起龐大的全球網路索引。這一成就對試圖建立競爭性搜尋引擎的公司來說,形成了難以踰越的障礙,即便是像微軟這樣資金雄厚的企業也不例外。

隨著生成式人工智慧的興起,一波新的初創公司湧現,旨在通過人工智慧模型為使用者提供精煉答案的搜尋產品。聊天機器人的流行讓Google內部對其搜尋引擎的主導地位產生了前所未有的危機感。然而,這些初創公司在真正撼動Google業務之前,必須首先解決如何進行網頁抓取的難題,而這並不容易。

抓取網站成本高昂,包括金錢、計算資源和儲存空間。因此,許多出版商會通過設定檔案規定爬蟲訪問其網站的規則。Google和微軟必應通常能獲得較大的存取權,因為它們的搜尋引擎能夠為網站帶來顯著的流量。

然而,人工智慧初創企業Tako Inc.的首席執行長亞歷克斯·羅森伯格(Alex Rosenberg)表示,搜尋引擎初創公司在未能獲得市場關注前,無法承諾為網站帶來相應的流量,這促使它們開始與出版商達成協議,通過支付內容授權費用獲取內容。

羅森伯格說:「如今,許多科技公司為內容付費,以確保獲取競爭所需的資源,而Google則由於其特殊地位,無需這麼做。」

在媒體公司與人工智慧初創公司之間頻繁合作的背景下,Google始終態度鮮明地加以抵制。據知情人士透露,除了與Reddit達成的6000萬美元交易外,Google私下向出版商傳達了無意參與內容授權談判的立場。

出版商與搜尋引擎之間的博弈:內容授權、合作與衝突

在這些談判中,媒體公司處於劣勢地位,尤其是在今年Google推出AI Overviews後,該服務利用人工智慧在搜尋結果頂端提供簡潔答案,立即引發了出版商對流量影響的擔憂,但卻沒有明確的應對方案。

值得注意的是,Google在某些人工智慧產品上使用了獨立的爬蟲(如Gemini聊天機器人),但其主要爬蟲Googlebot仍同時服務於AI Overviews和常規搜尋,原因在於這兩者之間技術上密切相關。Google發言人解釋說,這一安排是為了統一管理,確保搜尋體驗的一致性和高效性。

該發言人還指出,Google搜尋結果頁面以多種形式顯示資訊,包括圖像和圖表。此外,出版商可以選擇阻止特定頁面或部分內容出現在AI Overviews中。然而,這一選擇可能伴隨風險,即這些內容也將從Google所有搜尋功能中消失,包括傳統的網頁連結列表。

由於大多數出版商的流量至少有一半來自搜尋引擎,他們往往不願輕易冒險削弱自身的網路影響力。

文創平台Raptive創新主管馬克·麥科勒姆(Marc McCollum)代表出版商和網紅指出,Google的立場未能充分考慮內容創作者面臨的重大風險,特別是那些依賴搜尋可見性為生的創作者。他警告說,選擇退出可能會無意中降低創作者的整體搜尋可見性,從而損害他們與受眾的聯絡和收入能力。

iFixit網站(提供消費電子產品線上維修指南)的首席執行長凱爾·維恩斯(Kyle Wiens)表示,與其他人工智慧公司相比,該網站與Google的關係更為“脆弱”。他強調:“我可以阻止Anthropic的ClaudeBot索引我們的網站而不影響業務,但若遮蔽Googlebot,我們將失去流量和客戶。”

Google與Reddit的交易不僅為Google的人工智慧模型提供了海量寶貴資料(來自Reddit使用者就小眾話題的深入討論),還通過增加Reddit等論壇在搜尋結果中的展示,顯著推動了Reddit的流量增長。Reddit發言人還表示,產品品質和載入速度的提升也對流量增長起到了積極作用。

據知情人士透露,搜尋初創公司Perplexity正與Reddit洽談內容授權事宜,但Google與Reddit的協議價格高得令初創公司難以匹敵。Google表示,與Reddit的合作不僅限於資料訓練,涵蓋了更廣泛的領域。Reddit方面對商業合作細節保持沉默。

面對此情此景,其他搜尋初創公司則發現獲取此類資料幾乎不可能。搜尋初創公司Kagi的創始人弗拉基米爾·普雷洛瓦茨(Vladimir Prelovac)坦言:「Reddit的報價足以耗盡我們20年的收入,因此我從未考慮過。」

不僅僅是小型初創公司面臨這種困境。Open AI最近推出的SearchGPT測試版雖然受到了廣泛關注,但許多知名網站(如亞馬遜、Goodreads、優衣庫)已遮蔽其GPT爬蟲,這可能會對OpenAI的搜尋業務構成挑戰。OpenAI表示,即使網站拒絕內容用於人工智慧訓練,這些內容仍可能出現在其搜尋結果中。

普雷洛瓦茨指出,Kagi一半以上的成本投入都用於網路爬蟲及其他資料來源。建構詳盡的網路索引是搜尋引擎的基礎,它為使用者提供詳細的Internet內容檢視。而對於那些旨在通過人工智慧直接回答使用者問題的公司來說,資料具有更重要的戰略意義。

普雷洛瓦茨說:「生成式人工智慧模型本身並不聰明,要提供高品質的輸出,必須依賴廣泛的搜尋索引。」

搜尋初創公司You.com的創始人理查德·索徹(Richard Socher)表示,robots.txt檔案無處不在,為爬蟲設定了使用指南,迫使初創公司做出複雜的決策。儘管這些檔案沒有法律約束力,但只要不涉及登錄或使用者驗證,理論上可以抓取公開資料。他強調:「我們在進行爬取時,儘量不對網站造成過度負擔。那些只允許Google抓取的robots.txt設定,本質上是在幫助Google的搜尋壟斷。」

由前Google員工創立的Neeva搜尋初創公司去年被Snowflake收購後,提出“爬蟲中立”的倡議,以降低初創公司建構搜尋索引的難度。鑑於法院已裁定Google壟斷了線上搜尋市場,美國司法部正在考慮採取補救措施,包括強制Google與競爭對手共享資料,甚至可能分拆該公司。

Google反壟斷案的進展及可能對搜尋市場的影響

其中一項備受關注的提案建議,要求Google分享其Googlebot收集的資料,或開放其著名的搜尋索引。歐盟的《數位市場法案》已經要求Google分享部分搜尋查詢資料。

對於iFixit的首席執行長維恩斯來說,Google在搜尋領域的主導地位是其人工智慧工作的核心優勢,也是反壟斷爭議的焦點。他建議將Google搜尋與其人工智慧業務分開,以緩解利益衝突。

搜尋引擎DuckDuckGo表示,隨著技術的變革,Google的搜尋索引在生成式人工智慧時代變得更加重要,這也加劇了反壟斷擔憂。其公共事務高級副總裁卡米爾·巴茲巴茲(Kamyl Bazbaz)直言,搜尋索引在當今技術變革中至關重要。

Talking Points Memo的出版人拉加佐認為,無論Google反壟斷案件的結果如何,出版商都應掌握自己的命運,減少對任何單一技術平台的過度依賴,包括Google。他補充說:「我們的信念是,你必須與讀者建立起真正的聯絡,這是打造能經得起不同時代考驗的出版物的關鍵。」

 

 

 

加入T客邦Facebook粉絲團

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

作者 36Kr
依照官方說法,除了Google的Gemini 1.5 Pro 外,其餘無論是 GPT-4o ,還是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下敗將 ” 。1851dde44226ec74ca305affff33f6aa

前段時間,大型語言模型競技場上,一位程式碼為 sus-column-r 的匿名模型橫空出世。沒人知道它師出何門,但在過去的一個月裡,它卻稱得上是過關斬將……累計一萬多人的投票,硬生生讓它擠進了排行榜前列。到現在,綜合能力已經和 5 月 13 號發的 GPT-4o ( API 版本 )並列第三了。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

看這勢頭,當時就有不少人猜測,這可能是 OpenAI 那個遲遲沒公佈的,神秘的「 草莓 Q* 」項目。

然而,前兩天這個困擾大夥兒很久的謎語,終於有答案了。但解開它的,不是 OpenAI ,而是經常被大家忽略,但也在搞 AI 的馬斯克。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

這個匿名的 sus-column-r 模型,其實就是 xAI 要推出的新模型 Grok2 ,現在已經上線付費會員版的 X 了。

在官方推出 Grok2 的部落格裡,明晃晃地展示了之前 sus-column-r 積累的戰績,甚至還做了對戰勝率表。

按照他們自個兒的說法,表上除了Google的Gemini 1.5 Pro 外,其餘無論是 GPT-4o ,還是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下敗將 ” 。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

當然了,其他的紙面成績, Grok2 答得也挺不錯。光從各個基準的資料來看,它的各項能力,都和市面上最先進的 AI 差不多,這一線大型語言模型的行列,也算是被 Grok 給擠進去了。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

不過一個模型好不好,光看這些資料也還不行,最重要的是,得看大夥們的實際使用體驗。

相較於上次的還只能文字開開玩笑的 Grok1.5 ,這次 Grok2 最明顯的一個升級,就是新增了圖片生成功能。不過,與其他家自己動手搞多模態 AI 不一樣,這次馬斯克倒挺罕見地選擇了和別人合作: FLUX.1 。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

但沒想到內建到 Grok2 裡面的 FLUX.1 ,還真撞出了一點不一樣的火花。

倒也不是說在性能上它一夜之間飆升了一大截。而是相較於市面上的其他圖片 AI , Grok2 在「尺度」上面,可以稱得上是一騎絕塵。

同樣是迪士尼公主的一個提示詞, Grok2 在尺度上就比其他模型要大膽的多。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

而且, Grok2 還能直接對著自己的老闆惡搞,比如這是一個愛吃甜品,吃到發胖的馬斯克。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

不過, Grok2 這麼肆無忌憚地惡搞各種公眾人物、卡通人物,風險肯定還是有的。

像是有網友生成瑪歐馬抽菸喝酒、觀望 “ 911 ” 事件的圖片,就已經有人督促任天堂起訴了。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

 

另外,按照官方給的資料,這次 Grok2 在數學這塊領域,也能算得上一絕。比如之前 Grok 做錯的過的一道求導的問題,再拿來給Grok2試試。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

結果馬斯克還真沒騙人,它把這道題給解決了。

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet,他把AI煉成啥樣了?

偷X資料、拿特斯拉顯卡所練成的AI

而把 Grok 練成現在的模樣,馬斯克在背後出得力可不止一星半點兒。

但有意思的是,馬斯克主打的,就是把自己其他公司的資源「乾坤大挪移」。

先是員工這塊兒, xAI 統共就只有 50 來個員工,其中有 11 個都是在特斯拉工作的,而且裡面還有 6 個是在 Autopilot 團隊工作的,是一點兒都不想避嫌。

據華爾街日報消息,甚至原本要給特斯拉用的 GPU ,也被馬斯克要求優先供應給 xAI ,還冠冕堂皇的說,特斯拉現在也沒地方用,放著也是放著。

偷完特斯拉的家,還不過癮,馬斯克把手也伸到了 X 上。

就在前兩天,科技媒體 Techcrunch 稱,為了 「悄悄」用使用者們的資料訓練 AI , X 在更新的時候,還默默把用戶的預設設定給改了,而且要關掉還得專門登錄網頁版……

不過總這麼偷家,難免會吃上官司。像是馬斯克和他的 X ,就被特斯拉的股東,還有好幾個國家的資料保護機構給起訴了。

而另外幾個資料保護機構,也把 X 告得暫停用使用者資料訓練 Grok 了。甚至 X 還有可能遭到 “ 4% 平台營業額 ” 的罰款。

但無論如何,在大型語言模型這塊兒,馬斯克的 Grok 和其他大型語言模型比,不管是圖片生成,還是其他基礎能力上, Grok2 都不算差,甚至還搞出了一點兒自己的特色。

據說, xAI 下一步會把 Grok 更深入地揉到 X 平台上面,而且還要再發一個多模態理解的預覽版 AI 。

馬斯克會把AI搞成什麼樣,還是值得期待的。

 

 

 

 

加入T客邦Facebook粉絲團

Excel 是過去幾十年最成功的軟體產品,而 AI 則是新的 Excel

作者 36Kr
Excel 是過去幾十年最成功的軟體產品。而 AI 則是新的 Excel。從 AI 應用拆解出來的每一個使用範例,都有可能成為一款 APP,進而催生 AI 的大解綁。F3d1828a122608cef9d59b5e5ebd93cb

Every 的創辦人暨 CEO Dan Shipper,近日在 Every 官網發表了一篇文章,他用 Excel 比擬 AI,闡述對於 AI 未來的看法。內容如下:

過去幾十年最具代表性的軟體產品是試算表。 

在 Excel 之前就已經有 VisiCalc 了,VisiCalc 試算表通常被稱為電腦的第一個殺手級應用。它改變了職業人士的工作方式,其作用重要到大家買電腦就是為了能使用它。20 世紀 80 年代,各家公司為了爭奪試算表的主導地位而展開了激烈競爭。IBM 的 Lotus-1-2-3 等新進入者取得了進展,1985 年,當微軟發表 Excel 時,VisiCalc 遭遇激烈競爭。隨著 20 世紀 90 年代 Windows 3.0 的發表,Excel 佔據了試算表市場的主導地位,並在此後一騎絕塵。 

Excel 這款產品很優秀,因為它對初學者來說很容易上手:你只需在儲存格輸入內容即可。但它之所以成為一款出色產品,還因為它功能強大:從複雜的財務建模到資料分析和視覺化,再到製作遊戲電玩,專家使用者可以用來做任何事情。 

Excel 最初是為從事財務和會計工作的商業使用者設計的,但它的多功能性使其成為一種無處不在的通用工具。它也成為創業想法的源泉。只需找到一個在 Excel 中手動操作流程的客戶,然後為他們開發一個 SaaS 應用程式即可。 

Stripe 的 Patrick McKenzie 曾這樣總結 Excel 的生成能力:「未被滿足的軟體需求我最喜歡的一個症狀是,只要看到一個 Excel 試算表在員工之間傳遞更新然後返回,SaaS 天使(投資人)就會展開翅膀。」 

風投家 Tomasz Tunguz 率先注意到,在過去 15 年當中,Excel 已被解綁成 Asana、Looker 以及 QuickBooks 等眾多其他應用程式。但這種解綁只有在 Excel 變得足夠普及,使用者知道自己想要一個專門的替代品時才有可能。為了實現這一點,Excel 需要得到進階使用者的廣泛採用,這些使用者開始將其用於原先設計時不受支援的小眾工作流。 

一旦建立起這些工作流,進階使用者就會意識到自己部分的工作流效率低下,或者缺少適合其使用案例的功能。他們覺得需要專門開發的工具——這就為 B2B SaaS 發展成為 3,270 億美元的市場提供了機會。 

就像 Excel 催生了 B2B SaaS 時代一樣,ChatGPT、Claude 與 Gemini 等通用聊天機器人應用將為新一代的電腦使用者催生出創業公司的新時代。人工智慧聊天機器人與 Excel 一樣,兼具易用性和強大功能。它們也正朝著通用的普及水準邁進——而且用不了多久。 

現如今,使用人工智慧的人越來越熟悉人工智慧型軟體的基本單元:提示、上下文視窗、少樣本學習以及多模態。他們將利用 ChatGPT 或 Claude 建立適合其細分市場的工作流。在這個過程中,他們會形成關於如何使這些工作流程更好、更簡單、更便宜、更快和更安全的想法。

這為將這些工作流解綁成完全獨立的應用創造機會。隨著大語言模型(LLM)的採用率不斷提高,初創公司的機會也隨之增加。 

我親眼目睹了這一切。大約一個月前,我們發表了 Spiral,這款人工智慧應用可以自動執行重複的創意工作,比方說發表 X 發文、LinkedIn 文章、創作標題與產品發表說明。它已經擁有超過 3500 名使用者,並且每天都在增長。 

本質上,Spiral 是一個提示構建器。後端用的是 Claude,因此從技術上講,在 Spiral 可以做的一切事情也可以在 Claude 上面做。 

但是 Claude 的聊天介面並不是為 Spiral 擅長的任務而設計的。在 Claude 裡,很難跟蹤需要輸入的複雜提示(進而可以獲得好的結果)。也很難向團隊分享你發現的提示。 

對於特定工作流來說 Spiral 是更好的介面:創意人員與商務人士希望將自己的內容翻譯成不同的媒介。但現在它之所以能流行起來,是因為人們已經習慣了一兩年來提示 ChatGPT 與 Claude 完成類似的任務。他們已經對專門打造的東西做好了準備。 

「套殼AI」一直是個貶義詞。其潛臺詞是,當大家可以用 ChatGPT 或 Claude 等聊天機器人獲得同意結果時,沒人會使用專門開發的 AI 工具。 

但事實恰恰相反。ChatGPT 和與 Claude 增加了對套殼的需求,因為大家會用它們來尋找通用工具無法適應的使用案例。 

事實上,相對於初創企業會被 ChatGPT 和 Claude 打壓,這些套殼工具更像是尋找創業想法的絕佳場所。 

如果你想在人工智慧時代創業,只需觀察你如何使用 ChatGPT 或 Claude即可。如果你在反覆做某件事,並且獲得的輸出令人印象深刻,那它自己就有可能成為一款應用。 

 

資料來源:Every

加入T客邦Facebook粉絲團

微軟曾提出免費讓蘋果用Bing取代Google作為預設搜尋引擎年省數十億美元,蘋果拒絕了

作者 36Kr
Google反壟斷案庭審細節披露:微軟提議必應免費用,蘋果拒絕了9e8144486e12cde6bb03d25668d76393

近期,美國聯邦法院對Google的反壟斷訴訟作出了裁決,認定Google通過與 蘋果等公司的預設搜尋引擎交易非法維持其壟斷地位。Google計畫對這一裁決提起上訴。目前,法院尚未明確如何糾正Google的壟斷行為,但存在一種可能性,即Google可能不再能夠通過支付費用成為蘋果裝置上的預設搜尋引擎。

在長達數週的審理過程中,現在很多細節已被披露。但法官在本次判決中特別總結了一些值得注意的片段:包括高層間尖銳的交鋒、內部尷尬的研究報告,以及Google為確保其在蘋果 Safari 瀏覽器中保持預設搜尋引擎地位而支付的數十億美元的詳細資訊。

蘋果認為微軟Bing不堪一擊

為了保持其在 Safari 瀏覽器中的默認搜尋引擎地位,Google每年需要向蘋果支付高額費用。蘋果服務業務高級副總裁埃迪・庫伊(Eddy Cue)在庭審中表示,市場上沒有其他具有實際意義的選擇。他明確表示:「沒有任何價格能讓微軟讓我們在 Safari 中預裝Bing,他們甚至提議免費提供Bing,甚至願意將整個Bing轉讓給我們。」 

對Google而言,這表明他們已經贏得了預設搜尋引擎的地位,儘管為此他們需要向蘋果支付大量資金。法官阿米特・梅塔(Amit Mehta)指出,這反映了市場的現實:Google是唯一真正的預設通用搜尋引擎(GSE)選擇。

需要注意的是,庫伊的看法並不等同於對Bing搜尋品質的全面否定。事實上,裁決中提到,在桌機版,Bing的搜尋品質與Google相當,但在行動端則稍遜一籌。

微軟曾提出免費讓蘋果用Bing取代Google作為預設搜尋引擎年省數十億美元,蘋果拒絕了

除了Google,財富 500 強公司也別無選擇

Google不僅與蘋果簽有合作合同,還與各手機電信商及Android裝置製造商有合約,使其成為Android裝置上的預設搜尋引擎。這些合同的實施依賴於Google對 Google Play 商店的控制。

不僅僅是埃迪・庫伊不願給Bing機會 —— 所有這些公司都公認Google是市場上的唯一選擇。這些財富 500 強公司在選擇預設搜尋引擎時實際上沒有其他選項。

梅塔法官寫道:「Google明白,對於預設搜尋引擎並沒有真正的競爭者,因為它知道其合作夥伴無力轉投其他平台。」他進一步指出,Google的合作夥伴一再得出結論,從財務角度考慮,更換預設的通用搜尋引擎或尋求在搜尋服務上更大的靈活性都是不可行的,因為這意味著要犧牲Google支付的數億乃至數十億美元的收入分成。

Google與蘋果的合同條款

據裁決檔案透露,為了在 Chrome 和 Safari 上獲得獨家及非獨家預設設定(即使用者下載後設為預設的搜尋引擎書籤),Google向蘋果支付了一定比例的淨廣告收入,2022 年這一支付金額達到了 200 億美元,幾乎是 2020 年的兩倍,當時的支付金額佔到了蘋果營業利潤的 17.5%。

Google和蘋果的現行合同始於 2016 年,雙方的合作關係可以追溯得更早。那一年,蘋果推出了 Suggestions 功能,即當使用者在 Spotlight 中輸入時,系統會推薦相關網站,這與Google搜尋有所不同。這一新功能對Google產生了顯著影響。Google的一項分析估計,由於蘋果 Suggestions 的推出,Safari 的搜尋流量損失了 10-15%,而 iOS Safari 的廣告收入也因此減少了 4-10%。

為了應對這一變化,2016 年的新合同特別規定了蘋果實施 Safari 預設設定的方式必須與以往實施方式大體相似,以此限制蘋果在 Suggestions 功能上的進一步擴展,防止進一步的流量流失。

如今,就 iPhone 而言,Google幾乎佔據了 95% 的通用搜尋查詢比例。

2016 年的合同條款顯然對雙方都有好處。2021 年,Google和蘋果決定將協議延長至 2026 年。值得注意的是,蘋果有權“單方面將協議延長兩年”,如果雙方都同意,還可以將合同進一步延長至 2031 年。合同還規定,Google和蘋果必須“在應對監管行動時(如本案中的 DOJ 反壟斷訴訟)保衛本協議”。

蘋果如何才能挑戰Google?

根據梅塔法官的觀點,Google支付給蘋果的費用不僅是為了阻止蘋果挑戰其搜尋霸主地位,而且對於蘋果來說,想要進入這一領域幾乎是不可能的。

庭審中披露的雙方內部估算顯示,蘋果單是營運一個搜尋引擎每年的成本就高達 60 億美元,這還不包括它已經在搜尋功能上的開發投入。而Google在 2020 年底的評估顯示,蘋果如果要建立一個能與Google競爭的搜尋引擎,大約需要投資 200 億美元來複製Google專用於搜尋的技術基礎設施。

TikTok、亞馬遜和 Meta 並非Google搜尋的競爭對手

美國訴Google案明確區分了通用搜尋引擎(GSE)與專業垂直提供商(SVP)。雖然使用了大量技術術語,但其核心概念實際上非常簡單。GSE 是大家熟知的搜尋引擎,如Google、Bing、DuckDuckGo 等。

網路上還有成千上萬的小型“搜尋”功能,有時候它們的使用方式與Google搜尋類似,例如搜尋特定目的地的廉價航班或購買一條黑色喇叭褲。儘管如此,Booking.com 和 Amazon.com 並不會為全球網路提供編制索引。

社群媒體平台上的小型搜尋欄,如 TikTok,其運作方式略有不同,至少在使用者行為上如此,而且Google是否將某些公司視為競爭威脅也有所不同。2021 年,Google對“年輕使用者”進行了研究,發現“每天使用 TikTok 的 18 至 24 歲的‘Z 世代’使用者中,63% 的人報告說他們使用 TikTok 作為搜尋引擎”。

微軟曾提出免費讓蘋果用Bing取代Google作為預設搜尋引擎年省數十億美元,蘋果拒絕了

然而,梅塔法官指出,社群媒體平台是獨特的,它們是內容的圍牆花園。更重要的是,幾乎沒有證據表明它們真的與 GSE 競爭搜尋查詢。他表示,TikTok 的研究並沒有探討該平台的搜尋品質結果是否能與Google的競爭,僅僅因為年輕人喜歡 TikTok,並不意味著它就與Google搜尋處於相同的相關市場。TikTok 不是唯一的社群平台,他說,一項研究表明,Facebook 的使用與Google搜尋使用的增加有關。

對於梅塔來說,在進行反壟斷分析時,Z 世代的網路習慣並不是相關資訊。

「想像一下,如果Google的搜尋品質大幅下降,無論是故意還是由於疏忽,社群媒體平台或高級管理層是否能夠轉移資源,推出一款類似 GSE 的產品,從而吸引大量不滿意的Google使用者?答案顯然是不行。」即使是像亞馬遜或 Meta 這樣的巨頭,要填補市場空缺也需要非凡的成本和開支。

什麼是 AI 搜尋革命?

也許 AI 搜尋是未來的方向,但至少就反壟斷法而言,這一未來還未到來。

「AI 可能有一天會根本改變搜尋,但不會很快發生,」法官寫道。此外,他指出,「目前,AI 還不能替代搜尋的基本建構塊,包括網路爬蟲、索引和排名。」

他還發現,實際上,生成型 AI 還沒有(至少目前還沒有)消除或顯著減少提供高品質搜尋結果所需的使用者資料。判決的事實發現引用了 Neeva 的聯合創始人斯里德哈・拉馬斯瓦米(Sridhar Ramaswamy)的話,他說:「在給定上下文中找到與特定查詢最相關的頁面的中間問題仍然極大地受益於查詢點選資訊。絕對不是 AI 模型消除了這種需求或取代了這種需求。」

換句話說,當你搜尋「高爾夫短褲」時,你不僅會得到(希望是)與高爾夫短褲相關的結果 —— Google或多或少會自動接收到你認為相關結果的重要資訊,這取決於你最終點選了哪些頁面。AI 聊天機器人沒有這種反饋循環。

判決還引用了Google搜尋副總裁潘杜・納亞克(Pandu Nayak)的觀點,他說對Google來說至關重要的是繼續「擁有一個 [它] 能夠理解的基礎設施」—— 即傳統的排名系統。納亞克說,「我們沒有將我們的排名完全交給這些系統。我們仍然在控制發生的事情,並且能夠理解這些事情。」

只有壟斷者才會這麼做

2020 年,Google進行了一項研究,試圖瞭解如果「大幅降低其搜尋產品的品質」會對其底線產生什麼影響。結論是,即使公司故意惡化搜尋服務,來自搜尋的收入也將保持穩定。

法官寫道:「Google在不擔心使用者可能轉向其他地方的情況下更改產品,這是只有具有壟斷力量的公司才能做的事。」

從根本上說,反壟斷監管是建立在競爭對所有人 —— 市場、公司本身,尤其是普通消費者 —— 都有好處這一理念上的。儘管如此,在網路時代,「消費者損害」是否仍應作為定義壟斷行為的標準,這一點仍有爭議。但美國訴Google一案表明,即使是過去 20 年中最具創新力的公司之一也可能以傳統的方式損害消費者利益 —— 通過排擠競爭對手,它可以提供越來越差的產品,但仍然能賺取同樣多的錢。

 

 

加入T客邦Facebook粉絲團

電腦也許能擁有超級智慧,但產生不了意識

作者 36Kr
如果意識才是根本,物質只是意識的附帶現象會怎樣?28bf81007ec245444973d62466816653

生成式人工智慧最近的「超人」表現讓人憧憬機器也會產生意識。但有人出來潑冷水,靠增加指數級的運算資源只能極大地改善模擬,但卻永遠無法到達彼岸。本文主要探討了為什麼電腦無法獲得意識,闡述了科學的局限性、哲學與科學的區別、大腦與意識的關係,以及人工智慧與連接主義的局限。文章來自編譯。

人類已經將自身由細胞組成的生物體變成了完全不同的東西。但有一點令人困惑,那就是現代神經科學的進步與影響如何引導其從業者將人性的奇跡塞進大腦,以及電腦科學家如何進一步將大腦轉化成矽電路的邏輯門。 

由於人類以感覺為「輸入」,以言語和行動為「輸出」,這已經變成了人工智慧的信條,也就是令人信服地模仿人類的輸入輸出行為就相當於讓電腦真正具備人類特質。 

——阿里‧舒爾曼(Ari Schulman)

科學家們之所以能逃脫這種形而上學式謀殺的懲罰,是因為他們開發的技術具有極高的實用性。(Tallis 2014。)但令人驚訝的是,一群哲學家卻屈服於神經科學的光環,並向那些還原論者伸出了援助之手。 

娛樂媒體通過《雲端情人》以及《人造意識》等電影,將這種愚蠢的行為變成了未來的可能性。 

本文話題涉及到當下很火的從生物學到電腦偽科學的「神經」智慧時尚,同時還回答了我之前一篇談人工智慧與意識的文章許多問題與有效批評。 

在1998 年的一場討論意識的會議之後,研究意識的先驅神經科學家克里斯多福‧科奇(Christopher Koch)跟心靈哲學家大衛‧查爾默斯 (David Chalmers)打賭說, 25 年內,人們會發現大腦當中意識的神經關聯性。 

得分:哲學家 1,科學家 0。

科奇還沒在大腦中找到意識的神經指標。2023 年,查默斯被宣布為獲勝者,獎品是一箱葡萄牙的優質葡萄酒。 

生成式人工智慧以及一眾GPT的成功激發了人們對通用人工智慧 (AGI) 即將到來以及人工智慧可擁有意識的期待。19 位科學家最近發表的一篇論文進一步指出:「開發出滿足這些指標(意識)的人工智慧系統已無明顯的技術障礙。」 

毫無疑問,我們可以製造智慧型機器。可是,我們能製造出有意識的機器的假設的前提,是基於一系列關於科學、大腦以及思維的錯誤假設。 

科學及其局限性

意識問題

2005 年,《科學》雜誌將意識這個「難題」評為科學界第二重要的未解問題。難就難在解釋事物是如何產生主觀體驗的。大腦這樣的物質系統如何產生意識?如何通過神經活動模式區分香草與薰衣草的氣味?大腦作為一個物質物件,如何創造出非物質的精髓,比如價值觀、目的、意義、感覺或思想? 

儘管神經科學取得了令人矚目的進步,但它沒法回答這些問題——一個也回答不了。 

這個問題很難解決,它源於我們對意識的理解。雖然意識機器的可能性不能被斷然否決,但羅素的茶壺假說飛行麵條怪物假說也不能被斷然否決。這兩個假說在邏輯上都是合理的。但問題不在於意識機器的論證在邏輯上是否一致,而在於它是不是一個值得接受的有效假說。 

神經科學家堅信,解決與意識相關的簡單問題會讓我們朝著一個方向前進,也就是大腦處理結構與意識體驗結構之間會存在越來越緊密的對應關係。不過,希望神經活動與內在體驗之間對應關係更緊密就能解決難題,就像相信只要走得足夠遠,你就能走到地平線一樣。 

傳統意義的「科學」意識理論不存在,因為科學只能描述和預測自然的行為方式,而不能描述和預測自然是什麼。後者的研究屬於哲學領域,或者更確切地說,屬於形而上學領域。伯特蘭‧羅素 (Bertrand Russell) 早在一個世紀前就得出了這一結論 (Russell 2009)。 

科學解釋事物的運作方式,而哲學則尋求對事物意義的理解。科學研究事實,而哲學探究事實的意義。 

量子力學是物理學當中一門非常成功的學科,其數學以堅如磐石的精度描述了量子現實。然而,量子現實意味著什麼則完全是另一回事。量子物體怎麼能既是粒子又是波?意識在測量過程中會導致波函數坍縮嗎?這個學科的正統觀念幾十年來一直在壓制這類問題,讓追求這一道路的物理學家的職業生涯陷入了死胡同。量子物理學家會告誡人們:「閉嘴,算你的東西就行了!」 

科學把所有現實都簡化為量子、數位或計量單位。它處理的是外部事物,即可以用感官及其延伸感知的現實經驗領域。意識對於科學家來說是一個難以捉摸的概念,因為它完全是主觀的,無法簡化為客觀對應物。 

試圖用定量方法解決意識的難題,就像試圖透過看螢幕播放的電影來弄清楚前者是如何製造出來的。 

解釋(Explanation)與詮釋(Interpretation)

對於《李爾王》的文字,科學能解釋的是其定量維度:紙張的密度和重量、標牌墨水的化學成分、頁數等等。這些是你可以透過經驗觀察或瞭解到的關於文字的東西。然而,要理解《李爾王》的含義,我們需要學習一種語言及其符號,然後才能與他人進行多數人都能理解的溝通,進而著手進行。 

解讀並非只是主觀的隨性而發;《李爾王》講述的並不是戰爭的輕浮。詮釋有好有壞。而這些詮釋性理解與經驗解釋同樣重要,有時候甚至更加重要。 

另一個例子是談話療法,或心理療法,這是一段解釋性的奧德賽,展示了解釋如何影響幸福感和人類能動性。你不會從腦電波、皮質醇、血清素以及多巴胺水準的角度來解釋你的焦慮,而是從焦慮本身的第一人稱體驗(或感受性)的角度來解釋:疏離感、迷失方向、不適以及想得太多什麼的。跟知識相反,這些都是只有通過主體間語境才能理解的現象體驗。 

任何工具都不能直接觀察理性、價值觀、思想或情感。亞歷山大‧林克萊特(Alexander Linklater)說得最為精到: 

值得一提的是,儘管 fMRI 掃描非常出色,但神經科醫生仍可以透過與患者相處來多瞭解心理功能。

換句話說,透過對話來理解含義和背景,進而理解患者的體驗。

物質是否能產生感受性或主觀體驗這個問題本身沒法靠經驗判斷,也不屬於科學範疇。換句話說,物質產生感受性這種看法在科學上毫無根據:它是一種哲學(形而上學)學說。解決這一難題的所有嘗試都失敗了,它仍然頑固地成為形而上學唯物主義教派的教條主義者眼中的異類。 

但,我們依然不缺乏嘗試。 

方法之一是無解方案(non-solution):由於我們大腦的構造方式,我們永遠無法解決難題。這是哲學之愚。這種方法有什麼意義?如果你不想瞭解周圍的世界,為什麼要研究哲學? 

另一種是用消除唯物主義的形式來解釋意識,這種激進的主張認為意識是虛幻的;換句話說,心理狀態錯誤地認為自己並不存在。支持這種看似荒謬的、自相矛盾的觀點,這就是哥德式的悖論(Kastrup 2015)。你都不用動太多腦子就能看出這些哲學家們是怎麼推翻自己的論點的:如果我們不能相信自己的心智告訴我們自己是有意識的話,那麼為什麼要相信同一個心智告訴我們自己沒有意識呢?如果意識是一種幻覺,那麼誰或什麼在產生幻覺?這讓你想知道這種幻覺是如何超脫在意識之外產生的。 

第三個方法是現代泛心論,這是物理主義的一種更精緻、更複雜的形式,它認為萬物都有意識:動物、樹木、岩石,甚至亞原子粒子都有。 

他們試圖用更基本的意識形式來解釋動物和人類的意識:基本物質實體的意識,比如夸克和電子。

泛心論認為,當原子及其基本的「意識」部分聚集在一起形成複雜的聚合體時,這些小小的部分就會創造出「某種東西」,可以產生生命的意義、鹽的味道或愛的感覺。但是,這個難題仍然是個謎,因為它將感受性推向物質的更基本層面(基本粒子),但沒法解釋這些聚合體如何導致主觀體驗。 

有個老笑話可以搬過來用:意識在實踐上行得通,但在理論上卻行不通。 

心智是一台機器嗎?

從根本上來說,心智是一種句式的運算設備,它從感覺感測器那裡接收句子作為輸入,對其進行邏輯運算,並輸出其他句子。(Churchland,1989)

我們發現,行動源自我們的感知,而我們的感知是由大腦活動構建的……我們的行動完全是機械式的……我們是可程式化設計的機器,我們得像把地球是圓當作理所當然一樣接受這一點。 (Carter,2010)

把神經哲學當作幌子的科學主義,是服務於認知科學的形而上學,彼得‧溫奇幾十年前批評這種哲學變成了「助手」,只是作為科學的工具,用來消除語言混淆,為科學解釋鋪平道路。用約翰‧洛克的話來說:「掃一下地,清除一些妨礙知識獲取的垃圾。」 

於是,語言就成為充分表達事物和描述事物作用的工具。 

如今,我們竟將「who」轉化為「what」,將「我」分解為「它們」的集合。探尋人性真相的旅程,演變成了將萬物,包括我們自身,還原為單純物質的過程。在神經科學的魅惑之下,語言——容我說得直白些——遭受了一次精神上的腦葉切除。我們的表達,曾經豐富多彩,如今卻變得貧瘠單調,仿佛失去了描繪人性複雜性的能力。 

雷蒙德‧塔利斯(Raymond Tallis)將這種手法稱為「轉移修飾語思維」。用維根斯坦的話說,這導致語言「休假去了」——也就是脫離了它本該有的嚴謹與準確。,正是建立在這種概念轉移之上。這種偷樑換柱正是塔利斯所謂的「神經神話學」的核心。 

哲學家們把時間花在對概念的思考上。為什麼?認知科學的概念大多都很好。我們需要的是繼續發現事實。

大腦不會產生意識

把相關性、原因與身份混為一談

生物主義和神經哲學對人類在自然界地位的認識是錯誤的,因為它們將相關性與因果關係跟身份混為一談,同時將心智、生物以及物質置放在同一抽象層面。 

功能正常的大腦是體驗的必要條件,但並非充分條件。主觀體驗與神經活動模式的相關性並不能確定大腦產生意識的因果關係。( Papinaeu,2001)。雖然主觀體驗具有客觀的神經相關性,但科學只能得出這一結論。消防員在某個地點的存在可以與火災相關聯,但火災的原因無法從這種相關性中推斷出來。 

神經放電的感知相關性是否等同於感知的體驗?對紅色的體驗與其神經成像相關性的知識並不相同。火災現場的消防員並不等同於他們被派往要撲滅的火災。此外,如果神經或神經衝動被認為會引起感受性或意識,那麼它們就不可能彼此等同。如果 A 與 B 等同,A 就不能導致 B,反之亦然。 

只有一神論的上帝才能做到這樣的壯舉。 

妖言惑眾正在肆虐。 

神經神話學誤導了我們,讓我們自認為自己知道和理解哈很多。我會舉兩個例子。 

術語按照可操作的方式來定義。然後,在揮手之間,用一連串未經審慎檢驗的隱喻,大腦與心智之間的界限就這樣被輕易抹去了。 

信息

克勞德‧夏農開創性的資訊理論是通訊與電腦科學的基礎,該理論將資訊單位定義為「bit(位元)」,表示在兩個可能性一樣的備選中做出的選擇。資訊內容用消息的熵或不確定性來衡量:不確定性越大,資訊越多。因此,拋硬幣是高熵(資訊),因為結果不確定,概率為 50/50。 

這個資訊工程定義要想行得通,必須摒棄掉任何意義的概念。用夏農的話來說: 

通訊的語義與工程問題無關。

然後,理論將神經系統的功能視為一個傳輸系統,並把大腦概念化成一個處理和存放裝置,這只是邁出了一小步。 

衡量資訊的方法變成了資訊的定義,無視了資訊對接收者來說信息量有多大(是不是很有趣、很激動人心、很令人愉悅或令人震驚)。但是,從對資訊的一般理解當中剔除掉意義(資訊的詞源來自拉丁語 informare ,意思是「賦予一個東西形式、形狀或特徵」),這就忽略了對理解的要求。 

所以,電腦沒法思考或理解;它做的只是根據一組規則(演算法)交換符號。電腦指令集決定了符號與數位如何相互交換。 

哲學家約翰‧塞爾(John Searle)提出的中文房間思想實驗駁斥了圖靈測試(衡量機器智慧是否與人類智慧相當的指標)以及把心智(mnd)等同為資訊處理系統的概念。類比如下: 

把一個不懂中文的人放進一個封閉的空間裡。這個人透過輸入槽接收「輸入」,也就是漢字,然後根據一套英語規則操縱這些符號,並「輸出」看似經過深思熟慮的漢字答案。在外面的觀察者看來,房間似乎能聽懂中文。可是裡面的人只是按照規則操作,其實並不理解任何的符號。 

電腦以及現代基於 GPT 的人工智慧系統看似能理解語言,但其實不然。 

句法(結構、形式、規則以及詞語排列)不能等同語義(意義與解釋)。句法正確的句子,可能邏輯一致但毫無意義。 

理解意義跟基於規則的符號操作不一樣,因為符號還沒被解釋。中文房間想這樣一種觀點發起挑戰:即經過適當程式設計的電腦可以變得聰明,像人類一樣理解事物。這意味著通過圖靈測試未必就意味著具備了真正的理解或智慧。 

脫離語義的資訊也讓泛心論哲學家認為資訊以及進而的體驗無處不在。門也攜帶資訊,因為門的關閉狀態為 1,打開狀態為 0。 

岩石也能有訊息狀態——比方說,膨脹和收縮時——甚至從電子的不同狀態也能找到訊息狀態。因此,會有與岩石或電子相關的體驗。(Chalmers,1997 年)。

如果岩石有意識,那大腦也有意識,這一點毋庸置疑。心智則取決於大腦當中資訊位元的「功能組織」。可是,這種功能組織如何導致感受性呢……沒人知道。 

記憶

電腦有記憶體,用來儲存和處理資訊。可是,神經科學尚未找到大腦中記憶「檔案」的位置或「位址」,甚至連這種「檔案」是否存在都不知道。 

行為主義心理學家卡爾·萊士利 (Karl Lashley) 試過為老鼠製造腦損傷,想確定記憶與學習的不同位置。在給經過迷宮導航訓練的老鼠製造腦損傷後,他觀察到老鼠的表現並未受到影響。他得出結論,「記憶」沒有獨立的位址,而是遍佈整個大腦。 

根據他的學生、神經學家唐納‧赫布提出的理論,記憶的神經基礎是形成「細胞集群」,也就是體現被記住的體驗的細胞集合(神經元一起放電、被連接在一起),以及神經細胞之間突觸的選擇性刺激或抑制。在赫布看來,這種變化只是局部變化,而不是整個大腦的變化。 

局部記憶與分散式記憶、原子記憶與格式塔記憶理論:說道大腦中記憶的位置,神經科學仍然沒有定論: 

我們已經發現記憶形成的某些神經關聯,即伴隨著記憶出現的某些大腦活動,但尚未發現資訊本身儲存在哪裡。(Kastrup,2015) 

聯結主義

那能不能透過模擬神經模式來對大腦建模然後創造出心智呢? 

聯結主義這種運算形式是 GPT 以及 LLM (大語言模型)的基礎,為經典的認為思維類似於處理符號語言的數位電腦的認知科學提供了一種替代方案。大腦似乎不按規則運作,沒有處理單元,訊息也不存在於檔案或位址之中。聯結主義將大腦類比成分散式結構當中大量互連的系統,讓模擬神經元之間的連接因為學習、訓練或「體驗」而發生變化。 

算力的迅猛發展讓物理學和非線性數學的自組織思想被重新發現,還讓神經生物學家得以瞭解大腦對損傷的恢復能力以及認知的靈活性。 

與(假設大腦通過處理符號進行運算的)認知運算理論不同,聯結主義的前提是運算是從大量簡單元件或模擬神經元的連接層面開始的,這些元件或神經元會動態連接並「自我組織」。這種大型人工神經網路在模式辨識、分類以及翻譯等一系列認知能力方面取得了驚人的成功。 

意義並不存在於構成系統的人工神經元之中,而是「存在於從許多此類成分的相互作用所產生的複雜活動模式之中」(Varela 2016)。我會在後面詳細闡述複雜性、湧現性以及模式等術語。

 

生成式人工智慧的驚人進步引發了人們對聯結主義及其最新形式,也就是深度學習的濃厚興趣。人工智慧的新興特性與符號運算有何關聯,或者符號規律如何從複雜模式中「湧現」,這些問題是當今人工智慧研究最熱門的領域之一,但目前還未得到很好的理解。 

可是,這個問題是有誤導性的。從複雜模式湧現出規律是一個數學過程,而不是現象學意義或經驗意義上的過程。通過 GPT 和 LLM 進行的神經網路類比沒法理解輸入的人類符號,也沒法理解它生成的輸出。它所做的是通過一系列數學和幾何演算法將問題轉化為答案。 

所以GPT(Generative Pre-training Transformer)才叫GPT,以人類資料作為輸入,以人類解釋的輸出進行訓練。 

人工神經網路無疑將推動機器智慧的發展。這些系統會不會產生意識或體驗到像人工神經元系統一樣的感覺則完全是另一回事。 

有人曾希望,只要處理能力和複雜性足夠,電腦系統就能「躍升」到產生意識的地步,但這個錯誤的希望在這個難題上仍然會破滅,因為地圖不是領土。 

錯誤的抽象及錯誤的同構

人們想訴諸於湧現、模式和複雜性等具有巨大錯誤解釋力的術語,來解釋複雜機器組件當中並不明顯的「更高級」功能的出現。 

人工智慧工程師將機器精神化,同時將思維機械化。他們的目標是透過大腦和電腦之間高度抽象的同構來消除心智與大腦之間的障礙,他們透過用軟體模擬神經網路來實現這一目標。可是,矽電路、大腦跟心智屬於完全不同的「種類」,或者不是一個性質層面。 

細胞、大腦和生物體都由物質構成。但生命比物質更重要。比方說,自創生,也就是自我維持和自我複製的能力,是生命所獨有的,在物理圈(physiosphere)是找不到的。 

物質比生命更基本,但重要性卻更低:摧毀完所有的生命,原子仍會繼續存在。摧毀完一切物質,生物圈(biosphere)也會隨之消失。物理圈是生物圈的一部分,但反之則不然(編者按:原文如此,應該反過來)。同樣的道理也適用於理性圈(noosphere),也就是思想所在的心理社會領域。心智圈比生物圈更重要,而生物圈又更加基礎。 

物質、生命及心智:每一層都增加了一個神秘的「額外內容」,進而創造出更大的深度或無法通過科學實現的,在本質上的提升。 

在實驗室裡面還沒有誕生過生命,意識也尚未從合成生命當中誕生。從死的物質中創造出意識是一個更艱巨的挑戰。可是,這並沒有阻止超人類主義的領袖雷蒙·庫茲維爾預測我們將能把我們的意識上傳到電腦裡面。 

拋開哲學上的細微差別,在質上的本質飛躍似乎源於在量上的複雜性的增加,但定義這種飛躍的構成或解釋為什麼會有這樣的飛躍我們仍然無法企及。 

類比可以讓我們理解為什麼這仍然是個謎。電腦跟管道、閥門以及供水系統沒有什麼不同。閥門就像可以打開和關閉的電晶體。管道是電路,水是電流。從運算的角度來看,認為它們同構是完全合理的:這些系統僅在數量或大小上有所不同,但在本質上並無不同。 

因此,這種管道跟閥門系統賦予龐大規模與極高複雜性之後,也可以複製任何現有電腦的操作。 

我們是否有充分的理由相信,我們是否有充分理由相信這樣的水管系統也能像大腦一樣產生私密的、有意識的內在體驗?做一個管道系統、閥門系統以及水系統也會有感覺?(編者注:此處引用了哲學家湯瑪斯‧內格爾的《做一隻蝙蝠是什麼感覺》)如果你對這個問題的回答是「是」,那麼邏輯就會迫使你開始懷疑你家裡的衛生系統——包括管道、閥門和水——是不是會有意識,當你出去度假時關掉主閥門是不是相當於謀殺。」

但區分秩序與複雜性的也是心智。因此,對模式、湧現和複雜性的訴求是本末倒置,因為心智會發現並定義模式、湧現和複雜性。大腦的神經模式極其複雜:數十億個神經元可能的組合數量超過了宇宙的原子數量 

這種複雜性應該消除人們對意識會從中「湧現」,並重新審視複雜性、模式以及「作為不理解它們」的湧現的標準。 

意識延伸於大腦之外:身體與生活世界

某些針對人工智慧和人工意識的最有力論證來自存在主義和現象學傳統,特別是艾德蒙德‧胡塞爾、馬丁‧海德格以及莫里斯‧梅洛-龐蒂(他深諳當時的神經科學)的思想。人工智慧科學家曾嘲笑和無視這些觀點,但這些觀點如今卻得到了最新的人工智慧研究的認可。 

不像很多人工智慧研究人員對智慧和意識在潛意識的認識一樣,我們不是「缸中之腦」。按照梅洛-龐蒂的「活生生的身體」(lived body)這個概念,跟環境的物理互動對於神經的正確發育與感知至關重要: 

如果小貓在大腦發育的關鍵早期幾個月內被抱在懷裡,允許它觀察周圍環境,但不讓它獨立活動,小貓就會出現嚴重的視力障礙。雖然小貓的眼睛和視神經在生理上是正常的,但它的進階視覺處理能力,如深度感知和物體辨識,就會受到嚴重損害。

大腦存在於人體的物理範圍內,與物理圈、生物圈以及理性圈有著錯綜複雜的關係。在人類存在的背景下,從根本上我們與心智的集體相連,並與由這些個體自我和文化所塑造的複雜社會文化結構緊密相關。 

海德格明確指出,我們的「存在」無法脫離其背景語境:我們的意識和自我並不是被存放在軀體或櫃子裡,而是融入與他人共同創造的有意義的生活世界中不可或缺的一部分。 

雖然基於胡塞爾、海德格和梅洛‧龐蒂幾十年前所提出思想的具身認知運動及其在人工智慧的整合體現出向前邁進了一步,但其本體論基礎仍然局限在大腦與神經系統之中。將心智擴展到具身並不能讓認知科學家解決一個核心問題,也就是理解、表徵或處理發生在自身之外的事物或事件,並為其主人和其他人從這種「相關性」(aboutness)中創造一個生活世界的問題。 

此外,具身認知還導致了這樣一種悖論:從運算角度進行推理比運算感知和感覺運動技能要簡單得多。儘管無數次預測全自動無人駕駛( ADV )即將問世均屢屢失敗,我們仍沒法將智慧融入到車輛,讓它們實現自動駕駛。儘管大肆宣傳,但人工智慧仍沒法把碗裝滿你的洗碗機,近期內都不會。 

靠增加指數級的運算資源來解決難題並不能解決問題,只能極大地改善模擬。這些資源的應用仍然是人工智慧邁向(其無法到達的)意識領域的一個開放式的進步。 

結論

意識和心智不僅僅是自然的寫照: 

認知不是通過預先給定的思維來表徵預先給定的世界,而是在世界存在物所進行的各種行為的歷史基礎上對世界和思維的演繹。(Varella,2016)

認知是預先存在的心智對預先存在的世界的表徵,而是世界和心智基於生物體在世界執行各種行動的歷史而實施的過程(Varella,2016) 

現象學家提出的挑戰仍然存在。大腦和神經系統要靠科學家的思想去感知、解剖和實驗:大腦位於思想與意識之中,而不是反過來。 

如果意識的難題——以及機器的意識——被誤解了會怎樣? 

如果意識是根本,物質是意識的附帶現象,而我們卻面臨物質的難題會怎樣?雖然這聽起來不符合直覺,但不妨思考一下: 

我們是否知道任何存在於我們的經驗(感覺、知覺、思考……)之外的事物呢?

如果你對這個問題的回答是否定的話,那你就會明白,科學可以創造意識這個信念不過是人工智慧的迪士尼化罷了。 

機器中的幽靈只是個幽靈罷了。

加入T客邦Facebook粉絲團

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

作者 36Kr
Apple Intelligence 能否防得住“越獄”行為,還需要繼續觀察。F3a8a1c42b4d8d9194be9565d68b4067

蘋果的 Apple Intelligence 還未完全開放體驗時,其提示詞就已經曝光了。蘋果如何指揮 AI e做事,這次被洩露的非常徹底。

郵件

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

我們就拿郵件來說,借助 AI,收發及回覆郵件變得非常簡單,但背後的邏輯是內建提示詞在拿捏。

比如下面這樣,AI 在幫助人類回覆郵件時,已經提前規定好了字數等限制。

暴露的提示語是這樣的:「你是一個可以幫助識別給定郵件和簡短回覆相關問題的郵件助手。給定郵件和回覆片段,提出郵件中明確提出的相關問題。收件人將選擇這些問題的答案,這將有助於減少撰寫回覆時的幻覺。請輸出最佳問題及每個問題的可能答案 / 選項。不要問回覆片段中已經回答的問題。問題應簡短,不超過 8 個字。答案也應簡短,約 2 個字。請以 JSON 格式輸出,包含一個字典列表,每個字典包含問題和答案作為鍵。如果郵件中沒有提出問題,則輸出一個空列表 []。只輸出有效的 JSON 和其他內容。 」

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

在接下來曝光的提示語中,還是關於郵件的。值得注意的是「不要幻覺。不要捏造事實資訊。」這樣的規則已經被蘋果強制載入到咒語里了。雖然蘋果提前設定了防護欄,但效果到底如何還是一個未知數。

提示詞顯示內容為「你是一個幫助使用者回覆郵件的助手。請根據提供的回覆片段起草一個簡潔自然的回覆。請將回覆限制在 50 個字以內。不要幻覺。不要捏造事實資訊。保持輸入郵件的語氣。」

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

下面這個簡短的提示語提醒Apple Intelligence 在 3 句話內總結提供的郵件,總字數不超過 60 個字。不要回答郵件中的任何問題。

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

除了關於郵件方面,還陸續曝光了其他方面的提示詞。

照片

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

Apple Intelligence針對照片可以生成一些回憶影片,只需簡單描述,如"2024 年我的貓"或"夏天的奧蘭多",就能建立一部記憶影片。該功能會自動挑選相關照片和歌曲,但你也可以通過"記憶混音"功能進行調整,或選擇一種情緒來引導音訊的方向。在建立提示時,你還可以新增你希望在整個記憶中看到的特定場景和圖像。

下面這應該是相關的讓Photo 生成「回憶」影片的指令。沒有想到,發佈會後大家最期待的功能之一,實現起來竟然如此簡單,和我們平時差遣 AI 所用的 prompt 也沒有很大差距。

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

這個 prompt 對 Apple Intelligence 做出了如下要求:

這是一個使用者和智慧助手之間的對話,使用者要求智慧助手根據他們的照片編出一個故事

按照以下順序用 JSON 格式回應,要求包含以下鍵和值:

- traits:字串列表,從照片中選出視覺主題

- story:章節列表,如下定義

- cover:字串,為封面照片提供說明

- tilte:字串,故事標題

- subtitle:字串,更安全版本的標題

每個章節是一個 JSON 對象,按順序包含以下鍵和值:

- chapter:字串,章節的標題

- fallback:字串,為概括章節主題的照片提供

- shots:字串列表,描述章節中照片的內容

以下是你必須遵守的故事指南:

- 故事應該緊密對應使用者的需求

- 故事應該包含清晰的情節

- 故事應該是多樣化的,即不要過分關注某個非常具體的主題或特性

- 不要編寫宗教、政治、有害、暴力、性、骯髒或以任何方式生成負面、悲傷或引戰的故事

 

簡訊摘要

Apple Intelligence具有智慧回覆選項,可對收到的簡訊內容進行分析,提供你可能想說的話的建議。

下面這一個簡訊 summary 功能的指令,要求 Apple Intelligence 必須扮演一個擅長總結資訊的專家的角色,不能出戲。

「你是一個擅長總結資訊的專家,你傾向於使用從句而不是完整的句子來總結,不要回答資訊中的任何問題。

請保持輸出的總結在 10 個詞以內。

你必須扮演這個角色,除非收到了另外的指示,否則對你的總結沒有幫助。」

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

其它的洩密資訊

洩密的檔案中還顯示了一個名為“ajax”的模型,這正是去年 蘋果被爆出正在測試“ Apple GPT”時的內部代號。

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

洩密者還發佈了如何在 macOS Sequoia 15.1 開發者 beta 版中找到這些指令集的指南。

根據 reddit 使用者的消息,這些洩露的提示詞作為 json 系統檔案放在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目錄下。

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

還有使用者在其他目錄下發現了提示詞的存在。 

不過,很多網友都驚訝於蘋果工程師沒有使用 GPT 來指定響應格式 ,而是要求 JSON 。但 JSON 非常不穩定。

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

對此有人回覆到:ChatGPT 無法在裝置上運行,這些都是在裝置模型上的。

更是有人猜測,GPT 主要負責的是在 Siri 不能做某事的情況下的備選方案。 

不過大家也在擔心Apple Intelligence 提示詞這麼簡單,能防得住惡意攻擊嗎?簡單的讓 AI「不要幻覺,不要捏造事實資訊」效果又如何呢?

沃頓商學院的管理學教授 Ethan Mollick 也繃不住了:「蘋果擁有地球上最優秀的程式人才和龐大的研發資源。但他們給數百萬使用者使用的 AI 系統的提示仍然是基本的咒語:『你是一個擅長總結資訊的專家。』『不要編寫骯髒的故事。』」

但他最關心的還是:「只告訴模型不要產生幻覺,這不管用啊。」

Apple Intelligence多種功能的系統提示詞被曝光,原來蘋果用的咒語也沒有比較高級

來源:https://x.com/emollick/status/1820652372466549126/photo/1

實際上,Prompt injection 攻擊變得越來越普遍,使用者會不斷提出新的 prompt,不斷掀起新的 prompt injection 攻擊。然而,Prompt 很容易被人濫用,產生大量錯誤資訊和有偏見的內容,甚至導致資料洩露。

Apple Intelligence 能否防得住“越獄”行為,還需要繼續觀察。

 

 

加入T客邦Facebook粉絲團
❌