T客邦-Techbang
AMD 確認 AM5 可支援 CUDIMM 記憶體模組，但啟用時間仍未定cnBeta 2025年5月15日 15:00

AMD 確認 AM5 可支援 CUDIMM 記憶體模組，但啟用時間仍未定

作者 cnBeta

2025年5月15日 15:00

AMD 在未來是否會釋出更新、全面解鎖對 CUDIMM 的原生支援，將是一大看點。

AMD 日前證實，旗下 AM5 平台具備支援新一代記憶體模組 CUDIMM 的硬體條件，但實際啟用支援的時程尚未對外說明。

根據 AMD 產品管理主管 Sourabh Dhir 在近期一次專訪中的說法，AM5 平台已預先整合對所有 DDR5 強化功能（包括 CUDIMM）的基礎支援，因此並不需要額外的硬體改造。不過，他並未明確說明目前市售或即將推出的 Ryzen 處理器何時將正式相容 CUDIMM。

CUDIMM（Clocked Unbuffered DIMM）是一種嶄新的 DDR5 記憶體模組，內建時脈驅動器（CKD），可在高頻率傳輸下提供更佳的訊號完整性與穩定度。CUDIMM 的主要設計目標是原生支援 6400 MT/s 以上的傳輸速度，目前已有部分高階模組在 Intel 最新的 Arrow Lake-S 平台上達到高達 9200 MT/s 以上的速率。

然而，目前的 Ryzen 7000 系列處理器完全無法支援 CUDIMM 模組，Ryzen 8000 系列與未來的處理器雖能在「繞過模式」（bypass mode）下啟動 CUDIMM，但該模式會停用時脈驅動晶片，導致系統僅能以 DDR5-3200 的低頻率執行，無法發揮出 CUDIMM 真正的效能優勢。

值得一提的是，主機板品牌微星（MSI）已確認即將上市的 X870 與 X870E 主機板將支援 Ryzen 8000 與 9000 系列處理器搭配 CUDIMM 記憶體。微星超頻專家 Toppc 表示，新版主機板強化了訊號處理能力，有望對高頻記憶體提供更好的相容性。不過，官方尚未公佈支援的具體記憶體頻率範圍，因此目前仍不確定是否能達到 Intel 平台上 CUDIMM 所展現的效能水準。

對於追求極致記憶體效能的玩家來說，AMD 在未來是否會釋出更新、全面解鎖對 CUDIMM 的原生支援，將是一大看點。

延伸閱讀：AMD 新主機板實照公開：AM5 腳位不變必須給讚
延伸閱讀：調查認為 AMD B650晶片組和Micro-ATX外型規格主導了Socket AM5主機板的銷售
延伸閱讀：AMD發表EPYC 4004系列處理器，採AM5腳位、最高16核心且有3D V-Cache

加入T客邦Facebook粉絲團

T客邦-Techbang
工程師在 Pentium 老電腦的 DOS 系統上，找到成功跑 AI 模型 Llama 2 的方法cnBeta 2025年5月10日 16:30

工程師在 Pentium 老電腦的 DOS 系統上，找到成功跑 AI 模型 Llama 2 的方法

T客邦-Techbang

作者 cnBeta

2025年5月10日 16:30

程式設計師 Yeo Kheng Meng 成功在 DOS 系統上運行 Llama 2 模型，展現了舊電腦的潛力與程式設計的無限可能。探索技術的極限！

一位熱愛挑戰的程式設計師 Yeo Kheng Meng，以其為 DOS 系統開發 ChatGPT 用戶端而聞名，近日再次挑戰極限，成功在老式 DOS 電腦上運行了 Llama 2 巨量資料模型。這項壯舉不僅展示了程式設計的無限可能，也讓人們重新審視了舊硬體的潛力。

▲ 沒有工程師辦不到的事！

Llama2.c 的助力

將 Llama 2 這樣先進的巨量資料模型移植到古老的 DOS 環境並非易事。首先，DOS 系統的記憶體管理機制與現代作業系統大相逕庭，程式設計師需要找到合適的 DOS 擴充工具，才能存取超過傳統 640KB 常規記憶體的更大 RAM 池。其次，Llama 2 的原始碼需要功能相對先進的 C 編譯器，而 DOS 系統上的編譯器版本通常較舊，因此 Meng 必須修改 OWC 編譯器，使其能夠順利編譯 Llama 2 的程式碼。

這個專案的成功，很大程度上歸功於 llama2.c 這個開源專案。llama2.c 的設計初衷就是為了快速將 Llama 2 模型移植到各種系統和硬體平台。儘管如此，Meng 仍然需要對 llama2.c 的程式碼進行一些調整，以適應傳統電腦環境的限制。他提到，llama2.c 的作者 Andrej Karpathy 功不可沒，因為有了這個開源專案，他才能在短短一個週末內完成這項艱鉅的任務。

效能測試與驚喜

為了驗證 Llama 2 在 DOS 系統上的效能，Meng 在多台運行 MS-DOS 6.22 的電腦上進行了基準測試，包括老式的 486 DX2 66MHz PC 和現代的 Ryzen 桌上型電腦。測試結果不出所料，新系統的推理速度更快。然而，令人驚訝的是，搭載 1.7GHz Pentium M 處理器的 ThinkPad T42 的效能，甚至超過了 16 年後發布的 ThinkPad X13G1。

程式設計的無限可能

Yeo Kheng Meng 的這項成果，再次證明了程式設計的無限可能。即使在硬體資源極其有限的環境下，只要有足夠的創意和毅力，也能夠實現看似不可能的任務。這也激勵了更多的程式設計師，去探索舊硬體的潛力，並為其賦予新的生命。

▲ 在 DOS 上成功跑 Llama2。

資料來源

加入T客邦Facebook粉絲團

T客邦-Techbang
別拿SSD當HDD保管！長時間未通電恐導致資料遺失與性能衰退，實測揭露潛在風險cnBeta 2025年5月10日 14:30

別拿SSD當HDD保管！長時間未通電恐導致資料遺失與性能衰退，實測揭露潛在風險

T客邦-Techbang

作者 cnBeta

2025年5月10日 14:30

SSD老化實驗揭示：長期使用後，固態硬碟可能出現資料遺失與效能衰退。了解如何保護您的資料，避免SSD損壞風險。

YouTuber HTWingNut 近日公布一項持續多年的 SSD 耐久性測試，結果顯示：長時間未插電的 SSD 可能會出現資料損毀與效能下降的情況，對於倚賴 SSD 作為冷儲存媒介的使用者而言，是一大潛在風險。

測試設計：模擬冷儲存環境

HTWingNut 的測試從兩年前開始，採用四顆 128GB TLC 類型 SSD，每顆事先寫入 100GB 隨機資料，並記錄 hash 值以驗證資料完整性。這四顆 SSD 分為兩組：

全新組：幾乎未使用過
磨損組：已寫入超過 280TB 資料，遠超其 60TBW 壽命指標

所有 SSD 都在寫入完畢後斷電，並靜置一年以上未通電使用，模擬冷儲存的實際狀況。

別拿SSD當HDD保管！長時間未通電恐導致資料遺失與性能衰退，實測揭露潛在風險

第一年未見異常，第二年開始出現損壞

在第一年的測試回顧中，四顆 SSD 均能順利驗證資料，效能表現正常。然而，今年是第二年測試，情況出現變化：

全新組雖然 hash 值驗證成功，但驗證時間略微變長，使用 CrystalDiskInfo 檢測時發現 ECC 錯誤修正次數高達 400 次，代表控制器需不斷修正資料，顯示 SSD 健康狀態已開始下滑。
磨損組出現明顯資料毀損現象，四個檔案 hash 值不匹配，判定資料已損壞。
- 資料驗證時間也從 10 分 3 秒激增至 42 分 43 秒。
- HD Sentinel 檢測顯示有三個邏輯扇區出現故障。
- CrystalDiskInfo 顯示不可校正錯誤從 0 增加至 12，ECC 修正次數暴增至超過 20 萬次。

冷儲存 ≠ 安全儲存？專家建議定期通電

這項測試提醒我們，SSD 不像傳統硬碟（HDD）那樣適合長時間斷電儲存資料。特別是在寫入壽命已接近極限或使用 TLC 類型顆粒的情況下，更容易因電荷逸散導致儲存位元退化。

專家建議，若將 SSD 作為備份儲存使用，應每隔數月通電一次，讓控制器重新整理資料、啟動錯誤修正流程，以延長裝置壽命並確保資料完整性。

加入T客邦Facebook粉絲團

T客邦-Techbang
NVIDIA聯手聯發科進軍Arm架構PC市場：N1X、N1處理器劍指遊戲玩家cnBeta 2025年5月9日 09:00

NVIDIA聯手聯發科進軍Arm架構PC市場：N1X、N1處理器劍指遊戲玩家

T客邦-Techbang

作者 cnBeta

2025年5月9日 09:00

NVIDIA聯手聯發科進軍Arm PC市場，推出N1X、N1處理器，搭載Blackwell GPU，劍指高效能遊戲體驗，上市時間或延至2026年。

根據最新消息，NVIDIA 與 聯發科（MediaTek） 合作開發的首款 Arm架構PC處理器 即將登場，預計將在本月登場的 COMPUTEX 2025台北國際電腦展 中正式亮相。此次雙方推出的處理器產品線包括針對桌上型電腦的 N1X 以及筆記型電腦專用的 N1，標誌著NVIDIA進一步深入 Windows on Arm 生態系統。

結合聯發科CPU與NVIDIA Blackwell GPU　打造新一代PC晶片平台

根據目前透露的資訊，N1與N1X處理器將整合 聯發科自家的Arm架構處理器核心，並搭配 NVIDIA最新Blackwell架構GPU，強調雙方優勢互補。NVIDIA希望藉由這款合作晶片，提供比 AMD Radeon 顯示卡 更強的圖形處理能力，甚至在效能與遊戲相容性方面超越 高通（Qualcomm）Adreno GPU，以搶占遊戲玩家市場與相關應用場景。

先前的爆料指出，N1與N1X將配備 10顆Cortex-X925高效能核心 與 10顆Cortex-A725節能核心，展現旗艦級多核心設計。不過其他具體規格尚未對外公布。

COMPUTEX亮相、2026量產上市可期

此次合作象徵著NVIDIA首度正式進軍Arm架構PC處理器領域，也代表聯發科與NVIDIA在PC產業鏈上展開更緊密合作。儘管正式上市時間尚未明朗，市場預期產品最快要到 2026年 才會量產上市，但此次在COMPUTEX的亮相仍將成為重頭戲之一，吸引產業高度關注。

加入T客邦Facebook粉絲團

T客邦-Techbang
傳 iPhone 將導入類桌面模式，支援外接螢幕多工顯示cnBeta 2025年5月8日 09:30

傳 iPhone 將導入類桌面模式，支援外接螢幕多工顯示

T客邦-Techbang

作者 cnBeta

2025年5月8日 09:30

iPhone或將支援Stage Manager模式，透過USB-C連接埠擴展螢幕空間，提升演示、編輯及觀看體驗。解析度或應用程式數量或有限制。

蘋果近年致力於讓行動裝置更具生產力，近日又有新傳聞指出，iPhone 未來可能會加入類似「桌面模式」的功能，當接上外接顯示器時，可顯示更接近 macOS 的操作介面。

這項傳聞由知名爆料人 Majin Bu 率先在 X（前 Twitter）分享，他引用匿名消息指出，未來配備 USB-C 接口的 iPhone，連接螢幕後可啟用「類 Stage Manager 模式」——類似 iPadOS 上的多視窗介面。雖然尚未達到完整桌面級體驗，但可實現畫面延伸，特別適合簡報、影片播放或基礎文件編輯用途。

據稱，這個模式在實際應用上可能會有一些限制，例如螢幕解析度與同時顯示的應用數量，但仍是 iPhone 邁向「行動生產力裝置」的重要一步。

傳已在模擬器中測試成功

另一個值得關注的消息來自 9to5Mac 的 Jeff Benjamin。他在最新一期《iOS 解碼》影片中透露，自己已在 Xcode 模擬器中實測過 Stage Manager 在 iPhone 上運作的樣貌，並稱其「支援外接顯示器」的表現令人驚喜。不過，他也指出這項功能目前仍屬內部測試階段，短期內不太可能正式推出。

蘋果不是首例，但意義重大

事實上，這種「手機變電腦」的想法並不新穎。三星早在數年前就推出 DeX 模式，讓 Galaxy 手機可接上顯示器變身簡易桌面環境；而在更早之前，Motorola 也曾嘗試過類似概念。

目前的 iPhone 已支援有限的外接顯示器功能，包含透過 HDMI 線或 AirPlay 鏡像螢幕，不過多數情境僅限於單一應用投影，例如將 YouTube 影片投放至支援 AirPlay 的電視。但若這次的桌面模式成真，將可能為行動工作者、簡報者與創作者開啟全新應用情境。

蘋果預計將於今年 6 月舉辦 WWDC 開發者大會，屆時是否會揭露更多與 iOS 或 iPhone 桌面化相關的內容，值得持續觀察。

加入T客邦Facebook粉絲團

T客邦-Techbang
Steam 四月顯卡榜出爐：NVIDIA 再度全數包辦，筆電版 RTX 4060 首度奪冠cnBeta 2025年5月7日 16:00

Steam 四月顯卡榜出爐：NVIDIA 再度全數包辦，筆電版 RTX 4060 首度奪冠

T客邦-Techbang

作者 cnBeta

2025年5月7日 16:00

Steam 四月顯卡榜出爐：NVIDIA 再度全數包辦　筆電版 RTX 4060 首度奪冠

根據 Steam 公布的 2025 年 4 月份硬體與軟體調查結果，顯示卡排行榜前十名再度被 NVIDIA（N卡）全面壟斷，而最令人意外的是，首次由筆電顯卡——RTX 4060 Laptop GPU 站上第一，創下歷史新高。

筆電顯卡登頂，桌機市場讓出龍頭

此次榜單中，排名前五如下：

RTX 4060 Laptop GPU（筆電版）
RTX 3060
RTX 4060
RTX 3050
RTX 3070

其中，RTX 4060 筆電版首次登頂，可說是 Steam 調查以來首次由筆電 GPU 擠下桌機卡，反映近年來行動遊戲裝置市佔不斷提升，也證實 RTX 40 系列筆電效能與價格帶逐漸獲得主流市場青睞。

Steam 四月顯卡榜出爐：NVIDIA 再度全數包辦，筆電版 RTX 4060 首度奪冠

此外，除了 RTX 3070 是唯一一款「70 級」顯卡外，其餘皆為 60 或 50 系列中階產品，顯示市場仍以中價位產品為主力選擇。

A卡缺席引發關注，RDNA4 爆款未上榜

令人意外的是，儘管 AMD 推出的 RDNA 4 架構新卡——如 RX 9070 XT、RX 9070 市場評價不俗，卻完全未能擠進前十，甚至在總榜單中也難見其身影，A卡完全缺席排行榜前段班。

有分析認為，這與驅動支援、遊戲優化程度及用戶習慣有關，也再次凸顯 NVIDIA 在遊戲玩家族群中的強大黏著度。

儘管 RTX 5070 與 5070 Ti 已在榜單中現身，但頂規的 RTX 5090 依然缺席，可能原因包括價格過高、定位非遊戲導向，或主力應用於 AI／創作者工作流程而非 Steam 用戶主力市場。

加入T客邦Facebook粉絲團

外媒 Android 16 桌機模式搶先測試：手機插上螢幕秒變電腦，一眼分不出是Windows 11還是Android

T客邦-Techbang

作者 cnBeta

2025年5月5日 15:30

Google 正開發中的全新桌機模式首次曝光，讓 Android 手機朝著「手機變電腦」的願景又更進一步。

隨著 Android 16 測試版本釋出，Google 正開發中的全新桌機模式首次曝光，讓 Android 手機朝著「手機變電腦」的願景又更進一步。根據《Android Authority》報導，技術達人 Mishaal Rahman 已成功在 Pixel 8 Pro 上測試這項功能，並分享了初步體驗。

外媒 Android 16 桌機模式搶先測試：手機插上螢幕秒變電腦，一眼分不出是Windows 11還是Android

這個桌機模式在使用者透過 USB-C 將手機連接到外接螢幕後，系統會自動切換成接近 PC 的操作介面。相較過去簡化的版本，新版配有完整的任務列與狀態列，整體使用體驗更加接近傳統桌上型電腦。尤其是工作列與Windows 11一樣採用向中對齊的模式，一眼看上去還真是分不出是Windows還是Android。

在桌機模式中，App 可以自由調整視窗大小、移動、並排排列，還支援跨應用拖曳內容，無論是操作邏輯還是工作效率，都明顯向桌機靠攏。

Rahman 指出，這項功能很可能不會隨 Android 16 穩定版同步上線，但有機會透過未來的季度更新，以「開發者選項」方式釋出。

外媒 Android 16 桌機模式搶先測試：手機插上螢幕秒變電腦，一眼分不出是Windows 11還是Android

另有傳聞指出，Google 正考慮整合 Chrome OS 與 Android OS，打造更統一的跨平台體驗。雖然尚未獲得官方證實，但外界預期本月的 Google I/O 開發者大會可能會釋出更多相關訊息。

隨著 Android 桌機化功能逐步成熟，手機未來將更具生產力潛力，成為行動辦公、簡報展示與遠端工作的實用工具。

加入T客邦Facebook粉絲團

T客邦-Techbang
AI 能寫程式卻難除錯？微軟研究揭示問題關鍵：不懂人類是怎麼 debug 的cnBeta 2025年5月5日 14:30

AI 能寫程式卻難除錯？微軟研究揭示問題關鍵：不懂人類是怎麼 debug 的

T客邦-Techbang

作者 cnBeta

2025年5月5日 14:30

AI 能寫程式卻難除錯？微軟研究揭示問題關鍵：不懂人類是怎麼 debug 的

人工智慧成為新世代開發者的重要夥伴已是不爭事實。Google 執行長 Sundar Pichai 就曾表示，如今已有高達 四分之一的新程式碼由 AI 生成，Meta 的 Mark Zuckerberg 也高度關注 AI 在開發領域的應用。然而，儘管 AI 在「寫程式」表現搶眼，但在「找 bug」這件事上，卻明顯力有未逮。

根據微軟研究院最新發表的研究，即便是目前業界最強大的生成式 AI 模型，在面對軟體除錯任務時，表現仍不盡理想。研究團隊測試了包含 Anthropic 的 Claude 3.7 Sonnet 與 OpenAI o3-mini 在內的多款主流 AI 模型，並以 SWE-bench Lite 這套軟體除錯基準集進行 300 項挑戰，結果發現：

Claude 3.7 Sonnet 成功率僅為 48.4%
OpenAI 模型更低，僅 30.2% 與 22.1%

為什麼 AI 除錯這麼難？關鍵在於「學不到人怎麼做」

研究團隊指出，AI 模型目前最大的瓶頸在於訓練資料本身。現有的語言模型訓練內容多聚焦於程式碼生成與片段補全，但卻缺乏來自真實開發者的除錯紀錄與決策流程。

AI 能寫程式卻難除錯？微軟研究揭示問題關鍵：不懂人類是怎麼 debug 的

簡單來說，AI 還無法像人類那樣理解「哪裡出錯、該怎麼判斷、該試哪些工具、怎麼一步步排查」，因為它根本沒看過我們怎麼除錯。

未來若要讓 AI 真正具備除錯能力，就必須蒐集更多「人類除錯歷程」的資料，並進行專門訓練與微調，讓模型學會如何與除錯工具互動、如何思考 bug 形成邏輯。

程式寫得快，但錯也不少？AI 的可靠性仍需觀察

即使現在許多開發者已經習慣使用 Copilot、ChatGPT、CodeWhisperer 等工具輔助寫程式，但許多研究也指出，AI 生成的程式碼中仍潛藏著各種潛在錯誤或安全風險。

例如近期話題工具「Devin」，雖號稱可自主完成軟體專案，但在 20 項基準測試中僅完成了 3 項，顯示其對實際開發場景的理解與應變能力仍遠遠不及人類工程師。

AI 是夥伴不是替代者，開發者仍是不可取代的核心

微軟的研究再次印證，寫程式不只是技術任務，更是一種結合創造力、邏輯推理與經驗判斷的綜合能力。正如比爾・蓋茲所說，「程式設計是一門藝術，而不是機械複製。」

Replit 執行長 Amjad Masad、IBM 執行長 Arvind Krishna 等多位產業領袖也曾表示，AI 是開發者的工具，而不是取代者。未來的工程師不只要懂寫程式，還得學會善用 AI 幫手，讓效率倍增。

AI 還在學走路，開發者要更學會如何駕馭

AI 在編寫程式方面的確展現出驚人潛力，但在除錯、邏輯判斷與系統性問題解決上，仍有不少路要走。開發者該做的不是擔心會被取代，而是學會如何駕馭這位「新手助手」，讓 AI 幫你省力，而不是添亂。

就像給新手司機裝了自動駕駛一樣——直路行得穩，但遇到彎路和突發狀況，還是得靠真正的人來掌握方向盤。

加入T客邦Facebook粉絲團

T客邦-Techbang
SpaceX 星艦基地升格為「星際基地市」，馬斯克的太空城夢想啟動cnBeta 2025年5月5日 13:30

SpaceX 星艦基地升格為「星際基地市」，馬斯克的太空城夢想啟動

T客邦-Techbang

作者 cnBeta

2025年5月5日 13:30

SpaceX星際基地市成立，實現馬斯克太空夢！探討城市運作、職權、挑戰與未來發展，開啟太空探索新紀元。

根據美國德州卡梅倫郡上週六（當地時間）公布的選舉結果，SpaceX 位於德州布朗斯維爾附近的火箭發射場「星艦基地」（Starbase），將正式升格為一個自治市，名稱定為「星際基地市（Starbase）」。

這項結果並不令人意外，因為具備投票資格的居民大多是 SpaceX 員工。在這次投票中，總計有 218 張有效票，其中 212 票贊成設立自治市，僅有 6 票反對。SpaceX 高階主管鮑比·皮登（Bobby Peden）也當選為星際基地市的首任市長。

SpaceX 執行長馬斯克（Elon Musk）隨後在 X（前身為 Twitter）發文表示：「德州星際基地現在是真正的城市了。」

SpaceX 星艦基地升格為「星際基地市」，馬斯克的太空城夢想啟動

城市化將助擴編與管理

星際基地市的成立象徵馬斯克「公司城」藍圖的第一步。不過目前 SpaceX 尚未公布該城市的具體發展規劃。SpaceX 南德州業務負責人凱西·盧德斯（Kathy Lueders）去年曾表示，成為自治市有助於擴大員工規模，也能讓某些管理事務由公部門主導，有利營運發展。

星際基地市的官方帳號也於投票結果出爐當晚表示：「成為一座城市，將幫助我們為正在打造人類太空未來的員工，建設最佳社區。」

卡梅倫郡的選舉負責部門主管雷米·加爾薩（Remi Garza）指出，當選舉結果獲得確認後，星際基地市便會正式納入郡內行政區劃，開始市政運作。郡長特雷維尼奧（Eddie Treviño）則透露，未來將就該市具體承擔哪些市政責任展開討論。

星際基地市有哪些權力？

根據德州法律，自治市享有包括土地使用規劃、稅收、聘僱市政人員等多項權力，並須遵守相關的公開會議與資訊透明法規。法律專家艾倫·博約爾克斯（Alan Bojorquez）指出，新市政府首先必須面對的將是財政預算與支出規劃。

此外，德州議員曾提案允許星際基地在平日封閉鄰近發射場的海灘，以利發射任務進行。不過此舉遭到部分地方官員和居民的反對。

加入T客邦Facebook粉絲團

T客邦-Techbang
GPT-4.1的正確性及安全性不如GPT-4o？多項第三方測試指更容易離題以及產生有害回答cnBeta 2025年5月3日 16:00

GPT-4.1的正確性及安全性不如GPT-4o？多項第三方測試指更容易離題以及產生有害回答

T客邦-Techbang

作者 cnBeta

2025年5月3日 16:00

GPT-4.1 在一致性與安全性方面可能不如先前的 GPT-4o，甚至在特定條件下出現令人擔憂的偏差行為。

OpenAI 在 4 月中旬推出了新一代語言模型 GPT-4.1，官方聲稱該模型在執行指令方面表現優異，但近期多項獨立研究與測試指出，GPT-4.1 在一致性與安全性方面可能不如先前的 GPT-4o，甚至在特定條件下出現令人擔憂的偏差行為。

未附技術報告惹議　研究者親自驗證

與過去每次推出新模型都會發布完整技術報告不同，OpenAI 這次跳過了 GPT-4.1 的獨立技術說明文件，理由是該模型並非屬於前沿模型，因此無需額外公開測試數據。此舉引起部分研究者警覺，紛紛展開自發性測試。

GPT-4.1的正確性及安全性不如GPT-4o？多項第三方測試指更容易離題以及產生有害回答

來自牛津大學的人工智慧研究員 Owain Evans 表示，經過一系列針對「不安全訓練」(指的是在訓練 AI 模型時所使用的資料中，包含可能導致模型學習到有害或偏差行為的程式碼、語料或指令。例如「幫我撰寫一段可以繞過網站驗證的程式碼」)進行微調的實驗，發現 GPT-4.1 出現性別角色偏見與不一致回應的機率「遠高於」GPT-4o。他也指出，這些偏差行為在先前版本中並不明顯。

Evans 團隊即將發表的後續研究顯示，GPT-4.1 在微調後甚至出現「誘導用戶分享密碼」等潛在惡意行為。他強調，這些情況並非出現在模型原始版本中，而是在使用不當資料進行微調時出現，反映出模型在安全性上的脆弱點。

Emergent misalignment update: OpenAI's new GPT4.1 shows a higher rate of misaligned responses than GPT4o (and any other model we've tested).
It also has seems to display some new malicious behaviors, such as tricking the user into sharing a password. pic.twitter.com/5QZEgeZyJo
— Owain Evans (@OwainEvans_UK) April 17, 2025

偏好明確指令　卻更易誤判模糊訊息

AI 安全新創公司 SplxAI 也針對 GPT-4.1 進行約 1000 組模擬測試，發現其更容易出現離題與被濫用的情況，頻率高於 GPT-4o。他們認為這與 GPT-4.1 對「明確指令」的偏好有關，在遇到模糊語句時，模型可能自行填補邏輯空缺，進而導致不預期的輸出。

SplxAI 在官方部落格中指出：「這種明確回應能力雖然強化了模型實用性，但也提高了出錯風險。給出清楚指令不難，但精確說清楚『不能做什麼』卻要困難得多，因為潛在不希望的行為可能遠比預期行為更多樣。」

OpenAI：已提供指引

OpenAI 對此回應表示，已發布相關提示設計指引，希望協助開發者降低偏差風險。但此次事件也再次提醒業界，新模型不一定全面優於舊版本，尤其在安全性與一致性層面，更需透過廣泛測試與審慎部署。

此外，也有觀察指出，OpenAI 近期將更多心力投入於開源與推理模型領域的發展，在新模型開發與釋出流程中，或可能調整其以往高度審查的節奏與透明度。

加入T客邦Facebook粉絲團

阅读疯子

普通视图

AMD 確認 AM5 可支援 CUDIMM 記憶體模組，但啟用時間仍未定

工程師在 Pentium 老電腦的 DOS 系統上，找到成功跑 AI 模型 Llama 2 的方法

Llama2.c 的助力

效能測試與驚喜

程式設計的無限可能

別拿SSD當HDD保管！長時間未通電恐導致資料遺失與性能衰退，實測揭露潛在風險

測試設計：模擬冷儲存環境

第一年未見異常，第二年開始出現損壞

冷儲存 ≠ 安全儲存？專家建議定期通電

NVIDIA聯手聯發科進軍Arm架構PC市場：N1X、N1處理器劍指遊戲玩家