阅读疯子 YDFZ.CN - T客邦-Techbang - Page 398

ydfz.cn /html/index.html

GPT-4.1的正確性及安全性不如GPT-4o?多項第三方測試指更容易離題以及產生有害回答

GPT-4.1 在一致性與安全性方面可能不如先前的 GPT-4o,甚至在特定條件下出現令人擔憂的偏差行為。OpenAI 在 4 月中旬推出了新一代語言模型 GPT-4.1,官方聲稱該模型在執行指令方面表現優異,但近期多項獨立研究與測試指出,GPT-4.1 在一致性與安全性方面可能不如先前的 GPT-4o,甚至在特定條件下出現令人擔憂的偏差行為。 未附技術報告惹議 研究者親自驗證 與過去每次推出新模型都會發布完整技術報告不同,OpenAI 這次跳過了 GPT-4.1 的獨立技術說明文件,理由是該模型並非屬於前沿模型,因此無需額外公開測試數據。此舉引起部分研究者警覺,紛紛展開自發性測試。 來自牛津大學的人工智慧研究員 Owain Evans 表示,經過一系列針對「不安全訓練」(指的是在訓練 AI 模型時所使用的資料中,包含可能導致模型學習到有害或偏差行為的程式碼、語料或指令。例如「幫我撰寫一段可以繞過網站驗證的程式碼」)進行微調的實驗,發現 GPT-4.1 出現性別角色偏見與不一致回應的機率「遠高於」GPT-4o。他也指出,這些偏差行為在先前版本中並不明顯。 Evans 團隊即將發表的後續研究顯示,GPT-4.1 在微調後甚至出現「誘導用戶分享密碼」等潛在惡意行為。他強調,這些情況並非出現在模型原始版本中,而是在使用不當資料進行微調時出現,反映出模型在安全性上的脆弱點。 Emergent misalignment update: OpenAI's new GPT4.1 shows a higher rate of misaligned responses than GPT4o (and any other model we've tested). It also has seems to display some new malicious behaviors, such ...

玩家抱怨買了戰鬥通行證後,反而覺得自己好像是課金在遊戲世界加班

玩家抱怨戰鬥通行證像上班:不玩覺得虧,玩了又好累現在不論是 3A 大作還是獨立小品,幾乎都會導入「戰鬥通行證」系統,這種結合課金與限時獎勵的設計,雖然為遊戲公司帶來穩定收益,卻也讓不少玩家感到壓力山大。日前就有玩家在社群上發文抱怨,戰鬥通行證根本把玩遊戲變成「另一份工作」,此言一出引起大量共鳴。 買了不刷覺得虧,刷了又像在上班 這位玩家表示,自己在多款遊戲中都課金購買了戰鬥通行證,像是《VALORANT》、《Fortnite》等熱門線上遊戲,每一款通行證都有時間限制,為了不浪費花出去的錢,幾乎每天都要「打卡刷任務」,搞得比上班還累。 底下不少玩家紛紛回應,表示「超有感」、「我也是在刷通行證,不刷就覺得沒賺到」、「遊戲變成壓力來源真的很反感」。即便是沒課金的玩家,也會因為日常任務獎勵設計得太誘人,而忍不住每天上線,陷入無止境的「被動遊玩循環」。 有例外設計受好評,也有失敗案例 雖然戰鬥通行證常被詬病,但仍有些遊戲的設計相對友善。像是今年大受歡迎的合作射擊遊戲《絕地潛兵2》(Helldivers 2),也有戰鬥通行證系統,不過遊戲中的通行證點數沒有時效限制,玩家可以慢慢累積、不怕過期,這種設計獲得許多正向評價,被認為是尊重玩家時間的做法。 另外,也有開發商選擇放棄戰鬥通行證機制。以 Valve 的《Dota 2》為例,該遊戲在過去幾年持續推出戰鬥通行證,但銷量逐年下降,最終在 2023 年宣布不再發行新一代通行證,轉而回歸其他營利模式。 不少玩家呼籲,遊戲應該是一種放鬆的娛樂,不該為了趕獎勵、追進度,反而成為壓力來源。開發者若能在商業與體驗間找到平衡,或許才是長遠經營之道。加入T客邦Facebook粉絲團...

廣告公司正積極布局,讓你在 ChatGPT 等 AI 回應中看到廣告

AI 搜尋時代來臨,品牌行銷面臨轉型。掌握 AI 搜尋優化策略,提升品牌在 AI 搜尋結果中的能見度,是企業成功的關鍵。回顧 1999 年,Google 曾被譽為「純粹的搜尋引擎」,承諾提供簡潔、無廣告的使用體驗,與當時那些雜亂的入口網站形成鮮明對比。這項服務源自史丹佛大學,由拉里・佩奇(Larry Page)與謝爾蓋・布林(Sergey Brin)創立,早期他們堅決抵制廣告,認為廣告會影響搜尋品質。 不過,隨著業務成長,Google最終在 2000 年推出 AdWords 廣告服務,並迅速發展為按點擊付費(PPC)的巨擘。從一開始的側邊文字廣告,逐步演變為深度整合於搜尋結果頁面的廣告,最終讓 Google 成為全球最大的廣告收入來源之一,有時甚至讓使用者感覺搜尋結果「充滿廣告」。 到了 2022 年底,ChatGPT 強勢登場,這款對話式人工智慧以直接回答取代傳統連結列表,對 Google 依賴連結廣告模式的核心業務帶來重大挑戰。據傳,這一威脅在 Google 內部引發了高度緊張,促使 Google 加速推動自家生成式 AI 計畫。從 2023 年 Google I/O 大會上,執行長 Sundar Pichai 提到「AI」超過百次的頻率就可見一斑。 廣告業界急速跟進,搶攻 AI 搜尋曝光商機 根據《金融時報》報導,廣告集團與科技新創公司已快速意識到這場變革,積極開發新工具,協助品牌在 ChatGPT、Anthropic 的 Claude、Google 的 AI Overviews 和最新推出的 AI Mode 等生成式 AI 搜尋結果中獲得曝光。 這股高度關注源於 AI 產品迅速成為數百萬人搜尋資訊的新主流。諮詢公司 Bain 的研究指出,目前約有 80% 的消費者在至少 40% 的搜尋過程中依賴 AI 生成的答案。這導致自然網站流量下降,影響幅度高達 25%,因...

Intel新AI PC處理器客戶興趣不大,反而前代處理器供不應求

新處理器銷量遇冷 Intel客戶偏好購買舊款CPU近期,Intel(英特爾)面臨一項市場挑戰:新一代 AI PC 處理器 Lunar Lake 上市後銷售反應平平,反而舊款 Raptor Lake 處理器需求激增,導致自家 Intel 7 製程產能供不應求。​根據 Intel 財務長 David Zinsner 的說法,這種情況可能在「可預見的未來」持續。​ Intel 產品部門負責人 Michelle Johnston Holthaus 指出,許多企業客戶因應宏觀經濟不確定性與關稅壓力,對採購更為謹慎。​過去一兩代(即「N-1」與「N-2」)的處理器,因價格更具競爭力、性能也仍具吸引力,因此成為市場首選。​ 儘管 Lunar Lake 處理器在 AI 性能和能源效率方面有所提升,但其高昂的成本和封裝記憶體設計限制了市場接受度。當時的​Intel CEO Pat Gelsinger 承認,將記憶體整合至處理器封裝的設計是一項代價高昂的錯誤,未來將回歸使用傳統記憶體模組的設計。​ 此外,當時 Intel 預計在 2024 年出貨超過 4000 萬台 AI PC 處理器,並計劃在 2025 年供應超過 1 億台 AI PC 處理器。​然而,面對 AMD 在 CPU 市場的增長,Intel 需要重新評估其產品策略,以應對市場競爭。  加入T客邦Facebook粉絲團...

蘋果20周年紀念版iPhone計畫曝光:摺疊螢幕與全玻璃設計引領未來

蘋果20周年紀念版iPhone傳聞曝光!摺疊螢幕、全玻璃設計引領未來手機趨勢,預計2027年問世,果粉們敬請期待!蘋果公司傳聞將於2027年推出兩款20周年紀念版iPhone,其中摺疊螢幕iPhone備受矚目,另一款則可能採用全玻璃設計,引領手機設計新潮流。 蘋果爆料人馬克·古爾曼(Mark Gurman)透露,蘋果正在開發兩款極具特色的20周年紀念版iPhone,預計將於2027年問世。此消息一出,立即引起了廣大蘋果粉絲和科技愛好者的熱烈關注。 古爾曼表示,蘋果此次準備的兩款紀念版iPhone將帶來顯著的創新。摺疊螢幕手機一直是3C產品領域的熱門趨勢,其中一款預計將是備受期待的蘋果摺疊螢幕iPhone;另一款則可能是以玻璃為中心的Pro版本,儘管目前細節資訊較少,但其獨特的設計理念同樣令人期待。 根據相關爆料,摺疊螢幕iPhone的內螢幕將採用全面螢幕設計,尺寸可能達到7.76英寸,並預計首發蘋果螢幕下監視器技術。外螢幕則預計保持挖孔形態,尺寸估計為5.49英寸,方便用戶在摺疊狀態下也能輕鬆操作。同時,蘋果將致力於解決摺疊螢幕的折痕問題,並優化鉸鏈結構,以提升用戶體驗。 至於以玻璃為中心的Pro版本,目前相關資訊相對較少。不過,根據相關推測,這款機型可能會採用Unibody方案,將中框與背殼融為一體,從而提升手機的整體質感和耐用性。這種設計不僅能使手機外觀更加簡潔流暢,還能提高機身的結構強度。 從研發進度來看,蘋果首款摺疊螢幕iPhone預計正在穩步推進中,預計2026年下半年開始量產,甚至有可能在2026年9月與iPhone 18系列一同發布。這意味著消費者最早可能在明年就能體驗到蘋果的摺疊螢幕技術,無疑為市場注入了新的期待。 回顧蘋果十周年之際,iPhone X的推出至今仍具有相當高的熱度。因此,外界對於20周年版iPhone的期望也更高,預計將帶來進一步的革新。新...

Apple Watch SE 3 尺寸猜測:更小機身,更大螢幕?

Apple Watch SE 3 尺寸預測:傳聞蘋果可能推出更小機身、更大螢幕的SE 3,更適合兒童及追求時尚外觀的消費者。Apple Watch SE 系列一直以來都以其親民的價格和實用的功能受到消費者的歡迎。隨著 Apple Watch Series 10 和 Apple Watch Ultra 3 預計將於今年九月亮相,關於下一代 Apple Watch SE 3 的傳聞也越來越多。其中,最引人關注的莫過於其尺寸設計的猜測。 目前,Apple Watch SE 2 提供 40 公釐和 44 公釐兩種尺寸選擇。根據以往的慣例,Apple Watch SE 通常會基於現有的 Apple Watch 型號進行設計。例如,現行的 Apple Watch SE 便是基於 Apple Watch Series 6。因此,蘋果有可能繼續推出基於 Series 6 設計的 SE 3。然而,也有其他可能性存在。 一種猜測是,蘋果可能會採用更大的 Series 7 設計,將 SE 3 的尺寸調整為 41 公釐和 45 公釐。另一種更令人期待的可能性是,Apple Watch SE 3 將採用全新的設計語言。有傳言指出,蘋果正在考慮為 SE 3 採用硬塑膠外殼,並提供多種鮮豔的顏色選擇,以吸引年輕族群。如果蘋果真的採取這種策略,那麼 Apple Watch SE 3 有可能會在更小、更纖薄的機身中,配備 1.6 英吋和 1.8 英吋的螢幕,更接近 38 公釐和 42 公釐的尺寸選擇。 這樣的設計變更將帶來多重優勢。首先,更小的機身尺寸將更適合手腕較細的使用者,特別是兒童。蘋果一直將 Apple Watch SE 作為兒童的入門級產品進行推廣,因此,縮小尺寸的 SE 3 無疑更具吸引力。其次,更大的螢幕和更窄的邊框將帶來更佳的視覺體驗,使 Apple Watch SE 3 在外觀上更具現代感...

五月星空攝影指南:捕捉火星穿越鬼宿星團、流星雨與金星合月的奇幻時刻

五月夜空將上演一連串精彩的天文現象,為攝影愛好者提供絕佳的拍攝機會。從火星穿越鬼宿星團、寶瓶座 η 流星雨的極大期,到金星與月亮的近距離相會,每一幕都是不可多得的攝影題材。五月夜空將上演一連串精彩的天文現象,為攝影愛好者提供絕佳的拍攝機會。從火星穿越鬼宿星團、寶瓶座 η 流星雨的極大期,到金星與月亮的近距離相會,每一幕都是不可多得的攝影題材。 火星穿越鬼宿星團 5 月 3 日至 6 日,火星將穿越位於巨蟹座的鬼宿星團(M44),其中以 5 日最為接近。​鬼宿星團是一個肉眼可見的疏散星團,呈現朦朧的霧狀光斑。​在光害較少的地區,使用雙筒望遠鏡觀察,能清晰看到火星與星團交會的美麗畫面。​建議在天黑後,朝西方天空尋找明亮的紅色火星,即可定位鬼宿星團的位置。​ 寶瓶座 η 流星雨 5 月 6 日凌晨,寶瓶座 η 流星雨將達到極大期,預估每小時可見 20 至 30 顆流星。​這場流星雨以速度快、亮度高著稱,常伴隨持續數秒的流星痕。​最佳觀賞時間為凌晨 1 時 30 分後至天亮前,選擇視野開闊且無光害的地點,使用廣角鏡頭拍攝,可捕捉到流星劃過夜空的壯麗景象。​ 金星合月與土星秋分 5 月 24 日清晨,金星與月亮將上演「合月」現象,兩者相距不到 3 度。​此時的金星亮度達 -4.7 等,與月亮相映成趣,猶如「大月亮」旁的「小月亮」。​使用 20 倍以上的小型望遠鏡,能觀察到金星的盈虧狀態。​ 此外,5 月 6 日為土星的「秋分日」,土星環因陽光照射角度的變化而呈現黑暗,形成難得一見的景象。​這些天象適合在破曉前的東方天空觀察與拍攝,建議提前勘察地點,選擇無遮蔽的觀測點,以捕捉這些罕見的天文畫面。 拍攝建議 火星穿越鬼宿星團:建議使用天文望遠鏡搭配追星儀拍攝,同時考慮到火星亮度高,鬼宿星團較暗,建議使用疊圖處理,以呈現星團細節並保留火星的飽和色彩。 寶瓶座 η 流星雨:使用...

SpaceX 星艦基地升格為「星際基地市」,馬斯克的太空城夢想啟動

SpaceX星際基地市成立,實現馬斯克太空夢!探討城市運作、職權、挑戰與未來發展,開啟太空探索新紀元。根據美國德州卡梅倫郡上週六(當地時間)公布的選舉結果,SpaceX 位於德州布朗斯維爾附近的火箭發射場「星艦基地」(Starbase),將正式升格為一個自治市,名稱定為「星際基地市(Starbase)」。 這項結果並不令人意外,因為具備投票資格的居民大多是 SpaceX 員工。在這次投票中,總計有 218 張有效票,其中 212 票贊成設立自治市,僅有 6 票反對。SpaceX 高階主管鮑比·皮登(Bobby Peden)也當選為星際基地市的首任市長。 SpaceX 執行長馬斯克(Elon Musk)隨後在 X(前身為 Twitter)發文表示:「德州星際基地現在是真正的城市了。」 城市化將助擴編與管理 星際基地市的成立象徵馬斯克「公司城」藍圖的第一步。不過目前 SpaceX 尚未公布該城市的具體發展規劃。SpaceX 南德州業務負責人凱西·盧德斯(Kathy Lueders)去年曾表示,成為自治市有助於擴大員工規模,也能讓某些管理事務由公部門主導,有利營運發展。 星際基地市的官方帳號也於投票結果出爐當晚表示:「成為一座城市,將幫助我們為正在打造人類太空未來的員工,建設最佳社區。」 卡梅倫郡的選舉負責部門主管雷米·加爾薩(Remi Garza)指出,當選舉結果獲得確認後,星際基地市便會正式納入郡內行政區劃,開始市政運作。郡長特雷維尼奧(Eddie Treviño)則透露,未來將就該市具體承擔哪些市政責任展開討論。 星際基地市有哪些權力? 根據德州法律,自治市享有包括土地使用規劃、稅收、聘僱市政人員等多項權力,並須遵守相關的公開會議與資訊透明法規。法律專家艾倫·博約爾克斯(Alan Bojorquez)指出,新市政府首先必須面對的將是財政預算與支出規劃。 此外,德州議員曾提...

AOKZOE A1X掌上型電腦搭載Ryzen AI 9 HX 370處理器,遊戲續航力最長可達8小時

AOKZOE推出的A1X掌上型電腦搭載解析度為1920 x 1200的8吋觸控螢幕,以及AMD Ryzen AI 9 HX 370處理器,提供相對強悍的遊戲效能。AOKZOE推出的A1X掌上型電腦搭載解析度為1920 x 1200的8吋觸控螢幕,以及AMD Ryzen AI 9 HX 370處理器,提供相對強悍的遊戲效能。 搭載120Hz高速更新螢幕 AOKZOE A1X搭載Ryzen AI 9 HX 370處理器,可調整式TDP(cTDP)範圍為4~30W,具有4組Zen 5與8組Zen 5c處理器核心,總共為12核24緒配置,2種核心的最高Turbo時脈分別為5.1 GHz、3.3 GHz,並搭配RDNA 3.5架構的Radeon 890M內建顯示晶片,具有16組運算單元(CUs),最高時脈可達2900 MHz。內建顯示規格僅次於具有40組CUs的Ryzen AI Max + 395理器。 延伸閱讀:AMD Tech Day 2024(二):Ryzen AI 300系列行動版處理器架構解析,Zen 5、RDNA 3.5、XDNA 2完全體登場CES2025:AMD Ryzen AI Max + 395、Ryzen Z2筆電、迷你電腦、掌上型電腦全線出擊 AOKZOE A1X搭載32 GB或64 GB雙通道LPDDR5x-7500記憶體,並具有1組PCIe Gen 4x4 M.2 2280固態硬碟插槽,提供1 TB或2 TB容量選擇,內建螢幕尺寸與解析度分別為8吋、1920 x 1200,並支援120Hz更新頻率以及VRR(Variable Refresh Rate,可變更新頻率)功能,提供更加流暢且無撕裂的視覺體驗)。 ▲ AOKZOE A1X是款搭載8吋螢幕的掌上型電腦。 ▲ AOKZOE A1X採用12核24緒的AMD Ryzen AI 9 HX 370處理...

AI 能寫程式卻難除錯?微軟研究揭示問題關鍵:不懂人類是怎麼 debug 的

AI 能寫程式卻難除錯?微軟研究揭示問題關鍵:不懂人類是怎麼 debug 的人工智慧成為新世代開發者的重要夥伴已是不爭事實。Google 執行長 Sundar Pichai 就曾表示,如今已有高達 四分之一的新程式碼由 AI 生成,Meta 的 Mark Zuckerberg 也高度關注 AI 在開發領域的應用。然而,儘管 AI 在「寫程式」表現搶眼,但在「找 bug」這件事上,卻明顯力有未逮。 根據微軟研究院最新發表的研究,即便是目前業界最強大的生成式 AI 模型,在面對軟體除錯任務時,表現仍不盡理想。研究團隊測試了包含 Anthropic 的 Claude 3.7 Sonnet 與 OpenAI o3-mini 在內的多款主流 AI 模型,並以 SWE-bench Lite 這套軟體除錯基準集進行 300 項挑戰,結果發現: Claude 3.7 Sonnet 成功率僅為 48.4% OpenAI 模型更低,僅 30.2% 與 22.1% 為什麼 AI 除錯這麼難?關鍵在於「學不到人怎麼做」 研究團隊指出,AI 模型目前最大的瓶頸在於訓練資料本身。現有的語言模型訓練內容多聚焦於程式碼生成與片段補全,但卻缺乏來自真實開發者的除錯紀錄與決策流程。 簡單來說,AI 還無法像人類那樣理解「哪裡出錯、該怎麼判斷、該試哪些工具、怎麼一步步排查」,因為它根本沒看過我們怎麼除錯。 未來若要讓 AI 真正具備除錯能力,就必須蒐集更多「人類除錯歷程」的資料,並進行專門訓練與微調,讓模型學會如何與除錯工具互動、如何思考 bug 形成邏輯。 程式寫得快,但錯也不少?AI 的可靠性仍需觀察 即使現在許多開發者已經習慣使用 Copilot、ChatGPT、CodeWhisperer 等工具輔助寫程式,但許多研究也指出,AI 生成的程式碼中仍潛藏著各種潛在錯誤或安全風險。 例如近期話題...