現在的TTS的技術,不僅更像真人講話,甚至每個人都可以訓練一個自己的聲音模型。TTS語音模型可以讓機器自然流暢的像人一樣的說話,最讓人可以理解的就是早期的GOOGLE小姐。但現在的TTS的技術,不僅更像真人講話,甚至每個人都可以訓練一個自己的聲音模型。今天我們就來談談TTS語音模型的訓練過程,讓大家更了解這項技術。
Q:什麼是TTS技術?
A:TTS,全文為 Text to Speech,即文字轉語音技術,能將文字轉換為自然流暢的語音。。
Q:TTS主要的應用場景是什麼?
A:TTS 的應用場景非常廣泛,隨著技術的發展,應用範圍也越來越多。
早期應用
無障礙領域: 為視障或閱讀障礙人士提供協助,將電腦內容轉換為語音。
公共場所廣播: 機場、捷運、博物館等地的資訊播報。
電話語音總機: 提供自動化的語音服務。
隨著技術進步,應用擴展到
教育領域: 語言學習、電子字典、翻譯教材等。
數位內容: 教育訓練影片、電子書閱讀器、汽車導航等。
娛樂產業: 遊戲 NPC 配音、有聲書製作、AI 配音工具等。
商業應用: 客服機器人、電話語音系統等。
未來潛力
個人化應用: 自媒體內容製作、個人語音助理等。
更豐富的情感表達: 應用於戲劇、笑話等需要情感表現的場景。
只要有需要人聲的地方,TTS 都能派上用場,未來應用場景將更加多元化。
Q:語言模型是怎麼訓練出來的?訓練語言模型需要哪些資料?
A:
收集語音素材:
可以在專業錄音室錄製
也可以使用已有的聲音資料,如Podcast或YouTube影片的音訊
準備文字稿:
需要與語音素材相對應的文字稿
可能還需要標註注音、情緒等額外訊息
資料處理:
將語音素材和文字稿進行對應
可能需要標註情緒、語氣等訊息
模型訓練:
使用準備好的資料來訓練AI模型
訓練時間可能從一週到幾個月不...
仰築裝修設計專精老屋翻修,執行長廖棨弘 (Youtuber哇洗弘 A) 透過專訪分享他如何在日常辦公與裝修過程中妥善運用 Epson 標籤機 LW-K600 與 LW-600P 提升效率。根據政府統計,全台屋齡超過 30 年的老屋佔比達到 51.1%,相較於新成屋的室內規劃或裝修,老屋改造需要更多的時間與經驗積累,畢竟在翻修老屋的過程中,遇到突發狀況的情形不算罕見,T 客邦這次很榮幸的邀請到在 YouTube 上擁有 9 萬訂閱的老屋翻修專家「哇洗弘 A×仰築裝修設計」暢談老屋翻修的經驗與心路歷程,有興趣的讀者千萬別錯過。
從建材業邁向老屋裝修之路
仰築裝修設計的負責人廖棨弘,在 YouTube 頻道上化身為「弘 A」,以分享老屋翻修和室內裝修相關知識著稱。弘 A 表示,自己原本從事建材相關工作,在結識了身為室內設計師的太太之後,轉而攜手一起經營仰築裝修設計,目前專職老屋改造和空間規劃,不論是舊屋翻修、工程安排或是室內設計都是仰築裝修設計的承攬範圍,平均每個月會有 9 至 10 件翻修案進行中,因此要妥善且有效率的安排不同案場的進度,掌握各個案場的狀況,就是仰築裝修設計團隊的專長所在。
▲ 仰築裝修設計的負責人廖棨弘,時常在 YouTube 頻道「哇洗弘 A×仰築裝修設計」中和網友分享室內裝潢或是翻修相關知識。
老屋翻修和新成屋的室內設計大為不同,新成屋由於建築物本身狀況好,只需要專注在室內空間規畫以及材質搭配,反觀老屋翻修可能會遇到的狀況非常多,不單純只是設計室內空間,還需要結合局部的營建,所以一般的室內設計公司不太願意承接老屋翻修案。
▲ 老屋翻修現場實況。(仰築裝修設計提供)
弘 A 分享,一般來說,在翻修老屋前,仰築團隊會先進行場勘,透過場勘過程就可以掌握屋況,了解業主遇到的問題以及希望達成的目標後,接下來就會進入到提案流程,從場勘、提案、設計、發包、施工一整個...
本文從皮革藝術家 Huan 的視角,來看看她是如何利用 MSI PANO 系列特殊的全景房機殼空間創作出《借物少女艾莉緹》這件獨一無二的作品。生活中有不少利用皮革打造的物品,但你應該不曾想過,以實用性為主要訴求的皮革竟然也能被巧手打造成一株株幾可亂真的觀葉植裁,若非親眼所見,實在是很難想像!而這些「以假亂真」的作品,都來自本次專訪的主角:皮革植物設計師吳雨歡 Huan 之手。
曾是專業珠寶設計師,且擁有長達十年設計經驗的 Huan,有感於工作內容的一成不變、以及無法完全開展個人創意思維,毅然決然選擇跳脫這樣處處受限的人生,但因創作熱情不滅,故轉而走上自己一直熱愛的「手作」之路,開始了皮件設計與製作的嶄新人生。偶然間發現皮革創作能與自己鍾情的各類觀葉植物相結合,於是便創作一系列「皮革植物」作品並深獲市場好評,更在宜蘭創立了名為「緩室」的工作室,用緩慢但精緻的步調,全心投入皮革植物的創作。
▲ Huan 將位於宜蘭的工作室取名為「緩室」,以緩慢的步調悠閒地創作著。
究竟皮革這樣一種人文氣息濃厚的素材,與展現無窮生命力的植物,能和印象中冷冰冰的科技產品碰撞出什麼新意呢?以下我們從 Huan 的視角,來看看她是如何利用 MSI PANO 系列特殊的全景房機殼空間創作出《借物少女艾莉緹》這件獨一無二的作品。
得不到成就感的職場經驗,成為轉念創作的契機
從小就喜歡繪畫的 Huan,大學就讀於輔大應用美術系,但在分組時,渴望接觸新事物的她,選擇專精於金工組,更從雕塑、寶石學…等不同課程中接觸到各式各樣的創作媒材,而這段經歷也奠下她爾後朝手作領域發展的基礎。
▲ Huan 在大學時期就透露對手作的喜愛,也接觸過不同類型的創作。
畢業後,由於當年與金工相關的工作機會不多,Huan 嘗試朝珠寶設計領域發展,而這一投入就長達十年。不過 Huan 坦言這份工作並未讓她獲得太多成就感,主要原因...
三星代工被曝年底前啟動重組:打破部門壁壘,提高部門協作韓媒 ChosunBiz 報導,三星公司計畫在年底前啟動重組 DS(半導體代工)部門計畫,從而打破部門壁壘,解決諸如溝通不暢和團隊本位主義(只顧自己,不顧他人)等問題。
三星半導體的業務含括記憶體半導體、晶圓代工和系統 LSI 等廣泛領域。而其業務組織和員工規模龐大,因此其難以快速改變業務方向或進行大幅營運修正是其最大缺點。也因為公司內部的業務部門和工作小組過多,部門之間很容易出現競爭或製衡的狀態。使得在開發晶片或製程的過程中,半導體設計、設計、製造、可靠性評估等各部門的利益不一致。
報導稱三星在 DRAM 市場也面臨競爭壓力,在 HBM 和 DDR5 領域落後於 SK 海力士,因此本次重組幅度很大,要從根本上變革其組織架構。
三星半導體業務的負責人全永鉉在上個月表示,必須大刀闊斧採取措施,消除部門團隊之間的溝通障礙,促進組織內部公開透明化,停止「隱藏或逃避問題」。三星計畫調整現有的團隊基礎結構,整合調整為以專案為中心的模式,加強協作流程,以解決因部門各自為政而產生的問題。
該公司未來計畫裁員高達 30%,這家韓國科技巨頭的代工業務正面臨多重困境,其中包括 3nm GAA 工藝的低良率問題。
該媒體報導稱三星發言人承認,在新技術開發部門與量產責任部門之間仍存在脫節現象,由於失敗責任的推諉,導致嚴重問題頻發。
三星的本位主義來自垂直整合策略
三星多年來採用垂直整合策略,簡單來說,就是一家公司或集團為了更有效地控制生產過程,將原本由不同公司負責的上游或下游產業納入自身經營範圍,形成一條龍的生產體系。三星也變成一個橫跨半導體、面板、手機等眾多領域的科技巨擘。
垂直整合帶來了諸多優勢,如快速反應市場變化、掌握核心技術、降低成本等。然而,這把雙刃劍也同時帶來了嚴重的本位主義問題,阻礙了企業的創新與發展。
垂直整合最大的優勢在於能讓...
RCS 發展邁入新里程碑,行動通訊產業競爭格局將重塑蘋果公司最近推出的 iOS 18 更新,帶來了一項重要變革:支援進階通訊解決方案(RCS)。這一更新不僅象徵著Apple和 Android 平台間的跨平台溝通取得了重大進展,也為全球行動通訊領域開啟了新的篇章。
RCS 是一種被視為傳統 SMS 和 MMS 簡訊升級版的通訊協議。與傳統簡訊相比,RCS 提供了更多豐富的功能,例如打字提示、已讀回執、高解析度媒體共享以及改進的群組訊息功能。這些功能無論是在 Android 還是 iOS 平台上,現在都可以實現。隨著 iOS 18 的推出,iPhone 使用者在與 Android 使用者通訊時,也能夠享受到這些進階的功能,極大提升了跨平台消息體驗。
然而,儘管這是 RCS 發展歷史中的重要里程碑,目前 iOS 18 上的 RCS 訊息仍然缺少一個關鍵功能——端對端加密(E2EE)。目前,雖然 Google Messages 已經為 Android 使用者開啟了預設的 E2EE 功能,但Apple的 RCS 尚未提供此項保護。這意味著 iPhone 和 Android 之間的 RCS 通訊目前還無法完全避免第三方的訊息攔截。
GSMA 技術總監 Tom Van Pelt 表示,RCS 的下一步計畫是推動跨平台端對端加密的標準化部署。他強調,這將是首次在不同運算平台之間實現標準化、互操作的訊息加密,為使用者帶來更強的隱私與安全保護。除了加密技術的進步,未來的 RCS 版本還將加入更多保護措施,以應對詐騙、騷擾等潛在的安全威脅。
隨著Apple加入 RCS 陣營,行動通訊行業的競爭格局也將隨之發生變化。未來,我們將看到更多行動設備、通訊軟體在訊息加密、安全保護方面的合作與進步。消費者將受益於這一技術演進,無論是 Android 還是 iOS 使用者,都能享受到更加順暢、安全的通訊體驗...
大疆於日前發表全新旗艦運動相機DJI Osmo Action 5 Pro,採用全新1/1.3吋CMOS,包括畫質、裸機防水、電池續航力皆有感提升,雙觸控螢幕也升級成OLED,大太陽下看得更清楚。大疆於日前發表全新旗艦運動相機DJI Osmo Action 5 Pro,採用全新1/1.3吋CMOS,包括畫質、裸機防水、電池續航力皆有感提升,雙觸控螢幕也升級成OLED,大太陽下看得更清楚。
超旗艦影像,打造運動相機畫質新高度
全新一代 1/1.3 英吋感光元件,讓 Action 5 Pro 的影像畫質達到旗艦新高度。畫面等效像素尺寸達 2.4 μm,動態範圍高達 13.5 級,同時搭配 4 奈米高性能晶片,即使在城市夜晚或日落日出等明暗反差大的時刻,也能拍出清晰銳利、明暗層次豐富的畫面。在低光環境中,最高支援拍攝 4K/60fps 高動態低光影像,能細膩呈現暗部細節,內建的超級夜景模式亦可運用 AI 降噪演算法應對更為暗光的環境挑戰,讓畫面更加通透純淨。
更高的影像規格,讓錄影、拍照都清晰。Action 5 Pro 的最高影片規格升級至 4K/120fps 4:3,並支援 4K(3840 × 2880)全像素錄製。搭配鏡頭 155° 的超大視角,畫面亮點更豐富,視覺表現更具動感與衝擊力。依託 4 奈米晶片的超強算力,最高可逐影格分析 240fps 影片,智慧實現 32 倍超級慢速播放,再現每一個驚豔瞬間。內建的專業 10-bit D-Log M 和 10-bit HLG 模式能捕捉超過 10 億種色彩,更充分地記錄亮部和暗部細節,為專業創作提供強大的後製調色空間。Osmo Action 5 Pro 拍照也同樣清晰,最高可完成 3 秒 30 張連拍,單張照片最高具備約 4000 萬像素(7294 × 5472)或 8K(16:9)解析度,清晰度約為前代產品的 4 倍,完美還原...
免費高速上網,航空業再掀服務升級戰美國聯合航空宣布將與 SpaceX 合作,在其整個機隊中部署 Starlink 衛星網路服務,為乘客提供更快、更可靠的 Wi-Fi 連接。這不僅將提升乘客的飛行體驗,也將成為 Starlink 在航空領域的重要里程碑。
顛覆傳統,帶來「客廳級」網路體驗
聯合航空表示,Starlink 服務將於明年初開始測試,首批搭載該服務的客機預計在 2025 年底前投入運營。與現有 Wi-Fi 供應商相比,Starlink 在海洋和偏遠地區也能提供更穩定的連接,尤其對於聯合航空眾多的跨洋航線來說,這是一項關鍵優勢。乘客將能夠享受直播電視、串流媒體等服務,並可同時使用多個設備。
聯合航空首席客戶長琳達·喬喬(Linda Jojo)表示,Starlink 能夠應對大量乘客同時上網的需求,提供如同「客廳級」的網路體驗。這將改變乘客對機上 Wi-Fi 的期望,使其成為吸引商務旅客等高價值客戶的重要因素。
此次合作是 Starlink 在航空市場的重大勝利。之前,Starlink 已與夏威夷航空、卡塔爾航空等公司達成協議,但聯合航空將成為其迄今為止最大的航空客戶。近年來,Starlink 業務迅速成長,為 SpaceX 帶來可觀收入。預計 2024 年 Starlink 的營收將達到 66 億美元,遠高於 2022 年的 14 億美元。
航空 Wi-Fi 市場競爭白熱化
隨著乘客對機上 Wi-Fi 需求的增加,航空公司紛紛尋求更快速、更可靠的解決方案。達美航空已開始為其 SkyMiles 會員提供免費 Wi-Fi,夏威夷航空也提供免費機上 Wi-Fi。捷藍航空則多年來一直提供免費 Wi-Fi。
除了 Starlink,其他衛星網路供應商也在積極拓展航空市場。Viasat 已與達美航空和西南航空簽署協議,而 Intelsat 則為美國航空的支線飛機提供 Wi-Fi...
暴雪娛樂將與中華職棒味全龍隊攜手舉辦《暗黑破壞神 IV:憎恨之軀》史詩級主題日, 9/29 台北大巨蛋現場將有多樣融合《暗黑破壞神 IV》主題元素的開場表演、聯名球衣及周邊商品。《暗黑破壞神 IV:憎恨之軀》即將在 10 月 8 日(二)於全球盛大上市,暴雪娛樂將與中華職棒味全龍隊攜手舉辦史詩級主題日,9 月 29 日(日)在臺北大巨蛋開啟傳奇篇章!除了多樣融合《暗黑破壞神 IV》主題元素的開場表演、聯名球衣及周邊商品外,現場還將送出包含《暗黑破壞神IV》遊戲內物品、《憎恨之軀》PC 終極版、Xbox Series X 遊戲主機等超過3萬份的入場獎勵;流行團體「南拳媽媽」也將帶來精采的賽後演唱會,邀請玩家與球迷一同沉浸在冒險旅途與觀賽體驗。
《憎恨之軀》X 味全龍主題日 9 月 29 日登場
本次主題日的聯名主視覺還原了《暗黑破壞神 IV》遊戲內創建角色時的經典營火場景,召集味全龍陣中球員林智勝、王維中、吉力吉撈‧鞏冠、拿莫‧伊漾與啦啦隊「小龍女」成員林襄、琪琪組隊化身遊戲角色,帶給玩家滿滿情懷。主題日除了有《暗黑破壞神》Coser 現身球場與球迷同樂外,還將邀請神秘嘉賓蒞臨開場儀式!賽後則由流行創作團體「南拳媽媽」帶來接連數首膾炙人口的神曲演唱,為活動畫下句點。
▲ 主題日限定推出之球衣、球帽、雷雕棒球及毛巾等限量聯名商品,只在現場販售。
參與 9 月 29 日《暗黑破壞神 IV:憎恨之軀》x味全龍主題日活動的觀眾皆可免費獲得刮刮卡一張,有機會刮中《暗黑破壞神 IV》遊戲內物品、《憎恨之軀》PC 終極版、 Xbox Series X 遊戲主機、Xbox 無線控制器(磨砂黑及冰雪白)、 PC Game Pass 1 個月會員資格,以及聯名主題商品等超過3萬份的獎勵!此外,龍隊全體球員及包含林襄、李多慧在內的啦啦隊員,當日均將穿著聯名主題球衣登場,並於臺北大巨蛋現場販售同款...
Anthropic Claude 3.5 在Chatterbox Labs安全測試中表現卓越,領先同業在當前人工智慧(AI)技術蓬勃發展的背景下,AI的安全性問題越來越受到關注。根據近期Chatterbox Labs的測試,Anthropic旗下的Claude 3.5 Sonnet在大型語言模型(LLM)安全性表現上,領先於多家競爭對手,成為眾多模型中的佼佼者。
Chatterbox Labs的安全測試
Chatterbox Labs是一家英國科技公司,提供名為AIMI的測試套件,針對AI模型進行各類安全和道德性評估,涵蓋「公平性」、「毒性」、「隱私」與「安全性」等多個領域。這裡所提到的「安全性」,指的是模型對有害內容的抵抗力,而非程式碼漏洞或其他技術問題。Chatterbox Labs的技術長史圖亞特·巴特斯比(Stuart Battersby)指出:「我們關注的安全性,是這些模型能否在不產生有害內容的情況下運作。」
在此次測試中,Chatterbox Labs使用了30個不同的挑戰性問題來檢驗模型的回應能力,這些問題涉及自我傷害、色情內容、安全威脅與惡意軟體等潛在有害話題。測試結果顯示,所有參與測試的主要模型都或多或少生成了有害內容。這些模型包括:
Microsoft Phi 3.5 Mini Instruct(3.8b)
Mistral AI 7b Instruct v0.3
OpenAI GPT-4o
Google Gemma 2 2b Instruct
TII Falcon 7b Instruct
Anthropic Claude 3.5 Sonnet(20240620)
Cohere Command R
Meta Llama 3.1 8b Instruct。
▲ AI 模型安全測試結果表
Anthropic的Claude 3.5 Sonnet表現卓越
然而...
Sony全新MDR-M1封閉式監聽耳機自今起在台開放預購,搭載獨家深厚的聲學技術並與專業音樂人士共同調校,並配備Sony獨家研發驅動單體,實現超寬廣頻段掌握聲音細節,同時兼具絕佳隔音效果,Sony 全新 MDR-M1 封閉式監聽耳機自今起在台開放預購,搭載獨家深厚的聲學技術並與專業音樂人士共同調校,並配備 Sony 獨家研發驅動單體,實現超寬廣頻段掌握聲音細節,同時兼具絕佳隔音效果,採用封閉式聲學結構設計,精心設計輕量化的頭帶以及適合各種耳型柔軟舒適的耳墊,成就全新業界錄音室標準級監聽耳機。
MDR-M1 採用封閉式聲學結構提供絕佳的隔音效果,以應用於廣泛的音樂製作場合,此外,透過Sony 獨家研發柔軟且具備支撐力的振膜設計,兼顧飽滿的低音和準確不失真的高頻,實現 5-80,000Hz 超廣音頻精準重現聲音細節,加上耳殼設計的氣流孔,可調節低頻時的聲學壓力以最佳化振膜動態表現,改善低頻瞬態特性減少內部不必要的共振,實現理想的原音重現。
MDR-M1 更與專業的音響工程師共同調校,確保還原錄音室中曲目的錄製編排,以最高標準將創作者的意圖如實呈現!
考量音樂製作長時間的工作需求,MDR-M1 以多年的聲學經驗設計符合各種耳型的耳墊,搭配低回彈泡棉提供舒適的貼合感,同時也達到優異的隔音效果,整體的輕量設計也大幅度減輕長時間使用帶來的負擔感,亦配備可拆卸式耳機線應對線材意外斷裂的情況,還可根據需求更換不同插頭規格的線材;耳機與線材透過螺絲固定也更加強化穩固性避免使用中脫落狀況發生,提供專業音樂工作者可靠的使用體驗。
最後是售價資訊方面,Sony MDR-M1 封閉式監聽耳機建議售價 $7,990 元,即日起至 10/27 期間預購及購買並註冊就送 KKBOX HIFI 無損音質 30 天。
延伸閱讀:Sony 入門級 WF-C510 真無線藍牙耳機在台上市!主打小巧與音...