AI趨勢周報第248期:高雄大學開源生成式AI應用平臺Kuwa GenAI OS
· 2024-04-01

在國科會TAIDE計畫的支持下,高雄大學資工系開發並開源生成式AI應用平臺;Hume AI揭露一款富有人味的語音AI;另一個AI工程師Devika來了;15秒樣本就能生成逼真語音,OpenAI發表語音生成模型;Meta揭露AR新技術,用ML快速重建3D室內場景

  語音AI     Hume AI     EVI  

Hume AI揭露一款富有人味的語音AI

最近,由Google前研究員Alan Cowen成立的AI新創Hume AI,預覽一款很特別的對話式AI系統Empathic Voice Interface(EVI),可理解使用者的語氣,並以相應的語氣回覆,就像是在跟人說話一樣。Hume AI表示,EVI透過數百萬人類對話訓練而成,開發者目前可透過Hume API將EVI整合至各種應用程式中。

EVI有幾種特色,包括能以與人類相近的語氣回覆,還能根據使用者的情緒來調整語氣,也能偵測使用者語氣,來判斷對話是否結束。同時,EVI也能自然地從對話中斷處,繼續新一輪對話。此外,EVI還能提供語音對話的文字轉錄,以及文字轉語音功能,也能整合任何語言模型。Hume AI預計在4月正式發布EVI。(詳全文)

  工程師    Devika      Devin  

另一個AI工程師Devika來了,雖然還不及Devin

繼AI工程師Devin橫空出世後,最近出現另一個AI工程師Devika,能根據人類指令拆分任務,並進行研究、寫程式來完成目標。Devika的開發者是印度AI新創stitionai的創辦人Mufeed VH,他表示,Devika的能力雖然還不及Devin,但透過開源可讓它更進步。

Devika的核心功能有幾種,包括可透過Ollama來使用Claude 3、GPT-4、GPT-3.5或本地端的大型語言模型(LLM),也能使用規畫和推理演算法,以及上下文關鍵字提取、瀏覽網頁,還有用多種程式語言來編寫程式。Devika的目標是要用AI來改變工程師開發軟體和除錯的方式,要來簡化流程和提高效率。Mufeed VH還表示,Devika可自動執行自己寫的程式,並在遇到錯誤的時候自動修復問題,不需人類工程師干預。(詳全文)

  OpenAI     語音生成     Voice Engine  

15秒樣本就能生成逼真語音,OpenAI發表語音生成模型

OpenAI最近揭露一款語音生成模型Voice Engine,可根據任一15秒的語音樣本,生成一段自然的語音,而且富有感情。OpenAI表示,Voice Engine專案在2022年底就已啟動,目標是要為自家的文字轉語音API、ChatGPT語音和朗讀功能中的預設語音提供支援。

不過,擔心避免遭到濫用,OpenAI並未對外開放這款模型。他們自2023年底開始與一小群值得信賴的合作夥伴測試模型,目前也有不少進展,比如可用來加強教育,為兒童提供閱讀協助,又或是用於翻譯,模型能將影片和Podcast翻譯成多種語言,並保留口音特色。另一個例子則與社區健康有關,可用來強化偏遠地區醫療溝通和諮詢服務,甚至,還有一家神經科學研究所用Voice Engine來輔助言語障礙患者表達。(詳全文)

  AR     Meta     室內場景  

Meta揭露AR新技術,用ML快速重建3D室內場景

最近,Meta發表一款場景生成模型SceneScript,不需依賴寫死的規則,透過機器學習就能直接推斷房間的幾何形狀,並轉換為建築元素的近似值。這個方法簡化了房間3D建模的程式,還更加輕巧,只需幾個位元組記憶體,就能產生清晰且完整的幾何形狀,而且具備可解釋性,使用者可簡單閱讀和編輯這些表示。

為開發SceneScript,團隊先是打造一個Aria室內環境合成資料集,包括10萬個完全獨特的室內環境,每個環境都使用SceneScript語言進行描述。過程中,團隊用Aria眼鏡來收集室內環境資料,並用這些資料模擬出不同的室內環境。由於所有模擬訓練都不涉及個人資料,因此模型訓練都能確保隱私,而且在訓練後,也能使用Aria眼鏡來驗證模型。

SceneScript的優點在於可擴展性,只要在Aria合成環境資料集中的「門」添加附加參數,就能訓練來預測物理環境中門開啟和關閉的程度。此外,透過在架構語言添加新特徵,SceneScript還能準確預測物體的位置,並進一步將這些物件拆解成組成元件,像是沙發的墊子、椅腳和扶手,設計師可用來創造真正適用於各種物理環境的增強實境內容。(詳全文)

  行銷     Adobe     生成式AI  

瞄準行銷內容需求,Adobe推出GenStudio預覽版

日前Adobe在年度大會上,發表一款預覽版行銷人員專用的GenStudio產品,主打用生成式AI來優化內容供應鏈。進一步來說,GenStudio涵蓋跨通路行銷所需的各種工具,以生成式AI為基礎,可讓企業用來快速尋找和生成資產、打造各種作品,還能根據即時的內容效能洞察來優化體驗。比如,行銷人員可針對品牌、客戶角色及產品描述訓練AI,來產生符合需求的文案和圖像,或用AI來審查內容。

GenStudio可分為3大特點,分別是工作流程與規畫、創造與生產、啟用與遞送,而每一特點都由不同工具支援,可整合、流暢地執行內容供應鏈。雖然GenStudio仍在預覽階段,但試用過的企業Orvis發現,制定專案計畫的時間減少75%,JLL創意團隊在兩年內的交付成果增加了250%,T-Mobile在不增加人力的前提下活動產出提高了47%。GenStudio預計今年全面上市。(詳全文)

/Kuwa系統團隊、Mufeed VH、Meta、Databricks

  AI近期新聞 

1. 美國要求每個聯邦機構設立AI長

2. Claude 3 Opus模型登上LMSYS Chatbot Arena排行榜榜首

3. 樂天開源懂日文和英文的語言模型RakutenAI-7B

:iThome整理,2024年4月

熱門文章
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
英國確認各垂直行業的賭博稅稅率
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
首頁
遊戲
合作
發現
我的