

聯發科正式發布生成式AI服務平臺MediaTek DaVinci,提供各種工具和提示、4大商店和智慧助理架構,能讓使用者打造客製化的助理。同時,聯發科也以Mistral 8x7B模型為基礎,打造出450億參數的繁中大語言模型BreeXe。

同時,達哥也新添許多功能(如下圖),包括DocChat、VideoChat、WebChat和Plugins。前三個就像是智慧助理,比如,DocChat可用來分析競爭對手、履歷表媒合、技術文件摘要,VideoChat則能自動生成會議記錄、產出YouTube影片摘要、TED影片摘要等,WebChat能用於技術趨勢分析、市場趨勢收集、產業新聞集錦等。而Plugins新功能,可提供企業知識檢索、RPA自動化等。

另一方面,聯發科技協理葉家順指出,聯發科技自己已深度運用達哥,整個集團的滲透率達到96%,滿意度也達到4.4分(滿分5分)。他進一步表示,達哥在聯發科技內部的應用場景相當豐富,就軟體開發來說,可用來分析需求規格、生成技術文件,在編寫程式部分,還能協助寫程式、協助除錯和Code review等工作,另外還能幫助開發者自動生成測項、自動生成測試案例等。不只如此,對聯發科技不同部門來說,生成式AI的應用情境也很廣泛,比如能協助人資篩選履歷和自動配對,能協助財務自動辨識發票,來加速報銷流程,或是根據外部資料,自動撰寫信用報告。(如下圖)

他也表示,達哥也發展成可供外部企業導入的生成式AI服務平臺,目前已有數十家高科技、金融、電信、法律、製造、銷售、服務、系統整合和雲端服務等產業的企業使用,另也有教育機構、新創等加入MediaTek Davinci生態系。
揭露最新繁中大型語言模型BreeXe
與此同時,聯發科技創新基地負責人許大山揭露最新的繁中大模型BreeXe,具450億參數,中文知識水準超越GPT-3.5。他表示,這款模型以Mistral 8x7B開源模型為基礎,用大量繁體中文資料訓練而成。但有別於Mistral 8x7B模型只能處理4,000字,BreeXe可處理長達4萬字。再來,他們也準備開源臺灣-RAG的訓練資料。

這不是聯發科技第一次發表自然語言處理相關技術。在2022年6月,他們就全面押寶生成式AI,啟動繁中大語言模型計畫,並在2023年3月開源首個繁中LLM:BLOOM-zh 1B和3B版本,同時發表相關論文。去年10月,他們還推出了臺灣知識評測集TW Trivia、TMMLU,今年2月則發布用1TB資料預訓練的繁中LLM:Breeze 7B並開源,今天則是發表首個超越GPT-3.5的繁中模型BreeXe。接下來,他們要朝打造繁中GPT-4的方向前進。
聯發科技資深技術經理陳宜昌也在現場展示BreeXe能力,包括BreeXe採用擴充詞表技術,其生成答案的速度快1倍、成本也下降一半,未來可望供企業於地端部署,降低成本。再來,他也展示RAG情境,透過提供一系列履歷PDF檔案,並請BreeXe提供表格式摘要,並推薦最佳人選(如下圖)。此外,就算輸入3萬多萬字的小王子全書內容並提問,BreeXe也能正確給出答案。

