聯發科推生成式AI服務平臺和450億參數繁中大語言模型BreeXe，繁中表現贏過GPT-3.5-HUIDU Official Website

聯發科推生成式AI服務平臺和450億參數繁中大語言模型BreeXe，繁中表現贏過GPT-3.5

· 2024-04-10

聯發科正式發布生成式AI服務平臺MediaTek DaVinci，提供各種工具和提示、4大商店和智慧助理架構，能讓使用者打造客製化的助理。同時，聯發科也以Mistral 8x7B模型為基礎，打造出450億參數的繁中大語言模型BreeXe。

同時，達哥也新添許多功能（如下圖），包括DocChat、VideoChat、WebChat和Plugins。前三個就像是智慧助理，比如，DocChat可用來分析競爭對手、履歷表媒合、技術文件摘要，VideoChat則能自動生成會議記錄、產出YouTube影片摘要、TED影片摘要等，WebChat能用於技術趨勢分析、市場趨勢收集、產業新聞集錦等。而Plugins新功能，可提供企業知識檢索、RPA自動化等。

另一方面，聯發科技協理葉家順指出，聯發科技自己已深度運用達哥，整個集團的滲透率達到96%，滿意度也達到4.4分（滿分5分）。他進一步表示，達哥在聯發科技內部的應用場景相當豐富，就軟體開發來說，可用來分析需求規格、生成技術文件，在編寫程式部分，還能協助寫程式、協助除錯和Code review等工作，另外還能幫助開發者自動生成測項、自動生成測試案例等。不只如此，對聯發科技不同部門來說，生成式AI的應用情境也很廣泛，比如能協助人資篩選履歷和自動配對，能協助財務自動辨識發票，來加速報銷流程，或是根據外部資料，自動撰寫信用報告。（如下圖）

他也表示，達哥也發展成可供外部企業導入的生成式AI服務平臺，目前已有數十家高科技、金融、電信、法律、製造、銷售、服務、系統整合和雲端服務等產業的企業使用，另也有教育機構、新創等加入MediaTek Davinci生態系。

揭露最新繁中大型語言模型BreeXe

與此同時，聯發科技創新基地負責人許大山揭露最新的繁中大模型BreeXe，具450億參數，中文知識水準超越GPT-3.5。他表示，這款模型以Mistral 8x7B開源模型為基礎，用大量繁體中文資料訓練而成。但有別於Mistral 8x7B模型只能處理4,000字，BreeXe可處理長達4萬字。再來，他們也準備開源臺灣-RAG的訓練資料。

這不是聯發科技第一次發表自然語言處理相關技術。在2022年6月，他們就全面押寶生成式AI，啟動繁中大語言模型計畫，並在2023年3月開源首個繁中LLM：BLOOM-zh 1B和3B版本，同時發表相關論文。去年10月，他們還推出了臺灣知識評測集TW Trivia、TMMLU，今年2月則發布用1TB資料預訓練的繁中LLM：Breeze 7B並開源，今天則是發表首個超越GPT-3.5的繁中模型BreeXe。接下來，他們要朝打造繁中GPT-4的方向前進。

聯發科技資深技術經理陳宜昌也在現場展示BreeXe能力，包括BreeXe採用擴充詞表技術，其生成答案的速度快1倍、成本也下降一半，未來可望供企業於地端部署，降低成本。再來，他也展示RAG情境，透過提供一系列履歷PDF檔案，並請BreeXe提供表格式摘要，並推薦最佳人選（如下圖）。此外，就算輸入3萬多萬字的小王子全書內容並提問，BreeXe也能正確給出答案。

Popular articles

GAT Expo CDMX 2026 Kicks Off Today in Mexico with a Sold-Out Opening Reception at Big Bola Casino Santa Fe

Marketing