为了解决模型生成错误信息的幻觉问题,Google利用检索交错生成(RIG)以及检索增强生成(RAG)技术,让开源模型Gemma结合开源知识图谱Data Commons,发展出查证能力更好的DataGemma模型
/Google
第二种方式中,当用户查找DataGemma时,它会运用Gemini 1.5长脉络空间,先从Data Commons取得上下文信息,再生成回应,借此减少幻觉、提升回应品质。
Google之前已利用开源的Gemma和Gemma 2为基础,使用RIG和RAG微调出变种版本,而这次则是以Gemma 2为基础,再以RIG及RAG方法,分别生成DataGemma 2个27B版本变种,现已分别在Hugging Face平台公开。Google计划持续改善方法,最后会将这些方法学整合到开源的轻量模型Gemma,以及Gemini家族模型。一开始将局部开放给少数人试用,再阶段性逐步扩大开放。