

Titan Image Generator為Amazon自行開發的Titan家族最新模型之一,使其得以趕上OpenAI、Google、微軟等競爭者,具備圖片編輯及加入浮水印等功能
Titan Image Generator的圖片編輯功能之一,是利用內建分割模型自動編輯圖片。最新模型支援以圖片遮罩進行修補(inpainting)及以擴展(outpainting)延伸或變更圖片背景。使用者可設定圖片大小、指明想要模型產生幾種款式。用戶也可利用其自有資料客製化模型,以生成和公司品牌指引一致的圖片,或是透過微調令模型生成特定風格的圖像。它也支援負責任AI原則,防止生成有害或惡意的圖片。
此外,有鑒於這模型可被用於生成Deepfake影像,所有以Titan生成的圖片都會加入看不見的浮水印,以利辨識AI生成的圖片。不過Amazon並未說明技術資訊。《The Verge》引述AWS主管指出,這浮水印不會破壞圖片畫質,也無法被裁切或壓縮掉,但使用者需要連結到獨立API以判別是否為AI生成。
AWS還為Bedrock新增了2個Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express為「價格和效能兼顧」的文字生成模型,提供最多8000 token輸入,也可以微調。它支援的情境包含檢索增加生成(retrieval-augmented generation)、開放式文本生成、腦力激盪、摘錄重點、程式碼及表格生成、文本改寫、改述(paraphrasing)、關聯思考(chain of thought)、擷取、問答及聊天等。

而Text Lite版則是為特定使用場景而設計,強調「具成本效益且可高度客製化」的LLM。Lite版最大輸入為4000 token,支援場景包括摘錄重點及文案寫作(copywriting)。
Titan Text Express目前已正式推出英文版,並有100多個語言版本已以預覽版上線,Titan Lite則僅支援英文。
除了主打的圖片生成模型外,AWS昨日還推出Titan多模嵌入(Titan Multimodal Embedding)模型。此一模型可支援多模態提示輸入,包括文字、圖片或者兩者同時輸入。Titan多模嵌入模型支援輸入最高128 token及25MB圖片,僅支援英文。
Titan多模嵌入提供非同步批次API,Amazon OpenSearch Service的神經搜尋(Neural Search)很快也會加入連接器,以便加入Titan多模嵌入模型支援。