(相關(guān)資料圖)
12月2日消息,據(jù)了解,可靈AI于12月1日正式宣布,其自主研發(fā)的O1視頻大模型正式面向公眾全量開放。該模型被定位為一款統(tǒng)一的多模態(tài)創(chuàng)作工具,支持用戶通過單一輸入框融合文字、圖像、視頻指令進行視頻生成與編輯。
據(jù)悉,可靈O1模型采用MVL(多模態(tài)視覺語言)統(tǒng)一交互架構(gòu),結(jié)合Chain-of-Thought推理技術(shù),能夠處理文生視頻、圖生視頻、局部編輯、鏡頭延展等多種任務(wù),無需在不同功能模塊間切換。該技術(shù)通過多視角主體構(gòu)建方法,旨在解決視頻生成中人物或物體在鏡頭切換時出現(xiàn)的特征漂移問題,以提升畫面連貫性。
目前,可靈O1模型已在可靈App及官網(wǎng)開放體驗,支持生成3至10秒時長的視頻,主要面向短視頻創(chuàng)作者、廣告團隊及個人用戶。公司表示后續(xù)將開放API接口,供第三方平臺集成。(袁雪麗)
本文來自網(wǎng)易科技報道,更多資訊和深度內(nèi)容,關(guān)注我們。