8月29日,據(jù)彭博社報道,谷歌宣布將重新啟用其人工智能模型Gemini的人物圖像生成功能,部分訂閱了Gemini Advanced套餐的英語用戶將能夠再次使用這一功能。此外,企業(yè)用戶也將能夠利用這一工具,預(yù)計在未來幾天內(nèi)全面上線。
谷歌產(chǎn)品管理高級總監(jiān)戴夫·西特倫(Dave Citron)表示,公司在通過Imagin 3生成人物描述方面取得了顯著進(jìn)展。他提到,團(tuán)隊一直在努力提升產(chǎn)品的技術(shù)性能,并改進(jìn)了評估集、紅隊練習(xí)以及明確了產(chǎn)品原則。盡管Gemini生成的圖像并非完美無瑕,但公司將繼續(xù)收集早期用戶的反饋,不斷優(yōu)化用戶體驗(yàn)。
所謂“紅隊練習(xí)”,是指在產(chǎn)品正式發(fā)布前,通過模擬使用來發(fā)現(xiàn)其潛在風(fēng)險。西特倫強(qiáng)調(diào),用戶將無法生成過于真實(shí)的圖像、可識別的個人肖像、未成年人的形象,以及涉及血腥、暴力或性場景的內(nèi)容。
回顧此前事件,今年2月,谷歌的圖像生成工具曾因生成的人物圖像存在歷史不準(zhǔn)確的問題而遭到批評。例如,在生成“美國開國元勛華盛頓”主題的圖片時,出現(xiàn)了女性和有色人種的形象。此外,一些用戶指出,Gemini在處理白人形象時顯得異常謹(jǐn)慎,甚至難以生成相關(guān)圖像。為此,谷歌于2月22日宣布暫停Gemini的人物圖像生成功能,并致力于解決相關(guān)問題,計劃在不久后重新推出改進(jìn)版本。
谷歌DeepMind首席執(zhí)行官德米斯·哈薩比斯(Demis Hassabis)在今年MWC 2024的一次小組討論會上也提到,公司已暫時停用了Gemini的人像生成功能,并正在積極修復(fù)問題,預(yù)計在未來幾周內(nèi)重新上線。隨著此次更新,谷歌顯然希望能夠在保證內(nèi)容準(zhǔn)確性的同時,進(jìn)一步提升用戶的使用體驗(yàn)。