国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

“嘮嗑式P圖”,修圖改圖“動(dòng)口不動(dòng)手”!每經(jīng)記者實(shí)測(cè)Gemini 2.0 Flash圖像生成器:一鍵給漫畫(huà)上色、生成圖文菜譜......

每日經(jīng)濟(jì)新聞 2025-03-14 21:01:05

3月12日,谷歌正式發(fā)布支持原生圖像生成功能的Gemini 2.0 Flash全模態(tài)圖像生成器?!睹咳战?jīng)濟(jì)新聞》記者對(duì)其進(jìn)行實(shí)測(cè)后發(fā)現(xiàn),該模型在給漫畫(huà)上色、生成圖文菜譜、添加元素等任務(wù)上表現(xiàn)出色,雖在運(yùn)行中出現(xiàn)一些狀況,但整體表現(xiàn)可圈可點(diǎn),為圖像生成技術(shù)的應(yīng)用拓展了邊界。

每經(jīng)記者 宋欣悅    每經(jīng)編輯 蘭素英    

3月12日,谷歌正式發(fā)布Gemini 2.0 Flash全模態(tài)圖像生成器,支持原生圖像生成功能?,F(xiàn)在,所有開(kāi)發(fā)者都可以通過(guò)Gemini API和Google AI Studio中的實(shí)驗(yàn)版本使用Gemini 2.0 Flash進(jìn)行原生圖像生成。

《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱(chēng)“每經(jīng)記者”)在Gemini 2.0 Flash原生圖像生成功能開(kāi)放后進(jìn)行了測(cè)試。測(cè)試發(fā)現(xiàn),Gemini 2.0 Flash在給漫畫(huà)上色、生成圖文菜譜、添加元素等多項(xiàng)任務(wù)上,均表現(xiàn)出色。

圖片來(lái)源:谷歌官網(wǎng)

“嘮嗑式P圖”,修圖改圖“動(dòng)口不動(dòng)手”

據(jù)谷歌介紹,Gemini 2.0 Flash具有出色的文本和圖像結(jié)合能力。它能夠根據(jù)文本描述生成連貫的故事,并自動(dòng)匹配相應(yīng)的插圖,在整個(gè)故事中保持角色和場(chǎng)景的高度一致性。而且,用戶(hù)如果對(duì)生成的內(nèi)容不滿(mǎn)意,只需給予反饋,模型便會(huì)重新講述故事或改變繪畫(huà)風(fēng)格,為創(chuàng)作者提供了極大的便利和創(chuàng)作空間。

此外,其會(huì)話(huà)式圖像編輯功能也十分強(qiáng)大,做到了“嘮嗑式P圖”。無(wú)論是調(diào)整細(xì)節(jié)還是探索不同的創(chuàng)意方向,用戶(hù)都可以通過(guò)多次自然語(yǔ)言對(duì)話(huà),輕松地對(duì)圖像進(jìn)行編輯。

在世界理解方面,Gemini 2.0 Flash與傳統(tǒng)模型相比,具有明顯優(yōu)勢(shì)。Gemini 2.0 Flash利用豐富的世界知識(shí)和增強(qiáng)的推理能力來(lái)生成圖像,能夠更好地理解現(xiàn)實(shí)世界中的各種概念和關(guān)系,從而生成更加逼真、詳細(xì)且符合上下文的圖像。例如,在生成食譜相關(guān)圖像時(shí),它可以準(zhǔn)確地描繪出真實(shí)的食材和烹飪方法,同時(shí)在Google AI Studio中實(shí)現(xiàn)文本和圖像的交錯(cuò)輸出,讓用戶(hù)獲得更直觀的體驗(yàn)。

值得一提的是,Gemini 2.0 Flash在文本渲染上表現(xiàn)卓越。大多數(shù)傳統(tǒng)圖像生成模型在處理長(zhǎng)段文本時(shí),容易出現(xiàn)格式不佳、字符難以辨認(rèn)或錯(cuò)別字等問(wèn)題,而Gemini 2.0 Flash的內(nèi)部基準(zhǔn)測(cè)試顯示,其在渲染方面優(yōu)于競(jìng)爭(zhēng)對(duì)手的領(lǐng)先模型,這使其在創(chuàng)建廣告、社交媒體帖子和邀請(qǐng)函等需要高質(zhì)量文本圖像的場(chǎng)景中具有巨大的優(yōu)勢(shì)。

OpenAI前研究科學(xué)家威廉·古斯(William H.Guss)在社交媒體上感嘆道,“谷歌實(shí)力回歸了。”

圖片來(lái)源:X

多任務(wù)實(shí)測(cè):生成圖文菜譜、制作生日賀卡、給漫畫(huà)上色等輕松拿捏

在Gemini 2.0 Flash原生圖像生成功能開(kāi)放后,每經(jīng)記者通過(guò)生成圖文菜譜、制作生日賀卡、給漫畫(huà)上色等多項(xiàng)任務(wù),對(duì)該功能進(jìn)行了測(cè)試。

任務(wù)1:添加或去掉元素

首先,記者發(fā)送了OpenAI首席執(zhí)行官山姆·奧爾特曼出席活動(dòng)的一張照片,希望Gemini 2.0 Flash去掉圖片中的部分元素——頭發(fā)。

經(jīng)過(guò)五分鐘的等待,Gemini 2.0 Flash完成了記者提出的需求。雖耗時(shí)較長(zhǎng),但令人驚喜的是,處理前后的兩張圖片保持了高度一致性。不管是人物神態(tài)及五官、虛化的背景墻,還是圖像生成模型很難避開(kāi)的“坑”——人物手部細(xì)節(jié),Gemini 2.0 Flash都處理得相當(dāng)完美


然而,Gemini 2.0 Flash在運(yùn)行過(guò)程中也出現(xiàn)了一些狀況。當(dāng)記者在同一對(duì)話(huà)頁(yè)面繼續(xù)與模型交互,提出“去掉黃仁勛眼鏡”的指令時(shí),Gemini 2.0 Flash給出的回應(yīng)并非如預(yù)期那樣。其回傳的圖片中,主體變成了剛剛生成過(guò)的奧爾特曼形象,同時(shí)還融入了記者發(fā)送的黃仁勛圖片中的英偉達(dá)芯片元素。

隨后,記者又向Gemini 2.0 Flash發(fā)送了一張電車(chē)的圖片,并提出在車(chē)頂上添加“TAXI”標(biāo)志的指令。經(jīng)Gemini 2.0 Flash處理后回傳的圖片,“TAXI”標(biāo)志與電車(chē)整體融合度極高,幾乎難以察覺(jué)到后期添加的痕跡。

不過(guò),記者也留意到,圖片中車(chē)牌上的文字變得模糊難辨,除此之外,該圖片在其他方面的表現(xiàn)堪稱(chēng)出色,很難找出明顯瑕疵。

任務(wù)2:上色、改色

在上一項(xiàng)的測(cè)試任務(wù)中,Gemini 2.0 Flash展現(xiàn)出的一致性表現(xiàn)著實(shí)令人驚艷。那么,面對(duì)線(xiàn)條復(fù)雜、圖片中還夾雜著對(duì)話(huà)的漫畫(huà)場(chǎng)景,Gemini 2.0 Flash能否延續(xù)其出色發(fā)揮?

記者隨后發(fā)送了一張黑白漫畫(huà),并要求模型為該圖片上色,且色彩風(fēng)格需契合漫威的風(fēng)格。

待Gemini 2.0 Flash完成處理后,記者將前后圖片進(jìn)行比對(duì),發(fā)現(xiàn)模型精準(zhǔn)錨定了指令需求,專(zhuān)注于為圖片上色,未對(duì)圖片其他元素做額外改動(dòng)。漫畫(huà)中的原有文字,無(wú)論是字體樣式還是位置排版,均與處理前保持了高度一致。

圖片上色不成問(wèn)題,那么改動(dòng)某個(gè)物體的顏色,Gemini 2.0 Flash又表現(xiàn)如何呢?

記者隨即向Gemini 2.0 Flash發(fā)送了一張玫瑰的圖片,要求模型將玫瑰的顏色改成鮮紅色。

這次模型很快輸出了結(jié)果。回傳的圖片中,玫瑰呈鮮紅色,其色澤與質(zhì)感高度貼近現(xiàn)實(shí)中紅玫瑰的視覺(jué)效果,無(wú)論是花瓣的紋理還是整體色調(diào)的過(guò)渡,均處理得極為自然,幾乎難以察覺(jué)AI的修改痕跡。

任務(wù)3:AI電商模特,一鍵換衣

隨著記者加大測(cè)試難度,向其發(fā)送了一套服裝的圖片,要求模型將這套服裝穿到一位男性模特身上,同時(shí)將圖片背景色設(shè)定為橙色。

Gemini 2.0 Flash同樣很好地完成了任務(wù)。圖片中,服裝完美適配男性模特身形,且背景色也被準(zhǔn)確替換為橙色,整體效果自然流暢,毫無(wú)違和感。

不僅如此,當(dāng)記者進(jìn)一步要求AI模特展示不同動(dòng)作時(shí),Gemini 2.0 Flash同樣輕松應(yīng)對(duì),快速為AI模特更換了拍照動(dòng)作,堪稱(chēng)電商從業(yè)者的福音。

任務(wù)4:生成圖文菜譜

Gemini 2.0 Flash還具備一項(xiàng)技能——生成圖文并茂的菜譜。為測(cè)試其實(shí)際表現(xiàn),記者以“番茄炒蛋”這道家常菜為例,要求模型生成一份包含詳細(xì)步驟的圖文菜譜。

可以看到,模型不僅完整且條理清晰地呈現(xiàn)出了“番茄炒蛋”的菜譜,從食材準(zhǔn)備、烹飪步驟到火候掌控等信息一應(yīng)俱全,還在菜譜相應(yīng)位置精準(zhǔn)插入了與之匹配的圖片。值得注意的是,這些圖片均由Gemini 2.0 Flash自行生成,而并非從互聯(lián)網(wǎng)上搜索獲取。

任務(wù)5:制作生日賀卡

在圖像生成領(lǐng)域,眾多模型在應(yīng)對(duì)長(zhǎng)段文本處理時(shí),常陷入格式不佳、字符模糊難辨或錯(cuò)別字頻出等問(wèn)題。Gemini 2.0 Flash在這方面的表現(xiàn)如何呢?

記者向Gemini 2.0 Flash下達(dá)指令,要求其設(shè)計(jì)一張生日賀卡,并明確規(guī)定了賀卡上需呈現(xiàn)的文字祝福內(nèi)容。

約十秒鐘后,Gemini 2.0 Flash便生成了一張?jiān)O(shè)計(jì)精美的生日賀卡。仔細(xì)查看,賀卡上不僅完整涵蓋了記者所要求的全部文字,而且文字清晰易讀,格式也規(guī)范得體。

總體來(lái)看,Gemini 2.0 Flash原生圖像生成功能的表現(xiàn)可圈可點(diǎn),雖有一些小瑕疵,但為圖像生成技術(shù)的應(yīng)用拓展了邊界。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線(xiàn):4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

Gemini 谷歌 原生圖像生成

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0