• Skip to primary navigation
  • Skip to main content
  • Skip to primary sidebar

雲爸的私處

  • 首頁
  • Apple
    • iPad
    • iPad Mini
    • iPhone
    • iPhone Case
    • Macbook
    • Mac 周邊
  • 手機
    • HTC
    • ASUS
    • Samsung
    • Moto
    • 小米
    • OPPO
    • LG
    • HUAWEI
    • Sony
    • NOKIA
    • InFocus
    • Google
  • 生活家電
    • 電視盒
    • 空氣清淨機
    • 液晶電視
    • 電動車
    • 行動電源
    • 行車紀錄器
  • 各類3C開箱文
    • 手機周邊
      • 手機周邊
      • 穿戴式裝置
    • 平板
    • 其他亂敗家的東西
    • 收藏逸品
    • 汽車3C
    • 相機攝影
  • 電腦
    • 迷你電腦
    • 遊戲主機
    • 主機板、顯示卡
    • 機殼電源
    • 儲存裝置讀卡機
    • 滑鼠鍵盤
    • 耳機/喇叭
    • VR 軟硬體
    • NAS雲端儲存
    • 網通產品
  • 筆記型電腦
  • 生活家電
  • 好用軟體
    • Android APP教學介紹
    • 軟體技術研討
    • 遊戲攻略
    • MIS技術
    • 開機USB+XPE
    • 防毒軟體
    • 繪圖軟體
  • 就是要出國
雲爸的私處 > 軟體技術研討 > AI繪圖、語音 > 這款AI生圖太讚,連提示詞都不用,給圖當範例就完工

這款AI生圖太讚,連提示詞都不用,給圖當範例就完工

12 23, 2024 by 雲爸

AI 生圖工具,已經多得氾濫了,但Google 最新推出的Whisk,還是找到了一種很新的玩法,讓見過世面的網友也直呼好玩。

只要輸入三張圖片,subject(主題)、scene(場景)、style(風格),Whisk 就可以產生一張博採眾長的圖片。

▲ 圖片來自:Google

舉個例子,主題是老人,場景是藤蔓,風格是90 年代復古動漫,寫上「角色騎著飛行自行車」的提示詞,等待一會兒,一張類似吉卜力畫風的新圖片誕生了。

▲ 圖片來自:Google

老人還是那個老人,戴帽子,穿西裝,拿著書,但他騎上了提示詞裡的車,場景和風格也都變成了參考圖片的樣子。

這個全新AI生圖,名叫 Whisk

  • 網址: https://labs.google/fx/tools/whisk/unsupported-country
  • 目前尚未開放台灣註冊,可先預約排隊

Whisk 的長處便在這裡——讓我們少寫、不寫提示詞的同時,輕鬆玩轉各種風格,媽媽再也不擔心我不會寫提示詞了。

別寫複雜的提示詞了,直接給參考圖就好

別看只需要幾張圖片,Whisk 的玩法簡單,卻又無窮無盡。

刷刷刷上傳三張圖片-主題圖片,麥當勞薯條;場景圖片,莫內畫作《睡蓮》;風格圖片,像素風遊戲《星露穀物語》。

不寫提示詞,直接生成,Whisk 給出的結果,一張比三張更強大。

除了上傳自己的圖片,我們也可以擲骰子,讓Whisk 隨機產生主題、場景、風格。

其實,Whisk 為我們提供的預設風格已經很夠用,徽章、貼紙、刺繡、黏土、美漫、馬賽克拼貼等等,特色鮮明,效果立竿見影。

只要有腦洞和想像力,無需一個字,僅透過不同圖片的排列組合,我們可以不斷地做完形填空的遊戲——主題+場景+風格,而且不是每個空都必須填入。

▲ 1.主題圖片,燻雞;2.場景圖片,梵谷《星月夜》畫作;3.風格圖片,日本木版畫

▲ 1.主題圖片,《戴珍珠耳環的少女》;2.場景圖片,電影《千與千尋》劇照;3.風格圖片,蒙德里安抽象畫

▲ 1.主題圖片,衝浪預設頭像粉紅恐龍momo;2.風格圖片,Jellycat 玩偶

另外,Whisk 的每一次生成,場景和風格只能選擇一個參考圖片,但主題可以選擇多個。這意味著什麼?我們可以讓多個角色同框了!

例如,讓馬斯克、奧特曼、祖克伯通通變成胸章。

三位的服裝、裝飾、神態都還原得挺好,祖克柏的麥克風和項鍊都沒漏掉,但人臉沒辦法保持一致性,全部變成了大眾臉。

雖然Whisk 減少了寫提示詞的需求,但你需要寫的話,Whisk 也鼓勵。

在對話框中加上一句「角色們都舉著一塊告示牌,上面寫著AGI」,徽章小人們輕輕鬆鬆地遵循了提示詞。

如果我們需要某個場景或某種風格,但一時找不到參考圖,Whisk 的預設也沒有提供呢?

解決方式很簡單,沒有圖片,那就寫提示詞,讓Whisk 臨場發揮一個。

就像我需要一個讓角色站上去的、像素風格的底座作為場景,就讓Whisk 幫我生成了。

然後,再把貓貓表情包當作主題圖片,把像素小雞當作風格圖片,就可以得到一個有底座的像素貓貓。

總之,Whisk 就是非常自由,像橡皮泥一樣,怎麼捏都可以。

既生圖又識圖,把複雜的工作流程包裝成有趣的「打蛋器」

Whisk,其實是Google 多模態模型秀肌肉的一種方式。

為了讓我們少寫提示詞,Whisk 整合了視覺理解和圖片產生能力。

Gemini 模型辨識圖片,自動產生詳細的描述,然後這些描述會被輸入到Google 的圖片產生模型Imagen 3,由Imagen 3 生圖。

Whisk 是這樣的,用戶只要上傳和生成圖片就可以了,但它自己要考慮的事情就很多了。

Whisk 的每張圖片,不管是上傳的還是生成的,都寫了很長的底層提示詞,並且不藏著掩著,我們點開圖片就能看,也可以上手修改。

如果以一個人作為主題圖片,Whisk 會詳細地描述他的外表特徵,場景圖片也是類似的。

▲ Whisk 對奧特曼的描述:「一個膚色較淺的男子,有著短而深棕色的捲發,從胸部以上展示。他有著淺色的眼睛。他穿著一件淺米色的針織圓領毛衣。背景是一面斑駁的灰色混凝土牆。

風格圖片略有些不同,如果把一張動畫截圖當作風格參考,Whisk 不會說,畫面裡有三個人,而是描述這幅畫的色彩、光線、線條…

▲ Whisk 對史努比畫風的描述:「這張圖片以卡通風格呈現,具有粗獷的輪廓和平面著色。色彩調色板有限,主要使用原色和柔和的次要顏色。光線均勻,缺乏強烈的陰影或高光,給人一種簡單、幾乎孩童般的質感。

所以,Whisk 不是精準複製圖片,而是提取圖片的特色和精髓,將主題、場景、風格自然地融合在一起,各司其職,互不干擾。

同時,Whisk 也疊了甲——只從圖片中提取少量關鍵特徵,結果可能和預期不同。這也解釋了,為什麼Whisk 做不到人臉的精準還原。

所以,即使選擇不那麼抽象的復古膠卷風格,三位大佬的臉也是和本尊都不挨著,但其他細節都很準確。

物體也是一樣,特斯拉的賽博皮卡,經過特徵提取再生成之後,變得非常普通。

但如果是麥當勞薯條這種素材豐富的超級IP,效果倒還不錯,可以拿來當廣告圖了。試過一些迪士尼的角色,Whisk 復刻得也原模原樣,但圖就不放上來了。

另外,Whisk 還存在一個問題——沒法做很細緻的風格參考,模仿不了某種特定的畫風。

當我讓Whisk 生成蒙娜麗莎的樂高小人,出來的結果讓我兩眼一黑,但多加一句提示詞,「讓角色更像樂高人物」,Whisk 又能模仿個七八成。

某個漫畫家的畫風就更難模仿了,上傳漫畫截圖讓Whisk 參考,它最終給出的是一個非常普通的漫畫風格圖片,就算透過提示詞強調作品、角色、漫畫家,也不起什麼作用。

其實,Whisk 好玩就夠了,它更適合做一些不追求精準的創意探索,俗稱整活。

Whisk 可以翻譯為「攪拌」或「打蛋器」,Google 的這個名字取得即視感很強,可不就是把食材都混搭在一起嗎?

Whisk 的不精準,也讓它的定位和傳統的圖片編輯器不同,更像是一種創意工具。有了什麼腦洞,由它實現粗略的視覺效果。

▲ Whisk 生成,1.主題圖片,《火影忍者》截圖;2.風格圖片,毛絨玩具

以前實現Whisk 這種風格化的效果,跑通一整個影像產生的流程,我們可能需要在ComfyUI 搭建工作流程。

但現在有了Whisk,好像就在玩抽卡遊戲或開盲盒,而且只要能登入(限美國地區),目前還免費。

體驗指引👇
https://labs.google/fx/zh/tools/whisk

Google 領先的模型能力固然是前提與基礎,但設計出被大家需要的產品,仍需要創意和美感。

很喜歡Whisk 的slogan:「prompt less, play more.」(少寫提示詞,多玩耍。)

Whisk 出自Google labs,之前爆紅的AI 播客NotebookLM,也是出自這裡,後來慢慢發展成成熟的計畫。這個實驗室,本身就是這句slogan 的最佳註解。

強大的模式能力,有新意的產品,開放的心態,曾經似乎被OpenAI 威脅的Google,風輕雲淡地展現出了王者歸來的姿態。





喜歡這篇文章的話,請幫這篇文章點個讚,或者到 雲爸的3C學園按個讚,快速得到最新的文章喔


有任何疑問,歡迎加入《3C問題互助團》社團這裡可以讓大家互相討論手機、電腦問題

不定時我也會在這邊舉辦抽獎,歡迎一起來聊聊

Filed Under: AI繪圖、語音

Previous Post: « 8吋MSI Claw 8 AI+電競掌機,即日開放預購,早鳥送收納包
Next Post: 2024 bilibili,好頻道分享特輯 »

Reader Interactions

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Primary Sidebar

近期文章

遊戲制霸 realme GT 7 Pro : 讓你見識真正的性價比

開箱評測 Amazfit Cheetah Pro 旗艦跑錶-進階跑者自訓練、破PB的好夥伴

Sony Xperia 1 VII 登場!2025 超強旗艦手機完整開箱、特色與預購資訊

☢️「核彈即將在10分鐘後命中你住的城市」….你可以做什麼?

教你用安卓手機玩復古遊戲 – RetroArch 安裝設定懶人包 (NES/SNES/GBA/PS1/N64)

挑戰你的「恥力」,💖影片上全台小7 數位看板秀出「我愛妳!」

圖賞《Death Stranding 2: On the Beach》限量版DualSense無線控制器

作者

大家好,我是《雲爸》 曾任三星學園講師達兩年經驗,也曾擔任 LG G Pro2 體驗會講師,浸淫文字十多年,熱愛與大家分享 3C、生活、以及生活大小事 專注於最新手機、平板、筆電以及使用者教學、系統與APP 介紹,以及最有趣的話題,不愛贅字也不囉嗦,精簡扼要的讓你明白,什麼是3C。
業務合作請來信:dacota@outlook.com

分類

展開全部 | 收合全部

瀏覽量

本日人氣:609
總瀏覽量:97,302,774

Copyright © 2025 · 雲爸的私處 All Rights Reserved. | 關於雲爸 | 隱私權政策| 網頁維護:Fast Line 台灣速連