最近,朋友圈和抖音小红书几乎被 Nano Banana 刷屏了。这个香蕉模型似乎要让 P 图这个词消失,直接给 Gemini 带来了一千万的新用户,火得一塌糊涂。
各路大神的邪修玩法铺天盖地,什么 3D 手办、大佬合影都是基操了。虽然 Nano Banana 强得不行,但我们在留言区依然收到不少用户的疑问和需求。
首先使用门槛就拦住了不少人,甚至比在国内用 ChatGPT 还麻烦一些。在图片编辑过程中,最多人反馈的是 Nano Banana 图片分辨率不够高,以及比例高度不可控。
说实在,我也感觉自己有点吹毛求疵,但没想到,这些需求真的有人听了进去,并且做了出来,而且还是咱们国产厂商。
刚刚,火山引擎正式上线豆包・图像创作模型 Seedream 4.0。除了具备“超强主体一致性、多图灵活创作、连续生图”等核心能力,Seedream 4.0 还有一个 Nano Banana 也没有的功能——支持最高 4K 高清图片输出。
这也是首个最高支持 4K 多模态生图的模型,Seedream 4.0 同时也在豆包、即梦全量上线,最高支持 2K 输出。
实际表现如何需要拉出来溜溜。APPSO 提前拿到内测体验了几天,给它上点比 Nano Banana 更大的强度。
实测完后我发现,虽然也不能算完美,但国产生图确实来到了一个新的阶段。
我替苹果把 iPhone 17 Air 提前发布了
今晚就是苹果秋季发布会了,不用熬夜看直播,APPSO 先帮苹果把 iPhone 17 给上线了
我们用 Seedream4.0 生成了两款今年大火的 iPhone 17 Air 产品页面,这可是今年最受关注的超薄旗舰。
参考 iPhone 16Pro 的官网页面,替换手机和相关文案,保证果味十足
这个构图似乎有些古板,调整一下小字 ,再加上 Just 5.5mm thin 这个最大的亮点。
可以看到 Seedream4.0 生成的这版 iPhone 17 Air 将手握机身的倾角,刚好和字母 A 右边平行,有点资深设计师的审美了。
这次,我们不让库克来发布产品,有请特斯拉人形机器人来客串一把。还是熟悉的场景,熟悉的 Good Morning(doge)。
这组图用到了三张参考图,人形机器人、iPhone 17 Air ,以及库克的现场图,Seedream4.0 一致性确实有点东西。
其实这里还有个逆天的细节容易被忽略,注意看观察生成图机器人头盔上的反射细节,原图是漆黑一片的。
也就是说, Seedream 4.0 根据图 3 的蓝天白云和建筑物背景,推理出机器人应该有的反射,真的太细了。
不妨再脑洞大开一点,据称 iPhone 17 Air 就是为了明年折叠屏手机做准备。APPSO 用 Seedream4.0 也提前让大家看看 iPhone 首款折叠手机的“实拍图”。
眼尖的读者可能已经发觉,是不是跟华为新款的三折叠有点像,没错我用了它作为参考图,替换上了苹果的摄像头和logo,无论是构图、背景和水印的细节都完整保留了。
那干脆整一部苹果的三折叠,没有人知道那一夜,苹果和华为究竟发生了什么。
如果是“乔布斯”,他会怎么发布这款产品,我们请 AI 老乔限时返场。
熟悉的身影,穿透屏幕的气场,让我们再次高呼“Amazing”。
好玩之外,还真能用
Nano Banana 能走红,除了社交媒体的爆款玩法,更在于它的技术能“看得见未来”。
无论是一致性、局部修改、换色还是多图结合,都是能够直接用在电商、营销、社交媒体等等场景里。
技术如果不能应用到生产力场景,也只是玩具。下面我们看看 Seeddream 4.0 在一些实用场景能不能打。
我们先拿这两天刷屏的红月亮,融合到球鞋设计中。
我还想看看这款球鞋不同角度的展示,只需输入类似“生成一只白色运动鞋,展示正面、侧面和俯视视角”的提示词,不管是用于打样还是用于设计草图,都直接一步到位。
如果我还想找一个模特用不同姿势展示商品呢?找不到合适的参考照片也没关系,直接画个火柴人简笔画就行。
Seeddream 4.0 基于手绘图能有效控制模特姿势的一致性,同时实现角度的合理变化,在多角度呈现上表现精准。
像下面这个案例,我在提示词里面没有指定两个人的站位,所以在它生成的 4 张照片里面,两种站位都有,而且效果都很好。
它像一个周到的乙方,如果你需求没有很明确,那就把可能的情况都考虑到并把成品给你挑选。
提示词:将图1男子和图2女子合进一张画面,参考图3姿势
如果说拥抱这种动作太简单了,我们直接来一个举高高的动作,这次再指定多一张背景图片。
提示词:将图3和图1合进一张画面,参考图2姿势,图1是被举起来的那个小孩;同时背景使用图4。图四的背景是来自浪浪山,两个角色是罗小黑和他的师傅。
四个人的参考图,Seedream 4.0 同样可以很好的处理,保持和简笔画的姿势一致。
提示词:把图一的四个角色(西游记里面的师徒四人,沙僧、唐僧、猪八戒、孙悟空)按照图二的姿势(叠罗汉)排布,沙僧、孙悟空和猪八戒在下面,唐僧在上面。
如果还想给模特更换妆造,我们发现 Seeddream 4.0 也能准确把握不同发型的特质:长直发的柔顺、盘发的干练以及卷发的弧度,全部都清晰呈现。
同时,背景与人体保持高度一致,未出现边缘模糊或形变问题,成功实现了在保留主体特征的基础上对妆发风格的精准转换——省了多少模特妆造费用。
最让我惊喜的要数线稿生成,线稿通常为简洁的线条勾勒,仅包含物体基本轮廓与结构,缺乏细节、色彩及质感。在草图转渲染功能上,Seeddream 4.0 能将简单线稿转化为高质量成品图。
不仅精准填充丰富色彩,使物体视觉层次分明,还有细腻的光影处理与材质模拟,比如包包的皮质纹理、金属配件光泽等。
它对于“高质量渲染图”的理解,可谓是逆天,除了静物,还搭配了人像、场景,你没想到的,它都替你想到了。
讲真,Seeddream 4.0 这次更新后,对真实质感的处理完全超出我的预期。
像皮具、金属的纹理表现已经很稳了,但当我看到它生成人的皮肤纹路时,还是被秀到了。
这个皮肤纹理、隐约可见的青筋,甚至是手腕上自然的汗毛感,还有光线打在皮肤上的通透效果……所有细节都拿捏得非常到位,组合在一起就一个字:真。
而这组图的原始参考图是什么呢——
仅此而已。
细节还原仿佛真实拍摄,完美实现了真实世界照片拟合的需求。这都意味着模型能够适度的“创作”,在参考图和提示词给定的范围内,给出合理的发挥。
这种创作能力可以用在更有趣的玩法上,比如只需要一个矢量图,就可以给 APPSO 生成一整套完整的周边设计。
提示词:参考这个LOGO,做一套品牌视觉设计,品牌名称为 APPSO,包括包装袋、帽子、纸盒、卡片、手环、挂绳等。红色视觉主色调,趣味、简约现代风格
Seeddream 4.0 的“创作”能力和直接生成样品的玩法,极大地降低了制作成本。而且效果相当不错,模型捕捉到了“有趣味、简约现代”的核心风格,将品牌 LOGO 巧妙地应用在手机壳、卡套、挂绳和帽子上。
还有一点好评的是,Seeddream 4.0 支持最高 4K 分辨率的输出,而 2K 分辨率直出只需要几秒,能在电商等一些场景做到专业级输出,有更大的后期空间。
更多邪修玩法
除此之外,APPSO 还发现了一些有趣的邪修玩法,也跟大家分享。
最基本的桌面手办,当然是不在话下,我们试试让人物自己,拿着本人的手办。





























还没有评论,来说两句吧...