通过GPT-Image2我用了一周时间做了一个游戏并且上架了APP Store
一个从来没做过游戏的小白,借助GPT-Image2一周时间做了个游戏,并且上架了Apple Store,AI的发展快得难以想象。
这个游戏叫做Kitty Grid,(中文名:喵喵静悄悄)是一个类似八皇后问题的逻辑解谜游戏。规则很简单,每一行,每一列,每一个色块区域都有一只小猫,并且小猫之间不能相邻,连斜角也不可以贴在一起。玩家需要根据这些规则,把不可能的位置标记成 X,再翻开有把握的格子。
说实话,我一开始也没有想到这个东西最后会真的上架 App Store。我最开始只是想试一下 GPT-Image2 到底能不能帮我做出一套完整的游戏美术资源,结果做着做着,就变成了一个完整的小项目。
游戏本体
Kitty Grid 的玩法核心其实很克制。它没有复杂的剧情,也没有很重的数值系统,主要就是围绕一个棋盘做推理。我希望它可以在几分钟内玩完一局,但是又不能变成纯靠运气乱点。所以关卡本身需要保证唯一解,并且最好能通过比较自然的逻辑推出来。
游戏是用 Flutter 做的,棋盘部分用了 Flame。这里真正花时间的是交互细节。比如点一下标记 X,双击翻开格子,这个看起来很普通,但是双击时间如果太短,玩家会觉得怎么打不了X;如果太长,又会影响标记的手感。最后我把双击窗口调整到了 320ms,体感上会舒服很多。
关卡这块我做了一个离线 Python 生成器。规则是每行,每列,每个色块区域恰好一只猫,小猫之间不能八方向相邻,色块区域必须正交连通。生成器会校验唯一解,也会用轻量逻辑求解器过滤掉那种机器有唯一解,但是玩家只能猜的关卡。首发版本内置 1-100 关。
这里有一个很现实的问题:如果只是做一个能玩的 Demo,其实很快。但是要上架,就会多出很多看起来不属于游戏本身的事情。比如多语言,隐私政策,广告配置,内购配置,体力恢复,金币奖励,失败和通关结算,还有各种边缘状态。这些东西单独看都不大,但是加起来很消耗时间。
为什么会做 ImageKnifeWeb
这次最有意思的地方其实是 ImageKnifeWeb(像素工坊)。它是我为了做这个游戏顺手做出来的一个游戏图片资源处理工具。https://imageknife.newaimi.com/ 点击链接即可使用。
GPT-Image2 生成图片的效果确实不错,尤其是小猫,按钮,背景,UI 装饰这些素材,但是对于我这样一个之前完全没有接触过游戏的人来说,这些图片资源的处理简直就是恶梦。图片可能带背景,可能尺寸不统一,可能一张图里有很多小元素,可能边缘有一点脏,也可能生成出来的图很好看,但是游戏里需要的是带透明通道的PNG。
如果每一张图都手动打开修图软件处理,那这一周大概率就全花在整理素材上了,更何况我本人连抠图都不会。所以我干脆做了 ImageKnifeWeb,能给我这种小白一站式的图片资源解决方案。
AI 去背景
第一个功能是 AI 去背景。它主要负责把 GPT-Image2 生成的角色,道具,图标变成透明 PNG。后端用 FastAPI,推理部分会优先走 CUDA,页面上也能看到当前设备状态。这里我没有把它做成纯单机脚本,因为游戏资源处理会反复出现,后面每次改图都会重新用到。
去背景功能看起来很简单,但是它解决的是一个很烦的问题。游戏里大量素材都要求透明背景,如果每次都靠手工抠图,效率会很低。现在只要上传图片,开始处理,得到的结果就可以继续放大,编辑,或者直接进入游戏工程。
素材板拆分
第二个很关键的功能是素材板拆分。GPT-Image2 有时候会一次生成一整张 UI 素材板,比如按钮,星星,金币,装饰物全在一张图里。直接把整张图放进游戏没有意义,真正需要的是把其中每一个小元素单独导出来。
ImageKnifeWeb 的素材板流程大概是:先识别原图里的素材区域,再做抠图,然后把识别到的框展示出来。框的位置如果不准,可以手动调;某些元素不想要,也可以取消选择。最后导出时会把选中的组件打成一个 zip,里面每个组件都是独立 PNG。这个功能对我这次做游戏帮助很大,因为 UI 元素基本都要走这个流程。
图片放大和手动编辑
图片放大主要是为了解决素材尺寸不够的问题。游戏里有些地方需要高清图,但是 GPT-Image2 生成出来的图并不一定刚好符合使用尺寸。ImageKnifeWeb 里有通用,动漫,噪点图,像素图几种模式。提供最大8倍超分,最大支持十亿像素超分。
手动编辑则是给 AI 结果兜底用的。AI 去背景很方便,但它不会永远完美。有时候边缘会多出一点不该有的颜色,有时候小区域需要补一下,有时候需要把透明背景合成到固定底色上预览。所以我把画笔,橡皮,魔棒,选区,图层这些基础编辑能力放到了同一个工具里。
序列帧和视频转帧
ImageKnifeWeb 后面还加了序列帧相关功能。比如导入一组序列帧后,统一清理背景,裁切,补画布,对齐锚点,再导出 PNG 序列和 Sprite Sheet。还有 AI 生成视频和视频转帧,流程是先用外部视频生成 API 让角色动起来,再把视频抽帧,清理成游戏能用的透明序列帧。
这个功能在这次游戏里还没有大量使用,但是方向很明确。很多小游戏真正缺的是一套能播放的动作资源。只要这条链路打通,之后做 2D 游戏会轻松很多。
GPT-Image2
这次 GPT-Image2 最主要负责的是美术探索和素材生成。比如小猫图标,UI 风格,背景氛围,按钮质感,奖励弹窗里的装饰,都可以先通过它快速出图。以前我做独立项目的时候,经常会卡在美术上,因为我知道自己想要什么感觉,但是我没有足够快的美术产出能力。
这一次明显不一样。我可以先把想法用文字描述出来,让 GPT-Image2 生成一个方向,然后继续调整提示词。满意之后,再把图片丢进 ImageKnifeWeb,去背景,拆素材,放大,导出,最后放进 Flutter 工程里调布局。
当然,用 AI 做美术也不会让游戏自动完成。真正的工作仍然很多。规则要自己设计,关卡要自己验证,交互要自己调,Flutter 工程要自己写,App Store 的材料也要自己准备。AI 解决的是素材产出的速度问题,工程落地仍然需要耐心。
上架这件事
上架 App Store 这一步其实比我想象中顺利。Kitty Grid现在是免费游戏,有广告,也有去广告内购。App Store 已经可以搜索到。看到它真的出现在商店里的时候,我还是有点开心的。
不过我也必须承认,首版肯定还有很多地方可以继续改。比如关卡数量,动画资源,音效,教程节奏,远端关卡预览,广告频控,这些都还可以慢慢打磨。现在这个版本对我来说更像是一个证明:一个人可以借助 AI 先把想法做成一个真的能上架的产品。
后记
这次一周做完 Kitty Grid,对我最大的收获是我第一次比较完整地感受到,AI 可以把个人开发者最容易卡住的一环往前推一大步。以前没有美术资源,我可能会先拖着;现在我可以先做出来,再根据真实效果继续改。
ImageKnifeWeb 也会继续做下去。因为只要还在做游戏,只要还在用 AI 生成图片,就一定会遇到素材清理,拆分,放大,导出这些重复问题。把这些问题积累成工具,比每次临时处理一张图要划算很多。
这篇就先写到这里。后面如果 Kitty Grid 有新的版本,或者 ImageKnifeWeb 的序列帧和骨骼拆分做得更成熟了,我应该还会继续写。
哦对了,现在ImageKnifeWeb并没有开源,但是我做了公开的docker镜像可以自己部署
https://github.com/ZyaireXv/ImageKnifeWeb/pkgs/container/imageknifeweb
建议使用带独显的PC部署。如果你觉得有帮助,欢迎关注我。
1 | IMAGEKNIFE_PORT=8000 |
1 | services: |


















