Zyaire's Blog

通过GPT-Image2我用了一周时间做了一个游戏并且上架了APP Store

一个从来没做过游戏的小白，借助GPT-Image2一周时间做了个游戏，并且上架了Apple Store，AI的发展快得难以想象。

这个游戏叫做Kitty Grid，（中文名：喵喵静悄悄）是一个类似八皇后问题的逻辑解谜游戏。规则很简单，每一行，每一列，每一个色块区域都有一只小猫，并且小猫之间不能相邻，连斜角也不可以贴在一起。玩家需要根据这些规则，把不可能的位置标记成 X，再翻开有把握的格子。

说实话，我一开始也没有想到这个东西最后会真的上架 App Store。我最开始只是想试一下 GPT-Image2 到底能不能帮我做出一套完整的游戏美术资源，结果做着做着，就变成了一个完整的小项目。

游戏本体

Kitty Grid 的玩法核心其实很克制。它没有复杂的剧情，也没有很重的数值系统，主要就是围绕一个棋盘做推理。我希望它可以在几分钟内玩完一局，但是又不能变成纯靠运气乱点。所以关卡本身需要保证唯一解，并且最好能通过比较自然的逻辑推出来。

游戏是用 Flutter 做的，棋盘部分用了 Flame。这里真正花时间的是交互细节。比如点一下标记 X，双击翻开格子，这个看起来很普通，但是双击时间如果太短，玩家会觉得怎么打不了X；如果太长，又会影响标记的手感。最后我把双击窗口调整到了 320ms，体感上会舒服很多。

关卡这块我做了一个离线 Python 生成器。规则是每行，每列，每个色块区域恰好一只猫，小猫之间不能八方向相邻，色块区域必须正交连通。生成器会校验唯一解，也会用轻量逻辑求解器过滤掉那种机器有唯一解，但是玩家只能猜的关卡。首发版本内置 1-100 关。

这里有一个很现实的问题：如果只是做一个能玩的 Demo，其实很快。但是要上架，就会多出很多看起来不属于游戏本身的事情。比如多语言，隐私政策，广告配置，内购配置，体力恢复，金币奖励，失败和通关结算，还有各种边缘状态。这些东西单独看都不大，但是加起来很消耗时间。

为什么会做 ImageKnifeWeb

这次最有意思的地方其实是 ImageKnifeWeb（像素工坊）。它是我为了做这个游戏顺手做出来的一个游戏图片资源处理工具。https://imageknife.newaimi.com/ 点击链接即可使用。

GPT-Image2 生成图片的效果确实不错，尤其是小猫，按钮，背景，UI 装饰这些素材，但是对于我这样一个之前完全没有接触过游戏的人来说，这些图片资源的处理简直就是恶梦。图片可能带背景，可能尺寸不统一，可能一张图里有很多小元素，可能边缘有一点脏，也可能生成出来的图很好看，但是游戏里需要的是带透明通道的PNG。

如果每一张图都手动打开修图软件处理，那这一周大概率就全花在整理素材上了，更何况我本人连抠图都不会。所以我干脆做了 ImageKnifeWeb，能给我这种小白一站式的图片资源解决方案。

AI 去背景

第一个功能是 AI 去背景。它主要负责把 GPT-Image2 生成的角色，道具，图标变成透明 PNG。后端用 FastAPI，推理部分会优先走 CUDA，页面上也能看到当前设备状态。这里我没有把它做成纯单机脚本，因为游戏资源处理会反复出现，后面每次改图都会重新用到。

去背景功能看起来很简单，但是它解决的是一个很烦的问题。游戏里大量素材都要求透明背景，如果每次都靠手工抠图，效率会很低。现在只要上传图片，开始处理，得到的结果就可以继续放大，编辑，或者直接进入游戏工程。

素材板拆分

第二个很关键的功能是素材板拆分。GPT-Image2 有时候会一次生成一整张 UI 素材板，比如按钮，星星，金币，装饰物全在一张图里。直接把整张图放进游戏没有意义，真正需要的是把其中每一个小元素单独导出来。

ImageKnifeWeb 的素材板流程大概是：先识别原图里的素材区域，再做抠图，然后把识别到的框展示出来。框的位置如果不准，可以手动调；某些元素不想要，也可以取消选择。最后导出时会把选中的组件打成一个 zip，里面每个组件都是独立 PNG。这个功能对我这次做游戏帮助很大，因为 UI 元素基本都要走这个流程。

图片放大和手动编辑

图片放大主要是为了解决素材尺寸不够的问题。游戏里有些地方需要高清图，但是 GPT-Image2 生成出来的图并不一定刚好符合使用尺寸。ImageKnifeWeb 里有通用，动漫，噪点图，像素图几种模式。提供最大8倍超分，最大支持十亿像素超分。

手动编辑则是给 AI 结果兜底用的。AI 去背景很方便，但它不会永远完美。有时候边缘会多出一点不该有的颜色，有时候小区域需要补一下，有时候需要把透明背景合成到固定底色上预览。所以我把画笔，橡皮，魔棒，选区，图层这些基础编辑能力放到了同一个工具里。

序列帧和视频转帧

ImageKnifeWeb 后面还加了序列帧相关功能。比如导入一组序列帧后，统一清理背景，裁切，补画布，对齐锚点，再导出 PNG 序列和 Sprite Sheet。还有 AI 生成视频和视频转帧，流程是先用外部视频生成 API 让角色动起来，再把视频抽帧，清理成游戏能用的透明序列帧。

这个功能在这次游戏里还没有大量使用，但是方向很明确。很多小游戏真正缺的是一套能播放的动作资源。只要这条链路打通，之后做 2D 游戏会轻松很多。

GPT-Image2

这次 GPT-Image2 最主要负责的是美术探索和素材生成。比如小猫图标，UI 风格，背景氛围，按钮质感，奖励弹窗里的装饰，都可以先通过它快速出图。以前我做独立项目的时候，经常会卡在美术上，因为我知道自己想要什么感觉，但是我没有足够快的美术产出能力。

这一次明显不一样。我可以先把想法用文字描述出来，让 GPT-Image2 生成一个方向，然后继续调整提示词。满意之后，再把图片丢进 ImageKnifeWeb，去背景，拆素材，放大，导出，最后放进 Flutter 工程里调布局。

当然，用 AI 做美术也不会让游戏自动完成。真正的工作仍然很多。规则要自己设计，关卡要自己验证，交互要自己调，Flutter 工程要自己写，App Store 的材料也要自己准备。AI 解决的是素材产出的速度问题，工程落地仍然需要耐心。

上架这件事

上架 App Store 这一步其实比我想象中顺利。Kitty Grid现在是免费游戏，有广告，也有去广告内购。App Store 已经可以搜索到。看到它真的出现在商店里的时候，我还是有点开心的。

不过我也必须承认，首版肯定还有很多地方可以继续改。比如关卡数量，动画资源，音效，教程节奏，远端关卡预览，广告频控，这些都还可以慢慢打磨。现在这个版本对我来说更像是一个证明：一个人可以借助 AI 先把想法做成一个真的能上架的产品。

后记

这次一周做完 Kitty Grid，对我最大的收获是我第一次比较完整地感受到，AI 可以把个人开发者最容易卡住的一环往前推一大步。以前没有美术资源，我可能会先拖着；现在我可以先做出来，再根据真实效果继续改。

ImageKnifeWeb 也会继续做下去。因为只要还在做游戏，只要还在用 AI 生成图片，就一定会遇到素材清理，拆分，放大，导出这些重复问题。把这些问题积累成工具，比每次临时处理一张图要划算很多。

这篇就先写到这里。后面如果 Kitty Grid 有新的版本，或者 ImageKnifeWeb 的序列帧和骨骼拆分做得更成熟了，我应该还会继续写。

哦对了，现在ImageKnifeWeb并没有开源，但是我做了公开的docker镜像可以自己部署
https://github.com/ZyaireXv/ImageKnifeWeb/pkgs/container/imageknifeweb
建议使用带独显的PC部署。如果你觉得有帮助，欢迎关注我。

IMAGEKNIFE_PORT=8000
IMAGEKNIFE_SECRET_KEY=change-this-to-a-long-random-string
IMAGEKNIFE_APP_VERSION=local
IMAGEKNIFE_BUILD_NUMBER=local
IMAGEKNIFE_GIT_SHA=unknown
IMAGEKNIFE_BUILD_TIME=unknown
IMAGEKNIFE_MAX_UPLOAD_MB=50
IMAGEKNIFE_MODEL_INPUT_SIZE=1024
IMAGEKNIFE_TOKEN_TTL_SECONDS=604800
IMAGEKNIFE_CORS_ORIGINS=http://localhost:8000,http://127.0.0.1:8000

services:
  imageknife:
    image: ghcr.io/zyairexv/imageknifeweb:latest
    build:
      context: .
      args:
        IMAGEKNIFE_APP_VERSION: ${IMAGEKNIFE_APP_VERSION:-local}
        IMAGEKNIFE_BUILD_NUMBER: ${IMAGEKNIFE_BUILD_NUMBER:-local}
        IMAGEKNIFE_GIT_SHA: ${IMAGEKNIFE_GIT_SHA:-unknown}
        IMAGEKNIFE_BUILD_TIME: ${IMAGEKNIFE_BUILD_TIME:-unknown}
    container_name: imageknife-web
    restart: unless-stopped
    ports:
      - "${IMAGEKNIFE_PORT:-8000}:8000"
    environment:
      IMAGEKNIFE_SECRET_KEY: ${IMAGEKNIFE_SECRET_KEY:-imageknife-dev-secret-change-me}
      IMAGEKNIFE_APP_VERSION: ${IMAGEKNIFE_APP_VERSION:-local}
      IMAGEKNIFE_BUILD_NUMBER: ${IMAGEKNIFE_BUILD_NUMBER:-local}
      IMAGEKNIFE_GIT_SHA: ${IMAGEKNIFE_GIT_SHA:-unknown}
      IMAGEKNIFE_BUILD_TIME: ${IMAGEKNIFE_BUILD_TIME:-unknown}
      IMAGEKNIFE_MAX_UPLOAD_MB: ${IMAGEKNIFE_MAX_UPLOAD_MB:-50}
      IMAGEKNIFE_MODEL_INPUT_SIZE: ${IMAGEKNIFE_MODEL_INPUT_SIZE:-1024}
      IMAGEKNIFE_TOKEN_TTL_SECONDS: ${IMAGEKNIFE_TOKEN_TTL_SECONDS:-604800}
      IMAGEKNIFE_CORS_ORIGINS: ${IMAGEKNIFE_CORS_ORIGINS:-http://localhost:8000,http://127.0.0.1:8000}
      IMAGEKNIFE_STORAGE_ROOT: /data/storage
      IMAGEKNIFE_DB_PATH: /data/storage/imageknife.sqlite3
      IMAGEKNIFE_FRONTEND_DIST_DIR: /app/frontend/dist
      HF_HOME: /data/huggingface
      TRANSFORMERS_CACHE: /data/huggingface/transformers
      NVIDIA_VISIBLE_DEVICES: all
      NVIDIA_DRIVER_CAPABILITIES: compute,utility
    volumes:
      - ./imageknife-storage:/data/storage
      - ./imageknife-huggingface:/data/huggingface
    # GPU 能力由宿主机的 NVIDIA 驱动和 NVIDIA Container Toolkit 提供。
    # 容器内只携带 CUDA/PyTorch 运行时，不能替代宿主机驱动。
    gpus: all

volumes:
  imageknife-storage:
  imageknife-huggingface: