4o-ghibli-at-home
综合介绍
4o-ghibli-at-home 是一个可以自行部署在个人电脑上的AI图像风格化工具。它让用户可以在本地计算机上处理图片,将普通照片转换成具有特定艺术风格的图像,例如类似吉卜力工作室的动画风格。该工具基于增强的FLUX.1-Kontext-dev和DFloat11模型管线构建,能够在保证处理性能的同时注重用户隐私。用户上传的图片数据会保留在自己的机器上,不会上传到云端。除了内置的多种预设风格,它还支持用户创建、保存和管理自己的独特风格。整个应用操作简便,通过网页浏览器即可访问,无需登录,为用户提供了一个既强大又安全的选择。
功能列表
- 丰富的内置风格: 内置了数十种预设的风格配置文件,涵盖动画、艺术、复古等多种类别。
- 自定义风格管理: 用户可以根据自己的喜好调整参数,并保存为新的自定义风格,方便随时调用、加载或删除。
- 编辑历史追溯: 支持撤销和重做功能,方便用户在编辑过程中进行反复修改和比较。
- 高级参数控制: 提供对提示词、推理步数、引导比例和种子数等核心参数的精细化调整。
- 高效模型管线: 采用black-forest-labs/FLUX.1-Kontext-dev模型,并结合DFloat11进行增强,以实现高质量和高效率的图像生成。
- 显存优化: 在NVIDIA GPU上自动启用模型CPU卸载功能,以降低对显存(VRAM)的要求,使其能在消费级显卡上运行。
- 本地化部署: 整个应用在用户本地运行,无需依赖外部服务,确保了数据的私密性。
- 异步任务处理: 使用内存中的任务队列来逐一处理图像生成请求,避免服务器过载。
- 跨平台兼容: 能够自动检测并使用NVIDIA GPU,如果不可用,则会平稳地切换到CPU模式(但速度会显著降低)。
使用帮助
这个工具设计为在用户自己的计算机上运行,提供一个私密且强大的图像风格化环境。以下是详细的安装和使用步骤,帮助你快速上手。
环境要求
在开始安装之前,请确保你的系统满足以下条件:
- Python版本:
Python 3.11
或更高版本。 - 包管理工具:
pip
或uv
(推荐使用uv
,因为它速度更快)。 - 硬件: 推荐使用NVIDIA GPU以获得最佳性能,但工具也支持在CPU上运行(速度较慢)。大约需要
21GB
的显存(VRAM)才能达到最佳效果。 - 浏览器: 一款现代的网页浏览器,如Chrome、Firefox或Edge。
安装流程
第一步:克隆项目代码
首先,需要从GitHub上将项目的源代码下载到你的电脑。打开终端(在Windows上是命令提示符或PowerShell,在macOS或Linux上是Terminal),然后输入以下命令:
git clone https://github.com/TheAhmadOsman/4o-ghibli-at-home.git
cd 4o-ghibli-at-home
这会将项目文件下载到一个名为 4o-ghibli-at-home
的文件夹,并进入该文件夹。
第二步:创建并激活Python虚拟环境
为了避免不同项目之间的依赖库冲突,强烈建议创建一个独立的Python虚拟环境。
如果你还没有安装 uv
,可以通过以下方式安装:
- macOS/Linux:
curl -LsSf https://astral.sh/uv/install.sh | sh
- Windows:
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
安装后可能需要重启终端。
使用 uv
创建虚拟环境 (推荐):
uv venv
或者,你也可以使用Python内置的 venv
模块:
python3.11 -m venv .venv
创建完成后,激活虚拟环境:
- Windows:
.venv\Scripts\activate
- macOS/Linux:
source .venv/bin/activate
激活后,你会看到终端提示符前面出现了 (.venv)
的字样。
第三步:安装依赖库
在激活的虚拟环境中,安装项目所需的所有Python库。
使用 uv
安装 (推荐):
uv pip install -r requirements.txt
使用 pip
安装:
pip install --upgrade pip
pip install -r requirements.txt
第四步:配置环境变量
应用程序的配置通过一个名为 .env
的文件来管理。
- 在项目根目录下,找到名为
.env_template
的文件。 - 将这个文件复制一份,并重命名为
.env
。 - 用文本编辑器打开新建的
.env
文件,根据你的需求修改其中的配置。以下是默认配置项的说明:# --- 服务器配置 --- # 任务队列中可容纳的最大任务数 MAX_QUEUE_SIZE=10 # 允许上传文件的最大体积 (单位: MB) MAX_UPLOAD_MB=25 # 存放生成图片的文件夹,会自动创建 RESULTS_FOLDER="generated_images" # --- 任务与资源管理 --- # 模型运行设备 ('cuda' 或 'cpu')。如果检测到NVIDIA GPU,默认为 'cuda' PYTORCH_DEVICE="cuda" # 任务结果在内存和磁盘上保留的时间 (秒),默认为600秒 (10分钟) JOB_RESULT_TTL=600 # 清理后台任务的运行间隔 (秒),默认为300秒 (5分钟) CLEANUP_INTERVAL=300
如何运行
完成以上所有步骤后,就可以启动应用了。在终端中运行以下命令:
python3.11 app.py
该命令会同时启动Web服务器和后台处理程序。当你在终端看到类似 Running on http://127.0.0.1:5000
的输出时,说明服务已成功启动。
如何使用
- 打开应用: 打开你的网页浏览器,访问 http://127.0.0.1:5000。
- 上传图片: 你会看到一个简洁的界面。点击上传区域,选择你想要风格化的图片。
- 选择风格: 在右侧的控制面板中,你可以看到“风格配置”区域。这里有多个分类(如动画、艺术、复古),点击不同的分类可以展开查看具体的预设风格。选择一个你喜欢的风格。
- 调整参数 (可选):
- 正面提示词: 描述你希望在画面中看到的内容。
- 负面提示词: 描述你不希望在画面中出现的内容。
- 推理步数: 数值越高,图像细节可能越丰富,但处理时间也越长。
- 引导比例 (CFG): 控制AI在多大程度上遵循你的提示词。数值越高,风格化效果越强。
- 种子: 用于复现结果的随机数。相同的种子和参数会生成相同的图片。
- 开始生成: 点击“生成”按钮。图片处理请求会进入队列等待处理。你可以在界面上看到任务的状态(排队中、处理中、已完成)。
- 查看和下载: 处理完成后,生成的图片会直接显示在界面上。你可以右键点击图片进行保存。所有生成的图片也会保存在你之前配置的
RESULTS_FOLDER
文件夹中(默认为generated_images
)。
应用场景
- 个人艺术创作用户可以将自己的摄影作品或普通照片转换为具有油画、水彩、素描或特定动画风格的艺术品,用于社交媒体分享或个人收藏。
- 动漫风格转换动漫爱好者可以轻松地将真人照片或风景图转换成类似吉卜力工作室或其他经典动漫的风格,创造出独特的二次元效果。
- 游戏资产设计独立游戏开发者或设计师可以利用该工具快速生成具有统一艺术风格的游戏背景、角色概念图或道具图标,作为创作原型或灵感来源。
- 社交媒体内容制作内容创作者可以利用这个工具为自己的帖子、视频封面或个人资料图片添加独特的视觉风格,以吸引更多关注。
QA
- 这个工具是免费的吗?是的,该项目在AGPLv3许可下开源,你可以免费地为个人、研究或非商业目的使用、修改和分发。但任何形式的商业使用都需要获得作者的书面授权。
- 我的图片数据安全吗?非常安全。该工具完全在你的本地计算机上运行,所有图片处理和数据存储都在本地完成,不会上传到任何外部服务器。
- 为什么我运行起来非常慢?该工具对GPU性能有一定要求,尤其是显存。如果你没有NVIDIA GPU或显存较低,工具会自动切换到CPU模式,此时处理速度会显著变慢,这是正常现象。为了获得最佳体验,建议在配备有足够显存(推荐21GB)的NVIDIA GPU的设备上运行。
- 我可以创建和保存自己的风格吗?可以。在调整好各项参数后,你可以在“自定义配置管理”部分将当前的设置保存为一个新的风格配置文件,并为其命名。之后就可以在风格列表中直接选择你保存的风格了。