Pixelalchemy Studio?
Pixelalchemy Studio是一个由Python和Pygame构建的交互式2D绘图应用程序,并具有Google的Gemini和Weo API的生成AI功能。素描您的想法,通过AI驱动的图像生成来完善它们,并通过视频动画使它们栩栩如生!
202505241459.1.mp4
?功能
直观的绘图工具:
- 像素完美的图形
- 线图:DDA和Bresenham算法
- 圆形绘图:布雷森汉姆的算法
- 椭圆图:中点算法
- 立方贝齐尔曲线
- 基本形状:三角形,矩形
- 多点多边形
AI驱动的图像生成和编辑(双子座):
- 提供文本提示以生成图像或修改现有画布内容
- 使用Google的Gemini-2.0-Flash-Exp模型(可配置)
- 智能及时提高样式一致性(“保持相同的最小线涂鸦样式”)
AI驱动的视频动画(VEO):
- 使用固定的提示为当前的画布图像进行动画:“动画保持样式保持相同的最小线涂鸦样式。”
- 使用Google的VEO-2.0生成-001型号(可配置)
- 具有屏幕状态更新和轮询的异步操作处理
- 生成的视频作为MP4文件在本地保存
用户友好的界面:
- 清除帆布功能
- 可选的图纸颜色
- 用于工具和颜色的专用控制面板
- AI操作反馈的状态栏
- 键盘快捷键,用于快速工具访问
技术堆栈
- Python 3.11+
- Pygame :用于图形,UI和事件处理
- Google Generative AI SDK (Google-genai):与Gemini&Veo API互动
- 枕头(PIL) :用于图像操纵和处理
- 紫外线:用于快速项目和虚拟环境管理
- Python-dotenv :用于通过.env文件管理API键
项目结构
该项目的组织如下:
pixel-alchemy-studio/ ├── .env.example # Example environment file ├── pyproject.toml # Project metadata and dependencies for UV ├── README.md # This file ├── run.py # Script to easily run the application ├── src/ │ └── graficador/ │ ├── algorithms/ # Drawing algorithms (Bresenham, DDA, Bezier, etc.) │ ├── geometry/ # Geometric primitives (e.g., Point) │ ├── ui/ # UI components (Button, Canvas, Controls) │ ├── app.py # Main application class, event handling, AI integration │ ├── config.py # Configuration (screen size, colors, API models) │ └── main.py # Entry point of the application ├── assets/ # (Optional) For static assets like icons, fonts ├── docs/ # (Optional) For extended documentation, demo GIFs ├── tests/ # Test files └── uv.lock # UV lock file
设置和安装
请按照以下步骤在本地计算机上启动并运行Pixelalchemy Studio。
先决条件
- Python 3.11或更高
- 紫外线:安装在系统上。如果没有,请按照UV的官方网站上的安装说明进行操作
安装步骤
-
克隆存储库:
git clone https://*g*ithub*.com/josefdc/pixel-alchemy-studio.git cd pixel-alchemy-studio -
使用UV创建和激活虚拟环境:
uv venv source .venv/bin/activate # On Linux/macOS # .venv\\Scripts\\activate # On Windows
-
使用UV和pyproject.toml安装依赖项:
确保您的pyproject.toml文件具有[project.ipentencies]下列出的必要依赖项。
pyproject.toml的示例(确保您的项目的需求符合您的需求):
[ project ] name = \" pixel_alchemy_studio \" version = \" 0.1.0 \" description = \" Interactive drawing with AI-powered image and video generation. \" requires-python = \" >=3.11 \" dependencies = [ \" pygame>=2.5.0 \" , \" google-genai>=1.10.0 \" , # Check for the latest Veo-compatible version \" Pillow>=10.0.0 \" , \" python-dotenv>=1.0.0 \" ] [ build-system ] requires = [ \" hatchling \" ] build-backend = \" hatchling.build \"
然后使用以下方式安装依赖项:
uv pip sync
-
设置Google API密钥:
- 去Google AI Studio获取您的API密钥
- 确保在Google Cloud Project中启用了生成语言API(用于Gemini)和顶点AI API(为项目启用VEO模型访问)
- 对于VEO :VEO是一项付费功能。确保在与API密钥关联的Google云项目上启用计费
- 在项目的根目录中创建一个名为.env的文件(Pixel-Alchemy-Studio/.env)
- 将您的API键添加到这样的.ENV文件中:
GOOGLE_API_KEY=\"YOUR_ACTUAL_API_KEY_HERE\"
- (一个.env.example文件应在您的存储库中作为模板提供)
如何运行
设置完成后,请从项目的根目录中运行应用程序:
uv run python -m src.graficador.main
?如何使用
-
主接口:应用程序窗口分为左侧的图形画布,右侧为一个控制面板。
-
选择工具:单击控制面板中的按钮以选择绘图工具或AI功能。键盘快捷键也可用(按钮指示)。
-
绘画:
- 像素(P) :单击并拖动绘制徒手
- 线(L,B),圆圈(O),椭圆(E) :单击第一个点(例如,线开始,圆/椭圆的中心),然后单击第二点(例如,线的末端,radius/gende上的点,点上的点)
- Bézier曲线(Z) :单击四次以定义两个端点和两个控制点
- 三角形(T) :单击三次以获取顶点
- 矩形(R) :单击两个相对角的两次
- 多边形(y) :单击每个顶点。单击第一个顶点附近(阈值之内)以关闭多边形
-
选择颜色:单击控制面板中的颜色色板。
-
清除画布(C) :单击“清除”按钮或按\’c\’。这也重置AI指出。
-
双子座 – 图像生成/编辑(G) :
- 按\’g\’或单击“使用AI生成”按钮。状态栏将提示您输入
- 键入所需的修改或发电提示(例如,“戴着帽子的猫”,“使蓝色”)
- 按Enter。双子座将在您的提示下处理当前的帆布图像
- 画布将使用AI生成的图像进行更新
-
VEO-视频动画(V) :
- 确保画布上有图纸
- 按\’v\’或单击“用veo视频”按钮
- 该应用程序将使用当前的帆布图像和固定的内部提示(“动画保持样式保持相同的最小生产线样式。”)以生成视频
- 监视状态栏的进度(初始化→生成→轮询→完成/错误)
- 生成的视频(MP4)保存在项目的根目录中(例如,weo_video_12345_0.mp4)
- 注意:视频生成可能需要几分钟。在投票期间,UI将保持响应
-
退出:在其运行的终端中关闭Pygame窗口或按CTRL+C。
配置
可以在以下位置调整高级参数,例如FPS,默认颜色,API模型名称和VEO生成设置(默认的宽高比,持续时间)。
?潜在的未来增强功能
- 高级彩色选择器和定制调色板
- 图像导入/导出选项
- 层管理系统
- 撤消/重做功能
- 更复杂的刷子/绘图工具
- UI控件的VEO参数(提示,持续时间,纵横比)
- 应用内视频播放
- 使用绘制口罩的双子座涂上/支出
致谢和灵感
该项目的灵感来自其他AI驱动的绘图应用程序中展示的创造性可能性。特别感谢并致谢:
特鲁迪(Trudy)在拥抱面孔空间上的“双子座共同绘画” :该项目是探索协作和Ai-heancanced绘图的最初灵感。您可以在这里找到它:Trudy/Gemini-codrawing。
?许可证
该项目是根据Apache许可证2.0许可的。有关更多详细信息,请参见许可证文件。
与Pixelalchemy Studio一起开心的素描和炼金术!
