AI视频游戏角色生成器
概述
该项目利用稳定扩散,Dreambooth和Lora Technologies的力量来生成高度可定制和独特的视频游戏角色。该系统有助于创造者生成详细的角色图像,提高创造力并提供各种角色设计可能性。
特征
技术细节
技术堆栈
- 稳定扩散:用于基本字符图像产生。
- Dreambooth :用于微调通用模型以识别并生成新的特定角色。
- LORA(低等级适应) :适用于轻巧有效的模型微调,重点是增强生成的字符的特定方面。
数据集
该数据集由从12个不同的视频游戏中收集的31,800张图像组成,并使用DeepDanbooru和Blip等工具进行深刻标签,以进行准确的属性分类。
模型架构
- 基本模型:稳定的扩散V1.5,生成详细的基本图像。
- Dreambooth改编:增强了模型生成新的特定角色而不会失去一般功能的能力。
- LORA适应:提供最小的计算资源提供有针对性的改进,适合单个字符增强。
安装
git clone https://git*hu*b.co*m/VaradhKaushik/Ai-character-generation.git
cd Ai-character-generation
pip install -r requirements.txt
未来范围
- 下一步是使用这种方法尝试不同的模型。
- 在高分辨率数据集上微调模型。
- Comibne Lora和我们的Dreambooth训练有素的模型。
- 尝试训练样式,衣服,概念洛拉斯并进行比较。
- 探索使用Lycoris进行微调的使用。
参考
- https://huggi*ng*f*ace.co/runwayml/stable-diffusion-v1-5
- https://git*h*ub*.com/shivamshrirao/diffusers/tree/main/main/examples/dreambooth
- https://huggingf***ace.co/blog/stable_diffusion
- https://hugging**f*ace.co/docs/diffusers/training/lora?installation=PyTorch
- https://*g*ithub*.com/huggingface/diffusers/tree/main/main/examples/text_to_image
- https://civ*itai.c*o*m/models/4468?modelversionId=57618
- https://gith*u*b*.com/automatic1111/stable-diffusion-webui
- https://h*uggingf**ace.co/openai/clip-vit-base-patch32
- https://gi*t*h*ub.com/kichangkim/deepdanbooru
团队成员
Alexander Seljuk,Varadh Kaushik,Girish Adari Kumar
