PreTTI :使用大语言模型改进文本对图像模型
该项目的目的是探索大型语言模型的潜在用途,以改善最新的文本到图像模型(例如稳定扩散)的当前状态。
迅速写作的状态
编写最佳文本提示以最佳指导文本模型模型达到所需的结果可能是一项复杂的任务,通常需要使用看似任意的关键字和各种样式修饰符。
这些修饰符的大量使用是经验丰富的用户的常见实践,因为它们频繁地对主观美学质量产生积极影响,并且能够与所需的结果更加紧密地对齐图像。即使是单词放置的微妙变化也会产生重大影响,即使是最熟练的及时作家,也可能为不必要的工作创造了不必要的工作。
鉴于这种复杂性和缺乏直觉,对于文本到图像模型的UI的迅速输入目前并不理想。
下一步
该项目目前处于探索阶段。我们欢迎来自社区的任何反馈,并希望与对该项目有兴趣的任何人讨论潜在的建议。查看“讨论”选项卡以开始。
建议
| 姓名 | 描述 | 地位 |
|---|---|---|
| 最初的实验 | 通过LLM扩展及时的细节 | 完全的 |
| 训练有素的“未简化”模型 | 训练模型以“取消简化”提示 | 请求反馈 |
