开放式辅助
注意:开放式剂已完成,并且该项目现已完成。感谢所有贡献的人!查看我们的博客文章以获取更多信息。最终发布的OASST2数据集可以在OpenAssistant/OASST2的HuggingFace上找到
目录
什么是Open Assistant ?
Open Assistant是一个旨在让每个人都可以访问出色的基于聊天的大语言模型的项目。
我们相信,通过这样做,我们将建立语言创新革命。就像稳定扩散以新的方式帮助世界创造艺术和图像的方式一样,我们希望Open Assistant可以通过改善语言本身来帮助改善世界。
有用的链接
-
数据收集
-
聊天
-
项目文档
如何尝试
与AI聊天
聊天前端现在住在这里。登录并开始聊天!聊天时,请尝试对助手的反应进行反应。
为数据收集做出贡献
数据收集前端现在在这里使用。登录并开始执行任务!我们想收集大量质量数据。通过提交,排名和标签模型提示和响应,您将直接帮助提高Open Assistant的能力。
在本地运行开发设置(无聊天)
除非您为开发过程做出贡献,否则您无需在本地运行该项目。上面的网站链接将带您到公共网站,您可以在其中使用数据收集应用程序和聊天。
如果您想在本地运行Data Collection应用程序以进行开发,则可以设置运行开放式辅助设备所需的整个堆栈,包括网站,后端和与Docker相关的依赖服务。
要启动演示,请在存储库的根目录中运行此操作(如果有问题,请检查此常见问题解答):
docker compose --profile ci up --build --attach-dependencies
注意:使用M1芯片在MacOS上运行时,您必须使用:db_platform = linux/x86_64 docker组成…
然后,导航到http:// localhost:3000(可能需要一些时间来启动)并与网站进行交互。
注意:如果构建发生问题,请前往常见问题解答并查看有关Docker的条目。
注意:通过电子邮件登录时,请导航到http:// localhost:1080获取魔术电子邮件登录链接。
注意:如果您想在本地或使用github codespese的Web浏览器中使用标准化的开发环境(“ DevContainer”)运行此操作,则可以使用提供的.devcontainer文件夹。
在本地运行开发设置以供聊天
除非您为开发过程做出贡献,否则您无需在本地运行该项目。上面的网站链接将带您到公共网站,您可以在其中使用数据收集应用程序和聊天。
另请注意,本地设置仅用于开发,并且不应用作本地聊天机器人,除非您知道自己在做什么。
如果您确实知道自己在做什么,请查看推理文件夹,以使推理系统启动和运行,或者在上述命令中查看 – profile ci之外的 – profile推断。
愿景
我们不会停止复制chatgpt。我们希望建立未来的助手,不仅能够写电子邮件和求职信,而且可以做有意义的工作,使用API,动态研究信息等等,并能够由任何人进行个性化和扩展。我们想以一种开放且可访问的方式来执行此操作,这意味着我们不仅必须建立一个出色的助手,而且还必须使其小巧且高效地运行消费者硬件。
计划
我们希望通过遵循指令纸中概述的三个步骤来尽快到达初始MVP
- 收集高质量的人类生成的指令 – 实现样本(及时 +响应),目标> 50k。我们设计了一个众包的过程来收集和审查提示。我们不想培训洪水/有毒/垃圾邮件/垃圾/个人信息数据。我们将有一个排行榜来激发显示进度和最活跃的用户的社区。赃物将被送给顶级企业。
- 对于收集到的每个提示,我们将采样多个完成。然后,一个提示的完成将随机显示给用户,以将其从最佳到最差。同样,这应该发生众包,例如,我们需要与不可靠的潜在恶意用户打交道。至少必须收集独立用户的多票来衡量总体协议。聚集的排名数据将用于培训奖励模型。
- 现在,根据提示和奖励模型遵循RLHF培训阶段。
然后,我们可以采用生成的模型,并继续进行下一个迭代的完成步骤2。
滑梯
视觉和路线图
重要的数据结构
您如何提供帮助
所有开源项目都始于像您这样的人。开源的信念是,如果我们合作,我们可以将我们的知识和技术共同为人类的利益赋予世界。
查看我们的贡献指南以开始。
