TagScribeR

2025-12-11 0 676

TagScribeR

UI简化AI映像字幕的概念证明

引入TagScribeR ,这是旨在的终极工具集,旨在彻底改变您为AI驱动图像生成准备数据集的方式。我们的尖端平台不仅简化了标记和字幕过程,而且还为您的稳定扩散模型带来了新的精度和个性化水平。告别乏味的手动标记,并向无缝,AI驱动的自动捕获和直观的,用户定义的标记说再见。使用TagScribeR ,制作完美的数据集只需单击几下,节省了时间,并释放了前所未有的创意潜力。

TagScribeR :重新定义AI驱动的图像数据集准备

在AI和机器学习的新兴领域中,培训数据集的质量和细节至关重要。 TagScribeR是一个开创性的平台,旨在应对稳定扩散模型的数据集准备的挑战。我们的创新工具利用了AI的力量,特别是Blip-2利用剪辑审讯器,非常感谢Pebble先生的Discord先生,这要归功于剪贴画询问器团队,以实现自动启动图像,同时为自动启动图像实现,同时提供了用于自定义标签的用户友好界面。

关键功能:

使用BLIP-2自动捕获:利用AI的功率为您的图像生成准确的,上下文丰富的字幕,为您的数据集奠定了坚实的基础。自定义标记变得容易:使用我们的直观界面,通过附加自定义标签来为数据集添加个人风格,从而确保模型的输出与您的视野完美匹配。无缝数据集组织:毫不费力地对图像进行分类和管理,将混乱的文件变成了满足您需求量身定制的良好图书馆。社区合作:在TagScribeR社区中共享和利用标签集,促进协作以及在项目之间标准化标记实践。为什么要TagScribeR ?

节省时间,放大创造力:减少在数据集准备上所花费的时间,并在真正重要的事情上投入更多时间 – 您的创意和创新的产出。触手可及的精度:使用AI驱动的字幕和个性化标记,您的数据集将达到相关性和精度的新高度。社区和支持:加入越来越多的专业人士和爱好者社区。与共享资源和支持共享,学习和成长。 TagScribeR不仅是工具;这是迈向掌握AI驱动图像生成的下一步。我们正在寻找支持者,支持者和合作者,他们分享我们的愿景,以改变AI模型培训的格局。加入TagScribeR这一革命性旅程的一部分 – 您的创造力达到了AI效率。

A_CLEAN_POLEDY_AND_MODERN_LOGO_FOR_TAGSCRID_UPSCAYL_4X_REALESRESRGAN-X4PLUS-ANIME

加入我们的任务:协作,返回,代码!我们正在建造大型东西 – 成为TagScribeR的一部分

TagScribeR不仅仅是一种工具,它是未来的愿景,创作者和技术人员可以无缝地合并他们的才能以无与伦比的精确性和个性化训练AI模型。我们相信在一个世界上,稳定扩散模型的力量被社区的集体创造力解锁,每个数据集都讲述了一个生动的故事。

我们需要你!

?‍合作者:如果您对AI,图像处理或UI/UX设计充满热情,我们需要您的见解和专业知识来使TagScribeR栩栩如生。无论您是经验丰富的专业人士还是想为有意义的项目做出贡献,这里都有一个地方。

支持者:有远见的人和投资者,您对项目的信念可能是其翅膀下方的风。通过备份TagScribeR ,您不仅为工具提供资金;您正在投资于AI驱动的内容创建的未来。帮助我们将这个梦想变成现实。

?‍编码人员:我们正在寻找有才华的开发人员,他们准备深入探讨机器学习,前端和后端开发的激动人心的世界。您的代码可能是稳定扩散模型培训中新时代的基石。

为什么要参与?

?创新:成为技术进步的最前沿。 ?合作:与一个受激情和创造冲动的动力团队一起工作。 ?增长:增益敞口,经验和为开创性项目做出贡献的满意度。创造影响:您的贡献可能会彻底改变AI模型的训练方式以及如何产生创意内容。您的角色将如何塑造未来?

每个合作者都带来了一个独特的观点,可以使项目转向成功。每个支持者都为我们发展的基础增加了一个砖块。每个编码器都将一系列代码缝合在TagScribeR的遗产的结构中。

准备打个痕迹了吗?

加入我们的激动之旅。查看其余的读数,以了解我们的愿景和方向。如果您感到启发并看到潜在的火花,请联系!让我们探讨您的技能和想法如何与TagScribeR同步。

现在伸出援手!

无论您有问题,建议还是准备跳入 – 我们在这里聆听。通过adargelariesart@gmail.com与我们联系,或直接跳入我们的问题并提取请求。让我们一起创建,创新和提升。

TagScribeR正在等待您。让我们一起标记未来。

TagScribeR v0.03.0-alpha

当前的构建适用于Windows OS和Python,因为这是我正在使用的。 屏幕截图2024-01-24 093937

屏幕截图2024-01-25 152735

屏幕截图2024-01-30 062223

当前功能:

  • 加载目录和显示/编辑关联的文本文件在画廊选项卡/小部件中

  • 一旦BLIP-2集成,带有空白文本字段的负载目录,用于填充自动捕获

  • 图像选择(多选图像功能)

  • 标签面板(带有文本字段的可折叠标签面板以添加/创建新的标签按钮,并在需要时删除标签按钮)

  • 标记按钮(单击标签按钮时,要创建标签按钮和功能以将当前文本/字幕附加到选定图像的功能)

  • 持续的标签按钮(除非删除,否则从一个会话到会话持续存在标签)

  • sort/filter函数(按标签进行排序/过滤器,其中显示的图像和文本正在窗口中更新,以仅显示与要搜索/过滤的标签关联的图像/文本)

  • 类别/集合窗格/面板和函数(自定义类别/集合窗格创建新目录/数据集文件夹,以将所选文件复制到混合n匹配和创建新数据集的简便方法中)

  • 标签共享(在您的根文件夹中创建了所有用户自定义标签的文本文件,此文本文件充当您的标签按钮数据库,但也可以轻松地共享用户制作的标签)

  • BLIP-2集成(将BLIP-2和BLIP-2设置集成到自动生成文本字段的字幕,并将生成的字幕保存到以目标图像命名的新文本文件中)(当前仅基于CPU)

  • 图像编辑(添加了由OpenCV/CV2提供动力的图像编辑的图像编辑小部件,当前的图像编辑功能是旋转和调整大小,计划很快添加更多)

  • 设置(在容纳当前和将来的程序设置中添加了设置小部件。

  • 键盘热键/快捷键 – 在图库窗口中添加了键盘快捷键,此外,“快捷方式指南”现在也可以在设置中使用。现在可用!注意:画廊使用了所有这些;自动字幕仅使用保存,撤消/重做,选择/取消选择,清除选定的字幕;图像编辑仅使用保存,然后选择/取消选择全部。

CTRL+S:保存所有编辑

Ctrl+Z:撤消最后动作

CTRL+A:选择/取消所有图像(切换)

CTRL+F:专注于搜索栏

DEL:清除选定的字幕

CTRL+L:加载目录

CTRL+C:将选定的图像复制到集合

  • 添加了快速安装和快速启动.bat文件(请参见下面的说明)

  • 元数据编辑器 – 元数据编辑器功能性,双击以编辑字段(仍在测试中,需要UI调整)

  • 标记搜索,过滤器和组织 – 实现的标签搜索,过滤和组织。现在将标签按字母分类,可以分为类别。

  • 如何使用:

  1. 重要的序言: Tags.txt的处理方式已更改。如果您以前的标签已经消失,请不要惊慌,它们仍然在您的TagScribeR中。以前的方法正常将标签保存在TXT中,但是由于排序/分类增强,未分类的标签将需要“标签:”标签。例如:“标签:金发”。只需将“标签:”添加到标签文件中每个标签的开头。我建议将诸如Notepad ++的编辑器与Shift+Alt+Down函数一起使用,以快速CTRL+V the tag:tag:tag:tag:tag:tag+v。重新加载程序以查看您的标签恢复并准备排序。注意:我试图考虑以前的标签,并且该程序应自动为您完成所有操作,但这是解决方法,以防万一。

  2. 内部组织模式:

    • 勾选组织模式框。这将暂时暂停标签按钮功能。
    • 右键单击标签按钮窗格中的空区域。上下文菜单将弹出提示创建类别。
    • 将您的类别命名,并将自动添加到窗格字母内。
    • 要将标签分为类别,请右键单击“树线”旁边突出显示的区域(不是按钮本身)。这将提示一些选项:“移动到类别”,“重命名标签”,“删除标签”。
    • 为了排序,请选择“移动到类别”。带有下拉菜单的窗口将为您选择类别。
    • 选择您制作的适当类别,并将标签分类为类别。该类别现在可以扩展(tick框非功能,使用箭头),并且您的排序标签现在在您的自定义类别中。
  3. 在组织模式外:

    • 输入您保存到标签搜索栏的标签将通过与您键入的任何匹配的保存标签过滤。 (如果您的标签被分类为类别,它将显示类别。选择扩展箭头,它将仅显示您要搜索/过滤的单词的标签)
    • 加载标记/字幕的数据集/目录/集合时,右键单击标签窗格的标签按钮,它将隐藏所有图像,并带有与该标签不匹配的标题。 (我正在努力重组窗口以均匀地显示它们,但是目前,隐藏的图像/字幕留下了空白。)
    • 注意:在顶部仍然可以使用手动键入和搜索字幕/标签,以提供更广泛的搜索/过滤器范围。图像/字幕的标签过滤器主要用于跳到包含您感兴趣的自定义标签的项目。

要做列表:

  • 图像编辑套件(具有批处理功能的完整图像编辑小部件,以编辑/管理/删除/删除/crop/resize/调整亮度/对比度/色调/颜色/等)

  • 元数据编辑器(调整元数据编辑器UI并彻底测试所有功能)

  • 单独的图像预览实现了一个辅助窗口或可码头/可重大的窗口,以检查单个图像。

  • 拖动组织在创建数据集时拖动组织拖放组织/分组,以便用户便利/舒适/组织。

  • 重复检测实现重复检测,并从已加载的集合/目录中删除所选图像和/或重复的能力。

  • 对大多数主要语言的多语言支持实施支持。

  • Cloud Integration实施集成以允许在云存储空间中工作/工作(对我实现这一目标的能力不太自信,但如果可以的话,它会很好)。

  • 自定义主题/背景/小部件/窗格实现了用户自定义窗格/窗口的主题,背景,大小以及放置的能力,并允许窗口小部件选项卡拖动重组。

安装和运行

适用于Windows用户:

  1. 确保系统上安装了3.7或更高版本。

  2. git克隆到您想要的位置

  3. 双击install.bat文件以设置虚拟环境并安装依赖项。

  4. 安装完成后,双击启动.bat文件以运行TagScribeR 。

手动安装:

如果您希望手动安装或批处理文件有问题:

  1. 创建虚拟环境:Python -M Venv Venv
  2. 激活虚拟环境:
    • Windows:VENV \\ Scripts \\ Acivate
  3. 安装要求:PIP安装-R要求.txt
  4. 运行应用程序:python main.py

执照

该项目是根据AGPL-3.0许可证获得许可的 – 有关详细信息,请参见AGPL-3.0许可证文件。

下载源码

通过命令行克隆项目:

git clone https://github.com/ArchAngelAries/TagScribeR.git

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 建站资源 TagScribeR https://www.zuozi.net/35412.html

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务