宗旨
多年以前,我曾看到 GitHub 开源项目作者、全栈工程师 TJ Holowaychunk 说过这么一句话:
\”I don\’t read books, never went to school, I just read other people\’s code and always wonder how things work\”。
从那时起,我便认为,通过阅读源码,站在前辈的角度上,去思考代码架构与程序逻辑,乃是提升编程技巧最好的方式。
因此,GitHub 也自然而然的,成为我最喜爱的开发者平台。
秉着挖掘开源价值的初衷,GitHubDaily 自 2015 年 10 月 10 日正式成立。
我们希望能通过这一举措,帮助开发者们发现当下最火的开源项目,掌控最新技术动态, 扩大技术视野, 并从开源项目的学习中获得编程能力的提升。
目前,GitHubDaily 已累积分享超过 8000 个开源项目,内容包括但不限于 GitHub 上的开源技术资料、开发者工具、编程网站以及成熟应用。
除了 GitHub 之外,我们也开始在下面多个社交媒体平台,帮助开发者传播与分享优质开源项目,挖掘其未来的技术应用前景。
如果你想接收最新的 GitHub 开源项目资讯,可以关注一下?
- 公众号: GitHubDaily
- 微博: @GitHubDaily
- 知乎: @GitHubDaily
- X (Twitter):@GitHubDaily
有不错的开源项目,也欢迎到本仓库的 issues 推荐或自荐项目,我们期待你的分享。
2024 年复盘
下面是对 GitHubDaily 在 2024 年所推荐的项目进行分类整理,方便大家查找以往分享过的内容。
过往复盘 2023, 2022, 2021,2020,2019,2018
目录
- 宗旨
- 2024 年复盘
- 目录
- AI 技术
- AI 工具
- 免费书籍
- 学习教程
- 实用工具
- 实用插件
- 资料集合
- 其他
- 声明
AI 技术
| 项目 | 简述 | 源 |
|---|---|---|
| OmniParser | 一款基于纯视觉的 GUI 智能体,能够准确识别界面上可交互图标以及理解截图中各元素语义,实现自动化界面交互场景,如自动化测试、自动化操作等。 | |
| ChatTTS | 一款专门为对话场景设计的语音生成模型,主要用于 LLM 助手对话任务、对话语音以及视频介绍等,支持中英文混合文本合成语音,音色表现强,能达到真假难辨程度。 | |
| DLRover | 一套 AI 大模型训练方案,可实现训练\”自动驾驶\”,提高训练效率,降低研发成本,具有容错性、快速恢复和自动扩展等特点。 | |
| SwiftInfer | 一款基于 TensorRT 实现的 StreamingLLM 推理加速框架,可提升大模型推理性能 46 %,为多轮对话推理提供高效可靠的落地方案。 | |
| Audio2PhotoReal | 一项由 Meta AI 发布的新技术,能够通过音频驱动生成全身逼真的虚拟人物对话,包括动作、表情和多人对话等,可广泛应用于虚拟现实、影视制作等领域。 | |
| OpenVoice | 一项由 MyShell 团队开发的多功能即时声音克隆技术,只需提供简短音频样本,即可克隆原发言者的声音,生成多种语言语音,支持高精度音色克隆、灵活的声音风格调控以及无需样本的跨语言声音克隆。 |
↥ 返回目录
AI 工具
| 项目 | 简述 | 源 |
|---|---|---|
| Shortest | 一款利用 Claude 模型能力的端到端 AI 测试框架,通过自然语言编写可执行的单元测试,支持 GitHub 与 2FA 集成,提供安全认证方式。 | |
| STranslate | 一款开箱即用的翻译和 OCR 工具,支持多种翻译方式、多家翻译服务、离线 OCR、回译、TTS 等功能,提升翻译效率。 | |
| x-kit | 一款用于抓取和分析 Twitter 推友数据的工具,可自动抓取指定推友的基本信息和推文,支持定时更新时间线数据和本地存储。 | |
| MMAudio | 一款视频自动配音工具,可根据视频内容或文本提示生成符合场景的音效,并与视频画面动作保持同步对齐。 | |
| Hoarder | 一款自托管的书签管理 AI 工具,支持保存链接、笔记、图片和 PDF 文件,利用 AI 自动打标签分类存储,提供全文搜索能力。 | |
| Midscene.js | 一款由 AI 驱动的 UI 自动化 SDK,通过自然语言描述对任意网页进行自动化操作、验证和数据提取,生成可视化测试报告,支持多种主流 AI 模型和自动化库集成。 | |
| Browser Use | 一款开源工具,能让 AI 智能体自动化操作浏览器,像真人一样理解网页内容并完成复杂任务,如投递简历、查询航班等,具备视觉识别、HTML 解析、多标签页管理等功能。 | |
| Video Ocean | 一款基于 Colossal – AI 优化的 Sora 视频模型的免费视频生成平台,提供极低成本、快速的视频生成服务,并将优化方案开源。 | |
| LogoCreator | 一款开源的 AI Logo 生成器,使用 Flux Pro 1 . 1 模型快速生成 Logo 图标,支持编辑样式,代码完全开源并提供免费体验。 | |
| MarkltDown | 一款由微软开源的工具,可将常见文件如 Word、Excel、PPT 等转换为 Markdown 格式,支持 OCR 和 AI 模型处理多媒体文件,提供命令行、Python API 和 Docker 三种使用方式。 | |
| PDFMathTranslate | 一款开源的 PDF 文档翻译及双语对照工具,能够很好地保留公式、图表、目录和注释等排版,支持多种语言和翻译服务,可通过命令行、GUI 界面、Docker 等方式使用。 | |
| Gemini-Teacher | 一款基于 Gemini 2 . 0 开发的英语口语练习 AI 助手,能实时识别发音并提供反馈和纠正建议,适合英语口语学习和教学。 | |
| XHS Note Generator | 一款小红书笔记 AI 生成器,支持快速批量将视频或直播内容一键转换为符合小红书风格的爆款笔记,自动优化内容和配图。 | |
| ScreenPipe | 一款强大的开源 AI 桌面应用,可 24 小时监控电脑,通过屏幕录制、OCR、音频输入和转录收集信息,保存到本地数据库,利用 LLM 对话、总结和回顾你所做的事情。 | |
| RMBG-2.0 | 一款高效的背景移除工具,支持处理各种图像,一键移除背景,效果出色且处理速度快,适用于电商、广告等场景。 | |
| Comfyui_Object_Migration | 一套基于 ComfyUI 的服装迁移工作流,可将服装照片自然真实地迁移到模特身上,支持虚拟试穿和风格迁移(如动漫转现实风格),还原度较高。 | |
| NSFW Detector | 一款开源免费的 NSFW 内容检测器,使用 Google 模型,准确度高,支持检测图片、PDF 文件、视频、压缩包等多种文件类型,支持纯 CPU 推理,提供 API 服务便于集成。 | |
| VideoCaptioner | 一款功能强大的视频字幕翻译助手,提供可视化操作界面,支持字幕智能断句、校正、优化、翻译,一键生成双字幕视频。 | |
| MagicQuill | 一款开源的 AI 互动式图像编辑工具,用户只需通过画笔涂抹和简单提示词,即可轻松实现插入元素、擦除物体、调整颜色等各种图像编辑操作。 | |
| Voice-Pro | 一款集转录、翻译和文字转语音为一体的开源工具,提供简洁直观的可视化操作界面,支持实时转录和翻译,以及批量处理模式。 | |
| AdvancedLivePortrait-WebUI | 一款基于 Gradio 开发的开源工具,能够对图像中的人物进行实时面部表情精确控制,如微笑、眨眼、摇头等,支持多种部署方式使用。 | |
| pdf-extract-api | 一款基于 FastAPI 的 PDF 文档提取和解析工具,利用 OCR 技术和 Ollama 模型将 PDF 或图像转换为 Markdown 文本或 JSON 文档,支持表格、公式等格式解析,使用 Redis 缓存提高效率。 | |
| Cerebellum | 一款基于智能体的浏览器自动化工具,通过使用 LLM 构建的智能体实现自动化操作键盘和鼠标,在网页上完成数据抓取、自动化测试等任务。 | |
| PromptFix | 一款基于提示的 AI 图像修复工具,能够根据输入的提示对图像进行上色、移除物体、去除水印、高清化、调整光线等操作。 | |
| Maxun | 一款开源的自动化网页数据爬取工具,无需编写代码,通过可视化界面构建自定义机器人实现网页数据捕获、提取和处理等功能。 | |
| AI Podcast Generator | 一款开源的自动化 AI 播客生成工具,能够自动抓取网络新闻内容,并生成自然流畅的叙述性音频播客,提供简单易用的界面。 | |
| MegaParse | 一款基于大型语言模型构建的功能强大的文档解析开源工具,可以轻松处理 PDF、PPT、Word、Excel 等常见格式,保证解析过程中不丢失任何信息,还能准确识别文档中的表格、目录、页眉页脚和图片等内容,解析速度快,效率高。 | |
| SoniTranslate | 一款基于 Gradio 构建的简单易用的视频翻译工具,支持将视频一键翻译成多种语言,并提供视频同声翻译功能。 | |
| EveryoneNobel | 一款开源的 AI 工具,可用于生成个性化诺贝尔奖项图片,利用 ComfyUI 进行图像生成,并结合 HTML 模板展示图片上的文本,只需提供个人肖像图即可生成诺贝尔奖项风格图像。 | |
| PodCastLM | 一款开源免费的工具,可以将 PDF 内容转化为适合音频播客的自然对话,并输出为 MP3 文件。 | |
| Agent.exe | 一款开源的 AI 自主操作计脑工具,利用 Claude 3 . 5 Sonnet 直接控制本地电脑,展示了 Claude 的 Computer Use 能力,可用于自动化智能体开发。 | |
| Zerox | 一款简单易用的 OCR 文档工具,支持 PDF、Docx、图像等文件格式,可将文件转换为图像后利用 gpt – 4o – mini 模型识别图像信息并输出 Markdown 格式文件。 | |
| UVR5-UI | 一款功能强大的人声伴奏分离 AI 工具,提供在线简洁易用的操作界面,支持选择不同的 AI 模型以及输出格式和质量,支持批量处理。 | |
| Virtual Try-On Application | 一款基于 WhatsApp API 和 IDM – VTON 虚拟试穿模型的 AI 应用,用户只需在 WhatsApp 上传个人照片和服装照片,即可生成虚拟试穿效果图,提供便捷的虚拟试衣体验。 | |
| Claude Financial Data Analyst | 一款由 Anthropic 开源的基于 Next . js 和 Claude AI 构建的金融数据分析助手,支持多种格式文件上传,通过聊天界面进行财务数据分析并生成可视化图表。 | |
| Tabled | 一款基于 Surya 开发的 OCR 小工具,能够识别 PDF、图像、Word 和 PPT 等文件中的表格,并将表格内容提取转换为 Markdown、CSV 或 HTML 格式。 | |
| Surya | 一款开源且强大的文档 OCR 工具,专注于文档图像的处理和分析,能够准确进行逐行文本检测和识别,支持 90 多种语言。 | |
| Animate-X | 一款基于 AI 的动画生成工具,可以通过输入角色图片和参考动作视频,自动生成角色按照指定动作移动的动画效果,支持真人、游戏、卡通等多种类型的角色,保持角色一致性并允许大幅度动作。 | |
| AsrTools | 一款开源的智能语音转字幕文本工具,集成了多家公司的语音识别接口,支持多种音频格式,提供批量处理和生成字幕文件功能,界面简单易用。 | |
| Podcastfy | 一款开源工具,可将视频、PDF、论文、网站和文章等内容转换为对话式的播客音频。 | |
| gptme | 一款功能强大的开源终端 AI 助手,支持在终端执行本地代码、读写文件、搜索浏览网页和进行视觉识别等操作,可连接 OpenAI、Anthropic、OpenRouter 等主流 LLM 提供商,也可使用 llama . cpp 在本地提供服务。 | |
| FinRL | 一个开源的量化金融自动交易框架,包含市场环境、智能体和应用三层架构,提供先进算法核心支持连续交易决策。支持投资组合分配、加密货币交易、高频交易等金融任务和实时交易功能。 | |
| Youtube-Whisper | 一款利用 OpenAI Whisper 模型实现音频转文本的轻量级开源免费工具,可输入 YouTube 视频链接提取音频并转换为文本,支持多种语言。 | |
| ebook2audiobookXTTS | 一款开源的 AI 工具,利用 Calibre 和 Coqui TTS 将电子书转换为高质量的有声读物,支持多种语言和语音克隆功能。 | |
| Text Behind Image | 一款简单有趣的开源免费工具,可以轻松将文本添加到图像中指定对象的背后,如动物、人物或物品等,并支持保存到本地。 | |
| Compiler Explorer | 一款在线交互式编程语言编译器探索工具,支持超过 30 种语言如 C、C ++、Rust、Go 等,可在浏览器中实时编辑代码并查看编译后的汇编代码输出,提供多种编辑器、工具和可视化选项。 | |
| Local File Organizer | 一款基于 AI 的本地文件整理器,可以自动扫描指定目录中的文件,理解文件内容并生成相关描述、文件夹名称和文件名,将文件整理到新的目录结构中。 | |
| OpenScanner | 一款快速、易用且开源免费的文档扫描工具,具有自动文本识别、文档命名、地理位置标记、签名添加、Vision Pro 支持等功能,可保存、编辑、注释和分享扫描文档。 | |
| Diffusers Image Outpaint | 一款在线 AI 扩图工具,可以免费使用,只需上传图片并选择扩展比例,即可一键完成图像扩展。 | |
| GOT-OCR2.0 | 一款端到端的开源 OCR 模型,被称为 OCR 2 . 0,支持识别场景文本、文档、乐谱、图表、数学公式等多种内容,在 BLEU 评测中取得 0 . 972 的高分,模型体积仅 1 . 43GB。 | |
| Python Tutor | 除了 Python 外,还支持 Java、C、C ++和 JavaScript 等编程语言。 | |
| Fish Speech | 一款开源的多语言 TTS 模型,使用 70 万小时数据训练,支持英语、中文、韩语、日语、法语、德语、阿拉伯语和西班牙语 8 种语言。具有快速语音合成、低延迟、声音丰富、混合语言和语音克隆等特点。 | |
| wcf.js | 一款强大、快速、开源的微信机器人底层框架,提供消息监听、发送和群聊操作的一站式解决方案,内置强大易用的 Agent 库和开发者工具包,具有高效稳定的处理能力和自由控制发消息频率的功能。 | |
| markmap | 一款开源免费的工具,可以将 Markdown 文档内容转换为直观可视化的思维导图,支持图像、链接、代码块、内联样式和数学公式等格式内容。 | |
| Video2x | 一款开源免费的无损放大视频和图像工具,使用多种先进的超分辨率算法如 waifu2x、Anime4K、SRMD 和 RealSR 等实现视频/ GIF /图像的无损放大和提高帧速率。 | |
| PptxGenJS | 一款基于 JavaScript 的开源库,可用于生成 PPT 演示文稿,支持添加图表、表格、图像、视频等多种元素,生成的文件与 PowerPoint 等应用兼容,并提供 HTML 转 PPT 功能。 | |
| DataEase | 一款功能强大的开源数据可视化分析工具,可作为 Tableau 的替代品,提供丰富美观的图表展示、制作和数据引擎等功能,支持多种数据链接、拖拽式图表制作和与他人分享,并具备 AI 辅助分析和模板市场等创新功能。 | |
| MoneyPrinterPlus | 一款开源免费的全自动化 AI 视频剪辑工具,借助 AI 技术一键生成和批量混剪各类短视频,支持自动发布到视频平台,助力变现。 | |
| Melty | 一款专为 10x 工程师打造的开源 AI 代码编辑器,能够与开发者的整个开发流程集成,理解从终端到 GitHub 的操作,协助高效编写和重构代码,支持多文件大规模更改。 | |
| Easy Voice Toolkit | 一套功能丰富的开源 AI 语音工具箱,包括音频处理、语音识别、语音转录、数据集制作和语音合成等,形成完整语音模型训练工作流。 | |
| ChartDB | 一款基于 Web 的功能强大的数据库图表编辑器,支持多种数据库如 PostgreSQL、MySQL、SQL Server 等,提供基于 AI 的导出功能生成 DDL 脚本方便数据库迁移,可在线使用或本地部署。 | |
| FireCrawl | 一款开源且强大的 Web 爬虫工具,可爬取任何网站内容并转换为 Markdown 或结构化数据,为大语言模型训练、检索增强生成(RAG)提供数据。 | |
| MaxKB | 支持多种大语言模型对接,内置工作流引擎编排 AI 过程,可无缝嵌入第三方系统,在短时间内获得 9000 +星。 | |
| HivisionIDPhoto | 一款轻量级的 AI 证件照制作工具,可识别多种用户拍照场景,实现抠图和生成标准尺寸的证件照。 | |
| VideoLingo | 一款全自动视频翻译的 AI 工具,能够一键对视频进行字幕切割、翻译、精准对齐和个性化配音,生成高质量的字幕和配音。 | |
| Cursor | 一款智能代码编辑神器,提供代码补全、错误修复等功能,支持多种编程语言。该项目收集了各语言的最佳配置提示词和使用教程。 | |
| NarratoAI | 一款一站式自动化影视解说的 AI 视频剪辑工具,基于 LLM 实现文案撰写、自动化视频剪辑、配音和字幕生成,是影视解说剪辑神器,可高效创作内容。 | |
| voicechat2 | 一款响应快速且完全本地化的 AI 语音聊天工具,使用 WebSockets 实现低延迟语音交互并允许远程访问,可本地运行语音识别、文本转语音和大语言模型,在 4090 显卡上延迟低至 300 毫秒。 | |
| CyberScraper 2077 | 一款基于 OpenAI 大语言模型的强大网络爬虫工具,能够智能理解和解析网页内容,提供简单易用的可视化界面,无需编程知识即可操作使用。 | |
| awesome-digital-human-live2d | 一个开源项目,旨在打造一个有温度的数字人,支持 Docker 快速部署、Dify 服务接入、ASR、LLM、TTS、Agent 模块化扩展、Live2d 人物模型扩展和控制、PC 端和移动端 Web 访问。 | |
| LLM-Aided OCR | 一款基于大语言模型(LLM)的开源 OCR 扫描 PDF 工具,可将原始 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。 | |
| Product Hunt Daily Hot | 一款基于 GitHub Action 的自动化工具,每天定时爬取并生成 Product Hunt 热门产品榜单的 Markdown 文件,使用 GPT – 4 模型翻译产品描述,帮助快速查看每日热门榜单。 | |
| moffee | 一款开源免费的 PPT 制作工具,能够将 Markdown 文档一键转换为干净、专业的幻灯片,提供 web 界面实时预览效果。 | |
| Linly-Dubbing | 一款开源且强大的视频多语言 AI 配音/翻译工具,能自动下载视频、翻译字幕、人声分离、克隆音色配音并合成视频。 | |
| Transformer Explainer | 一个可视化交互式学习工具,以 GPT – 2 为例,通过输入文本实时观察 Transformer 各组件(嵌入层、自注意力机制、MLP 等)的工作过程和预测下一个 Token,适合教学和理解 Transformer 内部原理。 | |
| AI Scientist | 一款全球首个自动化科学研究 AI 系统,能够从构思、编写代码、进行实验、总结结果到撰写完整论文和进行同行评审的全过程,支持多种主流大语言模型。 | |
| Clapper | 一款集成多种 AI 功能的开源视频剪辑工具,可一键生成图像、视频、语音、音乐等素材,并进行二次剪辑,让用户无需专业技能即可通过互动迭代的方式制作视频。 | |
| ai-renamer | 一款基于 Node . js 的命令行工具,可根据文件内容自动批量重命名本地文件、图像或视频,默认使用 Ollama 本地模型如 Gemma、Llama 等进行智能识别。 | |
| metahuman-stream | 一个开源项目,实现实时交互流式数字人,支持音视频同步对话,具有多种功能如数字人模型选择、声音克隆、对话被打断处理、全身视频拼接、推流、视频编排和大语言模型对话等,基本可达到商用效果。 | |
| PPTX2MD | 一个开源免费的工具,能够将 PPT 幻灯片转换为 Markdown 文件,支持保留标题、列表、粗体、斜体、颜色、超链接、图片、表格以及合并单元格等 PPT 内容格式。 | |
| Fake Screenshot Generator | 一款可直接在线免费使用的字幕截图生成器工具,可生成逼真的带字幕的截图。 | |
| MinerU | 一款一站式、开源、高质量的数据提取工具,能够将 PDF、网页以及多格式电子书转换为 Markdown 格式,提取图像、表格并转换公式为 LaTex,支持多种语言识别。 | |
| Llama Tutor | 一款开源免费的 AI 个人导师工具,基于 Next . js 和 Tailwind CSS 构建,集成 Llama 3 . 1 和 Serper 提供强大的推理和搜索能力,可根据用户选择的教育水平生成个性化导师解答各种问题。 | |
| bilingual_book_maker | 一款利用大语言模型(如 ChatGPT、Claude 等)对文件和图书进行多语言翻译的开源工具,支持 epub、txt 和 srt 等格式。 | |
| Claude Engineer | 一款基于 Claude 3 . 5 模型的交互式命令行工具,整合了文件系统操作、网络搜索等功能,可协助完成各种软件开发任务,如智能代码分析、修改建议、项目管理等。 | |
| AudioNotes | 一款开源免费的音视频转结构化笔记工具,基于 FunASR 和 Qwen2 构建,可快速提取音视频内容,并利用大模型能力整理成结构化 Markdown 笔记,方便快速阅读。 | |
| Swapy | 一个简单的 JavaScript 开源工具,只需几行代码就可以将网页上任何布局转换为可拖动交换布局,适用于 React、Vue 等主流前端框架。 | |
| Kspider | 一款开源免费的可视化爬虫平台,通过流程图配置即可完成数据爬取工作,无需编写代码,对小白极其友好。 | |
| AI Shell | 一款开源的终端 AI 助手,可在命令行界面通过自然语言转换为对应的 Shell 命令执行,支持多种语言输入,提高终端操作效率。 | |
| Crawlee | 一款开源免费且非常强大的 Python 网页抓取和浏览器自动化库,旨在构建可靠的爬虫为 AI、大语言模型、检索增强生成或 GPTs 提取数据。 | |
| Enchanted | 一款开源的本地大模型 Mac 客户端,类似于 ChatGPT 客户端,需搭配 Ollama 使用,可轻松连接本地部署的私有模型,如 Llama2、Mistral 以及 Vicuna 等,提供在 iOS 生态系统中无过滤、安全、私密和多模态的使用体验。 | |
| Whisper Timestamped | 一款基于 Transformers . js 的浏览器内语音识别工具,可本地运行 whisper – base 模型进行语音转文字,支持 100 种语言并生成单词级时间戳。 | |
| Vanna | 一款 SQL 生成 AI 框架,允许在自有数据上训练 RAG 模型,通过自然语言准确生成 SQL 查询语句,支持多种主流大模型,使用简单,开源可自行部署。 | |
| Great Tables | 一款用于制作高质量表格的 Python 库,内置丰富的表格组件和格式化选项,可以组合创建多种类型的精美表格。 | |
| Comic Translate | 一款利用 GPT – 4 视觉能力的开源漫画自动翻译神器,支持多种格式如图像、PDF、Epub 等,可实现多种语言之间互译,包括日语、英语、中文、韩语、德语、荷兰语等,并提供可视化操作界面。 | |
| CodeGeeX | 一款功能全面的国产开源代码模型,集成代码补全、生成、问答、解释、工具调用、联网搜索等多种能力,覆盖编程开发各种场景,在百亿参数以下性能最强。同时也提供 CodeGeeX 智能编程助手插件。 | |
| 遇见李白 | 一个开源项目,旨在通过构建李白知识图谱的 AI 智能体,以生成式对话应用的形式推广和普及李白古诗词文化,最终目标是开发一款生成式对话应用,实现实时互动并提供个性化的李白诗歌鉴赏体验。 | |
| WebDesignAgent | 一款基于人工智能的网站构建工具,支持多页面管理、用户自定义添加/删除、迭代优化和视觉优化等功能,可通过文本、图片、视觉线索或混合方式生成设计精美的网站。 | |
| AI-YinMei | 一款功能齐全的 AI 虚拟主播(Vtuber)工具,集成了 FastGPT 知识库聊天、语音合成、Stable Diffusion 绘画、AI 唱歌等技术,可实现聊天、唱歌、绘画、跳舞、表情切换、换装、搜图、场景切换等多种功能。 | |
| OmniParse | 一款开源工具,能够将各种非结构化数据如文档、表格、图像、视频、音频和网页转化为结构化的可操作数据,方便用于检索增强生成(RAG)和微调。 | |
| gptpdf | 一款基于 GPT – 4o 视觉大语言模型的开源工具,仅用 293 行代码就能将 PDF 文件解析为 Markdown 格式,几乎完美地解析排版、数学公式、表格、图片和图表等内容。 | |
| Streamer-Sales | 一款能够根据商品特点进行解说的卖货主播大模型,通过生成细腻、独到的解说词,激发用户购买欲望,提供多种功能如文案生成、语音转换、视频生成等,旨在成为销售助手,提升销量和用户体验。 | |
| Wiseflow | 一款敏捷的信息挖掘开源免费工具,可从网站、公众号、社交平台等渠道爬取相关信息,擅长从公众号文章中提取信息。支持对爬取信息进行筛选、提炼、贴标签等处理,并可整合到任意 Agent 项目中作为动态知识库。可完全本地部署,无需 GPU,适合任何硬件环境。 | |
| GPT Computer Assistant | 一款开源的 GPT 客户端应用程序,旨在为 Windows 和 Linux 系统提供类似 macOS 上 GPT 应用的功能,包括屏幕读取、麦克风长音频输入、编写和运行程序以及知识库管理等。 | |
| Diffutoon | 一款开源的视频动漫化项目,提供 Colab 运行笔记,无需部署即可一键动漫化视频,转换后的视频画面稳定流畅,还可编辑和添加视频效果。 | |
| RTranslator | 一款开源免费、可离线的实时翻译应用,能够实时将对方说的语言翻译成你能听懂的语言,支持对话模式、对讲模式和文本翻译模式,使用 Meta 的 NLLB 和 OpenAI 的 Whisper 进行翻译和语音识别。 | |
| AI Math Notes | 一款基于 Python 开发的交互式绘图应用程序,允许用户在画布上手写数学方程,利用多模态大语言模型(LLM)计算并显示结果,实现了类似苹果\”备忘录数学计算器\”的功能。 | |
| Whisper Web | 一款基于 OpenAI 的 Whisper 语音识别模型的开源 Web 应用程序,允许直接在浏览器中运行使用 Whisper 进行语音转文本,支持 WebGPU 加速,无需后端服务器,可导出 TXT 和 JSON 格式文件。 | |
| GPT Academic | 一款功能强大的 GPT 学术优化开源项目,提供论文翻译、代码解析、知识获取、语法校对、论文润色、摘要生成等多种功能,支持接入多种 LLM 模型,提升学术研究效率。 | |
| Translation Agent | 一套由吴恩达老师开源的 AI 翻译工作流程,基于大语言模型进行翻译、反思和优化,可控制语气、地区和术语翻译一致性,翻译质量媲美商业工具。 | |
| ScrapeGraphAI | 一款基于大语言模型和直接图逻辑的 AI 网页爬虫工具,可以根据用户提示自动为网站和本地文档创建爬取管道,支持单页、多页和语音爬取,提高数据采集效率。 | |
| MiGPT | 一个开源项目,旨在将小米小爱音箱打造成专属的 AI 语音助手,将小爱音箱和米家智能设备与 ChatGPT 等大模型的理解能力完美融合,提供 LLM 回答、角色扮演、流式响应、长短期记忆、自定义 TTS 和智能家居 Agent 等功能。 | |
| pyVideoTrans | 一款开源的视频翻译配音工具,可将一种语言的视频自动翻译为指定语言的视频,生成字幕和配音,支持多种翻译服务和配音引擎,可本地离线使用。 | |
| cloudflare-ai-web | 一个开源项目,利用 Cloudflare Workers AI 免费提供的大模型,可快速搭建多模态 AI 平台,支持一键部署、无需服务器、个性化定制等,集成了 ChatGPT、Stable Diffusion 等多种 AI 模型。 | |
| ChatTTS-ui | 一款开箱即用的 ChatTTS 安装包,提供 Web 界面和 API 接口,支持 Windows、Linux、macOS 部署,Windows 用户可直接下载安装包一键安装使用。 | |
| Perplexica | 一款由 AI 驱动的开源搜索工具,能够深入互联网提供精准答案,理解问题并优化搜索结果,提供带引用来源的明确答案。具有隐私保护、本地大语言模型支持、双模式搜索和专注模式等特征。 | |
| RAGapp | 一款无需编码的可视化界面工具,用于配置基于 LlamaIndex 构建的 RAG 聊天机器人,类似于 OpenAI 的 GPT 模型,可轻松部署在自有云基础设施中。 | |
| MusicGPT | 一款开源免费的 AI 音乐生成器,支持在 Windows、macOS 和 Linux 系统上本地高效运行最新音乐生成 AI 模型,如 Meta 的 MusicGen 模型,无需安装依赖,易于使用。 | |
| Khoj | 一款融合本地文档和在线搜索的 AI 第二大脑工具,可连接个人知识库、提供强大搜索引擎、支持在线离线使用,并提供定制 AI 智能代理协助完成任务,完全开源免费。 | |
| Talk With Gemini | 一款可一键免费部署的私人 Gemini 应用程序,支持最新的 Gemini 模型,如 Gemini 1 . 5 Pro、Gemini 1 . 5 Flash 等,具有多模态支持、语音模式、视觉识别、助理市场、Markdown 支持、上下文压缩、隐私安全、精心设计的 UI 等特性。 | |
| ugly-avatar | 一个开源免费的潦草头像生成器,可以生成极具特色的头像,受到许多网友的喜爱。 | |
| DashPlayer | 一款专为英语学习打造的视频播放器,提供双语字幕、按字幕跳转、查词查询、可调整界面尺寸、记录播放位置、蓝牙遥控操作、夜间模式、AI 字幕生成、长视频切分和视频下载等功能,助力通过观看视频提升英语水平。 | |
| OpenGlass | 一款基于开源硬件的 AI 智能眼镜系统,只需 20 美元的成本即可将普通眼镜升级为智能眼镜,实现记录生活、识别物体、计算卡路里、实时翻译等多项 AI 功能。 | |
| PicProse | 一款开源免费的封面图片制作工具,能帮助用户轻松为 Medium、Wordpress、微信等平台的文章制作精美封面。 | |
| Reader | 一款开源免费的工具,专门用于将网页内容转换为 Markdown 格式,方便将网页内容整合到知识库中。 | |
| SuperMemory | 一款开源免费的个人知识管理工具,可以帮助用户轻松收集和管理网上的有价值内容,通过 AI 快速查找和回顾已保存的内容,打造属于自己的\”第二大脑\”。 | |
| STORM | 一款由斯坦福大学开发的创新型 AI 写作工具,可根据主题自动收集信息、创建大纲,模拟专家对话并撰写完整文章,帮助编写出具有深度和广度的高质量内容。 | |
| LLocalSearch | 一款完全本地化的 AI 搜索集成工具,无需依赖任何外部 API,通过 LLM Agents 寻找答案,支持低配置硬件运行,提供详细进度日志和后续问题交互,界面美观支持浅色深色主题,支持 Docker Compose 部署。 | |
| FreeAskInternet | 一款开源免费的基于搜索的问答 AI 工具,可本地运行无需 GPU 硬件支持,通过多引擎搜索并利用 GPT – 3 . 5 处理结果生成答案,确保隐私安全。 | |
| poster-design | 一款开源的在线创意图片编辑器,适用于海报图片生成、电商分享图、文章长图等场景,提供丰富的编辑功能,如元素拖拽、图片编辑、SVG 编辑、画布自定义等,无需客户端即可轻松完成图文排版。 | |
| Open WebUI | 一款专为大型语言模型(LLM)设计的可扩展且功能丰富的 Web 界面,支持运行各种 LLM 模型,包括 Ollama、OpenAI 兼容 API、Gemini、Groq、Claude 等,提供直观界面、响应式设计、代码语法高亮、Markdown 和 LaTeX 支持、本地检索增强生成(RAG)集成、多模型支持与多模态互动、安全和多用户管理等丰富功能。 | |
| Douyin_TikTok_Download_API | 一款开源免费的高性能异步数据爬取工具,支持 API 调用和在线批量解析及下载无水印视频或图集,覆盖抖音、快手、TikTok、B 站等多个视频平台。 | |
| AI Comic Factory | 一款基于 LLM + SDXL 技术的开源免费在线 AI 漫画生成工具,可自动生成精美漫画作品,支持自定义 LLM 和图像生成模型。 | |
| Suno-API | 一个非官方的 Suno AI API 项目,支持生成歌曲、歌词等功能,具有自动维护 token、全异步响应、代码简单易维护等特点。 | |
| Claude-Journalist | 一款基于 Claude 3 的 AI 写作助手,可根据输入主题自动搜索相关信息、撰写和编辑高质量文章,提高写作效率。 | |
| MoneyPrinterTurbo | 一款开源免费的 AI 工具,可以根据提供的主题或关键词自动生成视频文案、素材、字幕和背景音乐,并合成高清短视频,支持多种功能如自定义文案、视频尺寸、批量生成、语音合成、字幕设置等,提高短视频制作效率。 | |
| LiveStory | 一款利用 AI 进行实时语音绘图的工具,将传统的文本输入换成语音输入,实时生成图像,支持语音控制绘图。 | |
| Buzz | 一款开源免费、简洁、可离线的音频转录和翻译工具,基于 OpenAI Whisper 开发,支持拖放导入音视频文件进行转录和翻译,转录文本可导出多种格式,支持多种语音识别框架和命令行操作。 | |
| MediaCrawler | 一款开源的自媒体爬虫工具,支持小红书、抖音、快手、B 站、微博等平台的视频、图片、评论、点赞、转发数据抓取,具备多种登录方式、指定数据爬取、IP 代理池和多种数据格式保存等功能。 | |
| 小浣熊智能助手 | 一款由商汤科技研发的功能全面的国产 AI 工具,内置代码模式和办公模式,可大幅提升编程开发和协作办公效率。 | |
| Comflowy | 一款针对 Mac 用户优化的 ComfyUI 整合包,提供一键部署、模型管理、工作流管理和扩展管理等功能,使用体验比官方 ComfyUI 更佳。 | |
| Inpaint-web | 一款基于 WebGPU 技术开发的开源免费图像修复和放大工具,可直接在浏览器上运行,无需客户端,提供图像局部擦除修复和超分辨率放大功能。 | |
| AutoPrompt | 一个自动优化提示词的开源框架,可根据用户意图生成高质量详细的提示词,并通过迭代数据集不断优化提示词,减少工作量,解决敏感性和歧义性问题。 | |
| 青梧字幕 | 一款基于 Whisper 的开源字幕提取工具,支持智能提取、编辑和高质量翻译字幕,可生成单/双语字幕并选择多种格式下载。 | |
| Chat with MLX | 一款开源的本地 AI 对话助手工具,可与本地数据进行交互,支持多种文件格式和语言,并可集成多个开源大语言模型。 | |
| StickerBaker | 一款开源的 AI 贴纸制作工具,结合了 Stickers SDXL Lora 和 BRIA 背景移除工具,只需输入简单的提示词,即可快速生成高清精美的贴纸。 | |
| OOTDiffusion | 一款开源的 AI 虚拟试衣工具,支持一键试穿上半身/下半身/连衣裙,服装与模特贴合自然,试穿效果逼真。 | |
| MoneyPrinter | 一款自动化创建短视频的工具,可根据主题自动生成带配乐及字幕的视频,并上传到 YouTube 获取收益。支持使用 GPT、DALL – E 等大模型生成脚本和图像。 | |
| NotesGPT | 一款开源免费的语音笔记工具,界面简洁,支持语音输入转文字和自动总结,内置 Mixtral LLM 和 Whisper 转录引擎,支持中英混合输入。 | |
| Reor | 一款由 AI 驱动的开源免费桌面笔记工具,能够智能整理和归纳笔记内容,自动关联相关想法,内置 LLM 提供问答和语义搜索功能,可作为个人知识管理工具使用。 | |
| Noi | 一款开源的高颜值 AI 客户端,集成了 ChatGPT、Claude、Bard、Poe 等主流 AI 模型,并内置 GitHub、HuggingFace 和 VS Code 等工具,支持自定义 Prompt 管理、多语言、多主题等功能,可在 MacOS、Windows、Linux 系统上安装使用。 | |
| ChatGPT Web + Midjourney Proxy | 一款功能全面的镜像站,支持 AI 对话、AI 换脸、Midjourney、GPTs、TTS Whisper 等多种 AI 功能,提供 Vercel 一键部署。 | |
| ChatGemini | 一款开源的简洁 Google Gemini 网页客户端,界面和交互类似 ChatGPT,支持在对话框中上传图片并自动调用 Gemini – Pro – Vision 模型进行图像识别。 | |
| WhisperFusion | 一款基于 WhisperLive 和 WhisperSpeech 构建的 AI 对话系统,集成了 Mistral 大语言模型,实现了极低延迟的语音与 AI 对话体验,并通过 TensorRT 引擎优化和 torch . compile 技术提升了运行效率。 | |
| search_with_lepton | 一款使用不到 500 行代码构建的对话式搜索引擎,实现了类似 Perplexity 的效果,集成了大语言模型(Llama2、Mixtral)和搜索引擎(支持 Bing、Google 搜索),具有可自定义的个性化 UI 界面,支持搜索结果的共享和缓存。 | |
| AI红包封面生成器 | 一款基于 DALL – E 3 的 AI 红包封面生成工具,支持自定义生成红包封面图像,采用 Next . js 全栈开发,集成了多种功能如谷歌登录、图片上传、支付等。 | |
| Zed | 一款开源的高性能可多人协作代码编辑器,集成了 AI 代码生成和重构功能,提供语言感知、集成终端、多种编辑模式、团队协作和远程代码操作等强大功能。 | |
| Web LLM | 一款可在浏览器中直接运行大型语言模型的工具,支持 Llama 2 7B / 13B、Mistral 7B 和 WizadMath 等模型,并通过 WebGPU 实现加速,无需服务器支持。 | |
| WhisperSpeech | 一款基于 Whisper 语音识别模型的开源文本转语音工具,目前仅支持英语,作者计划在下一个版本增加多语言支持,可用于商业用途。 | |
| GPT-SoVITS | 一款开源的中文语音克隆工具,仅需 5 秒语音样本即可实现 80 %~ 95 %相似度的声音克隆,提供 1 分钟语音可逼近真人效果并生成高质量 TTS 模型。 | |
| QAnything | 一款开源的知识库问答引擎,支持本地部署和调用云端大模型服务,可导入多种格式文档,提供准确快速可靠的问答体验。 | |
| AI Gateway | 一款统一的 API 网关工具,可轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等,具有占用空间小、处理速度快、支持负载均衡、故障转移、自动重试等优势,已在超过 100B Tokens 上进行实战测试。 | |
| cutword | 一个简单快速的中文分词和命名实体识别工具,分词速度是知名\”结巴\”中文分词的两倍,字典文件根据最新数据统计得到,词频更加合理。 | |
| DDColor | 一款基于 AI 的图像着色工具,可为黑白老旧照片和动漫游戏场景提供逼真自然的着色效果,实现照片级真实感。 | |
| ReplaceAnything | 一款由阿里巴巴发布的 AI 内容替换工具,能够准确保留指定的物体(如人脸、人物、服装、物品等),并通过输入提示词实现超高质量的内容替换,可用于人物替换、服装替换、背景替换等多种场景。 | |
| Jan | 一款开源的本地 AI 工具,可无需编码运行主流大语言模型如 Mistral、Llama、Mixtral 等,支持 Windows、Mac 和 Linux 系统,拥有简洁美观的 UI 界面。 | |
| Mobile ALOHA | 一款多功能家务机器人,可以帮助浇花、拖地、做饭、逗猫、扔垃圾、洗衣服、铺床单、整理衣物等家务活动,具有模仿学习和远程操作功能。 | |
| Auto Job Find Assistant | 一款结合 GPT 和 RPA 技术的自动投简历助手,可根据个人简历和职位要求自动匹配合适的工作机会,生成自我介绍和求职信,并自动发送给 HR,实现一键寻找工作的全流程自动化。 |
↥ 返回目录
免费书籍
| 项目 | 简述 | 源 |
|---|---|---|
| Large Language Model in Action | 一本专注于大语言模型实践应用的开源书籍,通过介绍工具和案例实践,帮助读者快速上手大模型应用开发。 | |
| Select Star SQL | 一本免费的互动式学习 SQL 书籍,共五章内容,每章约 30 分钟,涵盖行操作、分组聚合、表连接等主题,结合实际案例学习。 | |
| The Little Book of ML Metrics | 一本面向数据科学家的开源免费书籍,涵盖广泛的机器学习指标,包括回归、分类、聚类、排行、计算机视觉和自然语言处理等领域,旨在成为数据科学家的快速参考手册。 | |
| Linux From Scratch 中文翻译版 | 一本免费的在线书籍,教授从源代码开始构建整个 Linux 系统的过程,深入了解 Linux 工作原理,支持个性化定制和优化,提高系统安全性,通过实践获得 Linux 系统的深刻理解。 | |
| Hands-On Large Language Models | 一本由吴恩达老师推荐的关于大语言模型的实践指南书籍,涵盖语言模型基础知识、文本分类、提示工程、语义搜索、多模态语言模型等内容,配有案例代码、插图和引用论文,帮助读者深入理解和使用大语言模型。 | |
| 计算机体系结构基础(第三版) | 一本由\”龙芯之父\”胡伟武老师等编写的开源免费在线书籍,涵盖指令系统结构、计算机硬件结构、CPU 微结构、并行处理结构、计算机性能分析等内容,适合本科生、研究生和技术人员学习参考。 | |
| Decision Making Under Uncertainty | 一本由麻省理工学院出品的免费电子书,涵盖概率推理、序列决策问题、模型/状态不确定性以及多 Agent 系统等内容,使用大量示例和练习帮助读者理解不同算法的直觉和应用场景。 | |
| Grammar Club | 一本开源且免费的在线英语语法学习书籍,采用循序渐进的方式,从初级到高级分为三大篇幅,涵盖简单句、复句、合句和简化从句等内容,旨在培养英语能力、建立信心并增强阅读兴趣。 | |
| 《理解深度学习》中文版 | 一本由麻省理工开源的深度学习教材中文版,全面涵盖深度学习基础概念、监督学习、强化学习等内容,并提供 PPT、笔记和 Python 练习 Demo。 | |
| Understanding Deep Learning | 一本来自麻省理工的开源书籍,全面涵盖了深度学习的基础概念、监督学习、强化学习、线性回归、神经网络、扩散模型等内容。该书提供了 PPT、笔记和 68 个 Python 练习 Demo 供学习和实践。 | |
| Python Guide for JavaScript Engineers | 一本面向 JavaScript 工程师的 Python 学习指南,由一名前端工程师编写,系统介绍了 Python 环境搭建、项目开发等内容,并对比了 JavaScript 和 Python 的异同,帮助 JavaScript 工程师快速掌握 Python 语言。 | |
| 深入超高可用架构原理与实践 | 一本开源的架构设计书籍,涵盖云计算、网络、分布式系统、容器技术、可观测性、服务网格、DevOps 等主题,帮助程序员深入理解相关技术的原理与实践。 |
↥ 返回目录
学习教程
| 项目 | 简述 | 源 |
|---|---|---|
| Reasoning with o1 | 一门由 OpenAI AI 解决方案主管 Colin Jarvis 主讲的免费 AI 短课程,教授如何有效使用 OpenAI 最新推理模型 o1,包括多步骤任务规划、代码开发与编辑、图像理解等实践项目,帮助学习者掌握 o1 模型的高级推理能力。 | |
| A Programmer\’s Guide to English | 一份专为程序员设计的英语学习指南,通过程序员易于理解的方式剖析语言学习本质,提供适合不同水平的训练方法和学习资料推荐,并从构建英语识别程序的角度助力学习。 | |
| ML Retreat | 一份从中级到高级的 AI 学习路径,包含作者在学习高级机器学习时的个人笔记和资源,涵盖从基础到更高级主题的深入理解,如从头构建大语言模型、LLM 幻觉深入研究以及 LLM 超越注意力机制等。 | |
| Machine Learning Course Notes | 一份来自卡内基梅隆大学的机器学习入门课程笔记,涵盖了机器学习各主题的要点,包括非参数模型、线性回归、逻辑回归、神经网络、支持向量机等,针对初学者提供全面的概念解释、数学证明和算法步骤。 | |
| AI Python for Beginners | 一门由吴恩达老师主讲的免费 AI 短课程,面向初学者,教授 Python 编程基础知识以及集成 AI 工具进行数据操作、分析和可视化,通过真实项目实践强化 Python 技能。 | |
| 软件工程师学习指南 | 一份从零开始成为软件工程师的详细学习指南,涵盖计算机基础知识、软件开发工具和流程、数据库、面向对象编程、DevOps 工具等内容,从 Python 语言入门,最后提供编码面试准备、工作选择和持续学习建议。 | |
| Machine-Learning | 一份从零开始学习机器学习算法的教程,包含神经网络和 Transformer 模型的详细解释和 Python 实现代码,如 Neuron、Layer 和 NeuralNetwork 类,还提供机器学习视频和 Jupyter Notebook 文件。 | |
| Spring-Reading | 一份深入了解 Spring 源码的系列学习资料,涵盖了 Spring 框架的核心概念和关键功能,如资源加载、表达式语言、Bean 定义、Aware 接口、核心注解和 AOP 等,帮助更透彻地理解 Spring 内部工作机制。 | |
| Machine Learning Specialization | 一套由吴恩达老师主讲的机器学习专业课程,包括机器学习回归与分类、高级学习算法、无监督学习等多个领域,涵盖监督学习、无监督学习、神经网络等内容,适合初学者和希望在人工智能领域发展的专业人士学习。 | |
| LLM Twin Course | 一门全面的大型语言模型(LLM)免费学习课程,教授如何构建生产级别的 LLM 和基于 LLM 的检索增强生成(RAG)系统,涵盖系统设计、数据工程、特征管道、训练管道和推理管道等方面。 | |
| Stable Diffusion From Scratch | 一套系统性的教程,讲解 Stable Diffusion 和扩散模型的工作原理及其背后的数学知识,并提供一系列步骤指导训练完成一个扩散模型。 | |
| From Tensor to Stable Diffusion | 一份开源的深度学习教程,提供为期 9 周的课程大纲,从张量基础到稳定扩散模型实现,包括视频讲解、代码实现和论文学习。 | |
| 大模型理论基础 | 一份关于大规模预训练语言模型的教程资料集合,涵盖数据准备、模型构建、训练策略、模型评估与改进等内容,旨在为读者提供深入的理论知识和实践方法。 | |
| AI Text-to-Video Model from Scratch | 一份手把手教程,教你如何使用 Python 从零开始构建一个文本到视频生成模型,涵盖理论概念、架构设计和编码实现等全过程。 | |
| nginx-tutorial | 一份开源的 Nginx 入门学习笔记,涵盖基础安装、参数说明、配置讲解、第三方模块安装、性能优化及常见使用场景等内容。 | |
| PyTorch Deep Learning Tutorial | 一份开源的《从零到精通深度学习 PyTorch》教程,涵盖 PyTorch 基础、深度学习工作流程、计算机视觉、自定义数据集处理、模块化代码编写及模型部署等内容,提供视频和代码示例,适合有 Python 编程和基础机器学习知识的初学者。 | |
| Generative AI Handbook | 一份系统化的生成式人工智能学习路线手册,包含 9 大章节,涵盖生成式 AI 的基础知识、实践应用和最新研究进展,并提供相关学习资源。 | |
| LingoHut | 一个免费的在线语言学习平台,提供 45 种语言的学习资源,包括 125 节免费课程,涵盖日常用语和词汇,让你用母语轻松学习新语言。 | |
| WTF-zk | 一份零知识证明入门教程,旨在让仅有高中数学基础的人也能入门零知识证明(zk)技术,教程使用 Python 复现相关算法,需要一些 Python 语言基础。 | |
| 100-exercises-to-learn-rust | 一套包含 100 个练习的 Rust 编程语言学习资源,旨在帮助初学者从零基础逐步掌握 Rust 编程,最终能够独立编写 Rust 程序。 | |
| 《大语言模型》电子书籍 | 一份全面系统地介绍大语言模型的电子书籍,涵盖基础理论、预训练、微调与对齐、使用部署以及评测与应用等内容,为大模型入门读者提供详细指南。 | |
| 《动手学大模型》 | 一份由上海交通大学《人工智能安全技术》课程讲义拓展而来的编程实战教程系列,通过实践帮助快速入门大模型相关技术,涵盖模型微调与部署、提示学习与思维链、知识编辑、模型水印以及大模型智能体与安全等内容。 | |
| machine-learning-list | 一份较为全面的机器学习教程,涵盖从基础到高级再到实践与应用的内容,包括基本简介、训练和微调、推理和执行策略、数据集处理以及实际应用等。 | |
| 50projects50days | 一份包含 50 个使用 HTML、CSS 和 JavaScript 实现的小 Demo 的项目集合,适合前端初学者练手,涵盖动画导航、背景滑块、密码生成器、图像轮播等常见网站功能。 | |
| self-llm | 一份超全面的开源大模型使用指南,提供针对国内初学者的开源大模型教程,通过 AutoDL 平台简化模型部署、使用和应用流程。 | |
| SQL之母 | 一个免费的闯关式 SQL 自学网站,通过有趣的交互式关卡,让初学者从 0 到 1 掌握常用 SQL 语法,包括 30 多个关卡、在线提交代码、自由选择关卡、自定义关卡等功能。 | |
| Hugging Face AI Courses | 一套由 Hugging Face 出品的 4 门 AI 学习课程,涵盖自然语言处理、深度强化学习、音频处理和开源 AI 开发等主题,适合初学者免费学习。 | |
| earthworm | 一个通过连词构句的方式帮助用户更好地学习英语的开源项目,从简单到复杂的句子逐步训练,让用户轻松掌握写出长句子,顺便还可以练习键盘英文打字。 | |
| 90DaysOfCyberSecurity | 一份 90 天网络安全学习计划,涵盖网络基础、安全基础、Linux、Python、流量分析、Git、ELK、AWS、Azure 和黑客攻击等主题,提供完整的学习资源和材料。 | |
| Build a Large Language Model (From Scratch) | 一套从零开始构建类似 ChatGPT 的大型语言模型(LLM)的教程,涵盖了文本数据处理、注意力机制实现、模型构建、预训练、微调等内容,帮助读者深入了解 LLM 的工作原理和实现方式。 | |
| LLM Course | 一份开源免费的大语言模型课程,包含详细的学习路线和实践笔记,分为三个部分:LLM 基础教程、LLM 深入探索和 LLM 应用与部署。 | |
| CS50 | 一门由哈佛大学免费开放的计算机科学和编程入门课程,教授编程基本原理和计算思维方法,涵盖 C、Python、SQL、HTML、CSS 和 JavaScript 等多种语言,最后以终极项目作为收官。 | |
| English-level-up-tips | 一份系统化的英语学习指南,包含认知、单词、听力、阅读、口语、写作和扯淡等七大章节,旨在帮助用户高效提升英语水平。 | |
| Docker 从入门到实践 | 一份全面的 Docker 学习指南,涵盖了 Docker 的基础知识、安装、镜像使用、容器操作、数据管理、网络配置等内容,旨在教会新手有效使用 Docker。 |
↥ 返回目录
实用工具
| 项目 | 简述 | 源 |
|---|---|---|
| VutronMusic | 一款高颜值的第三方网易云音乐播放器,支持本地歌曲、离线歌单播放,读取歌曲封面、内嵌歌词等功能,同时支持线上信息匹配、云盘、对歌曲评论,界面纯净无广告。 | |
| Squish | 一款开源免费的图像压缩工具,支持多种图像格式,具有高性能压缩优化功能,能保持图像质量不变,并提供批量处理、格式转换、实时预览等功能。 | |
| PairDrop | 一款开箱即用的跨平台文件传输工具,无需注册和安装,只需浏览器即可在同一局域网内任意设备之间自由传输文件,还支持创建临时公共房间实现公网传输,采用点对点传输保证数据安全隐私。 | |
| Checkmate | 一款高颜值的可视化实时监控工具,支持网站、页面加载速度、Docker 容器、Ping 响应等多种监控类型,并提供服务器 CPU、内存、磁盘和温度等状态信息。 | |
| MyIP | 一款开源的 IP 工具箱,可以检查 IP 地址、地理位置、DNS 泄露、网速测试、Ping 测试和网站可用性等,提供 258 项安全检查清单及详细解释。 | |
| Presenterm | 一款开源工具,能够在终端上演示由 Markdown 创建的精美 PPT,支持代码高亮、图片展示、LaTeX 公式渲染等功能,内置丰富主题风格并可自定义,还可导出 PDF 文件。 | |
| File Converter | 一款实用的文件格式转换工具,支持视频、音频、图片和文档等多种文件格式转换,可以快速完成文件格式转换和压缩,支持批量处理。 | |
| CodeSnap | 一款基于 Rust 开发的代码截图工具,可离线使用,支持 Sublime Text 代码语法高亮主题,可自定义字体、行号、水印等,支持 PNG、SVG 和 HTML 输出格式。 | |
| IP Helper | 一款简洁的 IP 信息查询工具,支持 Web、命令行、Telnet 和 FTP 等多种查询方式,提供 IP 地理位置查询、Token 认证和自定义域名等功能。 | |
| FastSend | 一款基于 WebRTC 技术的开源免费点对点文件传输工具,支持快速安全的文件和目录同步传输,具有加密传输、局域网优化、简洁界面等特性。 | |
| academic-project-page-template-vue | 一个基于 Vue 开发的学术论文项目页面模板,支持轮播图、嵌入视频、数据可视化等丰富功能,还能一键复制引用格式,内置评论系统,非常适合研究人员快速直观地呈现论文基本信息。 | |
| SiteOne Crawler | 一款简单易用且功能强大的网站分析工具,可一键完成网站分析、性能检测、SEO 优化建议,并导出完整的离线 HTML 分析结果,用于网站分析优化。 | |
| wechatDataBackup | 一款微信聊天记录导出工具,提供类似微信的简易操作界面,支持一键导出聊天记录、图片、视频、链接、语音、文件和表情等信息。还支持按类型、日期、群成员进行检索,以及多开账号选择导出和数据切换。 | |
| Neko | 一款开源的虚拟浏览器工具,支持多人同时访问和控制同一浏览器界面,实现画面和声音同步,内置聊天系统、文件传输等功能,可用于远程协作、在线观影等场景。 | |
| Koodo Reader | 一款开源免费的跨平台电子书阅读器,支持多种格式导入、多种阅读模式、听书、翻译、词典等功能,并提供个性化排版、笔记标注等功能。 | |
| WindTerm | 一款高颜值且功能强大的跨平台终端工具,支持多种协议连接、文件传输、多语言界面、命令补全、文件管理、分屏显示等功能,具有高性能、低延迟和低内存占用的特点。 | |
| MarkText | 一款高颜值的开源 Markdown 编辑器,界面简洁干净,提供实时预览、多种主题和编辑模式等功能,支持数学公式、表情符号、快捷键等,可导出 HTML 和 PDF 文件,适用于 Windows、macOS 和 Linux 系统。 | |
| RightMenu Master | 一款 Finder 右键菜单增强工具,内置多个实用预设
下载源码
通过命令行克隆项目: git clone https://github.com/GitHubDaily/GitHubDaily.git
常见问题
查看详情
相关文章
猜你喜欢
|
