GitHub Trending 日榜 Top 10 (2026/05/31)
每日精选 GitHub 最热门开源项目,按日 Star 增长量排序。
昨日回顾:GitHub Trending 日榜 Top 10 (2026/05/30)
🥇 1. microsoft/markitdown — 日增 ⭐2,759
- 语言:Python | 总 Star:134,153 | 协议:MIT
- 链接:github.com/microsoft/markitdown
微软出品的文件转 Markdown 工具,支持 PDF、Word、Excel、PowerPoint、HTML 等多种格式的一键转换。该项目填补了文档处理工作流中一个关键空白——将各类非结构化文档统一转换为 LLM 友好的 Markdown 格式。无论是 RAG 管线、知识库构建还是 AI Agent 的文档解析环节,markitdown 都能大幅简化数据预处理流程。凭借微软品牌的背书和出色的转换质量,它已经成为 AI 开发者工具链中的标配组件,日增近三千 Star 足以说明其刚需程度。
🥈 2. harry0703/MoneyPrinterTurbo — 日增 ⭐1,937
- 语言:Python | 总 Star:73,469 | 协议:MIT
- 链接:github.com/harry0703/MoneyPrinterTurbo
一款利用 AI 大语言模型一键生成高清短视频的开源工具。用户只需提供主题或文案,MoneyPrinterTurbo 即可自动完成素材检索、配音、字幕生成和视频剪辑的全流程。该项目深度集成了多种 LLM 和 TTS 服务,支持从脚本生成到最终渲染的端到端自动化,极大降低了短视频创作的门槛。尤其适合自媒体运营者和内容创作者快速批量生产内容。
🥉 3. D4Vinci/Scrapling — 日增 ⭐639
- 语言:Python | 总 Star:56,253 | 协议:BSD-3-Clause
- 链接:github.com/D4Vinci/Scrapling
一款自适应 Web 爬虫框架,能够智能处理从简单请求到大规模抓取的各种场景。Scrapling 的核心优势在于其自适应能力——自动处理反爬机制、智能选择器匹配和请求调度。项目集成了 Playwright 渲染引擎,支持 XPath 和 CSS 选择器,并提供 MCP Server 接口,方便 AI Agent 直接调用。对于数据工程师和 AI 应用开发者而言,这是一个值得收藏的爬虫利器。
4. OpenBMB/VoxCPM — 日增 ⭐639
- 语言:Python | 总 Star:23,225 | 协议:Apache-2.0
- 链接:github.com/OpenBMB/VoxCPM
OpenBMB 团队推出的多语言语音生成模型 VoxCPM2,采用无分词器(Tokenizer-Free)架构,支持高质量语音合成、创意声音设计和逼真语音克隆。该项目突破了传统 TTS 模型对音素分词器的依赖,直接在原始语音波形层面建模,实现跨语种的自然语音生成。对于语音交互应用、有声内容制作和多语言场景有极高实用价值。
5. FareedKhan-dev/train-llm-from-scratch — 日增 ⭐627
- 语言:Jupyter Notebook | 总 Star:2,686 | 协议:MIT
- 链接:github.com/FareedKhan-dev/train-llm-from-scratch
一个从零开始训练大语言模型的完整教程项目,涵盖数据下载、预处理、模型架构设计到文本生成的全过程。作者用直观的 Jupyter Notebook 形式,将 Transformer 训练的每个步骤拆解得清晰明了,非常适合想深入理解 LLM 底层原理的开发者学习。项目不依赖复杂框架,让读者真正理解每一行代码背后的原理。
6. nesquena/hermes-webui — 日增 ⭐320
- 语言:Python | 总 Star:9,695 | 协议:MIT
- 链接:github.com/nesquena/hermes-webui
Hermes Agent 的 Web 界面项目,提供浏览器和手机端的便捷访问方式。用户可以通过友好的图形界面与 Hermes Agent 交互,无需命令行操作。项目支持会话管理、多模型切换等功能,为 AI Agent 的日常使用提供了更亲民的入口,降低了非技术用户的使用门槛。
7. revfactory/harness — 日增 ⭐318
- 语言:HTML | 总 Star:4,481 | 协议:Apache-2.0
- 链接:github.com/revfactory/harness
一款元技能(Meta-Skill)框架,能够自动设计领域专用的 Agent 团队、定义专业化 Agent 角色并生成所需技能。Harness 的理念是“用 AI 设计 AI”——通过高层描述自动生成完整的 Agent 协作体系。适用于 Claude Code 等平台,为复杂工程任务的 Agent 编排提供了系统化解决方案。
8. EveryInc/compound-engineering-plugin — 日增 ⭐243
- 语言:TypeScript | 总 Star:18,594 | 协议:MIT
- 链接:github.com/EveryInc/compound-engineering-plugin
由 Every Inc 推出的复合工程插件,为 Claude Code、Codex、Cursor 等 AI 编程工具提供增强能力。该插件将软件工程最佳实践封装为可复用的技能模块,帮助 AI 编程助手在代码审查、架构设计和工程规范方面表现更加出色。作为跨平台兼容的工程增强工具,它体现了 AI 编程生态正在走向标准化和模块化。
9. supermemoryai/supermemory — 日增 ⭐236
- 语言:TypeScript | 总 Star:23,131 | 协议:MIT
- 链接:github.com/supermemoryai/supermemory
面向 AI 时代的记忆引擎与应用,提供极速、可扩展的 Memory API。supermemory 解决了 AI Agent 持久化记忆的核心问题——让 AI 能够跨会话、跨任务记住用户偏好和历史上下文。基于 Cloudflare Workers 和 Postgres 构建,兼顾性能和扩展性,是构建个性化 AI 应用不可或缺的基础设施组件。
10. github/docs — 日增 ⭐20
- 语言:TypeScript | 总 Star:19,629 | 协议:CC-BY-4.0
- 链接:github.com/github/docs
GitHub 官方文档站 docs.github.com 的开源仓库。作为 GitHub 最大的开源文档项目,它承载了平台所有功能的官方说明和教程。社区可以通过 PR 参与文档改进,体现了 GitHub 对开源协作文化的践行。
📊 趋势分析
Python 生态持续统治 AI 工具链。 今日 Top 10 中有 6 个 Python 项目,涵盖了文档处理、视频生成、爬虫、语音合成和 LLM 训练等核心场景。这印证了一个趋势:Python 已经不仅是“胶水语言”,而是 AI 应用的首选实现语言。开发者选择 Python 不仅因为其丰富的 ML 生态,更因为快速原型验证的需求——在 AI 应用迭代速度为王的时代,Python 的开发效率优势无可替代。
Agent 基础设施全面爆发。 harness(Agent 团队编排)、compound-engineering-plugin(工程增强)、hermes-webui(Agent 界面)、supermemory(Agent 记忆)四个项目共同指向同一个方向:AI Agent 正在从单次对话工具进化为具备持久记忆、专业技能和协作能力的自主系统。尤其值得注意的是 harness 的“元技能”理念——用 AI 自动生成 Agent 技能,这标志着 Agent 开发正在进入自我增强的飞轮阶段。开发者应当重点关注 Agent 编排和记忆系统这两个基础设施方向。
AI 内容生成走向平民化。 MoneyPrinterTurbo 日增近 2000 Star 反映出内容创作者对 AI 视频生成工具的巨大需求。与专业视频制作工具不同,这类项目追求的是“输入提示词即出片”的极简体验。结合 VoxCPM 的多语言语音合成能力,一个完整的 AI 内容生产流水线已经成型:文字生成、配音合成、视频剪辑均可由 AI 自动完成。对于开发者而言,围绕内容生成的垂直场景仍有大量创业和创新空间。
LLM 教育需求旺盛。 train-llm-from-scratch 以仅 2686 总 Star 的小项目获得日增 627 的亮眼表现,说明社区对 LLM 底层原理的学习热情持续高涨。随着模型训练成本降低和开源权重增多,越来越多的开发者不再满足于“调用 API”,而是希望深入理解 Transformer 架构和训练流程。这一趋势对教育内容和开源教程的创作者是一个积极信号。
跨平台 Agent 插件成为新范式。 compound-engineering-plugin 同时支持 Claude Code、Codex、Cursor 等多个平台,harness 也定位为跨 IDE 的元技能框架。这表明 AI 编程工具的插件生态正在走向标准化——开发者编写一次插件,即可在多个 AI 编程助手中使用。这种“写一次,到处运行”的模式将加速 AI 编程工具生态的成熟。