浏览器批注 & 截图标注 → AI 工具全景调研

2026-06-29 3 子 Agent 并行交叉验证 · GitHub · Reddit · MCP 生态 · Chrome Store

本报告调研了 2026 年 6 月所有可用于「浏览器批注网页 / 屏幕截图标注 → 发送给 AI Agent 分析」的工具。采用 3 个子 Agent 并行交叉验证,覆盖 GitHub、Reddit (r/ClaudeAI, r/AI_Agents, r/SideProject, r/webdev)、Chrome Web Store、Glama MCP 目录、Smithery、YouTube、ProductHunt 等渠道。

35+ 候选工具 3 大类 8 MCP Server 3 Hermes 路径

项目概述

用户需求:在浏览器中浏览网页时批注(高亮/笔记/箭头/框选),然后将批注连同上下文发送给 AI 进行分析。这是一个三环节工作流:

flowchart LR
    A[浏览网页] --> B{批注类型}
    B -->|网页元素| C[onUI / Draw2Agent / Hypothesis]
    B -->|截图标注| D[AgileShot / Snapmark / ShareX]
    C --> E[结构化导出]
    D --> E
    E --> F{对接方式}
    F -->|MCP 协议| G[Hermes / Claude Code]
    F -->|剪贴板| H[粘贴到 AI 聊天]
    F -->|REST API| I[脚本管道发送]

核心发现:onUI + Draw2Agent 是仅有的两个从浏览器内直接 MCP 桥接 AI Agent 的方案。Vibe Annotations (6K+ 用户) 是用户量最大的同类型工具。赛道仍处于早期,但 MCP 标准化正在加速。

* * *

一、浏览器批注类工具 (14个)

在浏览器内直接标注网页元素/文字,然后导出给 AI Agent。

onUI — MCP 桥接标杆

约 80 Stars[1] GPL-3.0 License v2.2.3 Latest Chrome+Edge+Firefox Platform

轻量级浏览器扩展 + 本地 MCP 桥接。专为 AI Agent 设计,是唯一真正打通「浏览器标注→MCP→AI 自动读取」全链路的工具。[2]

Draw2Agent — 手绘标注最直观

MIT License npm: draw2agent Package

MCP server 代理 localhost 页面,注入 Excalidraw 绘图层。用户可像在白板上一样画圈/箭头/文字标注页面。提交后自动将截图 + DOM 数据 + 标注打包发给 AI Agent。[3]支持 iPad 扫码画图、Scratch 白板模式。安装:npx -y draw2agent@latest

Hypothesis — 文本批注标杆

约 3,155 Stars (h)[4] BSD-2 License 18,891 Commits

网页批注领域最成熟的开源项目。W3C Web Annotation 标准,完整 REST API,hypothesisapi Python 库可直接调用。[5]通过 API 拉取批注 JSON → 格式化为 Markdown → 发送给 Hermes/Claude。

局限:文本级批注(高亮+笔记),不支持截图标注。无原生 MCP bridge,需自建桥接层。

AgentEcho — 极简 DOM 标注

Chrome 扩展:悬停高亮 DOM 元素→点击放置编号标记→填写反馈→一键复制为 AI-optimized Markdown。[6]只做「标注→Markdown→粘贴给 AI」一件事。

Glasp — AI 克隆 + 社交高亮

网页/PDF/YouTube 高亮批注 + 个人 AI 克隆(基于你的批注学习)。Obsidian 官方插件、GitHub Actions 自动导出、公开 highlights API。唯一提供「AI 用你批注的方式思考」的工具。[7]

浏览器批注工具汇总

工具类型标注方式AI 对接许可证
onUI约 80扩展+MCP元素标注+画框✅ MCP 原生GPL-3.0
Draw2AgentMCP ServerExcalidraw 手绘✅ MCP 原生MIT
Vibe Annotations6K+用户扩展+MCP元素标注+截图✅ MCP (SSE)PolyForm
Hypothesis约 3,155扩展+后端高亮+笔记⚠️ REST APIBSD-2
AgentEchoChrome 扩展DOM 编号标注⚠️ MarkdownPolyForm
Glasp商业扩展+云高亮+AI摘要✅ API+克隆专有
WorldBrain Memex约 4,700扩展高亮+笔记+搜索⚠️ 导出后使用MIT
Readwise商业聚合平台多源高亮聚合✅ API+MCP专有
Corpus ScribeMCP+桌面捕获+LLM笔记✅ MCP (13工具)开源
LLMFeeder扩展网页→Markdown✅ 剪贴板MIT
* * *

二、截图标注类工具 (13个)

先截图,再标注(箭头/框/文字/打码),最后发送给 AI。

AgileShot — AI 原生 + MCP

内置 AI 对话+OCR,MCP Server 提供 25 个工具让 AI 直接控制截图和桌面操作。[8]AI 可主动截图→标注→分析,无需人工介入。基础免费,闭源。

Snapmark — VS Code 内最实用

VS Code 扩展,截图→标注(笔/箭头/矩形/椭圆/文字/高亮/打码/编号)→一键复制→粘贴到任意 AI 聊天[9]通用性最强,不挑 AI 工具。

ShareX / Flameshot — 开源经典

工具平台AI 对接方式
ShareX约 30,000Windows自定义上传器→任何 API;80+ 上传目标
Flameshot约 25,000Win/Mac/LinuxCtrl+C 剪贴板→粘贴给 AI;CLI 管道
macshot约 3,000macOS (Swift)剪贴板;19+ 标注工具;OCR+翻译
eSearch约 6,400全平台内置 OCR (PaddleOCR);以图搜图;API 翻译
Ksnip约 2,500全平台剪贴板;OCR 插件;自定义脚本→API

AI 原生分析类

工具特色AI 对接
Snippai约 500截图自动识别公式→LaTeX、表格→CSV、代码解释内置 AI
Clearshot约 500Claude Code Skill:截图→CSS/颜色分析→结构化 PromptSkill 调用
MCP Screenshot Server约 100Python MCP:截图+标注(框/箭头/圆/文字/打码)✅ MCP
Instruckt约 60框架集成:Vue/React/Laravel 内标注→MCP→AI✅ MCP
* * *

三、MCP 生态 (8+ Server)

MCP 生态中与「截图/批注→AI」直接相关的 Server 正在快速增长。

Vibe Annotations (6K+ 用户)

Chrome 扩展标注 localhost 页面元素→MCP server (vibe-annotations-server, SSE port 3846)→AI agent 自动实现修复。支持 Claude Code / Cursor / Windsurf / Codex / OpenClaw。[10]

MarkUp — 纯 Chrome 扩展方案

7 种标注工具(编号/铅笔/箭头/矩形/圆形/文字/高亮)→导出 PNG + Markdown changelog(含 CSS selector)→粘贴给 AI。无后端、无账户、无遥测。[11]

MCP Server 完整汇总

Server方式核心能力兼容 Agent
onui-local扩展+本地 bridge元素标注+画框→6 MCP 工具Claude Code / Codex / Cursor / Hermes
draw2agentExcalidraw 覆盖层手绘标注→截图+DOM+MCPClaude Code / Cursor
vibe-annotations-serverSSE (port 3846)元素标注+截图→AI 修复Claude Code / Cursor / Windsurf / Codex
mcp-screenshot-serverPython MCP截图+标注(箭/框/圆/文字/打码)Claude Desktop / Cursor
ui-annotator反向代理Hover 标注(零扩展),MCP 查询Claude / Cursor
AgileShot MCP桌面+MCP25 工具:截图+AI对话+OCR+桌面操控任意 MCP 客户端
Playwright MCPPlaywright浏览器自动化+截图+JS执行Claude / Cursor / VS Code
Chrome DevTools MCP31k⭐DOM snapshot+截图+性能,无视觉标注Claude / Cursor
* * *

四、横向对比

工具浏览器批注截图标注AI 对接Hermes开箱用
onUI✅ 元素+画框MCP 原生约 80
Draw2Agent✅ Excalidraw✅ 截图内含MCP 原生
Vibe Annotations✅ 元素标注✅ 自动截图MCP (SSE)6K+
MarkUp✅ 7种工具✅ 截图+MD剪贴板⚠️686
Hypothesis✅ 高亮+笔记REST API⚠️约 3k
AgentEcho✅ DOM编号Markdown⚠️
Snapmark✅ 8+工具剪贴板⚠️-
ShareX✅ 全功能自定义API⚠️30k
MCP Screenshot✅ 标注+截图MCP 原生约 100
Instruckt⚠️ 需集成✅ 元素+截图MCP+MD⚠️60
* * *

五、Hermes 集成路径

Hermes Agent 有 3 条可行路径:

路径 1:onUI MCP(推荐)

  1. Chrome Web Store 安装 onUI 扩展
  2. 安装时启用 MCP bridge(onui-local
  3. Hermes 配置:hermes mcp add onui-local
  4. 浏览网页→标注→Hermes 通过 MCP 自动读取批注
优势:零手动操作,标注完成后 Agent 自动获取结构化上下文。全本地运行,无隐私风险。

路径 2:Draw2Agent MCP

  1. npx -y draw2agent@latest 启动
  2. 在 Excalidraw 层上手绘标注
  3. MCP 自动打包截图+DOM+标注发给 Hermes

路径 3:Hypothesis + 自定义 Skill

  1. 安装 Hypothesis 扩展
  2. Python 脚本通过 hypothesisapi 拉取批注
  3. 封装为 Hermes skill,定期拉取→分析
劣势:需额外开发桥接脚本,不支持截图标注。
* * *

六、推荐方案

首选:onUI + Hermes MCP

  • 唯一浏览器批注+MCP直连方案
  • 双模式(元素+区域)标注
  • 全本地零隐私风险
  • Chrome Web Store 一键装
  • 4 种导出格式适配不同场景

备选:Draw2Agent + Hermes MCP

  • Excalidraw 手绘最直观
  • 自动打包截图+DOM+标注
  • MIT 许可证
  • iPad 扫码画图支持
  • 一键 npx 启动
场景推荐理由
浏览器批注→AI 自动分析onUI / Draw2AgentMCP 直连,零手动
文本高亮+学术研究Hypothesis最成熟文本批注,W3C 标准
截图精细标注→粘贴AISnapmark / ShareX标注工具丰富,通用粘贴
开发中App视觉反馈Instruckt / Vibe框架集成,MCP 支持
AI主动截图分析AgileShot / MCP ScreenshotAI 可主动调用截图
简单网页→AI 上下文LLMFeeder / MarkDownload一键 Markdown,粘贴即用
全平台高亮聚合→AIReadwise / Glasp聚合+API,生态丰富

「浏览器批注→AI」赛道处于早期但增长迅速。MCP 标准化之后,2026 下半年预计会有更多工具涌现。onUI 和 Draw2Agent 是当前最精准匹配你需求的两个选择。

参考资料

  1. GitHub — onllm-dev/onUI — https://github.com/onllm-dev/onUI (获取于 2026-06-29)
  2. onUI 官方 — https://onui.onllm.dev
  3. GitHub — zero-abd/draw2agent — https://github.com/zero-abd/draw2agent
  4. GitHub — hypothesis/h — https://github.com/hypothesis/h
  5. Hypothesis Export — https://web.hypothes.is/help/...
  6. GitHub — areshkew/agentecho — https://github.com/areshkew/agentecho
  7. GitHub — glasp-co — https://github.com/glasp-co
  8. AgileShot — https://agileshot.com
  9. Snapmark VS Code — VS Code Marketplace
  10. GitHub — RaphaelRegnier/vibe-annotations — https://github.com/RaphaelRegnier/vibe-annotations
  11. MarkUp — Chrome Web Store
  12. GitHub — WorldBrain/Memex — https://github.com/WorldBrain/Memex
  13. GitHub — gradusnikov/corpus-scribe — https://github.com/gradusnikov/corpus-scribe
  14. GitHub — alienzhou/web-highlighter — https://github.com/alienzhou/web-highlighter
  15. GitHub — aamar-shahzad/mcp-screenshot-server — https://github.com/aamar-shahzad/mcp-screenshot-server
  16. GitHub — mcpware/ui-annotator-mcp — https://github.com/mcpware/ui-annotator-mcp
  17. GitHub — ShareX/ShareX — https://github.com/ShareX/ShareX
  18. GitHub — flameshot-org/flameshot — https://github.com/flameshot-org/flameshot
  19. GitHub — wiebekaai/browser-annotations — https://github.com/wiebekaai/browser-annotations
  20. Glama MCP Directory — https://glama.ai/mcp/servers
  21. Hermes MCP Integration — Hermes Agent Docs
  22. Reddit r/AI_Agents — onUI discussion
  23. Reddit r/webdev — annotate any UI