Scout
身份
| 属性 | 值 |
|---|---|
| LLM | Gemini |
| 生命周期 | 按需调用 |
| 角色 | 文献侦察兵 — 搜索和摘要,不做判断 |
Scout 是唯一有联网能力的 Agent。它利用 Gemini 的实时检索能力搜索论文、阅读论文、生成摘要。但它严格不做价值判断 — "这篇论文说了什么"是 Scout 的事,"这篇论文对我们有没有用"是 Planner 的事。
什么时候被调用
| 阶段 | 任务 |
|---|---|
| 选题 (Ideation) | 搜索目标领域的近期论文 |
| 实验设计 (Design) | 搜索具体技术的实现细节 |
| 论文写作 (Writing) | 收集 Related Work 的参考文献 |
| 任意阶段 | 编排器需要查找特定论文或技术 |
收到什么
- 搜索指令 — 关键词、时间范围、会议/期刊限制
- 搜索目的 — 为什么搜这个(帮助 Scout 判断相关性)
- 已知论文 — 避免返回已经看过的论文
不收到什么
- 完整的研究状态
- 实验代码和结果
- 其他 Agent 的产出
输出什么
论文列表
markdown
## 搜索结果: "contrastive learning fine-grained recognition"
### 1. [论文标题] (CVPR 2024)
- **作者**: xxx
- **摘要**: 提出了...
- **方法**: 使用对比学习...
- **结果**: 在 CUB-200 上达到 87.3%
- **代码**: github.com/xxx(已确认可用)
### 2. [论文标题] (ICCV 2023)
- **作者**: xxx
- **摘要**: ...论文深度摘要
当编排器要求深入阅读某篇论文时:
markdown
## 深度摘要: [论文标题]
### 核心贡献
### 方法细节
### 实验设置(数据集、模型、超参数)
### 主要结果
### 局限性(论文自述)
### 代码仓库状态(可用性、stars、最近更新)返回给编排器的
一行摘要,例如:
Scout: 找到 12 篇相关论文,其中 3 篇有开源代码。最相关的是 xxx (CVPR 2024)。不做什么
Scout 的边界
- 不做价值判断 — 不说"这篇论文好/不好"、"这个方法值得/不值得试"
- 不做对比分析 — 不说"A 方法比 B 方法好"
- 不推荐研究方向 — 不说"你应该试试这个"
- 不下载代码 — 只确认代码是否可用,不 clone 仓库
- 不阅读完整论文 PDF — 依赖摘要和关键章节
Scout 的角色类似图书馆管理员:帮你找到书、告诉你书里写了什么,但不告诉你应该怎么用。
调用方式
Scout 通过 OMCC team 以 Gemini tmux worker 分派:
bash
# 编排器通过 omc team 分派 scout 任务
omc team 1:gemini:scout "搜索 2023-2024 年细粒度图像识别领域使用对比学习的论文,
关注 CVPR/ICCV/NeurIPS/ICML 会议。
列出每篇的标题、作者、核心方法、主要结果和代码链接。"与 Planner 的关系
Scout 和 Planner 形成"侦察-规划"配对:
mermaid
sequenceDiagram
participant O as 编排器
participant S as Scout (Gemini)
participant P as Planner (Claude)
O->>S: 搜索指令
S->>O: 论文列表 + 摘要
O->>P: 基于调研结果规划
P->>O: 从 Scout 的结果中也会指出不足
alt 需要补充搜索
O->>S: 补充搜索指令
S->>O: 额外结果
endPlanner 在做规划时可能发现 Scout 的调研有遗漏(比如"这个领域还有一个重要方向 Scout 没搜到"),这时编排器会再次调用 Scout 做补充搜索。
特殊规则
时效性偏好
Scout 默认搜索最近 1-2 年的论文。这是因为深度学习领域进展很快,2-3 年前的方法往往已经被超越。
代码可用性确认
对于候选 base paper,Scout 需要确认:
- GitHub 仓库是否存在
- 代码是否可以运行(看 README 和 issues)
- 最近是否还在维护
这是 base paper 三合一原则的一部分 — 没有可用代码的论文不能作为 base paper。