参考
模型
支持的模型,以及如何按任务选模型。
ToShop 让你按 Agent 选不同的模型 —— 模型按 Agent 干的活儿匹配。
不加成、不代理
ToShop 不在模型上加成、不代理你的调用。调用从你机器经 TLS 直发到供应商官方 API。
供应商
模型: Claude Opus、Sonnet、Haiku。
长项: 深度推理、长上下文(Sonnet 有 1M 变体)、代码工作扎实。
上下文窗口:
- Claude Opus —— 200K Token。
- Claude Sonnet —— 200K(标准)/ 1M(长变体)。
- Claude Haiku —— 200K Token。
模型: GPT-5 系列、o3、GPT-5 Codex。
长项: 通用强、迭代快、函数调用稳。
上下文窗口:
- GPT-5 —— 200K(标准)/ 400K(长变体)。
- GPT-5 Codex —— 代码调优,200K。
- o3 —— 推理调优,200K。
模型: Gemini Pro 系列。
长项: 超长上下文、多模态。
上下文窗口: 1M+ Token —— 主流供应商里最大。
是什么: Meta-router,一个 API Key 接多家主流模型。
长项: 跨供应商统一计费、方便尝试多个模型。
计价: 按模型透传,OpenRouter 加一点点 Markup。详情见 openrouter.ai。
怎么选模型
"对的模型"取决于工作,不是最新榜单。
| 场景 | 选什么 |
|---|---|
| 深度推理、新问题 | Claude Opus / GPT-5。 |
| 日常 Agent 循环,性价比平衡 | Claude Sonnet / GPT-5-mini。 |
| 分流、分类、短任务 | Haiku / Mini 档。 |
| 代码密集 | GPT-5 Codex、Claude Opus。 |
| 长上下文(大文档、大仓库) | Claude Sonnet(1M 上下文)、Gemini Pro。 |
每个 Agent 一个模型
在 设置 → Agents → [Agent] → 模型 里设。每个 Agent 有自己的默认模型。组织建议见多 Agent。
按任务或消息覆盖
用不同 Agent 开新会话。
发送时按住 ⌥⏎(Option+Enter)调出模型选择器。
Agent 给子步骤挑合适的模型(例如琐碎分类用快模型,回到主模型)。要钉住模型可在 设置 → Agent → 自动模型切换 关掉。
费用
ToShop 每个任务后给出 Token 估算和预估费用。权威账单在供应商 Dashboard。
任务意外烧钱的话,Prompt 编写 里讲了如何收窄上下文。
ToShop文档