这是一篇面向技术读者的 AI 工具入门指南,帮助你建立对 AI 工具生态的系统认知。
目录
第一章:什么是 AI?
1.1 AI 的日常生活例子
AI(人工智能) 这个词听起来很高大上,但其实我们每天都在用:
| 场景 | AI 应用 |
|---|---|
| 和 Siri 对话 | 语音助手 AI |
| 淘宝客服机器人 | 智能客服 AI |
| 抖音推荐视频 | 推荐算法 AI |
| 拍照自动识别人脸 | 计算机视觉 AI |
💡 简单理解:AI 就是让计算机能够”像人一样思考和做事”的技术。
1.2 我们说的”AI”到底指什么?
平时聊天时说”我在用 AI”,大多数情况下指的是 LLM(大语言模型)——一种能理解和生成文字的 AI 系统。
最常见的 LLM 产品:
| 产品名 | 开发公司 | 特点 |
|---|---|---|
| ChatGPT | OpenAI | 最早流行,功能全面 |
| Claude | Anthropic | 擅长写作、代码分析 |
| Gemini | 集成 Google 全家桶 | |
| DeepSeek | 深度求索 | 国产开源,性能强劲 |
第二章:LLM 与大语言模型
2.1 什么是 LLM?
LLM = Large Language Model(大语言模型)
你可以把 LLM 想象成一个”读遍了整个互联网所有文字”的超级大脑。它见过的文字越多,理解能力和生成能力就越强。
2.2 模型 vs 产品:为什么总是分不清?
| 层面 | 说明 | 例子 |
|---|---|---|
| 模型(Model) | 底层技术本身 | GPT-5.4、Claude 4.6、Gemini 3.1 |
| 产品(Product) | 面向用户的应用 | ChatGPT、Claude App、Gemini App |
💡 类比:模型是”发动机”,产品是”整车”。你可以用同款发动机造出不同的车。
2.3 主流 LLM 模型(2026年3月最新)
| 模型 | 发布时间 | 擅长领域 | 上下文长度 | 费用 |
|---|---|---|---|---|
| GPT-5.4 | 2026年3月5日 | 全能型,编程能力强 | 1M tokens | 付费订阅 |
| GPT-5.4 Pro | 2026年3月5日 | 复杂任务 | 1M tokens | 付费订阅 |
| Claude 4.6 Sonnet | 2026年2月17日 | 日常使用、性价比 | 200K tokens | 付费订阅 |
| Claude 4.6 Opus | 2026年2月5日 | 复杂推理、超长任务 | 200K tokens | 付费订阅 |
| Gemini 3.1 Pro | 2026年2月19日 | 长文本、多模态 | 1M tokens | 部分免费 |
| Gemini 3.1 Flash-Lite | 2026年3月4日 | 快速响应 | 1M tokens | 极便宜 |
| DeepSeek V3 | 2026年1月 | 推理、代码、中文 | 128K tokens | 开源免费 |
⚠️ 版本注意:AI 模型迭代很快,GPT-4o、Claude 3.5 这些已经是”旧版本”了。实际使用中请以各厂商官网最新信息为准。
第三章:API 是什么?
3.1 用餐厅理解 API
想象你去餐厅吃饭:
- 你(客户端)想吃东西
- 你跟服务员说要点什么
- 服务员去厨房(后台系统)告诉厨师
- 厨师做好菜,服务员端回来给你
API(Application Programming Interface) 就是这个”服务员”——它是客户端和后台系统之间的传话人。
3.2 为什么 AI 需要 API?
直接用网页版的 AI vs 通过 API 调用:
| 对比项 | 网页版 | API 调用 |
|---|---|---|
| 操作方式 | 手动点击 | 程序自动 |
| 批量处理 | ❌ | ✅ |
| 集成到自己的应用 | ❌ | ✅ |
| 稳定性 | 一般 | 高 |
| 费用 | 订阅制 | 按量计费 |
3.3 API Key 是什么?
API Key = 身份证号
每个想用 AI API 的人都必须先申请一个 API Key,相当于在系统里注册你的身份。这样系统才知道是谁在使用、该收谁的钱。
⚠️ 安全提醒:API Key 等同于你的账号密码,不要泄露给他人!
API Key 安全最佳实践
| 做法 | 说明 |
|---|---|
| ❌ 禁止硬编码 | 不要把 API Key 直接写在代码里,否则提交到 Git 后全网可见 |
| ✅ 环境变量 | 将 Key 存储在环境变量中,代码运行时读取 |
| ✅ 配置文件 | 单独的配置文件中管理,并加入 .gitignore |
| ✅ 密钥轮换 | 定期更换 API Key,减少泄露风险 |
| ✅ 最小权限 | 只给需要的应用授权,不要一个 Key 通用 |
💡 实操建议:在 Cherry Studio、Cursor 等工具中配置 API Key 时,直接粘贴即可(工具会自动加密存储),但在自己开发的应用中务必使用环境变量方式。
第四章:AI 工具的两大类别
AI 工具可以分成两大类别:
| 类别 | 特点 | 本质 |
|---|---|---|
| 模型聚合类 | 帮你切换不同模型 | 你指挥,AI 回答 |
| Agent 类 | 能自主完成任务 | 你说目标,AI 自己动手 |
模型聚合类(Poe、Cherry Studio):
- 主要功能是让你切换不同 AI 模型对话
- 你问一句,它答一句,不会自己执行操作
Agent 类(Cursor、Manus、Claude Code):
- 可以自主规划、执行任务
- 不仅是问答,而是帮你完成任务
第五章:模型聚合类工具
模型聚合类工具的核心价值是:让你不用在多个平台之间切换,一个界面用多个 AI 模型。
5.1 Poe —— 老牌模型聚合平台
| 项目 | 说明 |
|---|---|
| 是什么 | Quora 开发的 AI 聚合平台 |
| 支持模型 | GPT-5、Claude 4、Gemini、Llama 等 100+ 模型 |
| 平台 | Web / iOS / Android |
| 定价 | 免费 / 付费 $19.99/月 |
核心特点
| 特点 | 说明 |
|---|---|
| 模型全面 | 聚合了主流模型,可快速切换 |
| 机器人创建 | 可创建自定义 Bot |
| 多端同步 | 手机、电脑数据同步 |
| 收藏夹 | 保存喜欢的 Bot |
💡 适合场景:想要在一个地方用遍主流 AI 模型,不想注册多个账号。
5.2 Cherry Studio —— 国产多模型客户端
| 项目 | 说明 |
|---|---|
| 是什么 | 国产开源的多模型桌面客户端 |
| 支持模型 | OpenAI、Claude、Gemini、DeepSeek 等 100+ 模型 |
| 平台 | Windows / Mac / Linux |
| 定价 | 免费开源 |
| 下载地址 | cherry-ai.com |
核心特点
| 特点 | 说明 |
|---|---|
| 开源免费 | 完全免费,无使用限制 |
| 内置助手 | 30+ 行业智能助手 |
| 知识库 | 支持本地知识库搭建 |
| 多 API 支持 | 可对接 OpenAI、Claude、DeepSeek 等 |
| 联网搜索 | 支持实时联网功能 |
支持的模型类型
| 类型 | 代表模型 |
|---|---|
| OpenAI 系列 | GPT-5.4、GPT-4o |
| Anthropic 系列 | Claude 4.6、Claude 3.5 |
| Google 系列 | Gemini 3.1 Pro |
| 国产模型 | DeepSeek V3、通义千问、文心一言 |
| 本地模型 | 通过 Ollama 支持本地部署 |
💡 适合场景:国内用户,想要免费、多模型、支持自定义 API。
Cherry Studio 快速配置(以硅基流动为例)
Step 1:获取 API Key
- 注册硅基流动账号:
cloud.siliconflow.cn(点击注册时填入邀请码可额外获赠额度) - 完成实名认证(必需)
- 在「API 密钥」页面新建密钥,复制生成的 Key
Step 2:配置 Cherry Studio
- 打开 Cherry Studio,点击左下角「设置」
- 进入「模型服务」,选择「硅基流动」
- 粘贴 API 密钥,点击「检查」验证连接
- 连接成功后在聊天界面选择模型即可使用
Step 3:搭建知识库(可选)
- 点击左侧「知识库」按钮,新建知识库
- 选择嵌入模型(如
BAAI/bge-m3) - 添加文件/网址/目录等数据源
- 在聊天界面选择知识库后即可基于知识库问答
💡 提示:国内还推荐使用「硅基流动」和「火山引擎」,配置方式类似,注册后获取 Key 填入即可。
5.3 其他聚合类工具
| 工具 | 特点 |
|---|---|
| ChatHub | 浏览器插件形式,支持多模型对比 |
| monica | 浏览器插件,侧重辅助写作 |
| Sider | 浏览器插件,多模型切换 |
5.4 模型聚合类工具对比
| 工具 | 平台 | 模型数量 | 免费 | 特色 |
|---|---|---|---|---|
| Poe | Web/App | 100+ | ✅ | 机器人创建 |
| Cherry Studio | 桌面端 | 100+ | ✅ | 知识库、国产友好 |
| ChatHub | 浏览器插件 | 多个 | ✅ | 多模型对比 |
⚠️ 时效性提醒:模型聚合平台支持的模型列表、定价、功能都在快速迭代。建议以各平台官网最新公告为准。
第六章:Agent 智能体
6.1 什么是 Agent?
Agent(智能体) 是能够自主完成多步骤任务的 AI 系统。
普通 AI 对话 vs Agent:
| 对比项 | 普通 AI 对话 | Agent 智能体 |
|---|---|---|
| 交互方式 | 你问一句,它答一句 | 你说目标,它自主完成 |
| 任务分解 | 你自己拆解 | AI 自动拆解 |
| 执行步骤 | 一次性完成 | 分步骤执行,可反馈调整 |
| 工具使用 | ❌ | ✅(可调用搜索、代码等工具) |
6.2 Agent 类工具分类
Agent 类工具可以按使用方式分成三类:
| 分类 | 特点 | 代表工具 |
|---|---|---|
| 现成 Agent 工具 | 下载安装就能用 | Cursor、Windsurf、Claude Code、Codex CLI、Copilot |
| Bot 构建平台 | 在上面创建自己的 Bot | Coze、Dify |
| 通用 Agent 产品 | 直接帮你完成任务 | Manus、Genspark |
⚠️ 时效性提醒:Agent 工具的功能、定价、模型支持变化很快,强烈建议查看各工具官网获取最新信息。
6.3 现成 Agent 工具
这类工具下载安装就能用,帮你完成特定任务,通常是编程或任务执行类工具。
Cursor —— 当前最火的 AI IDE
| 项目 | 说明 |
|---|---|
| 是什么 | 专为 AI 辅助编程打造的 IDE |
| 底层 | 基于 VS Code 修改 |
| 支持模型 | GPT-5.4、Claude 4、Gemini、自定义 API |
| 定价 | Free / Pro $20/月(内置 API 额度)/ 也可接自定义 API |
| 下载地址 | cursor.sh |
Windsurf —— OpenAI 收购的 AI IDE
| 项目 | 说明 |
|---|---|
| 是什么 | Codeium 出品的 AI IDE |
| 母公司 | 已被 OpenAI 收购(2025年5月) |
| 支持模型 | GPT-4o、Claude 3.5、Codeium 自研模型 |
| 定价 | Free / Pro 付费 |
| 特色 | Wave 13 + SWE-1.5 模型 |
Claude Code —— Anthropic 官方 CLI 工具
| 项目 | 说明 |
|---|---|
| 是什么 | Claude 的命令行 Agent 工具 |
| 开发公司 | Anthropic |
| 支持模型 | Claude 4.6 系列(需要自己提供 API) |
| 定价 | 免费,需自备 Anthropic API 或第三方 API |
OpenAI Codex CLI —— 命令行编程智能体
| 项目 | 说明 |
|---|---|
| 是什么 | OpenAI 开源的命令行 Agent |
| 支持模型 | GPT-5.4、o3、o4-mini(需要自己提供 API) |
| 定价 | 免费开源,需自备 OpenAI API 或第三方 API |
| 特色 | MCP 协议支持,工具链集成 |
GitHub Copilot —— 老牌 AI 编程助手
| 项目 | 说明 |
|---|---|
| 是什么 | 深度集成在 VS Code 等 IDE 中的 AI 助手 |
| 开发公司 | Microsoft + OpenAI |
| 支持模型 | GPT-4(微软调优) |
| 定价 | $10/月(包月制,内置额度,不用另买 API) |
Trae —— 字节跳动国产 AI IDE
| 项目 | 说明 |
|---|---|
| 是什么 | 字节跳动推出的国产 AI 原生 IDE |
| 开发公司 | 字节跳动 |
| 支持模型 | Claude 3.5、GPT-4o(国内版:豆包、DeepSeek) |
| 定价 | 基础版永久免费,内置模型可用 |
| 特色 | 原生中文支持,SOLO 模式(AI 主导开发),国内无需 VPN |
| 下载地址 | trae.com.cn(国内版)/ trae.ai(国际版) |
💡 适合场景:国内开发者首选,完全免费,支持中文问答和代码注释。 ⚠️ 注意:Trae 与 Cursor/Windsurf 定位相似但各有优势。Trae 国内版可直接使用,其他两者需 VPN。
Cursor 快速配置
Step 1:下载安装
- 访问
cursor.sh,下载对应系统的安装包 - 安装后首次启动,选择主题和快捷键方案
Step 2:配置自定义 API(可选)
- 点击左下角「Settings」→「Models」
- 在「OpenAI API Key」处填入你的 API Key
- 如使用第三方中转 API,同时配置 API Host 地址
- 点击「Verify」验证连接
Step 3:基础使用
Ctrl/Cmd + L:打开 AI 对话Ctrl/Cmd + I:打开 Composer(代码生成)Tab:接受 AI 代码补全建议
6.4 Bot 构建平台
这类平台让你自己搭建 Agent,可以定制行为、发布给别人用。
Coze —— 字节跳动的智能体平台
Coze 快速搭建 Bot
Step 1:创建 Bot
- 登录
coze.cn,点击「创建 Bot」 - 填写 Bot 名称和功能介绍
- 上传或让 AI 生成图标
Step 2:配置 Bot
- 选择大语言模型(如豆包、通义千问、DeepSeek 等)
- 编写「人设与回复逻辑」(即 Prompt)
- 可添加插件,知识库、数据库等扩展能力
Step 3:调试与发布
- 在右侧「预览与调试」区测试回复效果
- 设置开场白和预置问题
- 点击「发布」,选择发布平台(豆包、飞书等)
Dify —— 开源 Agent 平台
| 项目 | 说明 |
|---|---|
| 是什么 | 开源的 LLM 应用开发平台 |
| 特点 | 可自部署,完全可控 |
| 难度 | 需要技术背景 |
| 费用 | 开源免费,但需要自己部署和运维 |
6.5 通用 Agent 产品
这类是直接帮你完成任务的产品,你只需要说目标,它自己完成。
Manus —— 全球首款通用 Agent
| 项目 | 说明 |
|---|---|
| 是什么 | 通用型 Agent 产品 |
| 开发公司 | Monica(已于2025年12月加入 Meta) |
| 特点 | 能自主完成各类复杂任务 |
| 定价 | 邀请制,付费 |
💡 能做什么:筛选简历、分析股票、生成 PPT 等,直接帮你完成任务。
Genspark —— AI 搜索 + Agent
| 项目 | 说明 |
|---|---|
| 是什么 | AI 搜索 + Agent 平台 |
| 开发公司 | MainFunc(前百度高管创立) |
| 主要功能 | AI Search、AI Agent |
| 定价 | 注册送 10000 金币,月送约 150 金币 |
6.6 Agent 横向对比
| 工具 | 分类 | 费用 | 国内可用 |
|---|---|---|---|
| Cursor | 现成工具 | Free / $20/月(内置额度) | 需 VPN |
| Windsurf | 现成工具 | Free / 付费 | 需 VPN |
| Claude Code | 现成工具 | 需自备 API | 需 VPN |
| Codex CLI | 现成工具 | 免费(需自备 API) | 需 VPN |
| Copilot | 现成工具 | $10/月包月 | 需 VPN |
| Trae | 现成工具 | 免费 | ✅(国内版) |
| Coze | Bot 构建平台 | 免费(有内置 Bot) | ✅(coze.cn) |
| Dify | Bot 构建平台 | 开源免费 | 自部署 |
| Manus | 通用 Agent | 付费 | 需 VPN |
| Genspark | 通用 Agent | 免费金币 | 需 VPN |
6.7 Agent 的核心能力
一个真正的 Agent 通常具备:
| 能力 | 说明 |
|---|---|
| 任务分解 | 把大目标拆成小步骤 |
| 工具调用 | 使用搜索、代码执行等工具 |
| 自我反思 | 检查结果是否正确 |
| 记忆保持 | 记住之前的操作上下文 |
| 多轮迭代 | 尝试、失败、再尝试 |
第七章:常见问题 FAQ
Q8:常见问题与故障排查
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
| API 连接失败 | API Key 错误或过期 | 检查 Key 是否正确,尝试重新生成 |
| 显示”配额不足” | 免费额度用完或达到限制 | 充值或等待下月额度重置 |
| 网络连接超时 | 网络不稳定或被拦截 | 检查网络,换用国内平台 API |
| 模型响应很慢 | 服务器负载高或网络问题 | 错峰使用,或换用其他模型 |
| Cherry Studio 连接失败 | API 地址填写错误 | 确认平台地址,如硅基流动为 api.siliconflow.cn |
| Cursor 无法验证 API | 中转 API 地址或格式不对 | 确认 API Host 地址格式是否正确 |
⚠️ 遇到问题先检查:API Key 是否正确 → 网络是否稳定 → 平台是否正常运营 → 配额是否充足
Q1:模型聚合类和 Agent 类有什么区别?
| 对比 | 模型聚合类 | Agent 类 |
|---|---|---|
| 本质 | 切换模型对话 | 自主完成任务 |
| 交互 | 你问,AI 答 | 你说目标,AI 自己动手 |
| 工具 | Poe、Cherry Studio | Cursor、Manus |
Q2:现成 Agent 工具选哪个?
| 选择 | 场景 |
|---|---|
| Cursor | 想要完整 AI 开发体验,支持多模型 |
| Windsurf | 想要类似 Cursor 的替代方案 |
| Trae | 国内用户,想要原生中文支持,完全免费 |
| Claude Code | 喜欢用终端,CLI 操作 |
| Copilot | 已经在用 VS Code,不想换工具 |
| Codex CLI | 想要免费开源方案 |
Q3:Manus 和 Genspark 是什么?
| 工具 | 是什么 | 能做什么 |
|---|---|---|
| Manus | 通用 Agent | 直接帮你完成任务,如筛选简历、分析股票 |
| Genspark | AI 搜索 + Agent | 专注信息研究和搜索 |
Q4:Coze 和 Dify 有什么区别?
| 对比 | Coze | Dify |
|---|---|---|
| 部署 | 云端 | 可自部署 |
| 难度 | 低,可视化 | 高,需技术背景 |
| 国内可用 | ✅(coze.cn) | 需要自己部署 |
Q5:这些工具的费用是多少?
| 工具 | 费用 |
|---|---|
| Poe | 免费 / $19.99/月 |
| Cherry Studio | 免费 |
| Cursor | Free / $20/月 |
| Windsurf | Free / 付费 |
| Trae | 免费 |
| Claude Code | API 费用 |
| Copilot | $10/月 |
| Genspark | 免费金币 |
Q6:API Key 怎么获取?
| 类型 | 平台 | 地址 | 国内可用 |
|---|---|---|---|
| 官方(需 VPN) | OpenAI | platform.openai.com | 需 VPN |
| 官方(需 VPN) | Anthropic | console.anthropic.com | 需 VPN |
| 官方(部分可用) | aistudio.google.com | 部分可用 | |
| 国内平台 | 硅基流动 | cloud.siliconflow.cn | ✅ 直接用 |
| 国内平台 | 火山引擎 | console.volcengine.com | ✅ 直接用 |
| 国内平台 | DeepSeek 官网 | https://api.deepseek.com/v1 | ✅ 直接用 |
| 国内平台 | 阿里云百炼 | bailian.console.aliyun.com | ✅ 直接用 |
| 国内平台 | 百度智能云千帆 | 千帆控制台 | ✅ 直接用 |
| 第三方中转 | DeerAPI 等 | 需自行搜索 | ✅ 国内可用 |
免费额度汇总
| 平台 | 免费额度 | 说明 |
|---|---|---|
| 硅基流动 | 注册送 2000 万 Tokens + 实名送 16 元代金券 | 部分模型免费,DeepSeek-V3 极便宜 |
| DeepSeek 官网 | 新用户赠送额度 | 适合测试 DeepSeek 全系列 |
| 阿里云百炼 | 每个模型 100 万 Tokens | 通义千问、DeepSeek 全系等 |
| 百度智能云千帆 | 每个模型 100 万 Tokens | ERNIE-4.5、DeepSeek 等,3 个月有效期 |
💡 国内用户推荐:硅基流动和 DeepSeek 官网最推荐,额度多且价格便宜。阿里云百炼和百度千帆各有特色模型可选。
Q7:内地用户怎么访问这些工具?
| 工具 | 访问难度 | 方案 |
|---|---|---|
| Poe | 需 VPN | 使用 VPN |
| Cherry Studio | 国内可用 | 直接用 |
| Cursor | 需 VPN | 使用 VPN |
| Windsurf | 需 VPN | 使用 VPN |
| Trae | 国内可用 | trae.com.cn,直接用 |
| Genspark | 需 VPN | 使用 VPN |
| Coze | 国内可用 | coze.cn |
总结
工具选择建议(按需求分类)
| 需求 | 推荐工具 | 说明 |
|---|---|---|
| 多模型聊天 | Poe、Cherry Studio | 聚合多个模型,一个界面切换 |
| AI 编程(国内) | Trae | 国产免费,原生中文 |
| AI 编程(需 VPN) | Cursor、Windsurf | 功能全面,社区活跃 |
| 终端操作 | Claude Code、Codex CLI | 命令行极客风格 |
| 不换 IDE | Copilot | VS Code 插件形式 |
| 通用 Agent | Manus、Genspark | 直接帮你完成任务 |
| 搭建自己的 Bot | Coze(国内)/ Dify | 可视化编排 / 自部署 |
入门组合推荐
| 场景 | 推荐组合 | 费用 |
|---|---|---|
| 国内用户入门 | Cherry Studio + 硅基流动 API | 免费 |
| 国内 AI 编程 | Trae(内置模型) | 免费 |
| 进阶编程 | Cursor + 自定义 API | Free / $20/月 |
| 快速搭建 Bot | Coze(coze.cn) | 免费 |
后续学习路径
- Day 1:下载 Cherry Studio,配置硅基流动 API,体验多模型切换
- Day 2:尝试 Trae,用中文让 AI 帮你写个小工具
- Day 3:去 Coze 搭一个自己的 Bot,发布到豆包
- 后续:根据需求深入学习 Cursor / Agent 模式
参考资料
- Poe 官网
- Cherry Studio 官网
- Cursor 官网
- Windsurf 官网
- Claude Code 文档
- OpenAI Codex CLI
- GitHub Copilot
- Trae 官网
- Manus
- Genspark
- Coze 国内版
- 硅基流动
如果觉得有帮助,欢迎在评论区交流心得!
部分信息可能已经过时









