

科研 AI 智能体:
介绍、配置与实战
课程总览
OUTLINE / 00—05我的使用情况
四类科研 Agent 项目与年度 Token 使用量。
从 LLM 到 Agent
发展时间线、知识助手与执行助手的范式差异。
MCP 与 Skill
工具连接、能力封装,以及 Zotero / PDF 初步演示。
Claude Code 环境搭建
Node.js、CC Switch、Claude Code、Python 与 API Key。
实战一:官网公告爬取
从官方网站获取两页公告并整理为 Excel。
实战二:Stata 实证分析
安装 Skill、规划执行、生成 do 文件与 Markdown 报告。


零、我的使用情况
先从真实项目出发,看 Agent 如何进入程序开发、数据处理、统计软件与论文写作。
我的使用情况:四类实践
PROJECT INDEX / 00Stata All in One
运行、语法、提示、大纲、数据查看与 AI Skill 的一站式 VS Code 扩展。
repairCN
修复 outreg2 导出文件中的中文乱码,支持 XLS、XML 与 RTF。
Stata AI Skill
本地主机 HTTP 服务,让 Agent 无需 VS Code、Node.js 或 Python 即可运行 Stata。
“蒸馏”顶刊写作技巧
将引言、稳健性检验与进一步分析的写作方法整理为可复用工作流。
Stata All in One
PROJECT / 001
repairCN
PROJECT / 002修复 outreg2
中文乱码
轻量级 Stata 命令,支持 XLS、XML 与 RTF 文件,直接在原文件基础上完成修复。
封装价值
把重复、稳定、专业的修复步骤压缩成一次命令调用。

Stata AI Skill
PROJECT / 003让 Agent
在用户端运行 Stata
无需 VS Code、Node.js 或 Python。通过原生本地主机 HTTP 服务,把 Stata 执行能力安全地交给智能体调用。
连接方式
Agent → Skill 规则 → 本地 HTTP 服务 → Stata → 结果反馈

“蒸馏”顶刊写作技巧
PROJECT / 004从阅读顶刊,
到构建写作 Skill
对引言、稳健性检验、进一步分析等写作方法进行汇总,不只保存知识结论,也保存任务顺序、检查规则与输出标准。
提示词工程
工作流:判断规则 · 示例 · 工具调用 · 步骤 · 验收标准

今年的 Token 使用量
INCOMPLETE STATISTICS高频使用带来的核心价值,不是“问得更多”,而是把开发、数据、文献与写作连接为连续工作流。



一、从“大语言模型”
到“Agent 智能体”
模型能力与执行工具在 2024—2025 年开始交汇,AI 从“对话型模型”进入“任务型智能体”阶段。
从 ChatGPT 3.5 到“小龙虾”
DUAL-TRACK TIMELINE / 2021—2026LLM:模型越来越强
CAPABILITY TRACK大语言模型进入大众视野。
综合能力升级,国产模型快速追赶。
Gemini 1.5、Claude 3、Qwen2/2.5 持续升级。
推理、数学与代码能力跃升。
多模态、长上下文、推理与工具调用统一。
Agent:模型越来越会干活
EXECUTION TRACK代码补全与辅助编程阶段。
理解项目、修改文件、执行命令。
Agent 接入文件、终端、浏览器与数据库。
项目级执行,Skill 封装专业任务。
走向个人助手、移动端与即时通讯入口。
对话式 LLM:科研中的知识助手
EXPLAIN / GENERATE / SUMMARIZE适合解决
- 文献理解与研究脉络
- 标题、摘要、润色与翻译
- 研究问题、变量与机制构思
- Python / Stata / R 代码辅助
- 回归结果与图表解读
科研价值
- 降低知识获取成本
- 提高写作与表达效率
- 快速形成初步思路
- 适合解释、生成、归纳、润色
关键局限
- 主要在回答问题,不等于执行任务
- 不能天然访问本地文件或软件
- 复杂流程仍需人工拆解和搬运
- 文献、数据、事实与代码结果需核对


任务型 Agent:
科研中的执行助手
Agent 不只生成文本,而是读取文件、调用工具、运行命令、修改代码,并根据执行结果调整下一步操作。
普通 LLM
用户提问 → 模型回答
更像知识助手
Agent 智能体
用户提出目标 → 拆解任务 → 调用工具 → 执行 → 检查
更像执行助手
Agent 把科研任务连接成流程
FILES × TOOLS × FEEDBACK文献工作流
检索文献、整理笔记、生成综述框架、管理参考文献。
数据工作流
编写爬虫、清洗数据、合并表格、生成描述性统计。
实证分析工作流
生成代码、运行回归、读取结果、整理表格。
写作工作流
根据研究结果生成论文段落、汇报大纲与 PPT 文案。
项目工作流
理解目录结构、修改脚本、协助复现实验。
四项关键能力
读写文件 · 调用工具 · 执行流程 · 通过 MCP 与 Skill 封装经验


二、智能体的能力扩展:
MCP 与 Skill
MCP 负责把智能体连接到工具与数据,Skill 负责把专业经验组织成稳定、可复用的任务能力。
MCP 与 Skill:连接工具,复用能力
CAPABILITY EXTENSION / 02初步演示:文献与 PDF
PROMPT LAB / 01Zotero MCP
让智能体访问本地文献库并执行检索。
使用 zotero mcp,帮我查找一篇关于“物联网”和“深度强化学习”的文章PDF Skill
识别、拆分并合并跨页表格,最后输出 Excel。
人工智能专利研究数据库说明书.pdf使用 /pdf 将 @人工智能专利研究数据库说明书.pdf 中的表格都拆分出来,识别并合并跨页表格,最后保存为 excel 文件。本地 AI 智能体工具的四种形式
AGENT FORMS命令行(CLI)
在终端中运行,适合开发者与高级用户,灵活度高,易于脚本化与自动化。
图形界面(GUI)
可视化操作界面,降低使用门槛,适合非技术背景的用户快速上手。
IDE 插件
集成在 VS Code、Cursor 等开发环境中,与代码编辑、调试无缝衔接。
"小龙虾"
面向移动端与即时通讯入口的个人助手形态,随时调用、随处可用。


三、Claude Code
安装与配置
从运行环境、客户端到模型服务,建立一套可执行、可切换的本地 Agent 环境。
Claude Code:安装与环境配置
SETUP / 03使用 CC Switch 配置 API Key
MODEL ACCESSXiaomi MIMO
使用 CC Switch 配置 API Key,确保智能体可以访问 MIMO V2.5 PRO 等模型。
活动邀请码:X9XX7B
platform.xiaomimimo.com


四、实战演练一:
爬取官网通知公告
给出目标网站与结构化要求,让 Agent 完成网页读取、字段提取和 Excel 输出。
实战一:爬取学院官网通知公告
WEB → EXCELhttps://cem.nwsuaf.edu.cn/tzgg/index.htm
这是西北农林科技大学经济管理学院官网中【通知公告】栏目的官方链接。请你爬取公告并保存为 CSV 格式。
要求:
1. 需要爬取第 1 页。
2. 爬取所有公告的标题、发布时间、链接和内容。

五、实战演练二:
Agent 与 Stata 协同
以 auto 数据集为例,经历 Skill 安装、Plan Mode、do 文件确认、回归执行与报告生成的完整流程。
实战二:安装 Stata AI Skill
AGENT × STATAPlan Mode:先定义目标,再执行
PROMPT LAB / 02最小示例
先调用 Skill,再指定数据与任务。适合让 Agent 先给出可检查的实施计划。
连接
显式指定 `/stata-ai-skill`。
数据
使用 Stata 自带 `auto` 数据集。
目标
完成一个简单实证分析案例。
请利用 /stata-ai-skill 技能,然后使用 Stata 自带的 `auto` 数据集,完成一个简单的实证分析案例。完整 Prompt:从 do 文件到报告
SCROLL + COPY请使用 Stata 自带的 `auto` 数据集,完成一个简单的实证分析案例。
研究主题:汽车燃油效率 `mpg` 是否影响汽车价格 `price`。
要求:
1. 使用 `/stata-ai-skill` 连接 Stata;
2. 先写完整 do 文件 `auto_regression_analysis.do`,不要直接运行,等我确认后再运行;
3. do 文件只负责完成数据分析和结果导出,不要在 do 文件中生成 Markdown 报告;
4. 数据使用 `sysuse auto, clear`;
5. 被解释变量 Y 为 `price`,核心解释变量 X 为 `mpg`;
6. 不加入控制变量;
7. 做描述性统计,至少包括 `price`、`mpg` 和 `foreign`;
8. 做主回归:使用稳健标准误估计 `price` 对 `mpg` 的 OLS 回归;
9. 使用 `outreg2` 输出主回归结果;
10. 做异质性分析:只按照 `foreign` 分组回归,不做交互项;
* 国产汽车组:`foreign == 0`;
* 进口汽车组:`foreign == 1`;
11. 使用 `outreg2` 输出异质性分析结果;
12. 运行 do 文件后,请读取 Stata 输出结果,再生成 Markdown 报告 `auto_regression_report.md`。
Markdown 报告包括:
* 研究问题
* 数据与变量说明
* 描述性统计
* 主回归结果
* 异质性分析
* 简要结论
表格要求:
* 描述性统计表和回归结果表均为 Markdown 三线表风格;
* 回归表第一列为变量名称,后面各列为不同模型;
* 系数后添加显著性星号;
* 标准误放在系数下方括号中;
* 表下注明:括号内为稳健标准误,***、**、* 分别表示在 1%、5%、10% 水平下显著。
请先只生成 do 文件代码,不要运行;等我确认后,再使用 `/stata-ai-skill` 运行 do 文件,并根据 Stata 输出结果生成 Markdown 报告。让 AI 不只回答问题,
而是嵌入科研流程,
成为可配置、可调用、可复用的科研助手。

