AI增强之_Skills
我们见证了AI从最初在提示词的微光中摸索,到借RAG之势在知识海洋中巡航,继而通过MCP打破孤岛、纵横交错,最终在Skills的加持下破壁而出。这一场从‘对话’到‘行动’的远征,正不断警示着:掌握这些数字利器,方能握住未来的入场券。
打算把这一系列长期坚持写下去,见证AI技术一路的发展。同时不断提高自己使用AI的水平。
Agent Skills引入
Agent 是智能体,Skills是技能的意思,Agent Skills(智能体技能)是将专业知识、工作流规范固化为可复用资产的核心工具。
在智能体(Agent)快速演进的今天,模型本身的能力已经不再是唯一瓶颈。真正限制智能体落地到真实工作场景的,往往是 缺乏可靠、可复用的上下文与流程知识 。Agent Skills 正是为了解决这一问题而诞生的一种开放标准。
什么是Agent Skills
Agent Skills 是一种 简单、开放的能力封装格式 。它以文件夹的形式组织,将指令、脚本和相关资源打包在一起,使智能体能够在需要时发现并加载这些能力,从而更准确、高效地完成任务。
与“临时提示词”不同,Skill 更像是一个 可版本控制、可复用、可移植的能力模块 。一旦构建完成,就可以在多个支持该标准的智能体产品中使用。
为什么需要Agent Skills?
普通 AI 代理(如 Claude 或 Copilot)很聪明,但缺少特定上下文时容易出错。例如:
- 团队有自己的代码规范,但 AI 每次都要手动提醒。
- 需要处理 PDF 表单、调试 GitHub Actions 等复杂流程,AI 可能不知道最佳实践。
Agent Skills 解决这些问题:
- 自动触发 :AI 根据任务自动加载相关技能,无需手动输入长提示。
- 可复用 & 可共享 :一次创建,全团队或社区使用,支持 Git 版本控制。
- 高效利用上下文 :采用渐进式披露(progressive disclosure),只加载需要的部分,避免上下文窗口溢出。
- 跨平台 :同一个 Skill 可以在 Claude、VS Code Copilot、Cursor 等工具中使用。
开放标准与生态
Agent Skills 最初由 Anthropic 设计并发布为开放标准,目前已被越来越多的智能体产品采纳。该标准对整个生态开放,鼓励社区共同参与完善,使其成为智能体能力扩展的通用语言。
围绕这一标准,已经形成了从规范文档、示例技能到验证与工具链的一整套参考体系,为开发者和团队提供了清晰的落地路径。
github仓库地址:agentskills/agentskills: Specification and documentation for Agent Skills
Skills运行原理与组成
Skills目录结构
Skills的核心是一个包含 SKILL.md文件的文件夹。该文件包含元数据(至少包括 name和 description)以及指示智能体如何执行特定任务的指令。技能还可以包含脚本、模板和参考资料。
1 | |
SKILL.md文件
每个技能都以一个包含YAML前置元数据和Markdown指令的 SKILL.md文件开始
前置元数据
最小元数据示例:
1 | |
| 字段名 | 是否必填 | 类型 / 格式 | 说明 |
|---|---|---|---|
| name | 是 | string | 技能名称,1–64 个字符,仅允许小写字母、数字和连字符,需与目录名一致 |
| description | 是 | string | 技能描述,1–1024 个字符,说明技能做什么以及何时使用 |
| license | 否 | string | 许可证名称或指向随技能附带的许可证文件 |
| compatibility | 否 | string | 环境兼容性说明(目标产品、依赖、网络需求等),最多 500 字符 |
| metadata | 否 | map<string, string> | 任意键值对,用于存放额外的元数据 |
| allowed-tools | 否 | string(空格分隔列表) | 允许使用的预批准工具列表(实验性字段) |
包含可选字段:
1 | |
主体内容
MarkDown正文包含实际的指令,对结构或内容没用任何具体限制。
推荐章节:
- 分步骤说明
- 输入与输出示例
- 常见边界情况
注意:代理程序会在决定激活某个技能时加载整个SKILL.md文件。建议将较长的SKILL.md内容拆分成多个引用文件。
可选目录
scripts/
包含agent可以运行的可执行代码。脚本应:
- 要么是自包含的,要么清楚地记录依赖关系。
- 包含有用的错误信息
- 优雅的处理各自极端情况
支持的语言取决于代理的具体实现,常见的语言包括Pthon,Bash,JavaScript。
references/
包含agent需要时可查阅的其他文档:
- REFERENCE.md - 详细的技术参考
- FORMS.md - 表单模板或结构化数据格式
- 特定领域文件(
finance.md、legal.md等)
保持各个参考文件的简洁性。代理程序按需加载这些文件,因此文件越小,对上下文信息的依赖就越少。
assets/
包含静态资源:
- 模板(文档模板、配置模板)
- 图片(图表、示例)
- 数据文件(查找表、模式)
Skills如何运行
渐进式披露:并不一次把所有信息都摆在用户面前,而是按照用户的需求深度和操作阶段,逐步揭示内容。
- 初始阶段:只展示最关键、最常用的信息
- 需要更多时:再逐步展开更复杂、更专业的选项
- 高级用户:可以深入访问完整功能和细节
Skills采用渐进式披露来有效的管理背景信息:
- 发现:启动时,Agent只会加载每个可用技能的name和description,用来知道何时可能与技能相关。
- 激活:当任务与技能描述匹配时,Agent会将完整的
SKILL.md指令读取到上下文中。 - 执行:Agent按照指令要求执行,可根据需要加载引用的文件或执行捆绑代码。
文件引用
在技能中引用其他文件时,请使用相对于技能根目录的相对路径:
1 | |
文件引用应保持在 SKILL.md 的一级深度。避免使用深度嵌套的引用链。
在VScode中使用Skills
VS Code中的GitHub Copilot、GitHub Copilot CLI 等插件均已支持skills。
VS Code 中的Agent Skills 支持目前处于预览阶段。启用该功能须在设置中开启:
chat.useAgentSkills。
创建Skills
创建Skills仓库
VS Code 支持两种技能的Skills:
- 项目Skills:存储在代码仓库中:
.github/skills/(推荐).claude/skills/
- 个人Skills:存储在用户配置文件中:
~/.copilot/skills/(推荐)~/.claude/skills/
创建Skill
在Skills仓库下,为Skill创建一个子目录,如:.github/skills/webapp-testing
然后在目录中按照我们上述的Skills结构进行创建即可。
使用分享的Skills
我们可以下载其他人分享的Skills来增强Copilot的功能。这里我们给出一些可以Skills商城:
- copilot官方收集:github/awesome-copilot: Community-contributed instructions, prompts, and configurations to help you make the most of GitHub Copilot.
- manus Skills Marketplac:Agent Skills 市场 - Claude、Codex 和 ChatGPT Skills | SkillsMP
- awesome-claude-skills:ComposioHQ/awesome-claude-skills: A curated list of awesome Claude Skills, resources, and tools for customizing Claude AI workflows
Vs code 实战示例
下面以让agent学会制作ppt为例:

对于安装了nodejs的用户,我们可以直接在终端中输入命令进行安装:
1 | |
这里有两种安装方式:
- 自动检测电脑上存在的agent并针对所有agent进行安装
- 手动选择安装的agent

这里我选择了手动安装到github copilot

使用空格选择,回车确定,可以选择多个agent
然后让我们选择将skills安装到全局还是项目:

我这里选择安装到项目。
最后会文我们安装方式:
- 软链接:实际的Skills只有一份,其他agent目录中将存储软连接,更省内存。(推荐)
- 复制文件:每个agent中复制一份skills,安装几个agent,就有多少份agent。

安装完成:

精简ppt
我给了agent一个精简ppt的任务,可以看到AI直接读取了了技能pptx,并且渐进式的读取了ooxml.md文件

最后生成了12页的精简版ppt:

打开确认,精简后的ppt确实是12页,并且重点介绍的方面为学科与培养优势。
实际体验后,感觉Skills像是针对不同的具体工作,先由人设计了一套相对固定的,规范化的过程,再由Agent来执行,并没用实际提高AI的能力边界,当前的主要感受是减少了人引导AI的过程,减少让ai执行任务时开盲盒的概率,提升ai的产出质量。
