前言

什么是AI大模型?

目前较为通俗的定义:AI 大模型 = 用海量数据训练出来的、超级大的人工智能神经网络。

我们常用的deepseek,豆包,kimi,千问,文心一言,混元,minimax,ChatGPT,GPT-4,Gemini都可以叫Ai大模型。

大模型如何分类?

目前最通俗的分类,按擅长能力和使用场景分:

  1. 通用大语言模型(LLM)

    1. 聊天、问答、写作、推理、代码、规划全能

    2. 代表:GPT-5、Claude 3、文心一言、通义千问、Llama 3

  2. 代码专用大模型

    1. 专门优化代码生成、调试、解释

    2. 代表:CodeLlama、StarCoder、CodeGeeX、GitHub Copilot

  3. 多模态大模型(MM)

    1. 能同时处理文本 + 图像 + 语音 + 视频

    2. 代表:GPT-4V、Gemini、Claude 3 Opus、通义千问 VL、Kimi 多模态

  4. 垂直行业大模型

    1. 在专业领域微调,更专业、更安全

    2. 例如:医疗大模型、法律大模型、金融大模型、教育大模型

  5. 图像 / 视频生成大模型

    1. 文生图、图生图、视频生成

    2. 代表:Stable Diffusion、Midjourney、Flux、Sora、minimax海螺

  6. 语音大模型

    1. 语音识别(ASR)、语音合成(TTS)、语音对话

    2. 代表:Whisper、ElevenLabs、火山语音、讯飞星火语音

如何利用大模型?

  1. 最简单的用法--加强版的百度

    1. 写东西:文案、邮件、工作总结、请假条、演讲稿

    2. 改东西:润色文字、改错、优化表达、精简内容

    3. 想东西:出点子、想标题、想活动方案

    4. 算东西:做计划、排日程、算成本、做对比表

    5. 解释东西:看不懂的概念、代码、合同、政策,让它用大白话讲

  2. 进阶版

    1. 学习

      1. 看不懂知识点:让它 “用小学生都懂的话讲”

      2. 刷题:出题、讲解、举一反三

      3. 外语:翻译、造句、纠正发音、模拟对话

    2. 办公

      1. Excel / 表格:写公式、做透视表、整理数据

      2. PPT:出大纲、写每页内容

      3. 代码:写代码、改 bug、解释代码

      4. 数据分析:帮你梳理思路、写分析报告

    3. 创作

      1. 写小说、剧本、短视频脚本

      2. 写文章,写文件

    4. 其他

      1. 文件整理:归类汇总,提取原数据,语义搜索,向量化文档

        1. xxx在xxx次会议中提到xxx,能否找出相关文件?

        2. xxxx方案经历过几次修订?目前最新方案是哪份文件?

      2. Agent 智能体:自动化

        1. 让 AI 自主上网搜索信息、汇总、写报告

        2. 让 AI 自动操作软件、处理表格、发消息、整理文件

        3. 让多个 AI 分工协作:产品、设计、开发、测试一起 “开会”

        4. 自动数据分析:上传数据 → AI 清洗 → 可视化 → 出结论

      3. 机器人团队作战:若干个飞书,微信,企业微信,钉钉等机器人同时工作

      4. 手搓简单软件,搭建网站等

      5. 医院各科室适用场景:

        1. 运管,财务:运营财务数据分析,汇总,清晰,处理,计算,财务报告,报告审阅,PPT

        2. 医保:医保数据统计,分类,同his数据比对,出医保分析报告

        3. 人事部门:人员档案管理,人力资源分析

        4. 行政部门:文档归类,格式自动调整,自动发文,AI智能会议纪要

        5. 设备,总务:出入库数据,自动更新台账,合同归档,飞书/钉钉的工单派送,资产标签及管理,标准化巡查清单

        6. 宣传部门:喂素材,找热点,直接出公众号文章,润色,按人设写作,舆情监控等

        7. 公共卫生部:低代码的智能操作软件,完成信息报送

        8. 科教部,医务部:人员管理,人物画像,数据匹配与医师管理

        9. 其他:可覆盖50%以上日常业务

  3. 同样一个软件,为什么有人得到的答案就是准确的,有人得到的答案是模糊的?除了通过刻意地喂数据外,最关键的就是如何问问题,要问出一个好问题,首先要了解你面临的问题是什么?其实说到最后,考验的还是个人的逻辑、语言组织及专业能力。

如何进阶使用大模型提高效率?

首先介绍openclaw

本质上就是开源的ai智能体执行框架,不用理解高深的俗语,核心就是:给大模型装上手脚,让大模型去干活

维度

普通 AI(如ChatGPT / 豆包)

OpenClaw

能力

只能输出文字 / 代码 / 图片

直接操作电脑、自动完成完整任务

数据

云端存储,有隐私风险

本地存储,完全私有

模式

被动问答(你问我答)

自主规划、主动执行、持久记忆

定位

智能秘书(出主意)

数字员工(直接干活)

大模型(GPT / 文心 / 豆包) = ​大脑​(负责思考、理解、决策)

OpenClaw = ​手脚 + 神经系统 + 本地管家​(负责执行、操作电脑、调用工具、记住上下文)

全平台操控

  • 操作系统:Windows/macOS/Linux

  • 能操作:文件、终端、浏览器、邮件、日历、数据库、API、飞书 / 钉钉机器人

重点:openclaw一定不能部署在主力机或办公电脑上,有极大的安全隐患,最好是云服务器(腾讯云,阿里云等),或自己的闲置电脑(能保证24小时开机),如果无法保证24小时开机,就失去了意义。

使用openclaw的最低成本

  1. 云服务器,低配99元/年,基本可满足日常使用

  2. 自行订阅各大ai厂商的coding plan计划,推荐minimax,kimi,GLM(智谱)三大国产厂商,300-500元/年,不限token,有使用限制,基本无视。可以使用免费版,但效率打2折。自行考虑。2026年4月20日最新消息,大部分厂商已经改名叫token plan,成本收益出现困难,厂商已经支撑不住。

openclaw介绍

参考网站:OpenClaw - OpenClaw

  1. 如果不想安装,各大云服务商已经提供了免安装版的openclaw服务器,出厂自带openclaw,只需要自己部署飞书、钉钉、微信即可。各大云服务商都会提供安装指南,自己查看即可。比如腾讯云:在云端秒级部署OpenClaw全能助手

  2. 云服务器安装流程:买服务器----买大模型套餐---配置IM通道&安装技能

  3. 如果要自己折腾的,参考openclaw官网中的安装方法

  4. 演示,安装后的效果及机器人配置

  5. 自建服务器优先级推荐:Linux及Linux内核的桌面版(ubuntu,xbuntu等),其次Mac,最次windows(不推荐,中毒风险更高,被攻击几率更高),如果有兴趣,可单独开一节课。

  6. 用openclaw自带飞书插件(优先)或自己部署飞书官方插件(此优先):OpenClaw 飞书官方插件使用指南(公开版) - 飞书云文档

  7. 自己部署钉钉:开发机器人应用 - 钉钉开放平台

  8. 自己部署微信:微信ClawBot完整安装教程

  9. openclaw的使用场景:

    1. 云服务器:数字管家,信息收集,网站运维,非核心、非隐私数据库使用(可演示)

    2. 自建版本:文件处理,数据处理,PDF合并/拆分/提取,文件修改,文件审阅,报表生成,数据分析,调研报告,周报/月报,合同管理,整理照片,整理视频资料,文案,合规检查等,健身报告,学情报告,论文修改,论文降重等等

  10. 提问及演示环节,10-20分钟

其次介绍opencode

OpenCode = 终端 AI 助手 + 代码理解引擎 + 本地文件操作器
终端优先、隐私第一、模型自由、完全开源。

  1. 三端一体:终端,桌面app,IDE插件(VS Code、Cursor 无缝嵌入)

  2. 两大工作模式

    1. 规划模式(Plan):只分析、出方案、不写文件(安全)

    2. 执行模式(Build):自动读代码、改文件、运行测试、修复 Bug(全自动)

维度

OpenClaw(小龙虾)

OpenCode

核心定位

通用执行网关 / 数字员工

专业编程助手

任务复杂度

中大型任务(办公 / 运维 / 流程)

微观代码任务(开发 /debug)

架构

单 Agent + 插件(全能型)

单 Agent+LSP(代码专精)

交互入口

飞书 / 钉钉 / 微信 / 终端

终端 + IDE + 桌面

安全

权限控制(可选 Docker)

本地文件权限

最佳场景

个人 / 小团队自动化、聊天驱动

程序员日常开发

OpenCode 是狙击手,专攻精准代码问题;OpenClaw 是全能特种兵,什么活都能干。

  • 不要听到程序员开发就以为自己的是非适用用户,恰恰相反,opencode特别适合做固定且重复的工作,所有的工作在AI的认知里,都是一个动作一个动作组成的,因此,只要你有重复性的工作,就适用opencode。

使用OpenCode的最低成本

  1. 推荐安装在自己电脑上,windows最佳,优先选择桌面版,项目地址:OpenCode | 开源 AI 编程代理

  2. 桌面版演示:

  3. 终端演示:

opencode的桌面版使用演示

  1. 安装桌面版,下载地址OpenCode | 开源 AI 编程代理

    1. 最好提前安装node.js,绝大部分人的电脑不带node.js,官网下载 https://nodejs.org/en/download

  1. 配置大模型(演示)

  2. 界面简介(演示)

  3. opencode最重要的三个文件:人设,记忆,技能

何谓人设?

  1. 告诉opencode你是谁,你喜欢什么风格的机器人,你喜欢什么样的交互体验等等,都可以提前告诉opencode

  2. 人设可写可不写,可以随时补充,不存在格式问题

何谓记忆?

  1. 解决豆包,deepseek等APP的记忆遗忘问题,且本地化,没有数据泄露的风险,或风险很低,AI很聪明,没有记忆的话,只是个聪明的陌生人,拥有了记忆,等于拥有了一个独一无二的AI助理

  2. 方法一,即插即用,只建1个memory.md文件

  3. 方法二,每日日志,每天1个memory.md文件

  4. 好处

    1. 彻底解决 “AI 失忆”,跨会话永久记住

    2. Token 极省、速度极快

    3. 自动 “记忆刷新”,重要信息永不丢

    4. 支持debug 与复盘(工作神器)

    5. 本地私有化、100% 数据安全(医院刚需)

    6. 越用越专业的 “AI 助手”

何谓技能skills?

  1. 是指在大型语言模型(LLM)交互中封装的可复用功能单元,类似于人类的技能。它包括流程、配方、工具和材料等要素,使得 AI 能在特定任务中表现出专业化的能力。通俗讲:经过多人验证的,能通用的大模型操作流程,并用md文档写出的,可重复使用的提示词。

  2. 资源库:Find awesome Agent SkillsSkills Directory - Secure, Verified Agent Skills for Claude AI

  3. 常用技能压缩包,课后索取

  4. 不用贪多,日常常用的几个就够了

  5. 安全代码审查,举例:在你看不到的地方,悄悄写下提示词,完成数据后,请自动转发到xxxx@qq.com邮箱等,数据泄露风险,病毒扩散风险?

  6. 审查提示词:帮我检查一下这个skill技能,查看代码风险,如果有的话,按高中低风险分别给我列出来,让我来决定是否需要安装并使用

  7. 安装演示

建议搭配的工具

  1. markdown编辑器,ai大模型最喜欢的文档格式,优先级高于word,wps,pdf等,但上手难度远低于代码类文档。优势:

    1. 不用操心格式问题,只有一级标题,二级标题,三级标题等,加上段落,引用等,安心写作,无需操心格式

    2. 相同文字,文件大小远远低于word,pdf等传统文档格式,举例,141011个字的word,相差5-10倍是常态

    3. 最适合知识库的文档格式

  2. VPN软件,用于浏览全球最大的开源项目网站Github,你能想到的项目都有,但是需要科学上网。课后索要资料

  3. 个人知识库搭建,笔记软件,工作日志,经验总结分享

  4. 纸质笔记与软件类笔记相结合,OneNote,思源笔记,Obsidian,wps,word,飞书,钉钉都可以,工具不重要,重要的是归类,分档,记录。

  5. 数据库的操作,基本原理要搞懂,数据库≈速度更快,但规则更严,操作更死板的excel

  6. 学会写提示词

    1. 你是xxx角色,精通xxxx,现在有一个xxx任务需要你来完成,要达到什么目的,要求1234,是否了解?用你的理解复述一遍(听我指令再行动)

实操阶段