跳转至

机器于此理解语言

技术条目池

then-language-generates-by-computer

LLM 前沿技术与新概念补充¶

本文档用于记录大模型相关前沿技术、新工具、新框架等，便于后续补充到 18 章笔记中，并保持知识体系统一。

使用说明¶

每当遇到新技术，直接按下面的模板新增一个条目。
在“对应章节”里标记建议归档位置，先写章节号或 TODO 即可。
每隔一段时间，把这里的内容同步到正式章节里：
如果是核心概念，升级为章节内的小节
如果更偏 demo、工具或案例，放入扩展阅读 / tips
尽量保持字段统一，后续做索引和章节映射会更方便。

技术条目模板¶

技术名：`<填写技术名称>`¶

类型：Model / Training / Agent / Tool / Skill / Dataset / Framework
发布时间 / 来源：论文、blog、GitHub 或官方文档链接
原理概述：
核心原理（尽量 2-4 行）
核心组件 / 算法 / 模块
典型应用 / Demo：
可运行示例或典型场景
示例代码片段或 repo 链接
对应章节：
建议放置的 18 章笔记章节
笔记状态：
TODO / 写完 / 待更新
备注：
适合初学者理解的重点
注意事项或坑

已收录条目¶

技术名：DeepSeek-V4¶

类型：Model / MoE / Long-Context / Reasoning / Agent
发布时间 / 来源：2026 年 4 月 24 日技术报告；Hugging Face 模型集合
原理概述：
DeepSeek-V4 系列包含 V4-Pro 与 V4-Flash，二者均原生支持 1M token 上下文。
核心架构采用 CSA（Compressed Sparse Attention）与 HCA（Heavily Compressed Attention）的混合注意力，用压缩 KV、稀疏选择和滑动窗口分支降低长上下文成本。
同时引入 mHC、Muon optimizer、FP4 量化感知训练、异构 KV Cache 与 on-disk cache 等训练和推理基础设施。
典型应用 / Demo：
百万 token 长文档分析
长程 Agent 工作流
代码库级理解与代码 Agent
复杂推理任务中的 test-time scaling
对应章节：
第 5 章 Attention 机制
第 6 章 Transformer 架构
第 17 章 Agent 与 Tool Calling
第 18 章 LLMOps、部署与生产化
笔记状态：
写完分析报告初版：DeepSeek-V4 技术分析报告
备注：
初学者重点理解：百万上下文的瓶颈是 attention FLOPs 与 KV Cache，而不只是窗口长度。
后续适合把 CSA/HCA、KV Cache 成本和长上下文 Agent 案例分别回写到主章节。

技术名：OpenClaw¶

类型：LLM Skill / Tool
发布时间 / 来源：GitHub/OpenClaw
原理概述：
通过 LLM 调用外部工具或 API，把“生成回答”扩展为“执行任务”。
常见实现思路是让模型先决定动作，再把工具执行结果回填给模型继续推理。
可以和 chain-of-thought、tool calling、工作流编排结合，用于构造更完整的 Agent loop。
典型应用 / Demo：
自动化办公流程
数据分析助手
可进一步结合 RAG 或 skills 机制做复合任务
对应章节：
第 17 章 Agent 与 Tool Calling
笔记状态：
TODO
备注：
初学者可以先理解 tool calling 的基本流程：定义工具、生成参数、执行工具、回填结果。
如果后续要正式写进章节，建议把它当作“工具使用能力”案例，而不是单独抽象成全新理论。

技术名：Hermes Agent¶

类型：Multi-agent / LLM Agent Framework
发布时间 / 来源：GitHub/Hermes
原理概述：
强调分层 agent、任务拆解、记忆与规划，让复杂任务不必由单个 prompt 一次性完成。
常见系统模块包括 planning、reflection、memory、tool use，以及多 agent 间的职责分工。
它适合拿来理解“Agent 不只是一次工具调用，而是一个可迭代推进的任务系统”。
典型应用 / Demo：
复杂任务自动化
科学研究 / 数据分析 multi-agent
多角色协作式任务拆解与执行
对应章节：
第 17 章 Agent 与 Tool Calling
笔记状态：
TODO
备注：
初学者先抓住核心思想：任务拆解、角色分工、状态记忆、结果反思。
做 demo 时不必一开始就上多 agent，可以先用 1-2 个工具做最小闭环。

技术映射表¶

技术名称	类型	对应章节	笔记状态	来源 / 链接
DeepSeek-V4	MoE / Long-Context / Reasoning	5 Attention、6 Transformer、17 Agent、18 LLMOps	写完分析报告初版	Hugging Face / 技术报告
OpenClaw	Skill / Tool	17 Agent	TODO	GitHub/OpenClaw
Hermes Agent	Multi-agent	17 Agent	TODO	GitHub/Hermes

后续可补充方向¶

推理增强：test-time scaling、self-reflection、tree/graph search
Agent 工程：memory、planning、multi-agent orchestration、tool sandbox
训练范式：合成数据、post-training 新配方、agentic finetuning
应用框架：skills、workflow engine、browser/computer use、长期记忆系统