作者介绍¶

你好，我是 Ferris。

欢迎来看我的笔记。

我很难定义自己，从标签化的角度说，我是一个00后INTP且带点文艺气息的AI工程师。要是抽象而且中二地说：我是特殊的自由意志的客观存在，目前在做一些自己感兴趣的工作罢了。

我写这份笔记，并不是因为我已经站在某个确定的终点上，相反，正是因为我反复感受到学习过程里的断裂感，才更想把它整理出来。很多时候，我们会在课程里学到一点，在论文解读里学到一点，在项目里再补一点，但这些知识并不会自动连起来。只有当你开始自己梳理、自己复现、自己解释给别人听的时候，它们才会慢慢形成真正稳定的理解。

所以这份笔记会天然带着我的写作视角：偏 from-scratch，偏工程实践，偏长期积累。你会看到我反复回到几个问题上：

一个概念最核心的直觉是什么？
它在数学和代码里分别长什么样？
它在真实系统里为什么重要？
如果要把它讲给别人听，最清楚的方式是什么？

我并不想把这份笔记写成一种“已经掌握一切”的姿态。更准确地说，它是一份公开的学习过程，是一套对抗遗忘、对抗碎片化输入、对抗“看过但没真正懂”的写作方法。它既是写给读者的，也是在写给未来会回头查阅这些内容的我自己。

如果你也在学习大模型，希望进入这个方向，或者只是想更扎实地理解语言模型背后的结构与工程问题，那我们大概有相似的兴趣。欢迎你把这里当成一份一起迭代的笔记，而不只是单向阅读的成品。

当我在香港攻读人工智能硕士学位的时候，课堂上Dr.HanBo举了一个例子：机器学习形象化来说就是数据不断逼近这个边界的行为。我觉得非常形象和生动。愿我们都能在不断试错、复现、修正和表达的过程中，慢慢靠近真正的理解。

再一次感谢各位！