跳转至

作者介绍

你好,我是 Ferris。

欢迎来看我的笔记。

我很难定义自己,从标签化的角度说,我是一个00后INTP且带点文艺气息的AI工程师。要是抽象而且中二地说:我是特殊的自由意志的客观存在,目前在做一些自己感兴趣的工作罢了。

我写这份笔记,并不是因为我已经站在某个确定的终点上,相反,正是因为我反复感受到学习过程里的断裂感,才更想把它整理出来。很多时候,我们会在课程里学到一点,在论文解读里学到一点,在项目里再补一点,但这些知识并不会自动连起来。只有当你开始自己梳理、自己复现、自己解释给别人听的时候,它们才会慢慢形成真正稳定的理解。

所以这份笔记会天然带着我的写作视角:偏 from-scratch,偏工程实践,偏长期积累。你会看到我反复回到几个问题上:

  • 一个概念最核心的直觉是什么?
  • 它在数学和代码里分别长什么样?
  • 它在真实系统里为什么重要?
  • 如果要把它讲给别人听,最清楚的方式是什么?

我并不想把这份笔记写成一种“已经掌握一切”的姿态。更准确地说,它是一份公开的学习过程,是一套对抗遗忘、对抗碎片化输入、对抗“看过但没真正懂”的写作方法。它既是写给读者的,也是在写给未来会回头查阅这些内容的我自己。

如果你也在学习大模型,希望进入这个方向,或者只是想更扎实地理解语言模型背后的结构与工程问题,那我们大概有相似的兴趣。欢迎你把这里当成一份一起迭代的笔记,而不只是单向阅读的成品。

当我在香港攻读人工智能硕士学位的时候,课堂上Dr.HanBo举了一个例子:机器学习形象化来说就是数据不断逼近这个边界的行为。我觉得非常形象和生动。愿我们都能在不断试错、复现、修正和表达的过程中,慢慢靠近真正的理解。

再一次感谢各位!