总之是先看标题. Pytorch而不是Python.
Python基础的话自己去看论坛群里那个教程去. Pytorch是应用的最广泛的深度学习库之一. 你也许会在你的学校机房的Conda之类的里面见到它.
先说一下为什么突然打算做这个. 最近在从一些过时的老库向torch迁移, 闲着没事干做个整理也是加深自己印象了.
实际上你会发现给别人讲确实是加深自己理解的好办法, 也不局限于这一亩三分地了, 几乎都是如此.
-
Cover的范围是深度学习基础里的基础. 标题是个比较差劲的双关笑话, 但意思是不言而喻的, 基本上就是教你怎么在深度学习领域打螺丝. 后面怎么造火箭或者搓集成电路那就超出我目前的能力范围了. 到后期也就搭一些结构简单的神经网络和跑点简易演示用数据集什么的, 主要都在以简化与轻量化的方式演示概念. 所以没必要也不用期待太多.
我自觉从来都不是多负责任的好老师. 平时有批改压力和事务压力的话我肯定牺牲备课和加深学生理解的时间来赶业绩. 不过我对自己的自学能力还是比较有信心的. 我更擅长做学徒然后继续带人.
然后 也不算叠甲吧, 但总之我的经验主义习气比较重, 也不是正经学院出身的CST或者AI的人, 自己理解归纳的部分会比较多. 所以谬误大概是可能有的. 遇到需要勘误之处或者不理解的地方随时指出. 当然你想的话, 自己去查证了或者问了AI再来找我更好.
内容当然是目的导向, 以上手用为第一目标. 所以讲的会很快 很浅 很笼统, 这当然也是代码类教学的必然. 实用从来不是开卷考试. 做电子韩国人到处偷东西也好, 问AI或者让AI写代码也罢, 目的都是解决问题. 什么都教没有意义, 重要的是自己知道有这个概念之后去查证去理解去自己找解决办法.
因为是自己写自己看稍微带一点基础的东西, 不会讲的很详细.
刚好在看Raschka S. 所著 Build a Large Language Model (2025), 他的附录里有一个比较基础的Torch入门指南, 我就顺带着拿来当教材了. 章节: Appendix A: Introduction to Pytorch.
我是先用的别人的书入门的深度学习再转过来这边的, 梳理顺序上可能会比较跳跃, 有疑问就问是对的.
整本书后面关于LLM的部分, 如果以后把书吃的差不多了也许会顺便讲一下. 当然是如果我到时候想的话. 也许不会. 反正这本是当闲书看.
你需要的前置:
线性代数: 很少 (没有行列式没有Jacobian没有更多乱七八糟的东西)
微积分: 一点 (梯度不用你自己上手求), 总之线代和微积分的意义都是理解概念, 不用你算.
Python: 基础和一点进阶 (当然, 你说Pytorch名字里为什么带Py)
>!英语 (有必要提这个吗): 讲解会带原文, 供参考的代码里我也会用英文写注解, 这是显而易见的. 当然, 你都用Python了还不会英语的话那叫什么事.!<
-
课件:
这个帖子
书上原文 (一部分)
涉及到的代码部分 (我自己会进行过度注释一样的话痨注解)
别的 (也许会有, 也许会没有.)
-
课后练习:
我比较懒, 不是很想出题, 加上这字面意义上是个笔记 不算是课 也不完全有在带人, 所以不一定有. 如果我觉得有必要的话会有. 不然就是没有了.
-
看完之后你应该期待学到什么 (或者当然说的不通俗一点的话: Expected Learning Outcome):
不知道. 如果你以后做深度学习或者LLM方面的那确实这是基础. 就是字面意义上的这一行的打螺丝教程. 我讲是因为我闲. 此外愿者上钩.
-
书上这一块大概也就20页不到的篇幅, 不会有多少内容.
总之是占个位, 这两天有空了慢点开始讲.
想到哪讲到哪吧, 遇到问题也会回来改之前的章节, 大概…