Skip to content

AI 实践系列

本系列记录我的 AI 学习路径,从前沿认知到动手实践,从播客深度学习到从零构建大模型。

学习路径

前沿认知                    深度实践                    项目实战
   │                          │                          │
   ▼                          ▼                          ▼
Lex Fridman #490  ────→  从零构建 GPT          CIFAR-10 图像分类
   │                          │                          │
   │  AI 全景认知              │  手撕 Transformer        │  掌握 CNN/ResNet
   │  Scaling Laws            │  注意力机制               ▼
   │  RLHF/RLVR              │  预训练到微调        dlib 人脸识别 API
   │                          │                          │
   └──── 好奇心驱动 ────→     └──── 代码验证 ────→       ▼
                                                   TensorFlow 人脸登录

系列文章

前沿探索

文章核心内容关键词
4.5 小时 AI 深度对谈:我从 Lex Fridman #490 中学到了什么Lex Fridman × Nathan Lambert × Sebastian RaschkaScaling Laws、RLHF、MoE、开源闭源
手撕 GPT:从一行文本到下一词预测的完整链路7 天从零用 PyTorch 构建类 GPT 模型Transformer、注意力机制、BPE、预训练

基础入门

文章核心技术学习目标
CIFAR-10图像分类入门CNN、ResNet、TF-Slim掌握图像分类基础、理解深度学习训练流程

项目实战

文章核心技术应用场景
Python+dlib人脸识别APIdlib、68关键点、Flask人脸检测、表情识别
TensorFlow+小程序人脸登录FaceNet、TensorFlow、微信小程序刷脸登录、身份验证

技术栈

  • Python - 编程语言
  • PyTorch - 深度学习框架(GPT 构建)
  • TensorFlow - 深度学习框架(人脸识别)
  • FaceNet - 人脸识别模型(128维特征向量)
  • dlib - 机器学习库(人脸检测、关键点)
  • OpenCV - 图像处理
  • Flask - Web API 框架

推荐学习顺序

  1. 认知Lex Fridman #490 播客笔记 → 建立 AI 全景认知
  2. 构建手撕 GPT → 从零理解 Transformer 架构
  3. 入门CIFAR-10图像分类 → 理解 CNN、训练流程、数据增强
  4. 实战1dlib人脸识别 → 掌握人脸检测、关键点定位
  5. 实战2TensorFlow人脸登录 → 深度学习人脸识别、端到端应用