第一章 人工智能的范式转变与深度学习的崛起
1.1 从规则驱动到数据驱动的技术跃迁
传统AI(如专家系统)依赖人工定义逻辑规则,而深度学习通过端到端学习机制自动捕获数据内在规律。以ImageNet竞赛为例,2012年AlexNet将错误率从26%降至15%,标志着数据驱动时代的到来。
核心差异对比(表格):
维度 | 传统AI | 深度学习 |
---|---|---|
特征工程 | 人工设计 | 自动提取 |
可扩展性 | 场景受限 | 跨领域迁移 |
数据依赖性 | 低(规则明确) | 高(需大量标注) |
第二章 深度学习架构的多元化创新
2.1 卷积网络(CNN)的变体与优化
- 残差网络(ResNet):通过跳跃连接解决梯度消失,层数可达1000+(如ResNet-152)
- 轻量化设计:MobileNet利用深度可分离卷积,参数量减少90%(适合移动端部署)
2.2 Transformer与自注意力机制
- ViT(Vision Transformer):将图像分块为序列,在ImageNet上准确率超CNN
- 混合架构:Swin Transformer引入局部窗口注意力,降低计算复杂度
数学原理:
自注意力计算:
Attention ( Q , K , V ) = softmax ( Q K T d k ) V \text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V Attention(Q,K,V)=softmax(dkQKT)V