推荐序一
推荐序二
推荐序三
中文版前言
英文版前言
致谢
作者介绍
符号表
第 1 章 绪论 1
1.1 机器学习中的优化问题举例 1
1.1.1 正则化的经验损失模型 1
1.1.2 矩阵填充及低秩学习模型 3
1.2 一阶优化算法 3
1.3 加速算法中的代表性工作综述 4
1.4 关于本书 7
参考文献 7
第 2 章 无约束凸优化中的加速算法 14
2.1 梯度下降法 14
2.2 重球法 15
2.3 加速梯度法 16
2.4 求解复合凸优化问题的加速梯度法 23
2.4.1 第一种 Nesterov 加速邻近梯度法 23
2.4.2 第二种 Nesterov 加速邻近梯度法 27
2.4.3 第三种 Nesterov 加速邻近梯度法 31
2.5 非精确加速邻近梯度法 33
2.5.1 非精确加速梯度法 42
2.5.2 非精确加速邻近点法 42
2.6 重启策略 43
2.7 平滑策略 45
2.8 高阶加速方法 50
2.9 从变分的角度解释加速现象 55
参考文献 60
第 3 章 带约束凸优化中的加速算法 63
3.1 线性等式约束问题的一些有用结论 63
3.2 加速罚函数法 66
3.2.1 一般凸目标函数 71
3.2.2 强凸目标函数 71
3.3 加速拉格朗日乘子法 72
3.3.1 原始问题的解 74
3.3.2 加速增广拉格朗日乘子法 76
3.4 交替方向乘子法及非遍历意义下的加速算法 77
3.4.1 情形 1:一般凸和非光滑目标函数 82
3.4.2 情形 2:强凸非光滑目标函数 83
3.4.3 情形 3:一般凸和光滑目标函数 85
3.4.4 情形 4:强凸和光滑目标函数 87
3.4.5 非遍历意义收敛速度 88
3.5 原始–对偶算法 98
3.5.1 情形 1:两个函数均非强凸 100
3.5.2 情形 2:只有一个函数强凸 101
3.5.3 情形 3:两个函数均强凸 103
3.6 Frank-Wolfe 算法 104
参考文献 108
第 4 章 非凸优化中的加速梯度算法 112
4.1 带冲量的邻近梯度法 112
4.1.1 收敛性理论 113
4.1.2 单调加速邻近梯度法 120
4.2 快速收敛到临界点 120
4.2.1 能够检测强凸性质的 AGD 121
4.2.2 负曲率下降算法 123
4.2.3 非凸加速算法 125
4.3 快速逃离鞍点 128
4.3.1 几乎凸的情形 128
4.3.2 完全非凸情形 130
4.3.3 非凸加速梯度下降法 131
参考文献 136
第 5 章 加速随机算法 138
5.1 各自凸情况 139
5.1.1 加速随机坐标下降算法 140
5.1.2 方差缩减技巧基础算法 147
5.1.3 加速随机方差缩减方法 152
5.1.4 黑盒加速算法 158
5.2 各自非凸情况 160
5.3 非凸情况 166
5.3.1 随机路径积分差分估计子 167
5.3.2 冲量加速 173
5.4 带约束问题 174
5.5 无穷情况 197
参考文献 200
第 6 章 加速并行算法 202
6.1 加速异步算法 202
6.1.1 异步加速梯度下降算法 203
6.1.2 异步加速随机坐标下降算法 215
6.2 加速分布式算法 227
6.2.1 中心化模式 227
6.2.2 去中心化模式 232
参考文献 243
第 7 章 总结 246
参考文献 247
附录 A 数学基础 249
A.1 代数与概率 249
A.2 凸分析 250
A.3 非凸分析 257
参考文献 259
缩略语表 260
索引 262
· · · · · · (收起)