udl-chap1-2
信息
本书网站见,https://udlbook.github.io/udlbook/
如何阅读这本书
第一章是概论,作者讲了应该如何学习这本书,
本书中大多数剩余章节包含主体文本、注释部分和一组习题。
主体文本旨在自成一体,可以在不参考章节其他部分的情况下阅读。尽可能地,背景数学被纳入主体文本中。然而,对于较大的主题,如果它会分散论点的主线,背景材料会被附录处理,并在边缘提供参考。书中大多数符号遵循附录A的符号标准。然而,一些约定不太广泛使用,鼓励读者在继续之前查阅附录A。
主体文本包括许多关于深度学习模型和结果的新插图和可视化。我努力提供现有思想的新解释,而不仅仅是整理他人的工作。深度学习是一个新领域,有时现象并不完全清楚。我会明确指出哪些地方情况不明,以及我的解释应谨慎对待。
参考文献仅在章节主体中包含结果被展示的地方。相反,参考文献可以在章节末尾的注释部分找到。我通常不在主体文本中尊重历史先例;如果某个当前技术的前身不再有用,我将不会提及。然而,领域的历史发展在注释部分中进行了描述,并且希望能公平地给予相应的信用。
注释部分按段落组织,提供进一步阅读的指引。它们应帮助读者在子领域内定位自己,并理解其与机器学习其他部分的关系。与主体文本相比,注释部分的自成体系程度较低。根据你的背景知识和兴趣水平,你可能会发现这些部分的用处有所不同。
每章都有若干相关习题。在主体文本中,当应该尝试习题时,会在边缘进行引用。正如乔治·波利亚所言:"数学,您看,不是一项观众运动。"他是对的,我强烈建议您在阅读过程中尝试习题。在某些情况下,它们提供的见解将帮助您理解主体文本。对于在相关网站(http://udlbook.com)上提供答案的习题,会用星号进行标注。此外,帮助您理解本书中思想的Python笔记本也可以通过该网站获得,这些笔记本也在文本的边缘进行了引用。实际上,如果您觉得自己有些生疏,现在可能值得先学习一下关于背景数学的笔记本。
不幸的是,人工智能研究的快速发展使得本书不可避免地将是一项持续的工作。如果您发现某些部分难以理解、明显的遗漏或似乎多余的部分,请通过相关网站与我们联系。我们可以共同努力使下一版更好。
有监督学习
监督学习模型是一个函数
,它将输入 与输出 关联起来,具体关系由参数 决定。为了训练模型,我们在训练数据集 上定义损失函数 ,量化模型预测 与观察到的输出 之间的差异。接着,我们寻找最小化损失的参数,并在不同的测试数据集上评估模型,以检验其对新输入的泛化能力。 接下来的章节(3-9)扩展了这些概念。第3章讨论了浅层神经网络,它比线性回归稍复杂,但能描述更广泛的输入/输出关系。第4章介绍深层神经网络,能够用更少的参数描述复杂函数,并在实践中表现更好。第5章研究不同任务的损失函数,并揭示最小二乘损失的理论基础。第6和第7章讨论训练过程,第8章探讨如何衡量模型性能,第9章考虑正则化技术,以提高模型性能。