阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces
关于:
- 首次发表日期:2024-07-24
- Mathematics for Machine Learning官方链接: https://mml-book.com
- ChatGPT和KIMI机翻,人工润色
- 非数学专业,如有错误,请不吝指出
2.8 仿射空间
接下来,我们将更详细地考察从原点偏移的空间,即不再是向量子空间的空间。此外,我们还将简要讨论这些仿射空间之间映射的性质,这些映射类似于线性映射。
备注。在机器学习文献中,线性和仿射之间的区别有时并不明确,以至于我们可以发现将仿射空间/映射称为线性空间/映射的参考文献。
2.8.1 仿射空间
定义 2.25(仿射子空间)。设 \(V\) 为一个向量空间,\(\boldsymbol{x}_0 \in V\),\(U \subseteq V\) 为一个子空间。那么子集
称为\(V\)的仿射子空间或线性流形(linear manifold)。\(U\)称为方向或方向空间(direction space),\(\boldsymbol{x}_0\)称为支点(support point)。在第12章中,我们将这种子空间称为超平面。
注意,如果\(\boldsymbol{x}_0 \notin U\),则仿射子空间的定义排除了\(\mathbf{0}\)。因此,对于\(\boldsymbol{x}_0 \notin U\),仿射子空间不是\(V\)的(线性)子空间(向量子空间)。
仿射子空间的例子有\(\mathbb{R}^3\)中的点、线和平面,这些点、线和平面不(一定)通过原点。
备注。考虑向量空间\(V\)的两个仿射子空间\(L = \boldsymbol{x}_0 + U\)和\(\tilde{L} = \tilde{\boldsymbol{x}}_0 + \tilde{U}\)。当且仅当\(U \subseteq \tilde{U}\)且\(x_0 - \tilde{x}_0 \in \tilde{U}\)时,\(L \subseteq \tilde{L}\)。
仿射子空间通常由参数描述:考虑一个\(V\)的\(k\)维仿射空间\(L = \boldsymbol{x}_0 + U\)。如果\(\left(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\right)\)是\(U\)的一个有序基,那么每个元素\(\boldsymbol{x} \in L\)都可以唯一地描述为
其中\(\lambda_1, \ldots, \lambda_k \in \mathbb{R}\)。这种表示称为具有方向向量\(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\)和参数\(\lambda_1, \ldots, \lambda_k\)的\(L\)的参数方程。
**例 2.26(仿射子空间)**
- 一维仿射子空间称为直线,可以写作\(\boldsymbol{y}=\boldsymbol{x}_0+\lambda \boldsymbol{b}_1\),其中\(\lambda \in \mathbb{R}\),\(U=\operatorname{span}\left[\boldsymbol{b}_1\right] \subseteq \mathbb{R}^n\)是\(\mathbb{R}^n\)的一维子空间。这意味着直线由一个支点\(\boldsymbol{x}_0\)和一个定义方向的向量\(\boldsymbol{b}_1\) 定义。参见图 2.13 了解示意图。
- \(\mathbb{R}^n\)的二维仿射子空间称为平面。平面的参数方程为\(\boldsymbol{y}=\boldsymbol{x}_0+\lambda_1 \boldsymbol{b}_1+\lambda_2 \boldsymbol{b}_2\),其中\(\lambda_1, \lambda_2 \in \mathbb{R}\),\(U=\operatorname{span}\left[\boldsymbol{b}_1, \boldsymbol{b}_2\right] \subseteq \mathbb{R}^n\)。这意味着平面由一个支点\(\boldsymbol{x}_0\)和两个线性独立的向量\(\boldsymbol{b}_1, \boldsymbol{b}_2\) 定义,这两个向量张成方向空间(span the direction space)。
- 在\(\mathbb{R}^n\)中,\((n-1)\)维仿射子空间被称为超平面,相应的参数方程为\(\boldsymbol{y}=\boldsymbol{x}_0+\sum_{i=1}^{n-1} \lambda_i \boldsymbol{b}_i\),其中\(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1}\)构成\(\mathbb{R}^n\)的一个\((n-1)\)维子空间\(U\)的基。这意味着超平面由一个支点\(\boldsymbol{x}_0\)和\((n-1)\)个线性独立的向量\(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1}\)定义,这些向量张成方向空间。在\(\mathbb{R}^2\)中,直线也是超平面。在\(\mathbb{R}^3\)中,平面也是超平面。
备注(非齐次线性方程组和仿射子空间)。对于\(\boldsymbol{A} \in \mathbb{R}^{m \times n}\)和\(\boldsymbol{x} \in \mathbb{R}^m\),线性方程组\(\boldsymbol{A} \boldsymbol{\lambda}=\boldsymbol{x}\)的解要么是空集,要么是\(\mathbb{R}^n\)中维度为\(n-\operatorname{rk}(\boldsymbol{A})\)的仿射子空间。特别地,当\(\left(\lambda_1, \ldots, \lambda_n\right) \neq (0, \ldots, 0)\)时,线性方程\(\lambda_1 \boldsymbol{b}_1 + \ldots + \lambda_n \boldsymbol{b}_n = \boldsymbol{x}\)的解是\(\mathbb{R}^n\)中的一个超平面。
在\(\mathbb{R}^n\)中,每个\(k\)维仿射子空间都是非齐次线性方程组\(\boldsymbol{A x}=\boldsymbol{b}\)的解,其中\(\boldsymbol{A} \in \mathbb{R}^{m \times n}\),\(\boldsymbol{b} \in \mathbb{R}^m\)并且\(\operatorname{rk}(\boldsymbol{A})=n-k\)。回想一下,对于齐次方程组\(\boldsymbol{A x}=\mathbf{0}\),解是一个向量子空间,我们也可以将其视为一个特殊的仿射空间,其支点为\(\boldsymbol{x}_0=\mathbf{0}\)。
2.8.2 仿射映射
类似于我们在 2.7 节讨论的向量空间之间的线性映射,我们可以在两个仿射空间之间定义仿射映射。线性映射和仿射映射密切相关。因此,我们从线性映射中已经知道的许多性质,例如线性映射的复合(composition)是一个线性映射,也适用于仿射映射。
定义 2.26(仿射映射)。对于两个向量空间\(V, W\),一个线性映射\(\Phi: V \rightarrow W\),以及\(\boldsymbol{a} \in W\),映射
是从\(V\)到\(W\)的仿射映射。向量\(\boldsymbol{a}\)被称为\(\phi\)的平移向量。
- 每一个仿射映射\(\phi: V \rightarrow W\)也是线性映射\(\Phi: V \rightarrow W\)和\(W\)中的平移\(\tau: W \rightarrow W\)的复合,使得\(\phi = \tau \circ \Phi\)。映射\(\Phi\)和\(\tau\) 是唯一确定的(uniquely determined)。
- 仿射映射\(\phi: V \rightarrow W, \phi^{\prime}: W \rightarrow X\)的复合\(\phi^{\prime} \circ \phi\)是仿射的。
- 如果\(\phi\)是双射的,仿射映射保持几何结构不变。它们还保留维度和平行性。