高斯过程
高斯过程(Gaussian Process)是观测值出现在一个连续域(例如时间或空间)的随机过程。在高斯过程中,连续输入空间中每个点都是与一个正态分布的随机变量相关联。此外,这些随机变量的每个有限集合都有一个多元正态分布,换句话说他们的任意有限线性组合是一个正态分布。高斯过程的分布是所有那些(无限多个)随机变量的联合分布,正因如此,它是连续域(例如时间或空间)上函数的分布。
高斯过程是非常有用的模型,可以用来表示函数的分布。高斯过程不仅可以建模任意黑箱函数,同样可以用来建模不确定性。
我们考虑一个简单的回归问题,不包含噪声。
- 假设我们有一个函数映射:$f:\mathbb{R}\rightarrow\mathbb{R}$
- $\mathbf{x}=[x_ 1, \ldots, x_N]^T, \mathbf{y}=[y_ 1, \ldots, y_N]^T$,其中$y_i = f(x_i)$
- 我们希望能够预测一个新的输入$\mathbf{x}_*$ 时,对应$f$的值
高斯过程背后的关键点是函数可以使用无限维的多元高斯分布建模。换句话说,每个点都和随机变量相关,随见变量的联合分布可以建模成多元高斯分布。
一个简单的高斯过程回归建模的程序如下:
1 | from __future__ import division |
参考资料
[1] http://bridg.land/posts/gaussian-processes-1
[2] https://www.youtube.com/watch?v=4vGiHC35j9s