广义线性模型

众所周知，线性模型是：
$$
\begin{align}y &= \beta_0 + x_1 \beta_1 +x_2 \beta_2 +\cdots + x_p \beta_p + \epsilon\\&= x^T \beta + \epsilon\end{align}
$$
那么广义线性模型（Generalized linear models,GLM）相当于把y变为了$g(y)$。

指数族分布

可以写成
$$
p(y|\theta) = \exp {\frac{\theta y - b(\theta)}{a(\phi)} + c(y,\phi)}
$$
a通常定义为，其中w是样本权重：
$$
a(\phi) = \frac{\phi}{w_i}
$$

广义线性模型

一个线性预测器 $\eta=\beta^Tx$，被称为系统组件(systematic component)。
一个指数族分布作为响应变量 Y概率分布$P（Y；\theta)$，被称为随机组件(random component)。
一个连接函数（link function） g 使得 $\eta=g(\mu)$，$\mu$是Y 的期望，连接函数描述系统组件和随机组件之间的关系。

PRML上称$g^{-1}$为激活函数（activation function）。

g要求是任意可微和可逆的，也就是说g是单调的。

但是我也找到一篇印度人写的《GENERALIZED LINEAR MODELS WITH NON-MONOTONIC LINK FUNCTION》，似乎是不用单调连接函数，但可惜没有找到pdf，未能浏览全文。

如何优化

最大似然估计

梯度法

牛顿法

等等

参考资料

https://www.zhangzhenhu.com/glm/source/%E5%B9%BF%E4%B9%89%E7%BA%BF%E6%80%A7%E6%A8%A1%E5%9E%8B/content.html

PRML

#机器学习

广义线性模型

https://lijianxiong.space/2021/20210921/

作者

LJX

发布于

2021年9月21日

许可协议

《费尔巴哈和德国古典哲学的终结》上一篇

《中县干部》下一篇