【知识补充】克拉美罗界相关推导和计算

FIM(Fisher Information Matrix,费舍尔信息矩阵)

费舍尔信息矩阵(FIM) 用来度量 参数估计的精度。它描述了在给定观测数据的条件下,我们对模型参数(例如位置、速度、角度等)能了解多少信息;信息越多,理论上能把参数估得越精确。

定义

标量参数 $(\theta)$:
$[
\mathrm{FIM}(\theta)
= \mathcal I(\theta)
= -,\mathbb{E}!\left[\frac{\partial^2}{\partial \theta^2},\ln L(\theta)\right],
]$
其中 $(L(\theta))$ 是 似然函数(也常写作 $(p(\text{data}\mid\theta))$)。

向量参数 $(\boldsymbol{\theta}\in\mathbb{R}^p)$:
$[
\mathbf I(\boldsymbol{\theta})
= \mathbb{E}!\left[
\big(\nabla_{\boldsymbol{\theta}}\ln p(\mathbf x\mid \boldsymbol{\theta})\big)
\big(\nabla_{\boldsymbol{\theta}}\ln p(\mathbf x\mid \boldsymbol{\theta})\big)^{!\top}
\right]
= -,\mathbb{E}!\left[\nabla_{\boldsymbol{\theta}}^{2}\ln p(\mathbf x\mid \boldsymbol{\theta})\right].
]$

符号说明

  • $(L(\theta)) / (p(\mathbf x\mid\theta))$:给定参数时,数据的(对数)似然。
  • $(\nabla)、(\nabla^2)$:梯度与海森矩阵(对参数的一阶、二阶导)。
  • $(\mathbb{E}[\cdot])$:对数据的期望(在真实参数下)。

物理意义

  • 对角线元素:某个参数自身的“信息量”(可估精度)。
  • 非对角元素:参数间的耦合/相关信息。
  • 与 CRB 的关系:FIM 的逆给出 Cramér–Rao 下界(CRB),即无偏估计量方差的理论下限:
    • 标量:$(\mathrm{Var}(\hat\theta)\ \ge\ 1/\mathcal I(\theta))$
    • 向量:$(\mathrm{Cov}(\hat{\boldsymbol{\theta}})\ \succeq\ \mathbf I(\boldsymbol{\theta})^{-1})$

直观理解

  • 似然的对数曲线对参数越“陡”(二阶导绝对值越大),表示数据对该参数越敏感 ⇒ 信息越多可达到的方差下界越小(估计更准)。

小例子:定位/到达角估计

  • 观测模型(简化):$(\mathbf x = \mathbf a(\theta),s + \mathbf w)$,其中 $(\mathbf a(\theta))$ 是阵列导向向量,$(\mathbf w\sim\mathcal{CN}(0,\sigma^2\mathbf I))$。
  • 由该模型的似然 $(p(\mathbf x\mid \theta,s)) 可按上式求得 (\mathbf I(\theta, s))$,再用 Schur 补消去杂参 $(s)$,得到关于 $(\theta)$ 的等效信息量 $(\mathcal I_\theta)$。
  • 最终 $(\mathrm{CRB}(\theta)=\mathcal I_\theta^{-1})$ 给出 到达角 估计的理论精度下界;它随 阵元数、阵列孔径、快拍数、SNR 增大而降低(更精确)。

2. Jacobian Matrix(雅可比矩阵)

雅可比矩阵 是由向量值函数对其输入变量的一阶偏导数组成的矩阵,刻画多变量函数在某点的局部线性变化率。

定义

设向量值函数
$[
\mathbf{f}(\mathbf{x}) = \begin{bmatrix} f_1(\mathbf{x}) \ f_2(\mathbf{x}) \ \vdots \ f_m(\mathbf{x}) \end{bmatrix},
\quad \mathbf{x} = \begin{bmatrix} x_1 \ x_2 \ \vdots \ x_n \end{bmatrix},
]$
则雅可比矩阵 $( \mathbf{J}(\mathbf{x}) \in \mathbb{R}^{m \times n} )$ 为
$[
\mathbf{J}(\mathbf{x}) =
\begin{bmatrix}
\frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n} \
\frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n} \
\vdots & \vdots & \ddots & \vdots \
\frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}
\end{bmatrix}.
]$

物理意义

  • 反映输出对各输入的小扰动的灵敏度耦合关系
  • 常用于线性化非线性系统(在工作点附近用一阶近似)。
  • 在优化中用于构造一阶/二阶方法(如 Gauss–Newton、Levenberg–Marquardt)。

例子(定位直觉)

在目标定位中,传感器的每个测量值都是目标状态(位置、速度等)的函数。雅可比矩阵描述“目标状态微小变化会如何改变各个测量”,从而衡量系统对状态的敏感度。


3. FIM 与雅可比矩阵的关系

  • 在很多模型(例如高斯噪声、同方差、独立测量)下,费舍尔信息矩阵(FIM) 可由雅可比矩阵给出:
    $[
    \mathbf{I} ;=; \mathbf{J}(\mathbf{t}_u)^{!\top}, \mathbf{J}(\mathbf{t}_u)
    ]$

    更一般地,若观测协方差为 $(\boldsymbol{\Sigma})$,则 $(\mathbf{I}=\mathbf{J}^{!\top}\boldsymbol{\Sigma}^{-1}\mathbf{J})$。

  • 这里 $(\mathbf{t}_u)$ 是待估参数向量,$(\mathbf{J}(\mathbf{t}_u))$ 为对该参数的雅可比矩阵。

  • 通过 $(\mathbf{I})$ 的逆即可得到 Cramér–Rao 下界(CRB),量化可达估计方差的下界。


总结

  • 雅可比矩阵:一阶偏导数组成,度量输入→输出的局部线性映射。
  • FIM:度量“数据对参数的信息量”;常可由雅可比(及噪声协方差)构造。
  • 联系:有了 $(\mathbf{J})$ 就能构造 $(\mathbf{I})$,进一步得到 CRB 来评估参数估计的理论精度。
    alt text
    论文Cooperative Sensing in Cell-free Massive MIMO ISAC Systems: Performance Optimization and Signal Processing中的公式中
  • $(J(t_u^N)) 是 (\mathbf t)$ 空间的 FIM。
  • $(P,J(t_u^N),P^{\mathsf T})$ 是关于 $(\mathbf p)$ 的 FIM。
  • CRB:就是它的逆(在可逆、无偏条件下)。

【知识补充】克拉美罗界相关推导和计算
http://example.com/2025/08/20/克拉美罗/
作者
Yichen Wu
发布于
2025年8月20日
许可协议