惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

爱范儿
爱范儿
Security Latest
Security Latest
NISL@THU
NISL@THU
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
C
Cybersecurity and Infrastructure Security Agency CISA
Cloudbric
Cloudbric
T
Threat Research - Cisco Blogs
大猫的无限游戏
大猫的无限游戏
C
CXSECURITY Database RSS Feed - CXSecurity.com
阮一峰的网络日志
阮一峰的网络日志
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
雷峰网
雷峰网
C
Cisco Blogs
V
Vulnerabilities – Threatpost
S
Security Archives - TechRepublic
V
Visual Studio Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
J
Java Code Geeks
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Know Your Adversary
Know Your Adversary
博客园 - 叶小钗
腾讯CDC
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
P
Privacy International News Feed
P
Palo Alto Networks Blog
博客园_首页
V
V2EX
WordPress大学
WordPress大学
Schneier on Security
Schneier on Security
月光博客
月光博客
博客园 - 司徒正美
Google DeepMind News
Google DeepMind News
TaoSecurity Blog
TaoSecurity Blog
博客园 - 聂微东
酷 壳 – CoolShell
酷 壳 – CoolShell
人人都是产品经理
人人都是产品经理
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 【当耐特】
The Cloudflare Blog
罗磊的独立博客
美团技术团队
N
News | PayPal Newsroom
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Last Week in AI
Last Week in AI
K
Kaspersky official blog
Google Online Security Blog
Google Online Security Blog
S
SegmentFault 最新的问题
Application and Cybersecurity Blog
Application and Cybersecurity Blog
T
Tailwind CSS Blog

又见苍岚

COLMAP PatchMatch Stereo 算法详解 事件驱动的状态机框架:从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 分段五次多项式插值原理详解 路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件,因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程 大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录 机器人仿真平台 Gazebo 简介 多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案 全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为 图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件(PGM/YAML)规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具 私人云音乐平台 Navidrome 入门 手眼标定 四元数(Quaternions) OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼 一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面 公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决 阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换 修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误
广义逆矩阵(伪逆矩阵)
Yiwei Zhang · 2023-04-03 · via 又见苍岚

我们之前介绍过逆矩阵,可逆矩阵在线性代数中地位重要,应用方便。但遗憾的是,不是所有的矩阵都是可逆矩阵。我们有必要对矩阵的逆进行推广,使得每个矩阵甚至是非方块的矩阵都有广义的逆。

源起

设 $ \boldsymbol{A} $ 是 $ n \times n $ 可逆方阵, $ \boldsymbol{b} $ 是任意一个 $ n $ 维向量, 则方程组:
$$
A \boldsymbol{x}=\boldsymbol{b}
$$
总有解, 且解 $ \boldsymbol{x} $ 可表为:
$$
\boldsymbol{x}=\boldsymbol{A}^{-1} \boldsymbol{b}
$$
现设 $ \boldsymbol{A} $ 是任意 $ m \times n $ 阵, $ \boldsymbol{b} $ 是一个 $ m $ 维向量, 是否存在 $ n \times m $ 矩阵 $ \boldsymbol{G} $, 使 得只要方程 $ A x=b $ 有解, 则:
$$
\boldsymbol{x}=\boldsymbol{G b}
$$
这样的矩阵 $ \boldsymbol{G} $ 就涉及到广义逆的概念.

广义逆

广义逆 (generalized inverse), 也称伪逆(pseudoinverse),大多数情况下都是指 Moore-Penrose 广义逆矩阵 (Moore-Penrose pseudoinverse)。

也有说法将 M-P 广义逆矩阵称为伪逆矩阵,在这种表述下伪逆是一种特殊的广义逆。

Moore 广义逆矩阵

F. H. Moore 于 1920 年给出了矩阵的广义逆的概念:

  • 设 $ \boldsymbol{A} \in \mathbb{C}^{m \times n} $, 如果 $ \boldsymbol{G} \in \mathbb{C}^{n \times m} $ 满足
    $$
    \boldsymbol{A} \boldsymbol{G}=P_{R(\boldsymbol{A}), N\left(\boldsymbol{A}^{\mathrm{H}}\right)}, \quad \boldsymbol{G} \boldsymbol{A}=P_{R\left(\boldsymbol{A}^{\mathrm{H}}\right), N(\boldsymbol{A})}
    $$
    其中 $ P_{R(\boldsymbol{A}), N\left(\boldsymbol{A}^{\mathrm{H}}\right)} $ 表示沿子空间 $ N\left(\boldsymbol{A}^{\mathrm{H}}\right) $ 向子空间 $ R(\boldsymbol{A}) $ 上的正交投影算子, $ P_{R\left(\boldsymbol{A}^{\mathrm{H}}\right), N(\boldsymbol{A})} $ 表示沿子空间 $ N(\boldsymbol{A}) $ 向子空间 $ R\left(\boldsymbol{A}^{\mathrm{H}}\right) $ 上的正交投影算子, 则称 $ \boldsymbol{G} $ 为 $ \boldsymbol{A} $ 的 Moore 广义逆矩阵.

Penrose 广义逆矩阵

Moore 广义逆矩阵的含义不容易理解和应用, 因此 Moore 给出的广义逆矩阵一直未被 重视。 直到 1955 年剑桥大学的博士研究生 Roger Penrose 给出了广义逆矩阵的 另一个等价定义, 才使得广义逆矩阵的研究获得迅速发展。

  • 设 $ \boldsymbol{A} \in \mathbb{C}^{m \times n} $, 如果 $ \boldsymbol{G} \in \mathbb{C}^{n \times m} $ 同时满足:

    $$ \begin{array}{l} (1) \quad \boldsymbol{A} \boldsymbol{G A}=\boldsymbol{A} ,\\ (2) \quad \boldsymbol{G A} \boldsymbol{G}=\boldsymbol{G} ,\\ (3) \quad (\boldsymbol{A} \boldsymbol{G})^{\mathrm{H}}=\boldsymbol{A} \boldsymbol{G} ,\\ (4) \quad (\boldsymbol{G} \boldsymbol{A})^{\mathrm{H}}=\boldsymbol{G} \boldsymbol{A} , \end{array} $$

    则称 $ G $ 为 $ A $ 的 Penrose 广义逆矩阵, 简称为 Penrose 广义逆, 记为 $ A^{+} $, 或 $ A^{\dagger} $。

    这里 $ A^{H} $ 表示 $ A $ 的共轭转置矩阵。

矩阵的 Moore 广义逆与 Penrose 广义逆是等价的, 并且是唯一的, 故也称为 M-P广义逆

证明M-P广义逆唯一

存在性

设 $ r=\operatorname{rank}(A) $ ,则必定存在 $ m $ 阶可迕矩阵 $ P $ 以及 $ n $ 阶可迕矩阵 $ Q $, 使得:

$$ A=P\left(\begin{array}{cc}E_{r} & O \\ O & O\end{array}\right) Q $$

设 $ m \times r $ 矩阵 $ B=P\left(\begin{array}{c}E_{r} \\ O\end{array}\right), r \times n $ 矩阵 $ C=\left(\begin{array}{ll}E_{r} & O\end{array}\right) Q $

则 $ B $ 是列满秩矩阵, $ C $ 是行满秩矩阵,且 $ A=B C $ (事实上,任意矩阵都能分解为一个列满秩 矩阵与一个行满秩矩阵的乘积,这种分解叫做满秩分解)

此时 $ C C^{H} , B^{H} B $ 均为 $ r $ 阶可逆矩阵 (提示: 验证 $ \operatorname{rank}\left(C C^{H}\right)=\operatorname{rank}( C )=r $, 可仿照实 矩阵中二次型的方法,利用复矩阵中共轭二次型予以证明)

令 $ X=C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H}=C^{H}\left(B^{H} A C^{H}\right)^{-1} B^{H} $ ,则 $$ A X A=B C C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H} B C=B C=A $$ $$ \begin{aligned} A X A & =B C C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H} B C=B C=A \\ X A X & =C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H} B C C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H} \\ & =C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H} \\ & =X \\ (A X)^{H} & =\left(B C C^{H}\left(C C^{H}\right)^{-1}\left(B^{H} B\right)^{-1} B^{H}\right)^{H} \\ & =\left(B\left(B^{H} B\right)^{-1} B^{H}\right)^{H} \\ & =A X\end{aligned} $$

同理, $ (X A)^{H}=X A $

存在性得证

唯一性

若 $ Y $ 也是 $ A $ 的M-P广义逆矩阵,则

$$ A Y A=A, Y A Y=Y,(Y A)^{H}=Y A,(A Y)^{H}=A Y $$ $$ \begin{aligned} Y & =Y A Y \\ & =Y A X A Y \\ & =Y(A X)^{H}(A Y)^{H} \\ & =Y(A Y A X)^{H} \\ & =Y(A X)^{H} \\ & =Y A X \\ & =Y A X A X \\ & =(Y A)^{H}(X A)^{H} X \\ & =(X A Y A)^{H} X \\ & =(X A)^{H} X \\ & =X A X \\ & =X\end{aligned} $$

唯一性得证。

M-P广义逆

借助奇异值分解 (SVD) 计算 M-P 广义逆矩阵。我们知道对于任意一个矩阵均可以采用 SVD,对 $ m \times n $ 矩阵 $ A $ 分解得:
$$
A=U \Sigma V^{T}
$$
其中, $ U $ 和 $ V^{T} $ 为 $ m \times m $ 的正交单位阵, $ \Sigma $ 为 $ m \times n $ 的对角矩阵。记 $ A $ 的 M-P 广义逆矩阵为 $ A^{+} $,那么有:
$$
A^{+}=V \Sigma^{+} U^{T}
$$
其中, $ \Sigma^{+} $为 $ \Sigma $ 的 M-P 广义逆,计算方法为先将 $ \Sigma $ 对角线上的非零元素取倒数,再将整个矩阵转置,即可得到 $ \Sigma^{+} $。

广义逆矩阵

若矩阵 $ \boldsymbol{G} $ 满足条件 $(1), (2), (3), (4)$ 中的部分或全部, 则称 $ \boldsymbol{G} $ 为 $ \boldsymbol{A} $ 的广 义逆矩阵, 简称为广义逆.

种类

若 $ \boldsymbol{G} $ 只满足条件 (1), 则 $ \boldsymbol{G} $ 为 $ \boldsymbol{A} $ 的 $ {1} $-逆, 记为 $ \boldsymbol{G} \in \boldsymbol{A}{1} $. 若 $ \boldsymbol{G} $ 只满足条件 (1), (2), 则 $ \boldsymbol{G} $ 为 $ \boldsymbol{A} $ 的 $ {1,2} $-逆, 记为 $ \boldsymbol{G} \in \boldsymbol{A}{1,2} $. 满足条件 (1), (2), (3), (4) 的部分或全部的广义逆矩阵共有 15 类, 即:

$$ \mathrm{C}_{4}^{1}+\mathrm{C}_{4}^{2}+\mathrm{C}_{4}^{3}+\mathrm{C}_{4}^{4}=15 $$

常用的广义逆是以下 5 类:

$$ \boldsymbol{A}\{1\}, \quad \boldsymbol{A}\{1,2\}, \quad \boldsymbol{A}\{1,3\}, \quad \boldsymbol{A}\{1,4\}, \quad \boldsymbol{A}^{+} . $$

注意

  1. 只有 $ \boldsymbol{A}^{+} $是唯一的, 而其他各种广义逆矩阵都不是唯一的.

  2. 当 $\boldsymbol{A}$ 是可逆矩阵时, 它的所有广义逆矩阵都等于 $\boldsymbol{A} ^ {−1}$ .

存在性

  • 定理 : 任意 $ m \times n $ 矩阵 $ A \in \mathbb{C}^{m \times n} $ 都有广义逆矩阵

证明:

设 $ r=\operatorname{rank}(A) $, 则必定存在 $ m $ 阶可逆矩阵 $ P $ 以及 $ n $ 阶可逆矩阵 $ Q $, 使得:

$$ A=P\left(\begin{array}{cc}E_{r} & O \\ O & O\end{array}\right) Q $$

取 $ X=Q^{-1}\left(\begin{array}{cc}E_{r} & X_{1} \\ X_{2} & X_{2} X_{1}\end{array}\right) P^{-1} $ , 其中 $ X_{1} , X_{2} $ 分别是任意 $ r \times(n-r) $ 矩阵以及 $ (m-r) \times r $ 矩阵,则这样的 $ X $ 就是 $ A $ 的广义逆矩阵。

上述证明过程提供了求广义逆矩阵的一种方法,从证明过程中也可以看出广义逆矩阵不一定唯一

对于矩阵 $ A=\left(\begin{array}{ll}1 & 0 \\ 0 & 0\end{array}\right) $ ,有: 对任意的复数 $ a, b , B=\left(\begin{array}{cc}1 & a \\ b & a b\end{array}\right) $ 都是 $ A $ 的广义逆矩阵

广义逆的性质

- 定理:设 $ A \in \mathbb{C}^{m \times n} $, 则: $$ \begin{array}{l} (1) \quad \left(A^{+}\right)^{+}=A ,\\ (2) \quad \left(A^{H}\right)^{+}=\left(A^{+}\right)^{H} ,\\ (3) \quad \left(A^{H} A\right)^{+}=A^{+}\left(A^{H}\right)^{+}=A^{+}\left(A^{+}\right)^{H},\\ (4) \quad \left(A A^{H}\right)^{+}=\left(A^{H}\right)^{+} A^{+}=\left(A^{+}\right)^{H} A^{+} ,\\ (5)\quad A^{+}=A^{H}\left(A A^{H}\right)^{+}=\left(A^{H} A\right)^{+} A^{H} \end{array} $$

证明 : (1) (2) (3) (4) 可以通过定义直接验证, 对于(5)

$$ \begin{array}{l}A^{H}\left(A A^{H}\right)^{+}=A^{H}\left(A^{+}\right)^{H} A^{+}=\left(A^{+} A\right)^{H} A^{+}=A^{+} A A^{+}=A^{+} \\ \left(A^{H} A\right)^{+} A^{H}=A^{+}\left(A^{+}\right)^{H} A^{H}=A^{+}\left(A A^{+}\right)^{H}=A^{+} A A^{+}=A^{+}\end{array} $$

需要注意的是,一般来说, $ (A B)^{+}=B^{+} A^{+} $ 不一定成立

  • 定理:设 $ A \in \mathbb{C}^{m \times n} $ ,则 $ \operatorname{rank}(A)=\operatorname{rank}\left(A^{+}\right) $

    $$ \begin{array}{c} \operatorname{rank}(A)=\operatorname{rank}\left(A A^{+} A\right) \leq \operatorname{rank}\left(A^{+} A\right) \leq \operatorname{rank}(A) ,\\ \operatorname{rank}\left(A^{+}\right)=\operatorname{rank}\left(A^{+} A A^{+}\right) \leq \operatorname{rank}\left(A^{+} A\right) \leq \operatorname{rank}\left(A^{+}\right) \end{array} $$

方程组求解应用

齐次线性方程组的通解

  • 定理:设 $ A \in \mathbb{C}^{m \times n} $,则齐次线性方程组 $ A x=0 $ 的通解为
    $$
    x=y-A^{+} A y=\left(E-A^{+} A\right) y
    $$
    其中 $ y \in \mathbb{C}^{n} $ 是任意的,这样的通解能表示所有的解。

证明:

对任意的 $ y \in \mathbb{C}^{n} $, 有
$$
A\left(y-A^{+} A y\right)=A y-A A^{+} A y=A y-A y=0
$$
从而 $ x=y-A^{+} A y=\left(E-A^{+} A\right) y $ 是齐次线性方程组的解

反过来,对于齐次线性方程组的任意解 $ x_{0} $ ,有 $ A x_{0}=0 $
$$
x_{0}=x_{0}-0=x_{0}-A^{+} A x_{0}=\left(E-A^{+} A\right) x_{0}
$$
从而 $ x=y-A^{+} A y=\left(E-A^{+} A\right) y $ 是齐次线性方程组的通解。

  • 推论: 设 $ A \in \mathbb{C}^{m \times n} $,则齐次线性方程组 $ A x=0 $ 只有零解的充要条件是
    $$
    A^{+} A=E
    $$

非齐次线性方程组有解的充要条件

  • 定理: 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $, 则线性方程组 $ A x=b $ 有解的充要条件是 $ A A^{+} b=b $

证明:

充分性: 此时 $ x=A^{+} b $ 就是原线性方程组的特解

必要性: 设 $ x_{0} $ 是原线性方程组的一特解,则 $ A x_{0}=b $

则 $ A A^{+} b=A A^{+} A x_{0}=A x_{0}=b $

  • 推论: 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $ ,若线性方程组 $ A x=b $ 有解,则其通解为
    $$
    x=A^{+} b+y-A^{+} A y
    $$
    其中 $ y \in \mathbb{C}^{n} $ 是任意的,这样的通解能表示所有的解。
例题
  • 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $ ,则线性方程组 $ A^{H} A x=A^{H} b $ 一定有解,并求出其通解

证:此时

$$ \begin{aligned}\left(A^{H} A\right)\left(A^{H} A\right)^{+} A^{H} b & =A^{H} A A^{+}\left(A^{+}\right)^{H} A^{H} b \\ & =A^{H} A A^{+}\left(A A^{+}\right)^{H} b \\ & =A^{H} A A^{+} A A^{+} b \\ & =A^{H} A A^{+} b \\ & =A^{H}\left(A A^{+}\right)^{H} b \\ & =\left(A A^{+} A\right)^{H} b \\ & =A^{H} b\end{aligned} $$

即 $x=(A^{H} A)+AHb$ 是线性方程组的一组特解,故原方程组有解

特解可以写为:

$$ \begin{aligned}\left(A^{H} A\right)^{+} A^{H} b & =A^{+}\left(A^{+}\right)^{H} A^{H} b \\ & =A^{+}\left(A A^{+}\right)^{H} b \\ & =A^{+} A A^{+} b \\ & =A^{+} b\end{aligned} $$ 而 : $$ \begin{aligned} y-\left(A^{H} A\right)^{+}\left(A^{H} A\right) y & =y-A^{+}\left(A^{+}\right)^{H} A^{H} A y \\ & =y-A^{+}\left(A A^{+}\right)^{H} A y \\ & =y-A^{+} A A^{+} A y \\ & =y-A^{+} A y\end{aligned} $$ 故其通解为 :

$$
x=A^{+} b+y-A^{+} A y
$$
其中 $ y \in \mathbb{C}^{n} $ 是任意的。

从这里也可以看出,两个齐次线性方程组 $ A^{H} A x=0 $ 与 $ A x=0 $ 同解

相容方程组的最小模解

  • 定义: 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{n} $ ,若线性方程组 $ A x=b $ 有解(从而为相容方程组),则称相容方程组 $ A x=b $ 的所有解 $ x $ 中长度(模) $ |x|=\sqrt{(x, x)}=\sqrt{x^{H} x} $ 最小的解为相容方程组 $ A x=b $ 的最小模解。

相容方程组 $ A x=b $ 的通解为:
$$
x=A^{+} b+y-A^{+} A y
$$
其中 $ y \in \mathbb{C}^{n} $ 是任意的,则有:

$$ \begin{aligned} |x|^2=& \left(A^{+} b+y-A^{+} A y\right)^{H}\left(A^{+} b+y-A^{+} A y\right) \\ = & \left(A^{+} b\right)^{H}\left(A^{+} b\right)+\left(A^{+} b\right)^{H}\left(E-A^{+} A\right) y+ \left(\left(E-A^{+} A\right) y\right)^{H}\left(A^{+} b\right)+\left(y-A^{+} A y\right)^{H}\left(y-A^{+} A y\right)\end{aligned} $$ 而: $$ \begin{aligned}\left(A^{+} b\right)^{H}\left(E-A^{+} A\right) y & =b^{H}\left(\left(A^{+}\right)^{H}-\left(A^{+}\right)^{H}\left(A^{+} A\right)\right) y \\ & =b^{H}\left(\left(A^{+}\right)^{H}-\left(A^{+}\right)^{H}\left(A^{+} A\right)^{H}\right) y \\ & =b^{H}\left(\left(A^{+}\right)^{H}-\left(A^{+} A A^{+}\right)^{H}\right) y \\ & =b^{H}\left(\left(A^{+}\right)^{H}-\left(A^{+}\right)^{H}\right) y \\ & =0\end{aligned} $$ 同理 $ \left(\left(E-A^{+} A\right) y\right)^{H}\left(A^{+} b\right)=0 $ 故: $$ \begin{aligned} & \left(A^{+} b+y-A^{+} A y\right)^{H}\left(A^{+} b+y-A^{+} A y\right) \\ = & \left(A^{+} b\right)^{H}\left(A^{+} b\right)+\left(y-A^{+} A y\right)^{H}\left(y-A^{+} A y\right) \\ \geq & \left(A^{+} b\right)^{H}\left(A^{+} b\right)\end{aligned} $$ 当且仅当 $ y-A^{+} A y=0 $ 时等号成立,这时相容方程组 $ A x=b $ 的最小模解为 $ x=A^{+} b $, 并且最小模解是唯一的。

任意线性方程组的最小二乘解

无解的方程组又可称为"矛盾方程组",矛盾方程组的最小二乘解一般是不唯一的,所有最小二乘解中的极小二范数解是唯一的,我们一般求矛盾方程组的唯一极小二范数最小二乘解。

  • 定义: 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $ ,线性方程组 $ A x=b $ 可能无解。这时我们称使得长度 $ |A x-b| $ 最小的那个 $ x $ 为线性方程组 $ A x=b $ 的最小二乘解。

    需要注意的是,最小二乘解不一定是方程的解。

  • 定义: 设 $ V $ 是 $ \mathbb{C} $ 上的酉空间, $ x, y \in V $ ,称 $ |x-y| $ 为向量 $ x $ 到向量 $ y $ 的距离,记为 $ d(x, y) $

  • 定义: 设 $ V $ 是 $ \mathbb{C} $ 上的酉空间, $ x \in V , W $ 是 $ V $ 的子空间,称 $ \inf _{y \in W}|x-y| $ 为向量 $ x $ 到子 空间 $ W $ 的距离,记为 $ d(x, W) $

  • 引理: 设 $ V $ 是 $ C $ 上的有限维酉空间, $ x \in V , W $ 是 $ V $ 的子空间,若 $ y_{0} \in W $ 满足 $ x-y_{0} \in W^{\perp} $ ,则 $ \left|x-y_{0}\right|=d(x, W) $

证明:对 $ \forall y \in W $ ,有 $ x-y=x-y_{0}+y_{0}-y $ , $ \left(x-y_{0}\right) \perp\left(y_{0}-y\right) $ ,由勾股定理, $ |x-y|^{2}=\left|x-y_{0}\right|^{2}+\left|y_{0}-y\right|^{2} \geq\left|x-y_{0}\right|^{2} $ 故得证,引理可理解为连接一定点到子空间上的点的连线段中,垂线段最短 设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $ ,现在考虑线性方程组 $ A x=b $ 的最小二乘解。此时 $ \mathbb{C}^{m} $ 是酉空间。设 $ A=\left(\alpha_{1}, \alpha_{2}, \ldots, \alpha_{n}\right) $ 。则 $ W=L\left(\alpha_{1}, \alpha_{2}, \ldots, \alpha_{n}\right) $ 是 $ \mathbb{C}^{m} $ 的子空间。问题转化为求使得 $ \left|b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right)\right| $二范数最小的那个 $ x=\left(x_{1}, x_{2}, \ldots, x_{n}\right)^{T} $ 此时 $ x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n} \in W $ ,由引理,若能使 $ b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right) \in W^{\perp} $, 则这样的 $ x $ 就是 $ A x=b $ 的最小二乘解 此时由 $ b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right) \in W^{\perp} $ 立马可以得到 $$ \begin{array}{l}\left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{1}\right)=0 \\ \left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{2}\right)=0 \\ \ldots \ldots \\ \left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{n}\right)=0\end{array} $$ 即 $$ \begin{array}{l}\alpha_{1}^{H}\left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{1}\right)=0 \\ \alpha_{2}^{H}\left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{1}\right)=0 \\ \cdots \cdots \\ \alpha_{n}^{H}\left(b-\left(x_{1} \alpha_{1}+x_{2} \alpha_{2}+\ldots x_{n} \alpha_{n}\right), \alpha_{1}\right)=0\end{array} $$ 即 $ A^{H} b-A^{H} A x=0 $ ,即 $ A^{H} A x=A^{H} b $ , 我们已经证明了 $ A^{H} A x=A^{H} b $ 一定有解,其通解为 $ x=A^{+} b+y-A^{+} A y $ ,其中 $ y \in \mathbb{C}^{n} $ 是任意的。 反过来,若 $ x_{0} $ 满足 $ A^{H} A x_{0}=A^{H} b $, 则对任意的 $ x \in \mathbb{C}^{n} $ 由 $A x-b=A x_{0}-b+A\left(x-x_{0}\right)$ 以及内积 $$ \begin{array}{l} \left(A x_{0}-b, A\left(x-x_{0}\right)\right)&=\left(A\left(x-x_{0}\right)\right)^{H}\left(A x_{0}-b\right)\\&=\left(x-x_{0}\right)^{H}\left(A^{H} A x_{0}-A^{H} b\right) \\ &=0 \end{array} $$ 得: $$ |A x-b|^{2}=\left|A x_{0}-b\right|^{2}+\left|A\left(x-x_{0}\right)\right|^{2} \geq\left|A x_{0}-b\right|^{2} $$ 其中等号成立当且仅当 $ A\left(x-x_{0}\right)=0 $ ,从而 $ x_{0} $ 是线性方程组 $ A x=b $ 的最小二乘解。 若 $ x_{1} $ 也是线性方程组 $ A x=b $ 的最小二乘解,则由前面的分析可得 $ A\left(x_{1}-x_{0}\right)=0 $, 从而可推得 $ A^{H} A x_{1}=A^{H} b $ 也成立。

由上述分析可得

  • 定理 :设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $, 则下面两个命题等价
  1. $ x_{0} $ 是线性方程组 $ A x=b $ 的最小二乘解
  2. $A^{H} A x_{0}=A^{H} b $

此时线性方程组 $ A x=b $ 的最小二乘解的表达式为 $ x=A^{+} b+y-A^{+} A y $ ,其中 $ y \in \mathbb{C}^{n} $ 是 任意的。

  • 定义 :设 $ A \in \mathbb{C}^{m \times n}, b \in \mathbb{C}^{m} $,称方程组 $ A x=b $ 的所有最小二乘解 $ x $ 中长度(模) $ |x|=\sqrt{(x, x)}=\sqrt{x^{H} x} $ 最小的 $ x $ 为相容方程组 $ A x=b $ 的最佳最小二乘解。

如同之前的分析,我们可以得到方程组 $ A x=b $ 的最佳最小二乘解为 $ x=A^{+} b $ ,并且最佳最小二乘解是唯一的。

课件资料

参考资料

文章链接:
https://www.zywvvd.com/notes/study/linear-algebra/inverse-matrix/gen-inverse-matrix/