惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

爱范儿
爱范儿
Security Latest
Security Latest
NISL@THU
NISL@THU
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
C
Cybersecurity and Infrastructure Security Agency CISA
Cloudbric
Cloudbric
T
Threat Research - Cisco Blogs
大猫的无限游戏
大猫的无限游戏
C
CXSECURITY Database RSS Feed - CXSecurity.com
阮一峰的网络日志
阮一峰的网络日志
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
雷峰网
雷峰网
C
Cisco Blogs
V
Vulnerabilities – Threatpost
S
Security Archives - TechRepublic
V
Visual Studio Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
J
Java Code Geeks
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Know Your Adversary
Know Your Adversary
博客园 - 叶小钗
腾讯CDC
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
P
Privacy International News Feed
P
Palo Alto Networks Blog
博客园_首页
V
V2EX
WordPress大学
WordPress大学
Schneier on Security
Schneier on Security
月光博客
月光博客
博客园 - 司徒正美
Google DeepMind News
Google DeepMind News
TaoSecurity Blog
TaoSecurity Blog
博客园 - 聂微东
酷 壳 – CoolShell
酷 壳 – CoolShell
人人都是产品经理
人人都是产品经理
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 【当耐特】
The Cloudflare Blog
罗磊的独立博客
美团技术团队
N
News | PayPal Newsroom
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Last Week in AI
Last Week in AI
K
Kaspersky official blog
Google Online Security Blog
Google Online Security Blog
S
SegmentFault 最新的问题
Application and Cybersecurity Blog
Application and Cybersecurity Blog
T
Tailwind CSS Blog

又见苍岚

COLMAP PatchMatch Stereo 算法详解 事件驱动的状态机框架:从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 分段五次多项式插值原理详解 路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件,因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程 大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录 机器人仿真平台 Gazebo 简介 多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案 全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为 图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件(PGM/YAML)规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具 私人云音乐平台 Navidrome 入门 手眼标定 四元数(Quaternions) OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼 一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面 公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决 阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换 修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误
线性变换(linear transformation)
Yiwei Zhang · 2023-03-15 · via 又见苍岚

线性变换 (linear transformation) 是在生活和项目中经常见到的映射方式, 是线性代数(linear algebra)的基本概念,它是一类满足某些特殊性质的变换,本文介绍相关内容。

没人能够清楚地告诉你矩阵是什么,你必须自己亲自看看。 —— 墨菲斯

简介

国外很多线性代数课程的第一课便是线性变换,这个概念比矩阵来的更早。物理学家们通常更关注这个概念本身,关注它们是怎么变换的。但是在我们的学习中为了更方便的计算,引入了坐标系及坐标轴,并且使每一个线性变换都对应一个矩阵,矩阵背后也同样是线性变换的概念

相关定义

变换

变换从本质上讲就是函数的意思。函数的意思就是把一个集合中元素对应到另外一个集合中元素的对应法则。

在线性代数里面,由所有 $n$ 维向量组成一个集合,这些向量之间可以进行加减法运算和数乘运算。把可以进行这两种运算的集合通常成为一个线性空间(linear space),它其中的一组基(basis)所包含的向量的个数,称为线性空间的维度(dimension)。可以看出,所有 $n$ 维向量组成的集合就是一个 $n$ 维线性空间,通常记为$R^n$。

所以总结为一句话:变换的本质,就是从一个线性空间到另一个线性空间的函数。

线性变换

几何要素

线性变换从几何直观有三个要点:

  1. 变换前是直线的,变换后依然是直线
  2. 直线比例保特不变
  3. 变换前是原点的,变换后依然是原点
定义描述

线性映射( linear mapping)是从一个向量空间 $V$ 到另一个向量空间 $W$ 的映射且保持加法运算和数量乘法运算,而线性变换(linear transformation)是线性空间 $V$ 到其自身的线性映射。 —— 百度百科

公式表示

你可以将线性变换理解为一个特殊的函数,这个可以使得 $ V \rightarrow W $ ,并且满足以下条件:

$$ \begin{array}{l}\mathbf{T}(\mathbf{x}+\mathbf{y})=\mathbf{T}(\mathbf{x})+\mathbf{T}(\mathbf{y}) \\ \mathbf{T}(a \mathbf{x})=a \mathbf{T}(\mathbf{x})\end{array} $$

其中 $ x, y \in V , a \in R $ 。

性质

  1. 两个線性映射的复合映射是線性的: 如果 $ f: V \rightarrow W $ 和 $ g: W \rightarrow Z $ 是線性的,則 $ g \circ f: V \rightarrow Z $ 也是線性的。

  2. 若線性映射可逆,則该線性映射的逆也是線性映射。

  3. 如果 $ f_{1}: V \rightarrow W $ 和 $ f_{2}: V \rightarrow W $ 是線性的,則它们的和 $ f_{1}+f_{2} $ 也是線性的(这是由 $ \left(f_{1}+f_{2}\right)(x)=f_{1}(x)+f_{2}(x) $ 定义的)。

  4. 如果 $ f: V \rightarrow W $ 是線性的,而 $ a $ 是基础域 $ K $ 的一个元素,則定义自 $ (a f)(x)=a(f(x)) $ 的映射 $ a f $ 扡是線性的。

  5. 给定有限维的情况,如果基已经选择好了,則線性映射的复合对应于矩阵乘法,線性映射的加法对应于矩阵加法,而線性映射与标量的乘法对应于矩阵与标量的乘法。

示例

线性变换

$$
\mathbf{f}(x, y, z)=(3 x-y, 3 z, 0, z-2 x)
$$

非线性变换

$$ \begin{array}{c}\mathbf{g}(x, y, z)=(3 x-y, 3 z+2,0, z-2 x) \\ \mathbf{h}(x, y, z)=(3 x-y, 3 x z, 0, z-2 x)\end{array} $$

这两个都不是线性变换。

  1. 在函数 $ g $ 中,第二个分量为 $ 3 z+2 , 2 $ 是一个常数,并不包含输 入向量 $ (x, y, z) $ 中的任何分量,也可以换种解释方法,按照 $(1)$ 中的第二个公式,应有 $T(0)=0$,而$g(0,0,0)=(0,2,0,0) $ 与上式矛盾。
  2. 在函数 $h$ 中,很明显含有一个非线性分量 $ 3 x z $ ,因此也不是一个线性变换。

非线性变换图示

  1. 变换后不能保持直线

  1. 变换后原点位置发生了变化 如:在二维平面上的仿射变换(在 3 维视角下仍然时线性变换)

矩阵表示

如果 $ V $ 和 $ W $ 是有限维的,并且在这些空间中有选择好的基,則从 $ V $ 到 $ W $ 的所有线性映射可以被表示为矩阵。反过来说,矩阵生成线性映射的例子:如果 $ A $ 是实 数的 $ m \times n $ 矩阵,则规定 $ f(x)=A x $ 描述一个线性映射 $ R^{n} \rightarrow R^{m} $ 。

设 $ \left\{v_{1}, \cdots, v_{n}\right\} $ 是 $ V $ 的一个基。則在 $ V $ 中所有向量 $ v $ 是唯一的,可以由

$$
c_{1} v_{1}+\cdots+c_{n} v_{n}
$$
的系数 $ c_{1}, \cdots, c_{n} $ 确定。

如果 $ f: V \rightarrow W $ 是线性映射
$$
f\left(c_{1} v_{1}+\cdots+c_{n} v_{n}\right)=c_{1} f\left(v_{1}\right)+\cdots+c_{n} f\left(v_{n}\right)
$$
这蕴涵了这个函数 $ f $ 是完全由

$$
f\left(v_{1}\right), \cdots, f\left(v_{n}\right)
$$
的值确定的。

现在设 $ \left\{w_{1}, \ldots, w_{m}\right\} $ 是 $ W $ 的基。則可以表示每个 $ f\left(v_{j}\right) $ 的值为
$$
f\left(v_{j}\right)=a_{1 j} w_{1}+\cdots+a_{m j} w_{m}
$$
因此函数 $ f $ 是完全由 $ a_{i, j} $ 的值确定的。

如果把这些值放置到 $ m \times n $ 矩阵 $ M $ 中,則可以方便的使用它来计算 $ f $ 对在 $ V $ 中任何向量的值。如果我放置 $ c_{1}, \cdots, c_{n} $ 的值到 $ n \times 1 $ 矩阵 $ C $ ,我们有 $ M C=f(v) $。

一个单一的线性映射可以由很多矩阵表示。这是因为矩阵的元素的值依赖于选择的基。

矩阵表示的优点

对角化的矩阵具有诸多优点。线性映射在写成矩阵后可以进行对角化(不能对角化的矩阵可以化简成接近对角矩阵的准对角矩阵,从而可以获得对角化矩阵拥有的独特优势(极大地简化乘法运算,易于分块,容易看出与基的选取无关的不变量。

比如,对于作用于同一个空间的可对角化的方形矩阵 $ A $ ,要求出 $ A $ 自乘 $ n $ 次后的结果 $ A^{n} $ ,一个一个慢慢地乘是很麻烦的事情。而知道对角化技巧的人会发现,在将这矩阵对角化后,其乘法运算会变得格外简单。实际应用中有很多有意思的问题或解题方法都会涉及到矩阵自乘n次的计算,如1阶非齐次线性递推数列通项公式的线性代数求解法和马尔可夫链的极限状态(极限分布)的求解。线性代数及矩阵论的一个主要问题就是寻找可使矩阵对角化的条件或者可使矩阵化简到含很多个 0 的条件,以便简化计算(这是主要原因之一)。

线性变换矩阵例子

二维空间 $ R^{2} $ 的線性變換的一些特殊情况有:

  • 逆时针旋转90度:

$$ A=\left[\begin{array}{cc}0 & -1 \\ 1 & 0\end{array}\right] $$

  • 逆時針旋轉 $\theta$ 度:

$$ A=\left[\begin{array}{cc}\cos (\theta) & -\sin (\theta) \\ \sin (\theta) & \cos (\theta)\end{array}\right] $$

  • 针对 y 轴反射:

$$ A=\left[\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right] $$

  • 在所有方向上放大2倍:

$$ A=\left[\begin{array}{ll}2 & 0 \\ 0 & 2\end{array}\right] $$

  • 水平错切:

$$ A=\left[\begin{array}{cc}1 & m \\ 0 & 1\end{array}\right] $$

  • 挤压:

$$ A=\left[\begin{array}{cc}k & 0 \\ 0 & 1 / k\end{array}\right] $$

  • 向 y 轴投影:

$$ A=\left[\begin{array}{ll}0 & 0 \\ 0 & 1\end{array}\right] $$

仿射变换的线性性

上文示例中给出了二维仿射变换不是线性变换,其实这是违反我对仿射变换的认知的,因为旋转、缩放、平移、错切给我的感觉就很“线性”,咋还非线性了呢。

二维仿射变换的非线性性

二维仿射变换的非线性性主要来自于平移,考虑简单的二维向量 $\textbf{p}=[x,y]^T$位移 $\Delta d$ 向量的平移变换:
$$
f(\textbf{p})=\textbf{p}+\Delta \textbf{d}
$$
那么线性变换的加法运算:
$$
f(\textbf{p} + \textbf{q})=\textbf{p}+\textbf{q}+\Delta \textbf{d}
$$
但是:
$$
f(\textbf{p}) + f(\textbf{q})=\textbf{p}+\textbf{q}+2\Delta \textbf{d}
$$
这就导致了仿射平移在二维空间上没有保持线性加法,同理标量乘法的性质也丢了:
$$
f(c\textbf{p})=c\textbf{p}+\Delta \textbf{d} \ne c(\textbf{p}+\Delta \textbf{d})=cf(\textbf{p})
$$
原点也没有映射到原点:
$$
f(\textbf{0})=\Delta \textbf{d} \ne \textbf{0}
$$
表明确实二维仿射变换在二维空间中不符合线性变换的定义。

二维仿射变换在三维空间

如果将二维平面看做是三维空间中的一个平面,结果却不一样了

二维平面看做是三维空间中 $z=1$ 的平面,那么之前二维的向量变为了 $\textbf{p}=[x,y,1]^T$,平移向量多加一维 0 值,设为 $\Delta\textbf{d} = [a,b,0]^T$,此时神奇的地方在于平移可以表示成矩阵乘法:

$$ \begin{array}{l} f(\textbf{p})&=&\textbf{p}+\Delta \textbf{d}\\ &=& \left[\begin{array}{l}x \\ y \\ 1 \end{array}\right] + \left[\begin{array}{l}a \\ b \\ 0 \end{array}\right]\\ &=&\left[\begin{array}{l}1 & 0 &a \\ 0 & 1 &b \\ 0 &0&1 \end{array}\right]\left[\begin{array}{l}x \\ y \\ 1 \end{array}\right]\\ &=&\textbf{Ap} \end{array} $$

注意:此处 $\textbf{p}+\Delta \textbf{d}$ 与 $\textbf{Ap}$ 仅在 $\textbf{p}$ 第三维为 1 时等价,也就是说对于一般的向量 $\textbf{q}=[x,y,z]^T$,$\textbf{q}+\Delta \textbf{d} \ne \textbf{Aq}$

其中:

$$ \textbf{A}=\left[\begin{array}{l}1 & 0 &a \\ 0 & 1 &b \\ 0 &0&1 \end{array}\right] $$

则这个平移操作变成了固定系数的矩阵乘法,也就是一个线性系统了:
$$
f(\textbf{p+q})=\textbf{A}(\textbf{p+q})=\textbf{Ap} +\textbf{Aq}=f(\textbf{p})+f(\textbf{q})
$$

$$
f(\textbf{cp})=\textbf{A}(c\textbf{p})=c\textbf{Ap}=cf(\textbf{p})
$$

也就是说,仿射变换表示成三维矩阵乘法后是线性变换,他是一般三维线性变换的一个特例。

参考资料

文章链接:
https://www.zywvvd.com/notes/study/linear-algebra/linear-trans/linear-trans/