惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Forbes - Security
Forbes - Security
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
F
Fortinet All Blogs
B
Blog
T
The Blog of Author Tim Ferriss
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI
Y
Y Combinator Blog
Microsoft Azure Blog
Microsoft Azure Blog
L
LangChain Blog
Recent Announcements
Recent Announcements
U
Unit 42
Martin Fowler
Martin Fowler
M
MIT News - Artificial intelligence
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
The Register - Security
The Register - Security
Recorded Future
Recorded Future
C
Check Point Blog
V
V2EX
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Hugging Face - Blog
Hugging Face - Blog
WordPress大学
WordPress大学
Google DeepMind News
Google DeepMind News
酷 壳 – CoolShell
酷 壳 – CoolShell
F
Full Disclosure
小众软件
小众软件
A
About on SuperTechFans
云风的 BLOG
云风的 BLOG
宝玉的分享
宝玉的分享
Last Week in AI
Last Week in AI
有赞技术团队
有赞技术团队
MongoDB | Blog
MongoDB | Blog
爱范儿
爱范儿
P
Proofpoint News Feed
罗磊的独立博客
量子位
D
Docker
博客园_首页
D
DataBreaches.Net
Project Zero
Project Zero
博客园 - 司徒正美
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
博客园 - Franky
Security Latest
Security Latest
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
N
Netflix TechBlog - Medium
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
博客园 - 三生石上(FineUI控件)
H
Hackread – Cybersecurity News, Data Breaches, AI and More
大猫的无限游戏
大猫的无限游戏

博客园_首页

Plist 二进制格式 Milvus 和 PGVector,哪个更好? OpenClaw 已过时?在 VS Code 中运行 Hermes Agent! 第30篇文章:一个大三计科生的自白 Manim如何在数学公式中完美显示中文? Docker 部署 RocketMQ 5 并发编程核心概念辨析 C#事务处理最佳实践:别再让“主表存了、明细丢了”的破事发生 CLI 是什么?为什么大厂突然集体卷命令行? 【从0到1构建一个ClaudeAgent】协作-自主Agent UIImageView 设置图片不生效的原因排查 最小二乘问题详解20:无先验约束下的增量式SFM自由网平差 痞子衡嵌入式:大话双核i.MXRT1180之XIP应用里借助MU实现可靠Flash IAP的方法 AI Chat 封装, SemanticKerne.AiProvider.Unified 已发布 Windows下右键编辑js文件无法打开记事本——在注册表中使用环境变量 在后台服务中使用 Scoped 服务,为什么总是报错? H200 安装驱动并使用sglang启动模型 wireshark 抓包Trap上报告警内容 我用 AI 辅助开发了一系列小工具(2):图片压缩工具 [A Primer On MC and CC] 2.1 Memory Consistency 1 - 指令重排序和 SC 模型 Oracle数据库SCN推进技术详解与实践指南 玩转控件:封装个带图片的Label控件 Claude Code 4.7 真正该升级的不是模型,而是你的工作流 前端小白一句话,AI 帮我做了个颜值拉满的桌面媒体播放器。当代码不再是门槛,一句话编程就是现实。 5. WorkBuddy: 小龙虾的灵魂三件套,让你的小龙虾不只是工具 SQLite 分片方案实战:三种分片策略的深度对比 告别简陋 UI!一款基于 Fluent Design 和基于 WinUI 的开源免费、现代化的 Avalonia UI 控件库 关于二进制排列组合枚举的总结 AI开发-python-LangGraph框架(3-27-LangGraph从零实现大模型智能决策工作流) ElasticSearch主分片和副本分片概念详解 【002】HTTPS 粗解:证书、TLS 握手与对后端配置的影响 Hermes Agent 一周暴涨五万 Star,但我劝你别急着追 明明连接的是Redis的DB0,为什么能查到DB3的数据? 【从0到1构建一个ClaudeAgent】协作-Agent团队 熟悉电子元器件之后,电子小白下一步该怎么走? MAF快速入门(23)通过C#类定义Skills .NET 高级开发 | 手写一个对象映射框架 FastAPI数据库ORM怎么选?我肝了三个Demo后,终于不再纠结了 mysqldump 参数拾遗:在遗忘与铭记之间 C# .NET 周刊|2026年3月5期 Claude code入门 - 陈彦斌 一文学习入门 ThingsBoard 开源物联网平台 GitHub 热门项目 | 2026年04月16日 如何为GIT设置全局勾子,为每次提交追加信息 Number.isFinite和isFinite与isNaN()和Number.isNaN的区别 PortSwigger SQL注入LAB2 推荐一个测试人必备的Skills,从功能到性能全搞定(附详细实操和安装下载方式) 筑基期:掌握Odoo基础核心知识点02(Odoo XML 开发方式详解) GLM模型这么火,咱们用vllm也咧一个呗! 深入理解 AbortController:从底层原理到跨语言设计哲学 字符串学习笔记 多租户系统框架的基础模块设计和分析设计 Apache SeaTunnel Zeta 为什么能做到“又快又稳”? AI开发-python-LangGraph框架(3-26-LangGraph基本概念及第一个简单样例) Vue 3 组件通信,别只会用 Props 和 Emits 了,这几个狠活儿你得看看 ElasticSearch7.X版本配置密码 用Manim实现动态交点计算--从一个动点问题说起 团结引擎+Addressable+Instant Game打包抖音小游戏 function call 实战:让 LLM 自动判断 pod 异常、调用日志工具并完成故障分析 bubseek —— 让 Agent 的足迹,变成团队的洞察 通过 C# 读取并导出 PDF 书签 如何用 GitHub Actions 实现 Steam 自动化发布 【从0到1构建一个ClaudeAgent】并发-后台任务 .NET 高级开发 | 定制 ASP.NET Core 框架 电子小白:什么是运算放大器(运放) zero2Agent:面向大厂面试的 Agent 工程教程,从概念到生产的完整学习路线 堆上的ORW HC32F460 USB CDC通信异常:非对齐访问异常排查 20260413-Hyperbridge 攻击事件:发生在默克尔山上的验证绕过 那些喊着AI 要淘汰你的人,正在靠你的焦虑赚大钱! 深度学习进阶(八)Swin Transformer 最小二乘问题详解19:带先验约束的增量式SFM优化与实现 SnapTranslate 3.0 正式发布:全局划词翻译 + 完整英语学习闭环,一站式搞定查词、记词、复习 工作的意义、工作的困难认知再思考 .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 开了 TUN 模式还是直连?90% 的人都踩过这个坑 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术
深入剖析Java内存模型与volatile关键字
devpotato · 2026-05-13 · via 博客园_首页

缓存一致性问题

计算机在运行程序时,每条指令都是在CPU中执行的,在执行过程中会涉及到数据的读写。我们知道程序运行的数据是存储在主存中,这时就会有一个问题,读写主存中的数据没有 CPU 中执行指令的速度快,如果任何的交互都需要与主存打交道则会大大降低效率,所以就有了 CPU寄存器、各级缓存、主存构成了一个速度与容量的平衡金字塔。

有了 CPU 高速缓存虽然解决了效率问题,但是它会带来一个新的问题:数据一致性。

缓存一致性问题的本质
在程序运行中,会将运行所需要的数据复制一份到 CPU 高速缓存中,在进行运算时 CPU 不再和主存打交道,而是直接从高速缓存中读写数据,只有当运行结束后,才会将数据刷新到主存中。

举一个简单的例子:

i = i + 1;

当线程运行这段代码时,首先会从主存中读取 i 的值( 假设此时 i = 1 ),然后复制一份到 CPU 高速缓存中,然后 CPU 执行 + 1 的操作(此时 i = 2),然后将数据 i = 2 写入到高速缓存中,最后刷新到主存中。

其实这样做在单线程中是没有问题的,有问题的是在多线程中。如下:

假如有两个线程 A、B 都执行这个操作( i++ ),两个线程从主存中读取 i 的值( 假设此时 i = 1 ),到各自的高速缓存中,然后线程 A 执行 +1 操作并将结果写入高速缓存中,最后写入主存中,此时主存 i = 2 。线程B做同样的操作,主存中的 i 仍然 = 2 。

让我们通过一个时序图来理解问题所在:

线程A                     线程B             		主存
  │                 		│               		i=1
  ├─读取i───┐                 │               	   │
  │         │               │               		│
  │ 得到i=1 	│               │               	  │
  │         │               │               		│
  │ 计算i+1=2               │               		  │
  │         │              ├─读取i─┐                 │
  │ 写入缓存 │               │      │                 │
  │         │               │ 得到i=1	│             │
  │ 刷新到主存                │        │             │
  │         │               │ 计算i+1=2    	        │
  │ 主存i=2←───────────────→│       	│              │
  │                 		│ 写入缓存 	│            │
  │                 		│ 刷新到主存             │
  │                 		│ 主存i=2←─→
  │                 		│               		│

最终结果:i=2,而非期望的3。这就是经典的缓存一致性问题。

解决缓存一致性方案有两种:

  • 通过在总线加 LOCK# 锁的方式
  • 通过缓存一致性协议(MESI 协议)
解决方案 实现机制 优点 缺点 用场景
总线加锁 通过LOCK#信号锁住总线 实现简单 性能差,串行化 早期处理器
MESI协议 缓存行状态机管理 性能好,部分并行 实现复杂 现代处理器

MESI协议核心状态:

  • Modified:缓存行被修改,与主存不一致
  • Exclusive:缓存行独占,与主存一致
  • Shared:缓存行被多个CPU共享
  • Invalid:缓存行无效,需重新加载

方案分析:

  • 第一种方案存在一个问题,它是采用一种独占的方式来实现的,即总线加 LOCK# 锁的话,只能有一个 CPU 能够运行,其他 CPU 都得阻塞,效率较为低下。
  • 第二种方案,缓存一致性协议(MESI 协议),它确保每个缓存中使用的共享变量的副本是一致的。

Java内存模型(JMM)

上面从操作系统层次阐述了如何保证数据一致性,下面我们来看一下 Java 内存模型,稍微研究一下它为我们提供了哪些保证,以及在 Java 中提供了哪些方法和机制,来让我们在进行多线程编程时能够保证程序执行的正确性。

在Java中,所有的实例、静态变量和数组元素都存储在堆内存中,堆内存在线程之间是共享的。局部变量,方法定义参数和异常数量参数是存放在Java虚拟机栈上面的。Java虚拟机栈是线程私有的因此不会在线程之间共享,它们不存在内存可见性的问题,也不受内存模型的影响。

Java内存模型(Java Memory Model 简称 JMM),决定一个一个线程对共享变量的写入何时对其它线程可见。JMM定义了线程和主内存之间的抽象关系:线程之间共享变量存储在主内存中,每个线程都有一个私有的本地内存,本地内存中存储了该线程共享变量的副本。本地内存是JMM的一个抽象概率,并不真实的存在。它涵盖了缓存,写缓存区,寄存器以及其他的硬件和编译优化。

Java内存模型的抽象概念图如下所示:
Java 内存模型
看完了Java内存模型的概念,我们再来看看内存模型中主内存是如何和线程本地内存之间交互的。

JMM定义了8个原子操作规范主内存与工作内存的交互:

┌───────────────────┐    ┌───────────────────┐
│     主内存操作      │    │     本地内存操作    │
├───────────────────┤    ├───────────────────┤
│ 1. lock (锁定)     │    │ 4. load (载入)    │
│ 2. unlock (解锁)   │←--→│ 5. use (使用)     │
│ 3. read (读取)     │    │ 6. assign (赋值)  │
│ 8. write (写入)    │    │ 7. store (存储)   │
└───────────────────┘    └───────────────────┘

主内存和本地内存间的交互:
主内存和本地内存的交互即一个变量是如何从主内存中拷贝到本地内存又是如何从本地内存中回写到主内存中的实现,Java内存模型提供了8中操作来完成主内存和本地内存之间的交互。它们分别如下:

  • lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才能被其它线程锁定。
  • read(读取):作用于主内存的变量,它把一个变量从主内存传输到线程的本地内存中,以便随后的load动作使用。
  • load(载入):作用于本地内存的变量,它把read操作从主内存中的到的变量值放入本地内存的变量副本中。
  • use(使用):作用于本地内存的变量,它把本地内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量值的字节码指令时将会执行这个操作。
  • assign(赋值):作用于本地内存的变量,它把一个从执行引擎接收到的变量赋予给本地内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时将会执行这个操作。
  • store(存储):作用于本地内存的变量,它把本地内存中的变量的值传递给主内存中,以便后面的write操作使用。
  • write(写入):作用于主内存的变量,它把store操作从本地内存中得到的变量的值放入主内存的变量中。

从上面8种操作中,我们可以看出,当一个变量从主内存复制到线程的本地内存中时,需要顺序的执行read和load操作,当一个变量从本地内存同步到主内存中时,需要顺序的执行store和write操作。Java内存模型只要求上述的2组操作是顺序的执行的,但并不要求连续执行。比如对主内存中的变量a 和 b 进行访问时,有可能出现的顺序是read a read b load b load a。除此之外,Java内存模型还规定了在执行上述8种基本操作时必须满足以下规则:

  • read/load 和 store/write 必须成对出现
  • 不允许一个线程丢弃它最近的assign操作。即变量在线程的本地内存中改变后必须同步到主内存中。
  • 不允许一个线程无原因的把数据从线程的本地内存同步到主内存中。
  • 不允许线程的本地内存中使用一个未被初始化的变量。
  • 一个变量在同一时刻只允许一个线程对其进行lock操作,但是一个线程可以对一个变量进行多次的lock操作,当线程对同一变量进行了多次lock操作后需要进行同样次数的unlock操作才能将变量释放。
  • 如果一个变量执行了lock操作,则会清空本地内存中变量的拷贝,当需要使用这个变量时需要重新执行read和load操作。
  • 如果一个变量没有执行lock操作,那么就不能对这个变量执行unlock操作,同样也不允许unlock一个被其它线程执行了lock操作的变量。也就是说lock 和unlock操作是成对出现的并且是在同一个线程中。
  • 对一个变量执行unlock操作之前,必须将这个变量的值同步到主内存中去。

内存屏障

内存屏障(Memory Barrier,或有时叫做内存栅栏,Memory Fence)是一种CPU指令,用于控制特定条件下的重排序和内存可见性问题。Java编译器也会根据内存屏障的规则禁止重排序。

内存屏障可以被分为以下几种类型

  • LoadLoad屏障:对于这样的语句Load1; LoadLoad; Load2,在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。
  • StoreStore屏障:对于这样的语句Store1; StoreStore; Store2,在Store2及后续写入操作执行前,保证Store1的写入操作对其它处理器可见。
  • LoadStore屏障:对于这样的语句Load1; LoadStore; Store2,在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。
  • StoreLoad屏障:对于这样的语句Store1; StoreLoad; Load2,在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的。在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能。

volatile

volatile的三大特性:

  1. 可见性
  2. 禁止指令重排
  3. 不保证原子性
public class VolatileFeatures {
    // 1. 可见性保证
    volatile boolean flag = false;
    
    // 2. 禁止指令重排序
    volatile int counter = 0;
    
    // 3. 不保证原子性
    volatile int nonAtomic = 0;
    
    public void write() {
        // 普通写操作
        int temp = 100;
        // volatile写 - 建立happens-before关系
        flag = true;
    }
    
    public void read() {
        // volatile读 - 建立happens-before关系
        if (flag) {
            // 能读到之前所有的写入
            System.out.println("Flag is true");
        }
    }
}

核心规则:

  • volatile写前的所有操作不能重排序到写后
  • volatile读后的所有操作不能重排序到读前
  • volatile写与volatile读之间不能重排序

volatile可见性
volatile 可以保证线程可见性且提供了一定的有序性,但是无法保证原子性。在 JVM 底层,volatile 是采用“内存屏障”来实现的。

volatile禁止重排序
什么是重排序?重排序规则?
在介绍volatile的禁止重排序之前,我们先来了解下什么是重排序。重排序是指编译器和处理器为了优化程序性能而对指令进行重新排序的一种手段。那么重排序有哪些规则呢?不可能任何代码都可以重排序,如果是这样的话,那么在单线程中,我们将不能得到明确的运行的结果。重排序规则如下:

  • 具有数据依赖性操作不能重排序,数据依赖性是指两个操作访问同一个变量,如果一个操作是写操作,那么这两个操作就存在数据依赖性。
  • 重排序会遵循 as-if-serial语义 与 happens-before原则。

as-if-serial语义
意思是不管怎么重排序,单线程的程序执行结果是不会改变的。

happens-before原则
Java 内存模型下一共有 8 条 happens-before 规则,这样我们就可以根据规则去推论跨线程的内存可见性问题,而不用再去理解底层重排序的规则。

具体的8项规则:

  1. 程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地说,应该是控制流顺序而不是程序代码顺序,因为要考虑分支、循环等结构。
  2. 管程锁定规则(Monitor Lock Rule):一个 unlock 操作先行发生于后面对同一个锁的 lock 操作。这里必须强调的是同一个锁,而 “后面” 是指时间上的先后顺序。
  3. volatile 变量规则(Volatile Variable Rule):对一个 volatile 变量的写操作先行发生于后面对这个变量的读操作,这里的 “后面” 同样是指时间上的先后顺序。
  4. 线程启动规则(Thread Start Rule):Thread 对象的 start () 方法先行发生于此线程的每一个动作。
  5. 线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过 Thread.join () 方法结束、Thread.isAlive () 的返回值等手段检测到线程已经终止执行。
  6. 线程中断规则(Thread Interruption Rule):对线程 interrupt () 方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过 Thread.interrupted () 方法检测到是否有中断发生。
  7. 对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的 finalize () 方法的开始。
  8. 传递性(Transitivity):如果操作 A 先行发生于操作 B,操作 B 先行发生于操作 C,那就可以得出操作 A 先行发生于操作 C 的结论。

多线程问题的Happens-Before分析法
步骤1:识别共享变量

class ProblematicCounter {
    private int count = 0;  // 共享变量
    
    public void increment() {
        count++;  // 非原子操作
    }
}

步骤2:分析操作顺序

线程A: read count(0) → add 1 → write count(1)
线程B: read count(0) → add 1 → write count(1)
最终结果: 1 (期望2)

步骤3:应用Happens-Before规则

线程A内部:符合程序顺序规则
线程B内部:符合程序顺序规则
线程A与线程B之间:没有Happens-Before关系

步骤4:选择同步机制

// 方案1:synchronized(监视器锁规则)
public synchronized void increment() {
    count++;
}

// 方案2:volatile + Atomic(volatile变量规则)
private volatile int count = 0;
public void increment() {
    // 需要原子操作,volatile不够
}

// 方案3:使用AtomicInteger
private AtomicInteger count = new AtomicInteger(0);
public void increment() {
    count.incrementAndGet();  // 内部使用volatile
}

总结
Happens-Before原则是理解Java并发编程的钥匙,它提供了:

  1. 可见性保证:确保一个线程的修改对其他线程可见
  2. 顺序约束:建立操作之间的偏序关系
  3. 推理工具:让程序员可以推导多线程程序的正确性

关键要点:

  • Happens-Before是JMM的核心抽象,不是具体实现
  • 八大规则是构建线程安全程序的基础
  • volatile和synchronized是实现Happens-Before的主要手段
  • 传递性规则是最强大的推理工具