J.U.C Atomic（一）CAS原理

zoukankan html css js c++ java

J.U.C Atomic（一）CAS原理
CAS概念

CAS：Compare And Swap，比较并交换。java.util.concurrent包完全是建立于CAS机制之上的。

CAS原理

Java CAS是通过调用Unsafe的native方法，再由C程序调用CPU底层命令实现的。

下面是对应于intel x86处理器的源代码的片段：
// Adding a lock prefix to an instruction on MP machine // VC++ doesn't like the lock prefix to be on a single line // so we can't insert a label after the lock prefix. // By emitting a lock prefix, we can define a label after it. #define LOCK_IF_MP(mp) __asm cmp mp, 0 \ __asm je L0 \ __asm _emit 0xF0 \ __asm L0: inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) { // alternative for InterlockedCompareExchange int mp = os::is_MP(); __asm { mov edx, dest mov ecx, exchange_value mov eax, compare_value LOCK_IF_MP(mp) cmpxchg dword ptr [edx], ecx } }
如上面源代码所示，程序会根据当前处理器的类型来决定是否为cmpxchg指令添加lock前缀。如果程序是在多处理器上运行，就为cmpxchg指令加上lock前缀（lock cmpxchg）。反之，如果程序是在单处理器上运行，就省略lock前缀（单处理器自身会维护单处理器内的顺序一致性，不需要lock前缀提供的内存屏障效果）。

intel的手册对lock前缀的说明如下：
1. 确保对内存的读-改-写操作原子执行。
2. 禁止该指令与之前和之后的读和写指令重排序。
3. 把写缓冲区中的所有数据刷新到内存中。
那么，cpu是如何来确保读、改、写操作原子性的呢？
- Bus Locking（总线锁）
在x86 平台上，CPU提供了在指令执行期间对总线加锁的手段。CPU芯片上有一条引线#HLOCK pin，如果汇编语言的程序中在一条指令前面加上前缀"LOCK"，经过汇编以后的机器代码就使CPU在执行这条指令的时候把#HLOCK pin的电位拉低，持续到这条指令结束时放开，从而把总线锁住，这样同一总线上别的CPU就暂时不能通过总线访问内存了，保证了这条指令在多处理器环境中可以独占内存。（这种方式性能会比较差，所以后来有了缓存一致性方案）
- 缓存一致性
　　MESI是保持一致性的协议，实现原理是在CPU缓存中记一个标记位，标记位有四种状态：

　　M: Modify，只在本CPU中有缓存数据，而其他CPU中没有。同时其状态相对于内存中的值来说，是已经被修改的，且没有更新到内存中。

　　E: Exclusive，只有在本CPU中有缓存，且其数据没有修改，即与内存中一致。

　　S: Share，数据在多个CPU中都有缓存，且与内存一致。

　　I: Invalid，本CPU中的这份缓存已经无效。

　该协议约定的缓存上对应的监听：
1. 一个处于M状态的缓存行，必须时刻监听所有试图读取该缓存行对应的主存地址的操作，如果监听到，则必须在此操作执行前把其缓存行中的数据写回CPU。
2. 一个处于E状态的缓存行，必须时刻监听其他试图读取该缓存行对应的主存地址的操作，如果监听到，则必须把其缓存行状态设置为S。
3. 一个处于S状态的缓存行，必须时刻监听使该缓存行无效或者独享该缓存行的请求，如果监听到，则必须把其缓存行状态设置为I。
　　当CPU需要读取数据时，如果其缓存行的状态是I的，则需要从内存中读取，并把自己状态变成S，如果不是I，则可以直接读取缓存中的值，但在此之前，必须要等待其他CPU的监听结果，如其他CPU也有该数据的缓存且状态是M，则需要等待其把缓存更新到内存之后，再读取。

　　当CPU需要写数据时，只有在其缓存行是M或者E的时候才能执行，否则需要发出特殊的RFO指令(Read Or Ownership，这是一种总线事务)，通知其他CPU置缓存无效(I)，这种情况下会性能开销是相对较大的。在写入完成后，修改其缓存状态为M。

　　但是有两种情况下处理器不会使用缓存锁定。第一种情况是：当操作的数据不能被缓存在处理器内部，或操作的数据跨多个缓存行（cache line），则处理器会调用总线锁定。第二种情况是：有些处理器不支持缓存锁定。对于Inter486和奔腾处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

CAS缺点

　　CAS虽然很高效的解决原子操作，但是CAS仍然存在三大问题。
1. ABA问题
  因为CAS需要在操作值的时候检查下值有没有发生变化，如果没有发生变化则更新，但是如果一个值原来是A，变成了B，又变成了A，那么使用CAS进行检查时会发现它的值没有发生变化，但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号，每次变量更新的时候把版本号加一，那么A－B－A 就会变成1A-2B－3A。从Java1.5开始JDK的atomic包里提供了一个类AtomicStampedReference来解决ABA问题。
2. 自旋开销大
  自旋CAS如果长时间不成功，会给CPU带来非常大的执行开销。jdk1.8好像已经不是采用自旋的方式了，但是据说效率也没有得到多大提高。这个可以自己去测试一下。
3. 只能保证一个共享变量的原子操作
  当对一个共享变量执行操作时，我们可以使用循环CAS的方式来保证原子操作，但是对多个共享变量操作时，循环CAS就无法保证操作的原子性，这个时候就可以用锁，或者有一个取巧的办法，就是把多个共享变量合并成一个共享变量来操作。
　　
查看全文

相关阅读:
2.WindowsServer2012R2装完的一些友好化设置
 架构畅想：如果以你所会去进行架构，会到哪一步？
如何导出已有的谷歌插件，又如何把导出的插件安装到360浏览器中，又如何对插件小修小改？
SQL：指定名称查不到数据的衍伸~空格换行符回车符的批量处理
 SVN：服务器资源删掉，本地添加时和删掉的名字同名出现One or more files are in a conflicted state.
我为NET狂-----大前端专帖
 逆天通用水印扩展篇~新增剪贴板系列的功能和手动配置，卸除原基础不常用的功能
 万恶的剪贴板==》为存储而生
 转帖：DotNet 资源大全中文版
 在不动用sp_configure的情况下，如何 =》去掉列的自增长，并保留原数据

原文地址：https://www.cnblogs.com/monkey0307/p/8183061.html

J.U.C Atomic（一）CAS原理

CAS概念

CAS原理

CAS缺点