zoukankan      html  css  js  c++  java
  • 关于线程同步的问题

    ------------恢复内容开始------------

     

    多线程环境下对变量的读写操作是否是原子的?

     

    其实这个题目有点歧义,后面讲到

     

    以下多线程对int型变量x的操作,哪几个需要进行同步:( )
    A. x=y; B. x++; C. ++x; D. x=1;

     

    要彻底理解这个问题,我们首先需要从硬件讲起。以常见的X86 CPU来说,它基于以下三种机制保证了多核中加锁的原子操作:
    (1)Guaranteed atomic operations
    (2)Bus locking, using the LOCK# signal and the LOCK instruction prefix
    (3)Cache coherency protocols that ensure that atomic operations can be carried out on cached data structures (cache lock); this mechanism is present in the Pentium 4, Intel Xeon,

             and P6 family processors

     

    这三个机制相互独立,相辅相承。简单的理解起来就是
    (1)一些基本的内存读写操作是本身已经被硬件提供了原子性保证(例如读写单个字节的操作);
    (2)一些需要保证原子性但是没有被第(1)条机制提供支持的操作(例如read-modify-write)可以通过使用”LOCK#”来锁定总线,从而保证操作的原子性
    (3)因为很多内存数据是已经存放在L1/L2 cache中了,对这些数据的原子操作只需要与本地的cache打交道,而不需要与总线打交道,所以CPU就提供了cache coherency机制来保证

             其它的那些也cache了这些数据的processor能读到最新的值。

     

    那么CPU对哪些(1)中的基本的操作提供了原子性支持呢?

     

    从Intel486 processor开始,以下的基本内存操作是原子的:
    • Reading or writing a byte(一个字节的读写)
    • Reading or writing a word aligned on a 16-bit boundary(对齐到16位边界的字的读写)
    • Reading or writing a doubleword aligned on a 32-bit boundary(对齐到32位边界的双字的读写)

     

    从Pentium processor开始,除了之前支持的原子操作外又新增了以下原子操作:
    • Reading or writing a quadword aligned on a 64-bit boundary(对齐到64位边界的四字的读写)
    • 16-bit accesses to uncached memory locations that fit within a 32-bit data bus(未缓存且在32位数据总线范围之内的内存地址的访问)

     

    从P6 family processors开始,除了之前支持的原子操作又新增了以下原子操作:
    • Unaligned 16-, 32-, and 64-bit accesses to cached memory that fit within a cache line(对单个cache line中缓存地址的未对齐的16/32/64位访问)

     

    那么哪些操作是非原子的呢?
    Accesses to cacheable memory that are split across bus widths, cache lines, and
    page boundaries are not guaranteed to be atomic by the Intel Core 2 Duo, Intel®
    Atom™, Intel Core Duo, Pentium M, Pentium 4, Intel Xeon, P6 family, Pentium, and
    Intel486 processors.(说点简单点,那些被总线带宽、cache line以及page大小给分隔开了的内存地址的访问不是原子的,你如果想保证这些操作是原子的,你就得求助于机制(2),

    对总线发出相应的控制信号才行)。

     

    需要注意的是尽管从P6 family开始对一些非对齐的读写操作已经提供了原子性保障,但是非对齐访问是非常影响性能的,需要尽量避免。当然了,对于一般的程序员来说不需要太担心这个,

    因为大部分编译器会自动帮你完成内存对齐。

     

    回到最开始那个笔试题。我们先反汇编一下看看它们到底执行了什么操作:

     

    01
    02
    03
    04
    05
    06
    07
    08
    09
    10
    11
    12
    13
    14
    15
    16
    x = y;
    mov eax,dword ptr [y]
    mov dword ptr [x],eax
     
    x++;
    mov eax,dword ptr [x]
    add eax,1
    mov dword ptr [x],eax
     
    ++x;
    mov eax,dword ptr [x]
    add eax,1
    mov dword ptr [x],eax
     
    x = 1;
    mov dword ptr [x],1

     

    (1)很显然,x=1是原子操作。
             因为x是int类型,32位CPU上int占32位,在X86上由硬件直接提供了原子性支持。实际上不管有多少个线程同时执行类似x=1这样的赋值语 句,x的值最终还是被赋的值(而不会出现例如

            某个线程只更新了x的低16位然后被阻塞,另一个线程紧接着又更新了x的低24位然后又被阻塞,从而出现x的 值被损坏了的情况)。

     

    (2)再来看x++和++x。
             其实类似x++, x+=2, ++x这样的操作在多线程环境下是需要同步的。因为X86会按三条指令的形式来处理这种语句:从内存中读x的值到寄存器中,对寄存器加1,再把新值写回x所处的

              内存地址(见上面的反汇编代码)。

     

    例如有两个线程,它们按照如下顺序执行(注意读x和写回x是原子操作,两个线程不能同时执行):

     

    time    Thread 1         Thread 2
    0      load eax, x
    1                            load eax, x
    2      add eax, 1        add eax, 1
    3      store x, eax
    4                            store x, eax

     

    我们会发现最终x的值会是1而不是2,因为Thread 1的结果被覆盖掉了。这种情况下我们就需要对x++这样的操作加锁(例如Pthread中的mutex)以保证同步,或者使用一些提供了

    atomic operations的库(例如Windows API中的atomic库,Linux内核中的atomic.h,Java concurrent库中的Atomic Integer,C++0x中即将支持的atomic_int等等,这些库会利用CPU提供的

    硬件机制做一层封装,提供一些保证了原子性的API)。

     

    (3)最后来看看x=y。
           在X86上它包含两个操作:读取y至寄存器,再把该值写入x。读y的值这个操作本身是原子的,把值写入x也是原子的,但是两者合起来是不是原子操作呢?我个人认为x=y不是原子操作,

           因为它不是不可再分的操作。但是它需要不需要同步呢?其实问题的   关键在于程序的上下文。

     

    例如有两个线程,线程1要执行{y = 1; x = y;},线程2要执行{y = 2; y = 3;},假设它们按如下时间顺序执行:

     

    time    Thread 1        Thread 2
    0        store y, 1
    1                            store y, 2
    2        load eax, y
    3                            store y, 3
    4        store x, eax

     

    那么最终线程1中x的值为2,而不是它原本想要的1。我们需要加上相应的同步语句确保y = 2不会在线程1的两条语句之间发生。y = 3那条语句尽管在load y和store x之间执行,

    但是却不影响x=y这条语句本身的语义。所以你可以说x=y需要同步,也可以说x=y不需要同步,看你怎么理解题意了。x=1是否需要同步也 是一样的道理,虽然它本身是原子操作,

    但是如果有另一个线程要读x=1之后的值,那肯定也需要同步,否则另一个线程读到的就是x的旧值而不是1了。

    来源------多线程程序中操作的原子性 - nana0424 - 博客园
                  https://www.cnblogs.com/napolar/p/5096775.html

     

    ------------恢复内容结束------------
  • 相关阅读:
    第七周学习进度总结
    软件需求分析阅读笔记3
    第二周课堂小测:判断数组的最大子数组
    Android记账本开发(四):使用第三方插件库完成饼图数据显示
    Android记账本开发(三):数据库开发
    Android记账本开发(二):实现注册登录功能
    Android记账本开发(一):整体UI界面布局
    Android:Handle与Service
    上篇博客简单实例:字典与通讯录
    Android:数据存储技术
  • 原文地址:https://www.cnblogs.com/wyj96/p/11979239.html
Copyright © 2011-2022 走看看