OpenMP创建线程中的锁及原子操作性能比较

在多核CPU中锁竞争到底会造成性能怎样的下降呢?相信这是许多人想了解的,因此特地写了一个测试程序来测试原子操作,windows CriticalSection, OpenMP的锁操作函数在多核CPU中的性能。

创新互联建站专注于企业网络营销推广、网站重做改版、巢湖网站定制设计、自适应品牌网站建设、H5开发商城网站建设、集团公司官网建设、外贸营销网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为巢湖等各大城市提供网站开发制作服务。

原子操作选用InterlockedIncrement来进行测试,

对每种锁和原子操作,都测试在单任务执行和多任务执行2000000次加锁解锁操作所消耗的时间。

测试的详细代码见后面。

测试机器环境: Intel 2.66G 双核CPU 机器一台

测试运行结果如下:

SingleThread, InterlockedIncrement 2,000,000: a = 2000000, time = 78

MultiThread, InterlockedIncrement 2,000,000: a = 2000000, time = 156

SingleThread, Critical_Section 2,000,000:a = 2000000, time = 172

MultiThread, Critical_Section, 2,000,000:a = 2000000, time = 3156

SingleThread,omp_lock 2,000,000:a = 2000000, time = 250

MultiThread,omp_lock 2,000,000:a = 2000000, time = 1063

在单任务运行情况下,所消耗的时间如下:

原子操作                 78ms

Windows CriticalSection 172ms

OpenMP 的lock操作        250ms

因此从单任务情况来看,原子操作最快,Windows CriticalSection次之,OpenMP库带的锁最慢,但这几种操作的时间差距不是很大,用锁操作比原子操作慢了2~3倍左右。

在多个任务运行的情况下,所消耗的时间如下:

原子操作                 156ms

Windows CriticalSection 3156ms

OpenMP 的lock操作        1063ms

在多任务运行情况下,情况发生了意想不到的变化,原子操作时间比单任务操作时慢了一倍,在两个CPU上运行比在单个CPU上运行还慢一倍,真是难以想象,估计是任务切换开销造成的。

Windows CriticalSection则更离谱了,居然花了3156ms,是单任务运行时的18倍多的时间,慢得简直无法想象。

OpenMP的lock操作比Windows CriticalSection稍微好一些,但也花了1063ms,是单任务时的7倍左右。

由此可以知道,在多核CPU的多任务环境中,原子操作是最快的,而OpenMP次之,Windows CriticalSection则最慢。

同时从这些锁在单任务和多任务下的性能差距可以看出,,多核CPU上的编程和以往的单核多任务编程会有很大的区别。

需要说明的是,本测试是一种极端情况下的测试,锁住的操作只是一个简单的加1操作,并且锁竞争次数达200万次之多,在实际情况中,一由于任务中还有很多不需要加锁的代码在运行,实际情况中的性能会比本测试的性能好很多。

测试代码如下:

 
 
 
  1. // TestLock.cpp : OpenMP任务中的原子操作和锁性能测试程序。 
  2. // 
  3.   
  4. #include  
  5. #include  
  6. #include  
  7. #include  
  8. #include  
  9.   
  10. void TestAtomic() 
  11.      clock_t t1,t2; 
  12.      int      i = 0; 
  13.      volatile LONG      a = 0; 
  14.   
  15.      t1 = clock(); 
  16.   
  17.      for( i = 0; i < 2000000; i++ ) 
  18.      { 
  19.          InterlockedIncrement( &a); 
  20.      } 
  21.      
  22.      t2 = clock(); 
  23.      printf("SingleThread, InterlockedIncrement 2,000,000: a = %ld, time = %ld/n", a, t2-t1); 
  24.   
  25.      t1 = clock(); 
  26.   
  27. #pragma omp parallel for 
  28.      for( i = 0; i < 2000000; i++ ) 
  29.      { 
  30.          InterlockedIncrement( &a); 
  31.      } 
  32.      
  33.      t2 = clock(); 
  34.      printf("MultiThread, InterlockedIncrement 2,000,000: a = %ld, time = %ld/n", a, t2-t1); 
  35.   
  36. void TestOmpLock() 
  37.      clock_t t1,t2; 
  38.      int i; 
  39.      int a = 0; 
  40.      omp_lock_t    mylock; 
  41.   
  42.      omp_init_lock(&mylock); 
  43.   
  44.      t1 = clock(); 
  45.   
  46.      for( i = 0; i < 2000000; i++ ) 
  47.      { 
  48.          omp_set_lock(&mylock); 
  49.          a+=1; 
  50.          omp_unset_lock(&mylock); 
  51.      } 
  52.      t2 = clock(); 
  53.      
  54.      printf("SingleThread,omp_lock 2,000,000:a = %ld, time = %ld/n", a, t2-t1); 
  55.   
  56.      t1 = clock(); 
  57.   
  58. #pragma omp parallel for 
  59.      for( i = 0; i < 2000000; i++ ) 
  60.      { 
  61.          omp_set_lock(&mylock); 
  62.          a+=1; 
  63.          omp_unset_lock(&mylock); 
  64.      } 
  65.      t2 = clock(); 
  66.      
  67.      printf("MultiThread,omp_lock 2,000,000:a = %ld, time = %ld/n", a, t2-t1); 
  68.   
  69.      omp_destroy_lock(&mylock); 
  70.   
  71.   
  72.   
  73. void TestCriticalSection() 
  74.      clock_t t1,t2; 
  75.      int i; 
  76.      int a = 0; 
  77.      CRITICAL_SECTION   cs; 
  78.   
  79.      InitializeCriticalSection(&cs); 
  80.   
  81.      t1 = clock(); 
  82.   
  83.      for( i = 0; i < 2000000; i++ ) 
  84.      { 
  85.          EnterCriticalSection(&cs); 
  86.          a+=1; 
  87.          LeaveCriticalSection(&cs); 
  88.      } 
  89.      t2 = clock(); 
  90.   
  91.      printf("SingleThread, Critical_Section 2,000,000:a = %ld, time = %ld/n", a, t2-t1); 
  92.   
  93.      t1 = clock(); 
  94.   
  95. #pragma omp parallel for 
  96.      for( i = 0; i < 2000000; i++ ) 
  97.      { 
  98.          EnterCriticalSection(&cs); 
  99.          a+=1; 
  100.          LeaveCriticalSection(&cs); 
  101.      } 
  102.      t2 = clock(); 
  103.   
  104.      printf("MultiThread, Critical_Section, 2,000,000:a = %ld, time = %ld/n", a, t2-t1); 
  105.   
  106.      DeleteCriticalSection(&cs); 
  107.   
  108.   
  109. int main(int argc, char* argv[]) 
  110.   
  111.      TestAtomic(); 
  112.      TestCriticalSection(); 
  113.      TestOmpLock(); 
  114.   
  115.      return 0; 

原文链接:http://blog.csdn.net/drzhouweiming/article/details/1689853

新闻名称:OpenMP创建线程中的锁及原子操作性能比较
网页网址:http://www.csdahua.cn/qtweb/news5/491755.html

网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网