5月 « 2016 « ACS NEWS

2016 年 5 月 のアーカイブ

24コアマシンでのANSYS 17.0 並列性能テスト

2016 年 5 月 24 日 火曜日

ANSOLに続いて、24コア XON 2687EW V4マシンでのANSYS17.0並列計算性能を紹介します。

ANSYSライセンス:ANSYSメカニカル、MAX JOB数=1、デフォルトCPU数=2
            これにHPCオプションを追加して最大CPU数=6
問題:400万自由度、線形解析

最大ジョブ数が1なので、常に6CPUで使用するしかないのだが、並列化の効果を調べてみた。

先ずは、SMP版 SPARSE法とPCG法での比較を示す。
CPU数の指定は、  DOS> ansys170.exe -np 6 [他オプション]

ansys_smp_sparse_pcg

メモリサイズが、128GBだと、この大きさが限界で、これ以上のサイズになるとディスクIOが増えて
極端に遅くなる。また、マッシブな問題なので、当然PCG法が速く、メモリも少ない。

次に Distributed ANSYS (MPP版)を試してみた。
テストマシンには、既にIBM MPI(旧Platfrm MPI)が既にインストールされているので、
Platform-MPI Command Promptを起動して、以下を実行すれば良い。

DOS> ansys170.exe -dis -mpi pcmpi -np 6 [他オプション]

動き出すとCPU毎にモデルが分割され、指定CPU数に対応したANSYS.exeが動き出す。

IMG_6606_6proc

通常はこれだけでいいのだが、各プロセスのメモリ使用状況を調べていて、バランスが芳しくなかったら
以下のコマンドを入力データに追加してみる。

DDOPTION,AUTO/GREEDY/METIS   (指定なき場合は、AUTO)

6CPU、SPRASE&PCG法で、AUTO, GREEDY, METIS の測定結果を示す。

dis-ans_ddopt

パラメータを変えて何回も実行するのでなければ、AUTO(データ追加なし)で構わないようだ。

 

24コアマシンでのANSOL並列計算性能テスト

2016 年 5 月 24 日 火曜日

注意)以下の表の数値及び測定方法に不備がありました。訂正版はこちらをご覧ください。


24コア XON 2687EW V4マシン
でのANSOL並列計算性能を紹介します。
テストデータは、以前紹介したウィンドタービンモデルです。

ANSOL並列計算での注意点

・ソルバCalyxは、T3D GUIDEプログラムから起動され、GUIDE自体も時々CPUを使うので
 コア数が多い場合は、GUIDEとOS用に2コア程度は空けておくべき。
・1ライセンス当たりのCPU数は、ほぼ無制限なので、沢山使いたくなる。
 が、ANSOLの並列計算は、共有メモリ方式のみのため、コア数に比例した性能向上はない。

測定結果

ansol_para_test

このデータでは、12コア辺りが最速という結果になりました。

大容量メモリ 解析用マシン導入 - 陰解法での性能比較

2016 年 5 月 23 日 月曜日

先日導入した、24コア、512GBメモリマシンにおけるLSDYNA陰解法の性能比較です。

テスト問題:140万*TETRA10要素、線形性解析モデル。

LSDYNA陰解法で並列化(SPM, MPP共)が使用できるのは
    LSOLVR=5(*control_implicit_solver)
のみである。(イタレーティブソルバも早く並列化して欲しいものだ)

本テストモデルをインコア解法で解くためには、SMPの場合、最低でも128GBのメモリ
が必要。MPPではさらに多くのメモリが必要となり、従来の128GBでは厳しかった。
512GBでは、余裕で解けるようになった。最初に、メモリサイズの指定方法を紹介する。

・SMPにおけるメモリサイズ指定方法
 CPU数に関係なく使用可能なメモリサイズをワード(=8バイト)に変換し指定すれば良い。

 128GBの場合、lsdyna i=データ memory=16g あるいは 16000m
 512GBの場合、lsdyna i=データ memory=64g あるいは 64000m

・MPPにおけるメモリサイズ指定方法
 陽解法では、memory=xx : メイン memory2=yy サブ と指定するが、陰解法の場合
 全プロセッサに均等にメモリを割り当てる必要があり。memory2は指定してはいけない。

   memory = 使用可能なメモリ/使用CPU数 – MPPプロセスオーバーヘッド

 がおおよその目安となる。  たとえば24CPU使用の場合は以下を指定した。

   mpirun -np 24 mppdyna i=データ memory=1600m

以下に測定結果を示す。
1660 V2では、メモリ不足のためMPP処理は遅くなってしまった。

implicit_smp_mpp2

512GB, 24コアの性能を引き出すには、今回のモデルサイズは十分ではなかったようだ。

 

ANSOL Transmission 3D Rev.298

2016 年 5 月 17 日 火曜日

5/13 ANSOL Transmission 3D Rev.298 がリリースされました。
改良点は以下です。

2016/05/13
==========
1) Added Tertiary face cone capability for face-milled and face-hobbed
   hypoid pinions and gears. In the HYPOID|COMMON menu, if the
   SECONDARYFACE checkbox is enabled, the TERTIARYFACE checkbox
   will appear.
2) When a shaft segment has a rigid constraint on its inner
   our outer surface, we can now specify a value forUR, UTHETA or UZ on
   that surface using the URINNER, UTHETAINNER, UZINNER, or
   UROUTER,   UTHETAOUTER, UZOUTER boxes.
3) The AXIALOFFSET item in the GROUP menu has been removed–it was
   not being used by anybody, and was creating confusion. A similar effect
   can be obtained by other means.
4) Added a new spreadsheet HypoidWithEPGAlphaInT3D.xlsx in the scripts folder
   that shows how to set up a small two-rotor hypoid pair model with
   specified E,P,G,Alpha values.
5) Added a new script postexportgearcontactresults.cmd that will output
   gear contact information for a specific PAIR into an Ascii file. Also added a
   matching matlab file ImportGearContactResults.m that will allow a user to load
   this data. User can insert their own matlab code inside the time-step loop
   to do any calculations they want.
6) The zombie calyx process problem is now fixed
7) Bug fix. The protuberance model of Release 295 had an error.
   It  was generating an incorrect protuberance.
8) Bug fix: The banded colors option in iGlass was not placing the color
   bands and contours at precisely correct location. There was a small
   mismatch between the attribute value displayed at a node and the location of
   the color bands around that node.
9) Bug fix: The Parabolic tip relief check box for a planetary pinion in  iSys
   was not triggering a redraw of the profile modification chart.
10) Bug fix: The shaper-cut internal mesh generator was crashing.

6)については、以前より大規模モデル計算終了後、Calyxプロセスが残ってしまう問題が
完全に解決されたことを確認しました。

改良モジュールは、 
     インストールサイト/install/T3D/Transmission3D_iSys_x64_Rev298.msi
にアップロードされています。

4), 5) については、
    インストールサイト/Scripts/Scripts.ta.gz
をダウンロードして展開してください。

 

Deep Purple @ 日本武道館

2016 年 5 月 16 日 月曜日

5/15 日曜日、日本武道館にて、Deep Purple ライブ.
2014年以来、2年ぶりの来日。前回も見たのだが、写真がない、、、、、、
場内撮影禁止だったためと思う。今回は、スマホでフラッシュなしなら撮影OK

s_IMG_6552

開演17:00 前回もそうだったが、時間通りに始まる。

s_IMG_6559

いきなりハイウエウイスターだ!! 

s_IMG_6560 

アリーナ、1階、2階超満員。良かった。

s_IMG_6578-2

気が付けば、イアン・ギラン 70才、一番若いギターが61才。
前回もそうだったけど、「バーン」演奏してください。お願いします。

 

大容量メモリ 解析用マシン導入 - 陽解法での性能比較

2016 年 5 月 14 日 土曜日

先月注文した解析用大メモリのマシンが届いた。見た目は普通のPCと変わらない。

xeon24-IMG_6544

マシンスペック

・メーカ:UNIVPC (価格はWebページで確認できます)
・CPU : Xeon E5-2687w V4 3.0GHz (12core x 2CPU)
  何故2687W V4を選んだ理由 - 単独クロックが一番高かったのでこれを選択。
・メモリー: 512GB
・PCI-Expressストレージ: Intel SSD 1,2TB
・HDD : 6TB x 2
・ビデオコントローラ:GeForceGTX TITAN X 12GB
・光学ドライブ:Blue-Ray
・OS : Windows 10 Pro 64bit
 512GBのメモリは、Windows7では使用できないため、WIndows10かLinuxの選択となる。
 Linuxでも良かったのだが、自分以外の社員が触りたがらないので、WIndows10を選択した。

・モニター : ASUS Gamingモニター MG279Q 27型WQHDディスプレイ

xeon24-IMG_6545

このモニタはリフレッシュレート144Hzが可能。
144Hzを有効にするためには、DisplayPortでの接続が必須である。

xeon24-IMG_6539

コア数が24もあるので、タスクマネージャはこんな感じになる。

xeon24-IMG_6538

早速LSDYNAのベンチマークを行ってみた。

1、Explicit解析での性能比較

使用データ:TopCrunch neon_refined_riviced モデル

先ずは、SMP性能の結果を既存PCとの比較で示す。 

xeon24-explicit-smp

やはり、SMP版では8CPU以上での性能向上は少ない。場合によっては遅くなることもある。
更に、2687Wは最高クロックが3.18GHzとそれ程高くないので、CPU数が少ない場合は既存PCに負ける。

この結果だけ見たら、既存のPCで良かったのでは、と思うかもしれない。
しかし、コア数の多さは、MPP版でこそ実感できる。

xeon24-explicit-mpp

さすがに、CORE数と経過時間の関係はリニアにはならないが、24コア使用した場合、Core i7 4790K 
1コアに比べて10倍以上速くなった。

以上、Explicit解析での性能を示してきたが、このマシンの本来の目的は、大規模Implicitモデルに
対応することである。次回は、Implicit解析での性能比較を紹介する。

 

 

2016 4/29~ 香港、青森、八戸

2016 年 5 月 7 日 土曜日

ゴールデンウイーク開始直後から、LCCで2回目の香港、街ブラ

hkg010

LCC利用

hkg001

ホテルは、ネーザンロードにあるEATONホテル

hkg002

借主募集中

hkg003

路地裏の野良猫

hkg004 hkg005 hkg006 hkg007

テスラ モデルSがやたらと走っている。 面積小さいので丁度いいのか?

hkg021

ピザ屋のテスラ

hkg009

市内の駐車場料金 場所固定なら約46,000円/月 かなり高い。

 hkg011

スカイ100

hkg012

この程度の高級車がバンバン売れるらしい。

hkg013 hkg014 hkg015

ヨーロッパ高級ブランドに占領されたモール

hkg016

ふらりとケーブルカーに行ったら、凄い人数、、、長時間の待ち

hkg017 hkg018 hkg019 hkg020 

香港島にはフェリーで行きましょう。

hkg022 hkg023 hkg024

香港島上陸

hkg025

hkg026

ホテル近くの寺院

hkg028

寺院周辺には多くのホームレス、、、前回よりも増えたような気がする。

hkg027 

5/1 夜帰国、5/2 クルマで青森へ  岩木山

2016aomori01

浅虫温泉 大島 佐々木商店

2016aomori02 2016aomori03 2016aomori04 2016aomori05

佐々木商店の2階。 小鳥が手に乗った!!
飼っているかとお店に聞いたら「勝手に入ってくる」そうで即放鳥。

2016aomori06

5/3 八戸へ。 40年ぶりのような気がする。
八戸と言えば、イカ

hachi-IMG_6524

八戸近郊に住む、ロック研後輩が集まって歓迎してくれた。

hachi-DSC05258

店の名前:レイニーデイ 居酒屋なれど、楽器は全て揃っている。

hachi-DSC05248  

で、ビール飲みつつ大演奏会

hachi-IMG_6527

次の日は仙台、そして帰宅