計算の概略 | 原子核の見せかけの励起状態を求める |
---|---|
使用言語 | Fortran90, MPI |
問題 | 上記計算のため、十万次元くらいのエルミート行列を用いた連立線形方程式を解くプログラムがほしい。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | 磁気流体シミュレーションコードの空間解像度を部分的に挙げるために非一様格子を導入する |
---|---|
使用言語 | FORTRAN |
問題 | 2013年の千葉大学の磁気流体シミュレーションサマースクールで作成したHLLD法によるMHDコードへの、非一様メッシュの導入に伴う諸問題。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | 流束制限拡散近似を用いた輻射輸送方程式(線形拡散方程式+非線形方程式)を陰的に解く。 ニュートン・ラプソン法とマルチグリッド法(スムーザ=SOR 法)を用いている。 |
---|---|
使用言語 | FORTRAN |
問題 | MPI を用いて領域分割で並列化しているが、並列効率が悪いので、問題点を特定の上、改良したい。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | スパコン上でC言語を用いた複素指数関数計算について(原子核の励起状態の計算) |
---|---|
使用言語 | c |
問題 | 基研のSR16000 上のIBM 製xlc で複素数の計算を行いたいと考えています。しかし同等のFortran のコードと比較して、C のコードは4倍以上も遅くなると言う問題が生じています。原因を調べた結果、特に標準ライブラリlibm.a 中の複素数cexp がFortran と比べて異常なぐらい遅い事がわかりました。おそらくcexp を自分で置き換えたりするのが一般的な方法でしょうが、その場合は複素数cexp が提供されているその他のライブラリをご存知ないでしょうか?またこのような場合、他に何か解決策があるのでしょうか?同じくC をお使いの方が、このような問題が生じた時に、一般的にどのように対処されているのか、お知恵を拝借させてください。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | メインプログラムからの MPI サブルーチンの呼び出し、行列積に関する MPI 化について |
---|---|
使用言語 | FORTRAN |
問題 | bosonic BFSS 行列模型のコードで、MPI を用いないシリアルなコードからMPI を用いて並列化することを目指している。この際、行列の積A*B=C 演算部分が計算時間の大半を占めるため、この部分を並列化することを目指す。しかしながらそのMPI 化した行列積演算部分をサブルーチンとしてメインプログラムから呼び出そうと試行錯誤したがうまくいかない。MPI 版を正しく動作するようにしたい。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | Lattice QCD における gauge fixing |
---|---|
使用言語 | |
問題 | Lattice QCD の計算を行っているのですが、現在、(Coulomb) gauge fixing を、lattice QCD library の一つ、CPS (The Columbia Physics System) を用いて行っています。しかし、コードの実効 効率が非常に低いため (例えば 32^3×48 lattice を KEK SR16000 1node で計算する時の実効 効率は 2-3%程度)、もっと効率の良いコードを使いたいと思っています。お薦めのコードなどあれば紹介 していただけるでしょうか。 特に、GPGPU (HA-PACS)で高速な gauge fixing ができれば非常に助かるので、その辺りも調査し ていただければと思っています。 よろしくお願いします。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | コードのバージョン管理、メンバーでの情報共有について |
---|---|
使用言語 | |
問題 | 依頼内容 コード開発に関わるメンバーが多くなり、コードのバージョン管理を効率的に行い、研究や開発上の情報を後で参照/集約する方法を探している。またコードのモジュール化を進めて、複数のメンバーで開発やチューニングを行うための体制を作りたい。これまでの格子QCDコード開発では共同作業体制がうまくいっていると聞いているため、そこで得られたノウハウを教えて欲しい。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
計算の概略 | ユニタリ行列のオイラー角分解 応用としては格子QCDコードのメモリ量/帯域ないし演算負荷の軽減を考えていますが、割と基礎的な内容の数学の質問となります |
---|---|
使用言語 | c, c++, N=2,3ではMaximaを使ってEuler角から合成はしてみましたが、分解まではできていません |
問題 | UをU(N)ないしSU(N)のNxN複素行列とします。 このとき、次のような分解が可能であるように思えます。 U = ADB,ただしA, BはSO(N)の実回転行列、Dはexp(i diag(φ_1, φ_2,…,φ_N))となるような複素対角行列で、UがSU(N)のときはφ_iの総和は0とします。 A, D, B ∈ U(N) or SU(N)なのは明らかなのでこれらの積もU(N) or SU(N)になります。 自由度を数えるとA, BについてはN(N-1)/2、DについてはN or N-1で、合わせてN^2 or N^2 -1で、数合わせの上ではこれでよいように見えます。肝心の質問ですが ・このような分解は常に可能か、可能ならABの符号を除いて一意か? ・このような分解をするには、実際にどんな計算をすればよいのか? です。 使用する計算機(予定も含む):「京」、その他B/Fの低い計算機全般。 |
解決法、参考情報 | 詳しくはこちらをご覧ください(PDF) |
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
Hitachi SR16000を利用する際の注意点(PDF)
土井琢身氏(理化学研究所・HPCI戦略プログラム分野5課題1)
行った計算: 格子QCDによる核力の計算
使用言語、コンパイラ: C/C++, IBM XL C/C++ compiler for AIX
HPCI戦略プログラム分野5ではユーザー支援の一環として、最適なアルゴリズムや手法を探すための指針となるような情報をJICFuS WIKIに蓄積しています。項目については高性能計算の扉をご覧ください。
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク
京/FX10を利用する際の注意点(PDF)
土井琢身氏 (理化学研究所・HPCI戦略プログラム分野5課題1)
行った計算: 格子QCDによる核力の計算
使用言語、コンパイラ: C/C++, Fujitsu C/C++ compiler
HPCI戦略プログラム分野5ではユーザー支援の一環として、最適なアルゴリズムや手法を探すための指針となるような情報をJICFuS WIKIに蓄積しています。項目については高性能計算の扉をご覧ください。
コメントや質問がありましたら、 jicfus-support-at-ccs.tsukuba.ac.jp (-at-を@にして下さい)までお送りください。
関連リンク