BLAS 2

Linux Cluster Benchmark with mpich & BLAS & CBLAS, ATLAS, HPL

흔히 클러스터 시스템에서 벤치마크는 LINPACK을 사용하거나 HPL(High-Performance Linpack Benchmark)을 통해서 시스템의 실제 성능을 측정하게 된다. 1. 시스템의 성능이란 ? - FLOPS 그럼 성능?에서 성능은 무엇을 의미하는가?에 대한 해답이 선행되어야 할것이다. 슈퍼컴퓨터에서의 성능은 FLOPS(Floationg-point Operations Per Second : 초당 실수연산 회수) 1초에 덧셈, 뺄셈, 곱셉, 나눗셈 등의 실수 계산을 총 몇 번 할 수 있는지를 나타내는 값이다. 만약 1초에 실수끼리 곱셈을 2번씩 할 수 있다면 그때의 계산 속도는 2FLOPS가 되는 것이다. [quote]MFLOPS(MegaFLOPS, 106FLOPS) GFLOPS(GigaFLO..

Linux-cluster 2006.07.06

선형대수 - BLAS, ATLAS, HPL

어디서 가져오긴 가져왔는데 출처를 확실하게 모르겠네요. ^^; 문제되면 알려주세요. [quote]BLAS (Basic Linear Algebra Subprograms) 선형대수(Linear Algebra) 문제의 해를 효율적으로 구하기 위한 방법의 하나는 Basic Linear Algebra Subprograms(BLAS)를 이용하는 것이다. BLAS는 blocking 기법을 바탕으로 하여 기본적인 vector와 matrix 연산을 수행하는 역할을 한다. BLAS에는 연산의 종류에 따라 Level 1, 2, 3 BLAS로 나뉘어진다. Level 1 BLAS는 vector-vector 연산을 수행하고, Level 2 BLAS 는 matrix-vector 연산, Level 3 BLAS는 matrix-matr..

Linux-cluster 2006.07.05