흔히 클러스터 시스템에서 벤치마크는 LINPACK을 사용하거나 HPL(High-Performance Linpack Benchmark)을 통해서 시스템의 실제 성능을 측정하게 된다. 1. 시스템의 성능이란 ? - FLOPS 그럼 성능?에서 성능은 무엇을 의미하는가?에 대한 해답이 선행되어야 할것이다. 슈퍼컴퓨터에서의 성능은 FLOPS(Floationg-point Operations Per Second : 초당 실수연산 회수) 1초에 덧셈, 뺄셈, 곱셉, 나눗셈 등의 실수 계산을 총 몇 번 할 수 있는지를 나타내는 값이다. 만약 1초에 실수끼리 곱셈을 2번씩 할 수 있다면 그때의 계산 속도는 2FLOPS가 되는 것이다. [quote]MFLOPS(MegaFLOPS, 106FLOPS) GFLOPS(GigaFLO..
어디서 가져오긴 가져왔는데 출처를 확실하게 모르겠네요. ^^; 문제되면 알려주세요. [quote]BLAS (Basic Linear Algebra Subprograms) 선형대수(Linear Algebra) 문제의 해를 효율적으로 구하기 위한 방법의 하나는 Basic Linear Algebra Subprograms(BLAS)를 이용하는 것이다. BLAS는 blocking 기법을 바탕으로 하여 기본적인 vector와 matrix 연산을 수행하는 역할을 한다. BLAS에는 연산의 종류에 따라 Level 1, 2, 3 BLAS로 나뉘어진다. Level 1 BLAS는 vector-vector 연산을 수행하고, Level 2 BLAS 는 matrix-vector 연산, Level 3 BLAS는 matrix-matr..
flock는 모질라를 기반으로 하는 firefox의 아류작이 아니었다. Web 2.0에 대한 확실한 모범답안을 보여주고 있다. 또한 충실하게 이를 뒷받침해주고 있는 flickr를 보면 언제쯤 우리나라도 이런 조합이 가능할까 라는 생각을 해본다. 위의 스샷은 flock의 포토 업로드 기능을 통해 flickr에 사진을 업로드하고 이를 photo stream으로 보면서 태더툴즈에서 photo stream의 사진을 드래그하여 글을 작성하는 모습이다. 이 얼마나 협조적(?)인가!!
딸기가 먹고싶다.
이제 mpi 프로그래밍을 사용할 수 있는 환경이 마련되었다. 즉, 리눅스에서 병렬 프로그래밍이 가능해 졌다는 것이다. 그럼 이제 병렬 S/W를 만들고 실제 수행할 때 좀 더 심플하게 수행하도록 pbs나 loadleveler등의 스케줄러를 통해 실제 mpi 프로그램을 실행하도록 한다. loadleveler script for parallel job (parallel.cmd) [code c] #!/bin/bash # @ job_type = parallel # @ class = p_normal # @ input = /dev/null # @ step_name = parallel # @ output = $(step_name).$(cluster).out # @ error = $(step_name).$(cluster..