SCore - oraccha/omicron GitHub Wiki

RWCP がやっていた PCクラスタシステム.

  • [http://pdswww.rwcp.or.jp/home-j.html 並列分散システムソフトウェアつくば研究室] (RWCP) . 元々は RWC-1 という超並列計算機(電総研 EM-4 の後継?)用 OS として開発が始まったらしい.
  • [http://www.pccluster.org/ PC Cluster Consortium] . RWCP は解散したけど,PC Cluster Consortium で継続開発されている.
    • [http://www.pccluster.org/xoopsjp/ XOOPSのページ]ができている.

LGPL でライセンシングされている.


Beowulf 型クラスタとの違いは,PM という独自の高速通信機構,グローバル[OS]の存在が挙げられる.

  • PM通信ライブラリ
  • MyriNet のファームを書き換えることで実装されている.MyriNet の他に EtherNet で動作する PM/EtherNet がある.
  • MyriNet の GM との違いは?
  • 石川さん曰く,MPICH のバージョンアップに追従してメンテするのは不毛なので,自分達の研究用ビークルとしてスクラッチから YAMPII を開発することにしたそうな.
  • SCASH ソフトウェア分散共有メモリ.

Linuxで並列処理しよう,だっけなそんな感じの本を発見.元 RWCP の面々が書いているようだったから見てみたら,SCore の本だった.

ユーザレベルでメモリをピンダウンして,MyriNet を使ってゼロコピー通信.

  • 毎度 OS にピンダウンを要求するのではなく,ユーザレベルでキャッシュしておくピンダウンキャッシュってのを持っているらしい.
  • で,NICTLB を持っていて,プロセスの仮想アドレスから物理アドレスへ変換して,直接 DMA できるようになっているみたい.
    • [http://pdarwww.am.ics.keio.ac.jp/pdarch/jlab/jnetwork_interface_martini_nic.html NIC] (Martini) . SCore/MyriNet じゃないけど.

シングルユーザ(scout)環境と,マルチユーザ(Score-D)環境がある.

  • シングルユーザ環境は,クラスタホストを排他的に実行するモード.
  • シングルユーザでMPIプログラムを実行する {{{ $ scout -g scoreall --> -g の後はグループ名 (scoreboard.db参照) SCOUT: Spawning done. SCOUT: session started. --> 各ノードで scremote.exe 起動 $ mpicc pi.c -o pi $ mpirun -np 2 ./pi SCore-D 5.8.2 connected. <0:0> SCORE: 2 nodes (1x2) ready. Process 0 of 2 on pfg1001.naregi.org Process 1 of 2 on pfg1001.naregi.org : $ exit exit SCOUT: Session done. }}}
  • scout環境でscoredを実行するとマルチユーザ環境が起動する.後は,scrun,mpirunを実行したときに,scoredによってスケジューリングされる. {{{ $ export SCORE_OPTIONS $ scout -g scoreall # scored }}}

サーバホストで動いているのは,

  • scoreboard (クラスタデータベースサーバ)
  • scbcast (ブロードキャストサーバ)
  • msgbserv (ロックサーバ)

計算ホストで動いているのは,

  • scoutd (リモートプロセス起動サーバ.rexecd のようなもの)
⚠️ **GitHub.com Fallback** ⚠️