並列コンピュータ 非定量的アプローチ株式会社 オーム社, 2020/09/26 - 184 ページ スマホ からスーパーコンピュータまで ― 現代のコンピュータ の全体像がわかる! 本書は、コンピュータアーキテクチャを学ぶ大学学部生、 ムーアの法則が頭打ちとなり回路の動作周波数に限界が見え始めた 本書では、この並列コンピュータについて体系的に整理し、基礎、 このような方におすすめ ・コンピュータアーキテクチャを学ぶ大学学部生、院生 ・半導体の設計者、開発者、研究者 ・コンピュータシステムの開発者、研究者 主要目次 第1章 並列コンピュータとは 第2章 集中メモリ型並列コンピュータ 第3章 共有メモリを用いた並列プログラム 第4章 分散共有メモリ(NUMA) 第5章 クラスタ・NORA(NORMA) 第6章 相互結合網 第7章 アクセラレータ |
目次
1 | |
2 | |
5 | |
6 | |
7 | |
9 | |
133 シストリックアレイデータフローベクトル型CGRA | 11 |
14 なぜ並列コンピュータは一般的にならなかったのか? | 12 |
52 ウェアハウススケールコンピュータWSC | 81 |
53 メッセージパッシングライブラリ | 82 |
531 ブロッキング通信とノンブロッキング通信 | 83 |
532 MPI | 84 |
54 RDMAと仮想共有メモリ | 90 |
第6章相互結合網 | 93 |
612 ハイパーキューブ | 95 |
613 kary ncube | 97 |
142 マルチコア革命 | 14 |
143 そして領域特化型計算機へ | 16 |
第2章集中メモリ型並列コンピュータ | 17 |
22 共有バス | 22 |
222 アービトレーション | 23 |
223 バストランザクション | 25 |
23 クロスバスイッチ | 27 |
24 スヌープキャッシュ | 29 |
242 スヌープキャッシュの元祖 | 32 |
243 ライトバック型スヌープキャッシュの基本プロトコル | 35 |
244 Exclusive状態の導入 | 39 |
245 オーナーシップの導入 | 40 |
246 更新型プロトコル | 44 |
247 MOESIプロトコルクラス | 46 |
248 スヌープキャッシュの改良 | 47 |
第3章共有メモリを用いた並列プログラム | 49 |
32 不可分命令とクリティカルセクションの実行 | 50 |
322 さまざまな不可分命令 | 52 |
323 セマフォ | 54 |
324 不可分命令の実装 | 55 |
33 バリア同期 | 56 |
332 Fuzzy Barrier | 57 |
34 OpenMPによる並列プログラム | 58 |
342 OpenMPの実行 | 62 |
第4章分散共有メモリNUMA | 63 |
41 ディレクトリ方式 | 64 |
412 ディレクトリ方式の性能向上 | 70 |
413 ディレクトリのコスト削減 | 71 |
42 メモリコンシステンシィモデル | 74 |
422 Total Store OrderingTSOとPartial Store OrderingPSO | 75 |
423 ウィークコンシステンシィ弱いコンシステンシィ | 76 |
424 リリースコンシステンシィ | 77 |
43 さらなる大規模化 | 78 |
第5章クラスタNORANORMA | 79 |
51 ベオウルフ型クラスタPCクラスタ | 80 |
614 そのほかの直接網 | 100 |
62 間接網 | 102 |
622 不等距離間接網 | 105 |
63 パケットの転送方式 | 109 |
632 パケット蓄積法 | 110 |
633 フロー制御 | 113 |
635 デッドロックフリールーチング | 114 |
636 ルータスイッチの構造 | 118 |
637 適応型ルーチング | 120 |
第7章アクセラレータ | 123 |
72 GPU | 124 |
722 GPUの構成 | 125 |
723 CUDAによるプログラム | 128 |
724 GPUのメモリ | 132 |
Intel Xeon Phi | 133 |
733 PEZYSC12 | 135 |
734 Preferred Networks MN3 | 136 |
742 Intel Lake CrestSpring Crest Spring Hill | 141 |
743 その他のクラウド用途のAIアーキテクチャ | 143 |
751 Intel Mobidius Neural Compute Stick 2NCS2 | 144 |
753 Xilinx VERSAL | 145 |
754 その他のエッジ向けAI用アクセラレータ | 147 |
76 アクセラレータとしてのFPGA | 149 |
762 リコンフィギャラブルシステム | 150 |
763 マルチFPGAシステム | 151 |
764 FPGAを用いたアクセラレータの特徴 | 152 |
765 CGRA | 153 |
77 スーパーコンピュータ | 154 |
772 アーキテクチャ上の特徴 | 155 |
773 日本のフラグシップマシン | 157 |
159 | |
165 | |
171 | |
多く使われている語句
cube CUDA Dirty Exclusive FPGA アーキテクチャ アクセス アクセラレータ アドレス あり いく おり キャッシュ コア ここ システム しまう スイッチ スーパー コンピュータ スヌープ スレッド だが だけ チップ つの ディレクトリ データ できる という なけれ なっ など なら なる により ネットワーク ノード のみ パケット バス バッファ ビット プログラム プロセス プロセッサ ブロック ホームメモリ ほか まで ミス メッセージ ライト られ られる リンク ルーチング われ 以下 一般 演算 仮想 可能 解説 開発 簡単 基本 規模 記憶 技術 共有メモリ 経路 計算 結合網 呼ぶ 向上 構成 構造 行う 高速 使っ 持つ 時間 次元 示す 実現 実行 出力 処理 書き 書き込み 紹介 場合 状態 制御 性能 接続 送る 多く 対し 直接 通常 転送 動作 同じ 同期 読み出し 番号 必要 複数 分散 並列コンピュータ 方式 方法 無効化 命令 目的 問題 用い 用いる 要求 利用 良い 領域