最終更新日時(UTC):
が更新

履歴 編集

class template
<barrier>

std::barrier(C++20)

namespace std {
  template<class CompletionFunction = see below>
  class barrier;
}

概要

barrierクラスは、複数スレッドにより並行実行される反復的なタスク制御に便利な、スレッド調整機構(同期プリミティブ)である。 バリアの存続期間はバリアフェーズの列からなり、各フェーズでは予定スレッド数がバリアに到達するまで先行到達スレッドの実行をブロックできる。 複数スレッドがバリアオブジェクト上で待ち合わせ(合流)を行うさまから、ランデブーポイント(Rendezvous Point)とも呼ばれる。

バリア同期を用いるとFork-Joinモデルに基づくタスク並行構造を容易に実装できる。

  • コンストラクタにてバリア同期に参加するスレッド数を設定する。
  • arrive_and_wait()により自スレッドの現行フェーズ完了を通知し、他スレッド群の現行フェーズ完了を待機する。バリア同期参加中のスレッドが合流し終えると、各スレッドのブロックが解除されて次フェーズを開始する。
  • arrive_and_drop()により自スレッドの現行フェーズ完了を通知し、次フェーズからはバリア同期に参加しない(参加スレッド数を1つ減らす)。バリア同期参加中のスレッドが合流し終えると、自スレッド以外のブロックが解除されて次フェーズを開始する。

バリアオブジェクトは複数スレッド間の合流制御を繰り返して行えるが、1回のみの制御で十分ならばラッチlatchも利用候補となりえる。

詳細説明

説明のため、ここではバリアオブジェクトが保持するCompletionFunction型のデータメンバをcompletionと表記する。 同データメンバcompletionは、コンストラクタにて設定される。

各バリアフェーズ(barrier phase)は下記のステップで構成される:

  • arrive()またはarrive_and_drop呼び出しによって、予定カウントを減算する。
  • 予定カウントが0に到達したら、完了ステップを実行する。テンプレートパラメータCompletionFunctionのデフォルト値に対する特殊化では、完了ステップは予定カウントを0としたarrive()またはarrive_and_drop呼び出しの一部として実行される。それ以外の特殊化では、完了ステップはそのフェーズ内でバリア到達したスレッドのいずれか1つの上で実行される。
  • 完了ステップが終了したのち、予定カウントをコンストラクタ実引数expectedでリセットし、arrive_and_drop呼び出しの場合は調整を行って、次のフェーズを開始する。

各フェーズは、フェーズ同期ポイント(phase synchronization point)を定義する。 フェーズ内でバリアに到達したスレッドは、wait()呼び出しによりフェーズ同期ポイント上でブロックされ、フェーズ完了ステップが実行されるまでブロック状態は継続する。

フェーズ完了ステップ(phase completion step)は各フェーズ終了時に実行され、下記の効果を持つ:

  • 完了関数を呼び出す。completion()と等価。
  • フェーズ同期ポイント上でブロックされている全スレッドのブロックを解除する。

完了ステップの終了は、完了ステップによりブロック解除される全ての関数呼び出しからの復帰よりも、確実に前に発生(strongly happens before)する。 テンプレートパラメータCompletionFunctionのデフォルト値以外の特殊化においては、完了ステップの進行中にバリアオブジェクトのwait()を除くメンバ関数が呼び出されると、その動作は未定義となる。

テンプレートパラメータCompletionFunctionのデフォルト値は、追加で Cpp17DefaultConstructible 要件を満たす未規定の型であり、式completion()は何の副作用も生じない。 つまりテンプレートパラメータを省略したbarrier<>オブジェクトでは、各フェーズ完了時に追加的な処理を行わない。

barrier::arrival_tokenは、Cpp17MoveConstructible 要件および Cpp17MoveAssignable 要件および Cpp17Destructible 要件を満たす未規定の型。 つまり、コピー不可/ムーブのみ可能な型。

適格要件

テンプレートパラメータCompletionFunctionは Cpp17MoveConstructible 要件および Cpp17Destructible 要件を満たしていること。 is_nothrow_invocable_v<CompletionFunction&> == true

メンバ関数

名前 説明 対応バージョン
(constructor) コンストラクタ C++20
(destructor) デストラクタ C++20
operator=(const barrier&) = delete; 代入演算子 C++20
arrive 到達通知 C++20
wait 待機処理 C++20
arrive_and_wait 到達通知と待機処理 C++20
arrive_and_drop 到達通知後に離脱 C++20

静的メンバ関数

名前 説明 対応バージョン
max 処理系がサポートする予定カウントの最大値 C++20

メンバ型

名前 説明 対応バージョン
arrival_token 到達トークン型 C++20

#include <barrier>
#include <iostream>
#include <thread>

constexpr int NWORKERS = 2;  // ワーカ数
constexpr int NPHASES  = 3;  // フェーズ数

std::mutex cout_mtx;  // 行単位cout出力用ミューテックス

// このプログラムでは (NWORKERS+1)*NPHASES = 9個のタスクを実行する。
// 同じフェーズに属するタスクは複数のスレッド上で同時並行に実行される一方、
// バリアにより異なるフェーズに属するタスクが同時実行されないことを保証する。
// ここでは周期的なFork-Joinモデルのタスク並行実行が行われる。
int main()
{
  // バリア同期: 初期カウント値=ワーカ数+1(メインスレッド)
  std::barrier<> sync{NWORKERS+1};

  // ワーカスレッド群をFire-and-Forget起動
  for (int id = 1; id <= NWORKERS; id++) {
    std::thread([&,id]{
      for (int phase = 1; phase <= NPHASES; phase++) {
        { // ワーカスレッドのフェーズタスクを実行
          std::lock_guard lk{cout_mtx};
          std::cout << "Worker#" << id << " " << phase << std::endl;
        }

        // 合流ポイント: メインスレッド+他ワーカスレッドと同期
        sync.arrive_and_wait();
      }
    }).detach();
  }

  // メインスレッド処理
  for (int phase = 1; phase <= NPHASES; phase++) {
    { // メインスレッドのフェーズタスクを実行
      std::lock_guard lk{cout_mtx};
      std::cout << "Main     " << phase << std::endl;
    }

    // 合流ポイント: 全ワーカスレッドと同期
    sync.arrive_and_wait();
  }
}

出力例

Worker#1 1
Main     1
Worker#2 1
Main     2
Worker#2 2
Worker#1 2
Worker#1 3
Worker#2 3
Main     3

バージョン

言語

  • C++20

処理系

関連項目

参照