Kaluza AnalysisのTreeプロット:マルチカラーフローサイトメトリーのデータの迅速かつ包括的な概要を確認
このホワイトペーパーでは、フローサイトメトリーデータの包括的なデコンボリューションのための教師付きアプローチとして、Treeプロットを紹介します。このアプローチは完全な手動解析と教師なしの計算解析アプローチの間のギャップを埋めるものです。Kaluza Analysis Flow Cytometryソフトウェアを使用したTreeプロットの生成方法について、ステップごとに説明します。
マニュアル フローサイトメトリー データ解析
フローサイトメトリーのデータは伝統的にはシーケンシャルゲーティングによって解析されます。マーカーの発現を一度に1つまたは2つずつ可視化し、ヒストグラム中に表示された分布の上に、いわゆるゲートを配置することにより、集団が主観的に同定されます。
この親ゲート内に含まれるすべてのイベントは他のマーカーについてさらに評価され、より多くの子ゲートが定義されます。こうして、関心のある集団だけが残るまで、解析からさらに多くのイベントを順次除外するゲート階層が構築されます。(図1参照)4
Booleanゲーティングでは、AND、NOT、ORなどの論理演算子を使用し、前もって定義されたゲートを組み合わせて、ゲート内のイベントやゲートの組み合わせを含めるか除外するかを決めることができます。

図1. 選抜されたB細胞サブセットのシーケンシャルゲーティング。ヒト末梢血を、DURAClone IM B Cell Antibody Panel(製品番号 B53328)を用いて取扱説明書に従って染色し、フローサイトメーターCytoFLEX LXで取得した。データは、Kaluza Analysisで解析した。細胞集団は、シーケンシャルゲーティングおよびBooleanゲーティングによって同定された。
どちらのアプローチもユーザー定義のゲートに依拠しており、非常に主観的です。古典的なゲーティング戦略は、再現性に欠け、操作者間のばらつきが大きいことが示されています。5さらに、10色のパネルにおける全マーカーの組み合わせを包括的にレビューするには、45個のヒストグラムを評価する必要があるため、手間がかかります。7
イベントの除外は、操作者特有のバイアスが生じる可能性があります。この場合のデータ解析は、ゲーティング戦略を定義した人の事前知識と仮説のみによって行われます。文献に記載されていない集団や異常なマーカー発現パターンは、容易には認識できないかもしれません。3
計算的フローサイトメトリー データ解析
最近では、次元削減やクラスタリング技術などの計算的アプローチが一般的となってきています。viSNEやFlowSOM(図2、SNEやFlowSOMの例)のようなアルゴリズムは偏りがなく、細胞集団間のこれまで認識されていなかった類似性を発見することができます。2,7 クラスタリングアルゴリズムは、手動ゲーティングの結果と一致し、より高い再現性があるということが示されています。1 これらのアプローチは、まだ実行に時間がかかるかもしれませんが、一般的には手動解析ほどの手間は必要ありません。加えて、実行にプログラミングのスキルを必要としない市販のソリューションは、結果の妥当性を確認するのに役立つ専門的な知識を加えるサポートはしていません。6

図2. Kaluza R Pluginを使用した計算的解析。 Kaluza R Console Pluginを使用した DURAClone IM B Cell Antibody Panel(製品番号 B53328)の計算解析。R Consoleプラグインのサンプルファイルで提供されるスクリプトは、CD19+でゲーティングされたイベントで実行するよう調整されました。A) CD45 を除くすべての蛍光チャンネルを含む tsne 解析を行いました。tSNEクラスターのカラーバックゲーティングを可能にするために、シーケンシャルゲーティングを並行して行いました。B)FlowSOM解析後のCD19+イベントのスタープロット。
フローサイトメトリーデータのTreeプロット可視化
Kaluza Analysis Softwareが提供するTreeプロットは、専門的な知識による解析と、包括性、スピードの間の溝を埋めます。解析に含まれるすべてのイベントの物理的特性を、教師付きの方法で評価することができます。予期しないマーカーの組み合わせが容易にわかるようになるでしょう。Treeプロットは1つのTreeプロットで最大28の二変量プロットのデータを凝縮することができ、したがって、一度解析戦略が設定されれば、データ解釈に必要な時間を短縮することができる有用なデータ比較ツールです。Treeプロットは、ゲーティング情報に基づいてイベントを様々なクラス/集団に分類します。イベントは、与えられたゲート内に含まれているか、除外されているかによってクラスに割り当てられます。Treeプロットには軸がないため、軸情報はありません。Treeプロット上の分類に使用できるゲートの最大数は8つまでです。クラスの数は2のゲート数乗であるため、8つのゲートでは、1つのTreeプロットで256個の集団を表示することができます。Treeプロットは、細胞集団がバイモーダル(二峰性)またはバイナリの発現パターンを示すマーカーによって特徴付けられる場合に特に有効です。
図3は、Treeプロットに含まれる以下の構成要素を示しています。:
- Branches(分岐)は、特定の表現型データタイプの結果が陰性か陽性かどうかに基づき、細胞集団を分類するために使用されます。Branchesは、プロットの上にあります。
- Bars(棒グラフ)では、2つの細胞集団間で可能性のある陰性/陽性の分岐の組み合わせを比較できます。Barsは、この表現型分類システムの視覚表現であり、Treeプロットの中心となります。Barsは、Countまたは% Gatedのいずれかで見ることができます。

図3. 共発現パターンを比較するTreeプロット表示。プロットの分岐としてCD27とCD38の共発現パターンを比較したIgM/IgD- CD19+細胞(青い棒グラフ)とIgM/IgD+ CD19+細胞(緑の棒グラフ)のTreeプロット表示。データは、DURAClone IM B Cells Antibody Panel(製品番号 B53328)を使用して生成しました。
KaluzaのTreeプロット作成の手順
1. BranchまたはBarとして Treeプロットに含めたい全ての表現型を表示するプロットを作成します(図4参照)。
2. 各プロット上に、それぞれの表現型について陽性のイベントを含むゲートを作成します。Kaluzaは、表現型を含む棒グラフと分岐を自動的に+でラベル付けし、表現型を除外するものを-でラベル付けします。したがって、CDマーカーについては+または-を省略して、集団名のみでゲートをラベリングするのがよいでしょう(図4)。

図4. DURAClone IM B Cell Antibody Panelを用いた集団および表現型の同定。DURAClone IM B Cell Antibody Panel(製品番号 B53328)を用い、取扱説明書に従って細胞を染色しました。 A) CD19+リンパ球を同定するためのシーケンシャルゲーティング。CD19+集団を入力ゲートとして使用します。B) CD19+リンパ球は、IgMおよびIgD発現レベルに基づいてさらに分割されます。TreeプロットからIgM- IgD+およびIgM+ IgD-の細胞を除外できるように、Booleanゲートを作成しました。IgM/IgDゲートは、Treeプロットの棒グラフを定義するために使用されます。C) CD38およびCD27の発現を可視化するために、Histogramプロットを作成しました。陽性カットオフの識別を容易にするため、リンパ球を入力ゲートとして選択しました。陽性イベントと陰性イベントの間のカットオフをマークするため、「Divider」ゲートタイプを使用しました。Dividerの陽性側には、表示されたマーカーの名前をラベル付けしました。
3. Plots & TablesリボンタブのTree Plotアイコンを選択して、新しいTreeプロットを追加します。
4. プロットの上部にある[Ungated]ハイパーリンクを選択し、ポップアップメニューからゲートを選び、データをフィルタリングする入力ゲートを選択します(必要に応じて)。
5. <Choose Branches(Branchesを選択する)>ハイパーリンクを使用して、ツリーのBranchesを選択します。Branchesは、データセット内の任意のゲートにすることができます。ツリーに追加された各Branchは、より優先順位の高いBranchで定義された表現型特性が陽性か陰性かに基づいて、ゲートされたイベントをさらに分類します。Barsの凡例は、色と、各棒グラフに特に関連した陽性/陰性の表現型データ分類の定義を含み、デフォルトではプロットの下部にあります。
6. 棒グラフを表示するのに適切なY軸データタイプを選択します。デフォルトの測定タイプはCountです。測定タイプを% Gatedに変更したい場合は、<Count>ハイパーリンクを選択し、ポップアップリストから% Gatedを選択します。

図5. DURAClone IM B Cells Antibody PanelのTreeプロット設定。 A) 新しいTreeプロットが作成され、入力ゲートとしてCD19+が選択されました。B) CD27を最初の分岐として選択しました。Dividerゲートは、ゲートリストのQuadrant(四象限)カテゴリにあります。C) CD38が2番目の分岐として選ばれました。Treeプロットには現在、CD27とCD38の発現として可能な4つの組み合わせを表す棒グラフが含まれています。D) IgM/IgDが棒グラフとして追加されました。E) y軸スケールを%Gatedに切り替え、Tree PlotのラジアルメニューにアクセスしてColoringオプションを選択することで、棒グラフに異なる色を割り当てました。
7. Treeプロットで棒グラフとして可視化された任意の集団について、さらなる解析を行うため、それらのイベントをBooleanゲートの生成によって自動的に抽出することができます。TreeプロットからのBarsを、他のTreeプロットを含む他のプロットの入力ゲートとして使用することができます。Barを使用してプロットをゲーティングするには、Altキーを押しながらBarを選択して適切なプロットにドラッグし、マウスボタンを離すと処理が完了します(図6参照)。

図6. TreeプロットからのBooleanゲートの作成。 ヒト末梢血を、DURAClone IM T Cell Antibody Panel(製品番号 B53328) を用いて取扱説明書に従って染色し、フローサイトメーターCytoFLEX LXで取得しました。データはKaluza Analysisで解析しました。A) CD45RA+ CCR7+ CD4+の棒グラフ(水色)を、ALTキーを押しながら選択し、CD27 vs. CD28ドットプロットにドラッグして(ステップ1)、それらの関連するイベントのみを表示するように表示を変更しました(ステップ2)。B) Boolean Gatesダイアログボックスに示されているように、選択された棒グラフを表すBooleanゲートが自動的に作成されました。
ヒント1: Barの上にマウスを置くと、陽性または陰性の分類を含むゲートの名前が、そのBarに関連付けられたBranchesに表示されます。
ヒント2: Treeプロットは、図7に示すように、2つのデータファイルをマージし、ゲーティングで分離することで、2つのサンプルを比較するのに使うこともできます。

図7. コントロールサンプルとテストサンプルを比較したTreeプロット。コントロールサンプル(青)とテストサンプル(緑)は、時間プロットに示されるように、Kaluzaでマージされました。 CD19+イベントを入力集団として使用し、CD27とCCR7を分岐として使用しました。CCR7とCD27のヒストグラムは、ゲート配置を示しています。Treeプロットは、コントロールサンプル(青)とテストサンプル(緑)の%Gatedを棒グラフで比較しています。データは、Thomas Liechti、Huldrych GünthardおよびAlexandra TrkolaによってCytometry Part Aで生成されました。8
Summary
仮説に基づいた手動データ解析は、データの探索や新しい集団の発見には理想的ではないかもしれませんが、定義された研究課題や既知の細胞サブセットの解析には、今日でも適しています。特許取得済みのTreeプロットによって、Kaluzaはマルチカラーデータの高速かつ包括的なデコンボリューション、迅速な統計結果の生成、サンプル間の比較を可能にするツールを提供します。Treeプロットは、二峰性の発現パターンを示すマーカーの解析に特に有効です。
参照
- Aghaeepour, N, Chattopadhyay, P, Chikina, M, et al. A Benchmark for Identification of Cellular Correlates of Clinical Outcomes. Cytometry Part A 2016:89(1). doi.org/10.1002/cyto.a.22732.
- Amir, ED, Davis, KL, Tadmor, MD, et al. ViSNE enables visualization of high dimensional single-cell data and reveals phenotypic heterogeneity of leukemia. Nature Biotechnology 2013:31(6). doi.org/10.1038/nbt.2594.
- Irish, JM. Beyond the age of cellular discovery. Nature Immunology 2014:15(12). doi.org/10.1038/ni.3034.
- Lugli, E, Roederer, M, Cossarizza, A. Data analysis in flow cytometry: The future just started. Cytometry Part A 2010:77A(7). doi.org/10.1002/cyto.a.20901.
- Maecker, HT, Rinfret, A, D’Souza, P, et al. [No title found]. BMC Immunology 2005:6(1). doi.org/10.1186/1471-2172-6-13.
- Reiter, M, Rota, P, Kleber, F, et al. Clustering of cell populations in flow cytometry data using a combination of Gaussian mixtures. Pattern Recognition 2016:60. doi.org/10.1016/j.patcog.2016.04.004.
- Saeys, Y, Gassen, SV, Lambrecht, BN. Computational flow cytometry: Helping to make sense of high-dimensional immunology data. Nature Reviews Immunology 2016:16(7). doi.org/10.1038/nri.2016.56.
- Liechti, T, Günthard, HF, Trkola, A. OMIP-047: High-Dimensional phenotypic characterization of B cells. Cytometry Part A 2018:93. doi:10.1002/cyto.a.23488.
研究用としてのみご利用いただけます。診断用途には使用しないでください。