Cytobankを用いたハイパラメータデータの解析パイプライン
viSNE、SPADE、FlowSOMは教師なしアルゴリズムであるため、これまで知見の得られていない未知のフェノタイプを発見できる可能性が高まります。ハイパラメータデータを2次元へ次元圧縮し可視化するviSNEは、希少な細胞集団や研究において着目すべき集団の同定を可能にします。viSNEはしばしば解析の第1ステップとして実行されます。その後クラスタリングのアルゴリズムと組み合わせることで、データに潜在する事象への理解を深めることができますが、Cytobankではその組み合わせを同一のプラットフォームで簡便に行うことができます1。FlowSOMは処理速度、直感的な解析、ファイルサイズの大きいハイパラメータデータセットに特化したクラスタリングで、Self Organizing Mapアルゴリズムによってフェノタイプの類似している細胞をツリー状に可視化します2。viSNEとクラスタリングを組み合わせ、viSNEマップ上にクラスタリングデータを表示することはクラスタリングの最適化検討とその生物学的同定にとても便利です。Figure 2にそのパイプラインを示し、各ステップについて説明します。
テクニカルノートフローサイトメトリーハイパラメータ(高次元)データでのマシンラーニングアルゴリズムを用いた解析・可視化CytoFLEX LX 20カラーパネルでの例でも詳しく説明していますので、ご参照下さい。

Figure 1. Cytobankを用いた高次元フローサイトメトリーデータの解析パイプライン。ここでは特にバイオマーカー探索の場合について示す。 1)データ取得 2)コンペンセーション・スケール調整、QC 3)データのクリーンアップとプレゲート(必要な場合) 4)viSNEによる探索 的解析 5)クラスタリングとバイオマーカー探索 6)ディスカッションをするための可視化
1.データ取得
実験計画とデータ取得では、コントロールの設定と同時にサンプルのデータサイズが統計的に信頼できるかが重要であることに注意してください。もしもサンプルが複数のバッチで測定された場合、バッチ違いに起因する潜在的な影響を考慮し検証を済ませてください。
2.コンペンセーションとスケールの調整、クオリティコントロール
CytobankにはMLアルゴリズムを用いた解析を行うために必要なデータの前処理機能も実装されています。コンペンセーションやスケール調整は、Kaluzaソフトウエア と Kaluza Cytobank plugin を使用することでより簡便に行うこともできます。コンペンセーション調整:
他のチャネルへ漏れ込んでしまう蛍光は補正する必要があります。補正が適切でないとその後の解析に良くない影響を及ぼします。コンペンセーションマトリックスが適用されたサンプルデータであっても、すべてのデータに適切なマトリックスが適用されているかを確認することはとても有用です。

Figure 2. サイトメトリーデータはMLを用いた解析を実施する前に適切なコンペンセーションが施される必要があります。 ( A)は適切でない補正(B)は適切な補正後の同一データ。
スケール調整:
フローサイトメトリーでは主にリニア、log10、arcsinh, やbiexponentialがスケール表示に用いられます。市販のデジタルフローサイトメーターから出力されるデータの蛍光チャネルへは、Cytobankはインポート時に自動でarcsinhスケールを適用します。MLアルゴリズムの計算では適切なスケールが設定されていることはとても重要です。特にarcsinhスケールではargumentに注意が必要です。MLアルゴリズムはスケール調整の有無にかかわらず設定されているスケールをそのまま読み込みます。このため適切に測定されたデータであればスケールの最大値・最小値の調整は大きな変更は不要ですが、argument値は結果に影響するため、場合によっては調整が必要です。詳細は効率的なスケール調整(英文)もご参照ください。

Figure 3. スケール調整例。( A)は不適切で(B)は適切。( A)ではゼロ周辺の領域が沈んでいるような分布となっている。(B)のように陰性集 団がゼロ周辺でシングルピークとなるように調整すると良い。
クオリティコントロール:
測定時の安定性は、timeパラメータ vs 散乱光または蛍光パラメータプロットで確認できます。測定時に詰まりや気泡が含まれてしまったデータでは空白として見られます。この操作は、流速とシグナル検出ともに安定しているデータのみでその後の解析を進めることができるという点で有用です。

Figure 4. クオリティコントロール。蛍光強度が一定で空白もない、安定したデータ例。
3.データのクリーンアップと(必要ならば)プレゲート
クリーンアップでは、デブリス(夾雑物)やダブレット、死細胞など解析に含めたくないものをゲーティングで除きます。この前処理を適切に行わないと、その後の解析に良くない影響を与えたり、混乱させるような結果が得られたりしてしまう可能性があります。研究によっては、クリーンアップの後にさらにゲーティングで解析対象の細胞集団を絞るプレゲートもアプローチのひとつです。
Figure 5. データの前処理。 ( A)シングルセルへのゲーティング、(B)デブリス除去、(C)生細胞ゲーティング、(D)必要であればCD45+白血球細 胞やリンパ球などの集団をゲーティング。
4.viSNEによる探索的データ解析
viSNE 実行のセットアップ- 前処理したゲートから解析対象とする集団とファイルをすべて選択します。total number of eventsにviSNEに最大数の細胞数を設定し、equal samplingを選択します。
- viSNEに用いるclustering channelを選択します。前処理のゲーティングに用いたチャネルを含めないように気をつけてください。細胞集団の同定に用いるチャネルはもれなく含めます。選択したチャ ネルのスケールに、リニアとarcsinhとが混在しない(蛍光チャネルと、time・散乱光チャネル)ように注意します。
viSNE結果の確認
- viSNEマップが得られたあと、それが解析に用いることができる結果なのかを確認したいときは、Illustrations機能でrowsにFCS file をcolumnsにchannelを設定します。次元圧縮が問題なく機能したかをまとめて見ることができます。

Figure 6. 20色のフローサイトメトリーデータのviSNEマップ。シングルの生細胞ゲートについてviSNEを行った。死細胞染色以外の19マーカーをviSNEのclustering channel に使用した。細胞数10万細胞で、iteration 1000, perplexity 30, theta 0.5(デフォルト)設定。左上に表示されているマーカーについてプロット右のカラースケールで表示している。
良好な結果では、clustering channelに設定したマーカーの発現が類似している細胞が集まり、viSNEマップ上に独立した大陸や島状の集合(ランド)を形成されていることを確認できます。他の細胞と特徴的に異なるマーカーのプロットでは発現強度の高い(赤い)細胞で1 つのランドを形成しますし、その他の場合はあるランドの部分的な領域として見ることができます。望ましくない結果の場合、ランドが重なり合っていたり、島状に分かれていなかったりするマップとして確認できます (Figure 7A)。いくつかのマーカーでカラースケール表示をすると、ランドというよりも紐状や細長いパターンとして見られるのも特徴です。このような結果が得られた場合はviSNE設定でadvanced setting のiterationsを増やした設定でviSNEを再度試してください (Figure 7B)。ランドの分離が良くない結果が得られる場合は、perplexityを増やした設定を試してください (Figure 7C)。

Figure 7. 20カラーのフローサイトメトリーデータを異なるviSNE設定で実行した結果のviSNEマップ。シングルの生細胞ゲートについてviSNEを行った。死細胞染色以外の19マーカーをviSNEのclustering channel に使用した。左上に表示されているマーカーについてプロット右のカラースケールで表示している。
* 研究用にのみ使用できます。診断目的での使用はできません。
参考文献
- Amir, E. D., Davis, K. L., Tadmor, M. D., Simonds, E. F., Levine, J. H., Bendall, S. C., Shenfeld, D. K., Krishnaswamy, S., Nolan, G. P., & Pe’er, D. (2013). ViSNE enables visualization of high dimensional single-cell data and reveals phenotypic heterogeneity of leukemia. Nature Biotechnology, 31(6), 545–552. https://doi.org/10.1038/nbt.2594
- Van Gassen, S., Callebaut, B., Van Helden, M. J., Lambrecht, B. N., Demeester, P., Dhaene, T., & Saeys, Y. (2015). FlowSOM: Using self-organizing maps for visualization and interpretation of cytometry data: FlowSOM. Cytometry Part A, 87(7), 636–645. https://doi.org/10.1002/cyto.a.22625