KaluzaとCytobankの組み合わせによる解析ワークフローの構築

マシンラーニングは、複雑なイムノフェノタイピングのデータの詳細な解析や、サンプルのグループや条件についてのバイアスのない検討に、不可欠なものとなりつつあります。研究者が研究対象から洞察を得るためには、新たなツールを習得し、そこから得られた結果を他のプラットフォームとマニュアル作業で統合しなければならないことも少なくありません。

Kaluza Cytobank Plugin*を使用すれば、コンペンセーション、スケール調整、匿名化されたデータセットをデスクトップ型ソフトウエアKaluzaからクラウドプラットフォームであるCytobankへ移行することが可能で、 Kaluza解析ソフトウエア* にサポートされる簡便なコンペンセーション調整機能と、Cytobankプラットフォームに実装されているマシンラーニングアルゴリズムを活用することができます。この2つのパッケージを組み合わせて使うことで、数多くの機能から柔軟に選択し、研究ニーズに合うよう解析パイプラインをカスタマイズすることができ、簡単で総合的なデータ解析&管理ソリューションとして提供されます。

Kaluza Cytobank PluginはKaluza Downloads pageからダウンロードできます。

ステップバイステップでの手順の説明は、 Cytobankラーニングセンターの Leveraging the Combined Power of Kaluza and the Cytobank Platform をご参照ください。

 

Kaluza Cytobank pluginを使用することで、Kaluzaの簡便なスケールおよびコンペンセーション調整機能と直観的操作性に優れたゲーティングの機能を、Cytobankプラットフォームで提供される先進的なアルゴリズム解析やデータ管理機能と組み合わせることが可能となります。

それほど複雑でないデータの場合は、様々な解析ソフトウエアが提供されています。特にKaluza 解析ソフトウエアでは、リアルタイムでのデータ探索ツールに加えて、専用モジュールによる機器と解析のQCトラッキングも提供されます。データレポート機能とバッチ解析機能を備えており、結果概要を迅速に作成することができます。

Cytobankソフトウエアは、フローサイトメトリーやその他のシングルセルデータに対応したマシンラーニングアルゴリズムによる解析と、構造化され高い安全性を持つデータ管理システムを搭載したクラウドベースの解析プラットフォームです。

Cytobankのクラスタリング、次元削減、視覚化ツール(SPADE, viSNE, CITRUS, FlowSOM)は、拡張可能なコンピューティングとクラウドの連携力により、大規模なデータ解析も迅速に実行できます。また、クラウドベースのストレージにデータが自動保存され、共有も簡単に安全にできます1

フローサイトメトリーの多次元データの解析は、複数のステージに分けられます2。データQCとクリーンアップが行われる初期のステージでは、それほど高い計算能力を必要としないため、個人のラップトップやPCでも実行可能です。コンペンセーションとスケール調整、クリーンアップが行われ、その後、探索的解析とクラスタリングが行われます。

探索的解析のステージでは、サンプル内の全細胞の概要が示されます。それほど複雑でないマーカーパネルでは、2次元プロットとラダープロットやツリープロット等のツールによって十分に視覚化が可能です。高次元データの場合は、 viSNEなどの次元削減アルゴリズムを使いることで、全てのパラメータからの情報をひとつの2次元プロットにまとめることができます4

CD4+ と CD8+ T細胞サブセットでのT細胞メモリーマーカー発現を様々な方法で視覚化。ここに示すプロットは、デモンストレーションのみを目的としています。 Kaluza ツリープロット (A)、Kaluza ラダープロット (B)、 Cytobank viSNEマップ(C)。DURAClone IM T Cell Subsets Tube* (製品番号 B53328)で染色した健常者全血サンプルを CytoFLEX LXフローサイトメーターで測定したデータをKaluza解析ソフトウエア * およびCytobankプラットフォーム*を用いて解析した。

 

データ解析の次のステージは、FlowSOMやSPADEなどのクラスタリングアルゴリズムを使って、自動的にバイアスなく、フェノタイプが類似した細胞クラスターにまとめることができます5,6

T細胞およびT細胞メモリーマーカー発現でのクラスタリング方法の違い。ここに示すプロットは、デモンストレーションのみを目的としています。 Cytobank FlowSOMによる Minimum Spanning Tree (A)と、 Cytobank SPADEによる Minimum Spanning Tree (B)。DURAClone IM T Cell Subsets Tube* (製品番号 B53328)で染色した健常者全血サンプルを CytoFLEX LXフローサイトメーターで測定したデータをKaluza解析ソフトウエア * およびCytobankプラットフォーム*を用いて解析した。

 

上述の解析ステージ後半では、クラウドコンピューティングを利用することで端末のスペックを使用することなく、並列にアルゴリズムを実行できるという利点があります。viSNE、 SPADE、FlowSOMの計算をデスクトップ型ソフトウエアで行うことは可能ではありますが、計算中はその端末を他の作業に使うことはできません。また、一度に実行できる解析は1つだけなのでアルゴリズム設定の最適パラメータを検討する必要がある場合には、多大な時間を要してしまいます。クラウドベースのデータ解析では、このような不便はありません。

デスクトップでのリアルタイムで直観的な操作性の快適さと、パワフルなクラウドベースでのマシンラーニング解析と組み合わせるためには、スムースなデータ移行が必要となります。Kaluza Cytobank Pluginを使うことで、リアルタイムレスポンスで直観的な操作のKaluzaでコンペンセーションやスケール調整を行った後、Cytobankのアカウントに直接アップロードすることが可能となります。

 

参考文献

  1. Kotecha, N., Krutzik, P. O. & Irish, J. M. Web-Based Analysis and Publication of Flow Cytometry Experiments. Current Protocols in Cytometry 2010:53, 10.17.1-10.17.24.

  2. Rahim, A. et al. High throughput automated analysis of big flow cytometry data. Methods 2018:134–135, 164–176.

  3. Mair, F. et al. The end of gating? An introduction to automated analysis of high dimensional cytometry data: Highlights. European Journal of Immunology 2016:46, 34–43.

  4. Amir, E. D. et al. viSNE enables visualization of high dimensional single-cell data and reveals phenotypic heterogeneity of leukemia. Nature Biotechnology 2013:31, 545–552.

  5. Qiu, P. et al. Extracting a cellular hierarchy from high-dimensional cytometry data with SPADE. Nature Biotechnology 2011:29, 886–891.

  6. Van Gassen, S. et al. FlowSOM: Using self-organizing maps for visualization and interpretation of cytometry data: FlowSOM. Cytometry 2015:87, 636–645.

 

* 研究用です。診断には使用できません。