MoFlo XDP を使用したビーズソーティングの導入によるRoche社 GS FLX+のデータ改善
概要
MoFlo XDPを含むセルソーターは、10 μm前後の細胞をソーティングする目的で使用されることが主である。しかしセルソーターの性質上、懸濁液を作ることで細胞以外の粒子も扱うことも得意としており、測定・ソーティングすることができる。今回、DNAシーケンシングの分野への応用例として、表面にDNAが結合した直径20 μmのビーズのソーティングを行い、その具体的事例を紹介する。
現在、DNAシーケンシングの分野において第二世代シーケンサー(*1)と分類される機器が活躍しており、Roche社 GS FLX+(*2)もその1つである。Roche社 GS FLX+は第二世代シーケンサーの中でも読み取り長に秀でた特徴を有しており(最大で1,000 bp以上の読み取りが可能である)、特にゲノム配列が未知の生物を対象とするde novoシーケンシングを進める上で活用されている。
沖縄科学技術大学院大学(OIST)では多くの生物種をde novoシーケンシング解析の対象としている。しかし特定の生物種において、読み取り配列の長さが100塩基以下のものが増加し、また最頻読み取り長の低下、さらに得られる配列の数自体も低下するという現象が確認された。この現象が発生した場合、塩基配列を長く読み取れるRoche社 GS FLX+の長所が薄れてしまうが、本手法を用いる事により現象が発生しなかった場合の質と量に近い配列データを得ることが可能になった。
- *1 ・・・
- 次世代シーケンサー(NGS; Next-Generation Sequencer)とも呼ばれる。従来のキャピラリ電気泳動を用いたシーケンサーとは原理が全く異なり、同時並行した反応で大量のデータを取得できる特徴がある。
- *2 ・・・
- Roche社 GS FLX+では、読み取る対象のDNAを数百?2kbp程度に断片化した後、各断片の塩基配列を読み取る。読み取った配列1つ1つを「リード」と呼び、1回のシーケンスで得られるリードの数は百万前後である。またそれぞれのリードの長さ(=読み取り長)にはばらつきがあるのも特徴である。
Roche社 GS FLX+におけるメーカー提供のシーケンスプロトコールでは、Emulsion PCR(*3; 以下emPCR)により、同一配列の1本鎖DNAが表面に複数分子結合したビーズを得ることができる。また全てのビーズに結合している1本鎖DNAは共通する配列を持っている。そのため、この共通配列と相補的なオリゴDNAにAlexa488を結合しておき、それアニーリングすることで、ビーズ上のDNA分子数に応じた蛍光を発する状態にできる。(図1)

図1 DNAラベリングの模式図
- *3 ・・・
- PCR反応液と油を混ぜ激しく攪拌することで、油の中に無数の液滴を形成することができる。
この液滴を含んだ油をエマルジョンと呼ぶ。(図2)各液滴内は独立した反応系となり、反応系の数だけ反応wellを用意する必要がない。Roche社GS FLX+では1回の実験で3500万個のビーズを処理するが、一つ一つのビーズに独立した反応系を用意する必要がある。
しかしEmulsion PCRを用いれば、96wellプレート2枚で実現可能である。

図2 Emulsion PCR 概要
emPCR後のビーズ(DNAが増幅したビーズ(R1 and R3)と増幅していないビーズ(R1 and R2)が混在する)をMoFlo XDPで測定すると図3のようなヒストグラムが得られる。さらにDNAが増幅したビーズ(R1 and R3)をLog表示からLin表示へ展開し、蛍光の弱い部分を回収してくる。(詳細は実験手法内のソーティングに記載があります。)

図3 emPCR後のビーズ測定結果
メーカー提供のシーケンスプロトコールでは、Alexa488ではなくビオチンで標識したオリゴDNAをアニーリングさせ、Streptavidinでコーティングされた磁性ビーズを用いてPCRがかかったもののみを選抜し(図4)、得られた全てのDNAビーズをシーケンスへ用いる。しかし、必ずしも全てのDNAビーズがシーケンスに適しているわけではないため(*4)、シーケンスに適さないDNAビーズをMoFlo XDPでのソーティングにより除去することで(図3)、得られる配列データの質と量が向上する。

図4 通常プロトコールにおける、DNA増幅(+)ビーズ回収
- *4 ・・・
- ビーズ表面のDNA分子数が多いとシグナルが強くなりすぎ、シーケンス反応と配列読み取りの過程で、周辺に存在するビーズのシグナルに干渉してしまう。
また、emPCRにおいて1つのビーズに対しての鋳型DNAが2分子以上存在するとシグナルが混合して読み取れないが、このようなビーズも表面のDNA分子数が多くなる傾向にある。
実験手法
◯ emPCR
メーカー提供のプロトコールに従いエマルジョンPCRを行う。
◯ Alexa488 ラベリング
- emPCR後のビーズ懸濁液
- 1,000万個 ビーズ
- 1x Annealing buffer (*5)
- up to 490 uL
- 50 uM Alexa488標識Primer
- 10 uL
- Total
- 500 uL
- ↓
- Vortexでよく懸濁・混合する
- ↓
- 65℃、5min インキュベート
- ↓
- 氷上で2min静置
- ↓
- 卓上遠心機で遠心し、上清を廃棄
- ↓
- 1 mL の 1x Annealing bufferで2回洗浄
- ↓
- ポアサイズ35 μm程度のフィルターを通す
- ↓
- 1x Annealing bufferを加え、3 mL程度にメスアップ
- (3,000-3,500個 ビーズ/uL)
- ↓
- MoFlo XDPでのソーティングへ
- *5 ・・・
- GS FLX Titanium LV emPCR Kit (Lib-L) v2 (Roche; 製品番号 5618428) に含まれる。
◯ソーティング
- ・ドットプロット&ヒストグラム
- (1) X軸=FSC Height, Y軸=SSC Height (図3)
- (2) X軸=FL1-Log_Height のヒストグラム (図3)
- (3) X軸=FL1-Height のヒストグラム (図5)
- ・ゲーティング
- (1)の対象ビーズである主集団(全体の90%以上)にリージョンを作成。
- (2)には、(1)の主集団を囲ったリージョン内のデータのみが表示されるようゲートをかける。
2つのピークのうち右側のピークが目的のDNA増幅(+)のビーズとなる。
更にそこへリージョンを作成する。 - (3)には、DNA増幅(+)の集団を囲ったリージョン内のデータのみが表示されるようゲートをかける。ソーティングを行うエリアは図5に表示する。
- ・ソーティング条件
- 大きなビーズの詰まりを低減するため100 μmのノズルを使用する。
シグナルが低い側の60~80%が回収されるように(図3)のヒストグラムへリージョンを設定する。
EPS(個/秒)は3,000~10,000程度になるよう調節する。
当然、EPSは低い方が回収率・純度が良くなるが、ソーティング所要時間とのトレードオフとなるため、必要に応じて設定する。
また攪拌機能を使用することで、ビーズが沈殿しないように注意する。
結果
従来の方法で成功したランにより得られたシーケンスデータを、横軸がリード長のヒストグラムで示したものが図6-Aである。最頻リード長が800 bp前後にあり、100 bp弱のピークも非常に小さい。このシーケンスが行われた際の、各リードのシグナル強度をヒストグラムで表したのが図6-Bである。

図6 ラン成功時のシーケンス結果
一方、従来の方法で冒頭で述べた現象が発生した場合の、同様のヒストグラムを図7に示した。図7-Aにおいて、100 bp弱のピークが高く、また最頻リード長も600 bpと短い。この時のシグナル強度を見ると値が1,500を超えるリードが多かった。
シグナル強度が高くなる主な原因として考えられるのは、ビーズ表面に結合しているDNA分子の数である。この分子の数が多くなるとシーケンス時のシグナル強度が高くなるが、実験手法のところで述べたとおり、これらを事前に除去することが可能である。
同じサンプルを実際にMoFlo XDPを用いたビーズソーティングを適用した際のシーケンス結果が図8である。ソーティングを行わない場合に比べ、100 bp以下のリードが減少しそれに伴い平均リード長が120 bpほど長くなった。また、リード間でのシグナル干渉が低減することにより得られるリード数も向上し、その結果得られるデータ量は約1.9倍となった。(表1)

図7 問題発生時のシーケンス結果

図8 MoFlo XDPを使用して選別したビーズのシーケンス結果
表1 ソーティングの有無によるシーケンス結果の違い
| 総塩基数 (Mbp/region) |
平均長 (bp) |
リード数 | |
|---|---|---|---|
| Sorting (-) | 200 | 466.0 | 430,407 |
| Sorting (+) | 386 | 590.3 | 654,143 |
| 増加量 (増加率) |
+186 (1.93倍) |
+124.3 (1.26倍) |
+223,736 (1.52倍) |
結論
MoFlo XDPを用いた前処理の導入により、 Roche社 GS FLX+でも生物種を問わず長いリードを得ることができるようになった。それに伴って1度のランで得られる総データ量も最大2倍程度増加することが確認された。
また本手法は、シーケンスの原理が類似するIon Torrentシーケンサーに対しても利用できる可能性がある。
データ提供:沖縄科学技術大学院大学(OIST) DNAシーケンシングセクション様