IT Cutting Edge ─世界を変えるテクノロジの最前線

第1回不治の病から慢性疾患へ ─"1グラム2ペタバイト"のデータが変えるガン治療の未来

本連載では、年の半分近くを海外出張で過ごす筆者が、現地で取材したイベントやインタビューをもとに、日本ではあまり紹介される機会の少ない、最先端(Cutting Edge)なIT関連の話題を取り上げていく予定です。不定期更新ですが、お時間あればお付き合いいただけると幸いです。

第1回は、6月18~19日に米サンフランシスコで行われたクラウド関連のイベント「GigaOM Structure」に登場したIlluminaのプレジデント、フランシス・デソーザ(Francis deSouza)氏のセッションから、医療の世界を大きく変えようとしているゲノム解析データ技術の現状について触れてみたいと思います。

フランシス・デソーザ氏
フランシス・デソーザ氏

ゲノム解析でガンが治る!?

デソーザ氏がプレジデントを務めるIlluminaは、米サンディエゴに本社を置く、最先端の遺伝子解析技術を武器とするバイオサイエンス企業です。1998年に数名のバイオ科学者たちによって設立された同社は、現在、従業員3000名を超えるグローバルカンパニーに成長し、2013年度の年間収益は14億ドルを超えました。日本にも支社があります。

Illuminaがビジネスを順調に伸ばしてきた背景には、同社が提供する最先端のDNA/RNAシーケンサーやアセイ(分析試料⁠⁠、ゲノム解析サービスなどに対する世界的な強いニーズがあります。もともと米国では、クリントン政権時代からバイオテクノロジーを国家的事業として推進してきた経緯もあるのですが、それに加え、最近ではゲノムデータを解析することで個別化医療を進めようとする動きが世界中で活発化しており、Illuminaのようなすぐれたゲノム解析技術をもつ企業への注目度も相対的に高まっているのです。

染色体(Chromosome)はヒストンと呼ばれるタンパク質のまわりにDNAが巻き付いて構成されている。DNAは4つの塩基(ACGT)が二重螺旋構造で結合しており、DNAの一部に遺伝子がデータとして書き込まれる。ひとつの細胞に含まれるDNAの長さは約2m、うち遺伝子が書き込まれている部分は5%ほどといわれている
染色体(Chromosome)はヒストンと呼ばれるタンパク質のまわりにDNAが巻き付いて構成されている。DNAは4つの塩基(ACGT)が二重螺旋構造で結合しており、DNAの一部に遺伝子がデータとして書き込まれる。ひとつの細胞に含まれるDNAの長さは約2m、うち遺伝子が書き込まれている部分は5%ほどといわれている

デソーザ氏はセッションの冒頭、ゲノム解析が治療に大きく貢献した象徴的な例として、ワシントン大学の著名なゲノム研究者であるルーカス・ワートマン(Lukas Wartman)博士が、自身が罹患した急性リンパ性白血病をゲノム解析によって短期間で完治させた話題に触れています。

ワートマン博士は昨年はじめ、急性リンパ性白血病を宣言されましたが、有効な治療法がないとされるなか、同じ大学の友人たちの協力を得て、腫瘍のガン細胞と健康な細胞の両方の遺伝子を全解析することに取り組みました。両方のゲノムデータを解析し比較することで、どの遺伝子が悪玉であるかを突き止め、有効な治療法を探ることにしたのです。大学にあるほぼすべてのシーケンサーとスパコンをフル稼働して解析した結果、ガン細胞の増殖を促すタンパク質を大量に生成する、一見健康に見える遺伝子を発見し、このタンパク質の生成を抑えるにはファイザー製薬の作った腎臓ガンの治療薬が有効とわかると、ワートマン博士はその薬の服用を開始、徐々に回復に向かい、数ヵ月後にはほぼ完治するまでに至りました。

デソーザ氏は「もちろんこれは非常にラッキーな例に過ぎないし、誰にでも応用できる話ではない。だが、ガンが発生場所の臓器からその名前を付けられ(胃ガン、肝臓ガン、腎臓ガンなど⁠⁠、分類されるやり方はもう古くなってきている」と指摘、ゲノム解析が旧来の治療に取って代わる日は遠くないとしています。

このほかにもゲノム解析はすでに多くの分野で新しい実績を挙げつつあります。デソーザ氏は例として、胎児の遺伝子疾患を出生前に診断する検査では、羊水穿刺(子宮に長い針を刺して羊水を吸引する方法)ではなく、母体の血液をゲノム解析する方法が主流になりつつあることや、事件事故のあらゆる解析(フォレンジック)の現場でゲノム解析が一般化しつつあることを挙げています。⁠あと2、3年もするとポータブルシーケンサー(簡単に持ち運びできる遺伝子解析シーケンサー)が一般的になり、事故現場ですぐにゲノム解析を行うことも可能になる」⁠デソーザ氏)そうです。犯罪捜査ドラマの捜査シーンや鑑定シーンも大きく変わるかもしれませんね。

ゲノム解析データが抱える4つの課題

ゲノム解析は確実に身近なものになりつつありますが、その大きな要因として、解析(シーケンス)に要するコストの大幅な下落があります。30億塩基対にもおよぶヒトゲノムの全塩基配列を解析したヒトゲノムプロジェクトが終了したのは2003年ですが、当時は人間ひとり分のゲノムを解析するのに30億ドル近くの費用がかかりました。ところが現在ではわずか1000ドルで事足ります。

デソーザ氏は「ムーアの法則なんてバカバカしくなるほどのコストダウンがこの世界では起こっている」としていますが、相対的にシーケンスされるゲノムの数は爆発的に増えており、2011年の段階でバイオ企業によるゲノム解析数は3万を超えるとのこと。

ゲノム解析にかかるコストは12年で激減し、解析件数は増大した。ムーアの法則(左のグラフの点線)と比較するといかに劇的なコストダウンが実現したかがわかる
ゲノム解析にかかるコストは12年で激減し、解析件数は増大した。ムーアの法則(左のグラフの点線)と比較するといかに劇的なコストダウンが実現したかがわかる

そしてデータ解析の機会が増えれば増えるほど、Illuminaのような企業にとって大きな課題となってくるのが、解析したデータの扱いです。デソーザ氏はゲノム解析データにおける4つの課題として以下を挙げています。

データの量が多すぎる

言うまでもなくゲノムデータの量は膨大です。デソーザ氏は「1グラムのDNAに格納できるデータ量は2ペタバイト。これはNetflixの全データ量とほぼ同じ」と語っていますが、この膨大なデータをどこに保存し、どう管理していくのかはもっとも頭の痛い問題だといえます。Illuminaがどのようにゲノム解析データを管理しているのかについては今回のセッションでは語られませんでしたが、最近では同社のようなバイオ系企業の多くがパブリッククラウドにデータを移行する事例が増えています。

データが構造化されていない

ひとくちにゲノム解析データといっても、データのタイプはさまざまです。テキストもあれば画像もあり、また、解析に使った試料やシーケンサによってもデータ形式が異なります。またデータを採取する医師、解析するアナリストによってもデータのアウトプット形式は変わってきます。構造化されていないデータであるがゆえに、解析をいかに高い精度でもって効率化させることができるかが、Illuminaのような企業の差別化ポイントになります。

データがサイロ化しやすい

ゲノム解析データはセンシティブなデータであるため、非常にサイロ化しやすいデータでもあります。医療機関、医師/研究者、Illuminaのような解析サービスプロバイダといった単位で保存/運用され、データの共有や統合は非常に困難です。またEMR(電子カルテ)や外部のデータベース、パブリックサービスとの連携もむずかしく、解析データから適切な治療法を導きにくいことも少なくありません。

データがつねにセキュアであることを求められる

ゲノム解析データは究極のプライバシーともいわれます。自分のゲノム解析を依頼する人は、そのデータがどこにも流出することなく、たとえ2次利用される場合も匿名化や暗号化されていることを望むはずです。しかしDNAのマッチングは意外と容易に行えるため、たとえ匿名化されたゲノム解析データでも個人を特定するのはそれほど難しくないとも指摘されています。なお、米国にはHIPAA(Health Insurance Portability and Accountability Act, 医療保険の相互運用性と説明責任に関する法律)という医療関係者が必ず守らなければならない法律があり、患者データの取り扱いが厳密に規定されています。一方で「HIPAAによる規制は過剰で、データ共有を妨げ、医療の発展を阻害する」と批判する動きもあります。

この4つの課題のうち、もっとも注目度が高く、そしてもっとも解決が難しいものが最後のセキュリティとプライバシーだといえます。冒頭で紹介したワートマン博士のような個別化医療を発展させ、一般化していくためには、ここで挙げられた4つの課題をすべてクリアした、社会で共有できるゲノム解析データ基盤が必要になります。そしてデータ基盤にデータを集約していくには、より多くの人々に自身のゲノムデータを提供することに同意してもらわなければなりません。

ゲノム解析データをめぐる課題でもっとも難易度が高いのがセキュリティとプライバシーの問題。この課題の落としどころを見つけない限り、共有基盤の構築は難しいが「実現にこぎつけることはできる」とデソーザ氏。期待しましょう!
ゲノム解析データをめぐる課題でもっとも難易度が高いのがセキュリティとプライバシーの問題。この課題の落としどころを見つけない限り、共有基盤の構築は難しいが「実現にこぎつけることはできる」とデソーザ氏。期待しましょう!

デソーザ氏は「現状では、ゲノム解析データの共有は非常に限られた条件下でのみ行われている。今後、共有基盤を拡充していくには、一にも二にも提供者との間で合意を徹底すること。データの匿名化や暗号化に関する疑問に答え、データの利用に関する説明責任を果たす、そしてこのデータベースがいかに医学を発展させるかを理解してもらう」と強調しますが、逆に言えばこのプロセスで手を抜かないことが、信頼される医療データ基盤の構築につながるといえるでしょう。

ゲノム解析技術は世界を変える!

セッションの最後、デソーザ氏はゲノム解析技術の発展によって「あと数年以内で起こること」として、以下の6つを挙げています。

  1. シーケンス(ゲノム解析)がより多くの命をダイレクトに救う(もうすでに起こっている)
  2. 腫瘍のサンプルは定期的に解析されるようになり、治療のスタンダードとなる(1~5年後)
  3. 国家が国民のシーケンスを行うようになる(1~3年後)
  4. シーケンスの際に患者の電子カルテにアクセスできるようになる(2~5年後)
  5. 子供は生まれたときから定期的にシーケンスされる(3~7年後)
  6. ガンはただの慢性疾患として扱われるようになる(5~10年後)

ガンがただの慢性疾患になる ─これがもし実現したら、人類の未来は本当に大きく変わると言っても過言ではないでしょう。ゲノム解析をはじめとする分子医学の発展は、これまで不可能とされていたことを可能にし、医療の常識を大きく塗り替えてきました。先に挙げた4つの課題をクリアしたゲノム解析データ基盤が登場すれば、デソーザ氏の予測がすべて当たることも夢ではないかもしれません。


お気づきの方もいるかもしれませんが、デソーザ氏は昨年11月までSymantecのプロダクト&サービス部門のプレジデントを務めていました。MIT卒業後、IBMのワトソン研究所でキャリアをスタートしたデソーザ氏は、その後、いくつかのベンチャーを立ち上げたり、MicrosoftやSymantecのようなな大企業のエグゼクティブとして活躍したりと、米国のIT業界ではかなりの有名人です。

そのデソーザ氏をSymantecから引き抜いたIlluminaの姿勢に、この会社がゲノム解析データ基盤の構築に本気で取り組んでいることがよくわかります。ゲノム解析データのようにセンシティブなデータを扱う企業だからこそ、セキュリティを含むあらゆるIT技術に精通し、豊富な人脈をもつデソーザ氏をトップに迎えたのです。ITを理解している人を経営陣に加え、ビジネスを伸ばし、社会にも貢献していく。米国にはこのようにITがビジネスを変えるという経営を地で行っている企業が少なくありません。そうした土壌が新しいイノベーションを次々と生み出す源泉になっていることを、現地で取材すると肌で実感します。

おすすめ記事

記事・ニュース一覧