2018年2月27日掲載 ITトレンド全般 InfoCom T&S World Trend Report

生物由来のDNAがもたらすデータ・ストレージのイノベーション



人類の歴史はストレージ技術の歴史と言っても過言ではない。現時点で知られる最古の洞窟壁画は紀元前数万年頃に描かれたと言われている。また、紀元前数千年頃に文字が発明されてからは、壁面にヒエログラフが刻まれるようになり、さらに時代が下ると、粘土板やパピルスに記録されるようになった。2世紀初頭には紙の製法が確立され、現代に至るまで主要な記録メディアとして利用されている。1950年代以降、記録メディアは急速に発展し、磁気・電気・光学を活用した記録メディアが登場した。

近年では、RAMやHDD/SSD、クラウド・ストレージを含めたデータ・ストレージ市場が拡大する中、その一領域であるアーカイブの重要性もますます高まってきている。様々なデータをリアルタイムに処理する潮流がある一方で、法令で保存が義務付けられるなどセキュアかつ長期に保存しなければならないデータもある。1950年代より前の映画作品のほとんどは、経年劣化しやすいセルロイドに保存されていたため、既に失われてしまっているという。人類の生み出すデータ量は指数関数的に増加しており、この先、現行のストレージ技術では間に合わなくなるかもしれない。動画に関して言えば、4K/8KやVR/ARといった既に見えている技術を使ったコンテンツだけを考えても、膨大なデータ・ストレージが必要になるはずだ。例えば、IntelのBrian Krzanich CEOが2018年1月に米国ラスベガスで開催されたCESの席上で語ったところでは、同社の“True VR”で制作したVR動画の配信では1分当たり3TB(1秒当たり50GB)ものデータが生み出されるという。

このような背景から、新たな記録メディアとして注目されているのがDNAだ。「タンパク質の設計図」と形容されるDNAには、遺伝情報が格納されている。DNAは既存の記録メディアより遥かに大きな容量を持ち、極めて高い密度でデータを保存できる。1EB(100京、10の18乗)ものデータが1立方ミリメートルのスペースに収まるという。また、DNAは耐久性にも優れており、数千年レベルでデータを保存し続けられるという。

DNA解読チャレンジ

時は3年前の2015年に遡る。同年1月にスイスで開催された世界経済フォーラム(ダボス会議)において、欧州バイオインフォマティクス研究所のNick Goldman教授があるプレゼンテーションを行った。それはDNAが記録メディアとしていかに有用かということを主張するもので、Goldman教授は「DNAは既存の記録メディアより長期にデータを保存することができる。DNAの主が死んでしまった後もデータを保持しておける。DNAは非常にコンパクトなもので、極小スペースに膨大な量のデータを格納することができる」と熱弁をふるった。

Goldman教授は単にプレゼンテーションを行っただけでなく、面白い試みを始めた。その内容とは、学生を対象としたコンテストで、DNAの中に隠されたメッセージを解読すると賞金として1BTCが与えられるというもの。なお、2015年1月末時点のBitcoinの価格は200ドル強だった。

このコンテストの期限は2018年1月21日に設定されており、解読に成功する人物が現れないまま3年が過ぎてしまうかに思われた。しかし、結果としては、ベルギーのアントワープ大学の博士課程に在籍するSander Wuyts氏が期限間際で同コンテストの勝者となる。DNAの研究に携わっている同氏は、2017年半ばに暗号通貨に強い関心を抱いたことから、同コンテストに参加することを決意。コンテスト開始時に配布されていたDNAのサンプルチューブを何とか入手し、数カ月の間、四苦八苦しながら試行錯誤を繰り返して解読に漕ぎ着けたという。

このエピソードはそれほど大きく報じられたわけではないが、同コンテストにはGoldman教授のプレゼンテーションの趣旨がよく反映されており、DNAストレージに関する研究の振興に一役買ったと言えるだろう。

DNAストレージの仕組み

既存の記録メディアの場合、物質の磁気的・電気的・光学的性質のいずれかを利用して状態の変化を「0」と「1」に対応させ、デジタル・データとして書き込む。いわゆる二進化されたバイナリ・データだ。

これに対し、DNAを記録メディアとして使う場合には、方法が少し異なる。DNAはヌクレオチドと呼ばれる物質(塩基・糖・リン酸が結合したもの)の連鎖で構成されている。ヌクレオチドには塩基の種類に応じて、アデニン(A)、シトシン(C)、チミン(T)、グアニン(G)というそれぞれの名称がある。なお、この他にウラシル(U)という塩基もあるが、DNAには含まれない。

DNAストレージの仕組み

【図1】DNAストレージの仕組み
(出典:情報通信総合研究所作成)

このように、DNAには4つのヌクレオチドが存在するため、これを利用し、「0」と「1」のバイナリ・データではなく、デジタル・データのパターンを「A」「C」「T」「G」の4文字のいずれかに当てはめることで対応する。例えば、「00」は「A」、「01」は「C」、「10」は「T」、「11」は「G」のように割り当てる。このようにすると、「00011011」という配列の8ビット・データは「ACTG」というように変換することができる(図1)。これを繰り返してDNA鎖をつないでいくことでデータを書き込んでいくわけだ。

次に、DNA鎖に保存されたデータの読み出しには、塩基配列を解析するためのDNAシーケンサを用いる。塩基配列を識別し「A」「C」「T」「G」のいずれかを特定した後、それらをバイナリ・データにデコードしていくという手順になる。書き込むときにそれぞれがどの位置のパーツなのかが分かるようにマーキングしておくことで、読み出すときにそれを目印にして元の位置に並べ直すことでデータを復元できる。

DNAストレージの現在地

DNAストレージに関する研究は世界各地で行われているが、米国のハーバード大学の研究チームは画像ファイルを生きた細菌のDNAに保存し、当該ファイルを約90%の精度で復元することに成功している。これは大きな功績だ。というのも、DNAストレージに関する研究の大半においては、人工DNAが用いられているからだ。自然界に存在する生きた細胞は代謝を行い、分裂・枯死するなど絶えず活動しているため、人工DNAにデータを保存するよりも難度が遥かに高い。

また、研究者の説明によれば、生きた細菌細胞のDNAにデータを格納することのメリットとして高い耐久性が挙げられるという。細菌の中には、大量の放射線曝露下や超高温といった過酷環境下でも生き延びられる種が存在するからだ。

上記の研究は細菌のDNAを用いたものだが、基本的な原理は同じであるため、いずれは他の生物種や人間のDNAに応用できる可能性も出てくるだろう。

Microsoftの取り組み

これまで見てきたように、DNAストレージはまだ研究・実験段階にある。しかし、実用化に向けた動きがないわけではなく、その点ではMicrosoftが先行しているようだ。

Microsoftは、自社の研究機関であるMicrosoft ResearchにおいてDNAストレージに関する研究を行っている。しかし、純粋な学術機関とは異なる営利企業であることからも、Microsoftでは実用化に向けた具体的な目標が掲げられている。すなわち、2020年までに自社のデータセンターにDNAストレージのプロトタイプを実装するというものだ。また、アーカイブに用いられる記録メディアとしては今のところ磁気ドライブが主流だが、Microsoftはこれを最終的にDNAストレージに置き換えていくとしている。

また、Microsoftは2016年7月、ワシントン大学と共同研究を行い、DNA鎖に200MBのデータを保存・復元することに成功したと発表している。これは現時点で世界記録となっている。一つ一つのDNA鎖には20バイト程度のデータしか書き込むことができない。理論的にはDNA鎖をつなげていくことで大量のデータを書き込むことが可能だが、実際に長くつなげていくのは化学的に難しい。このような前提を考慮すると、実用化に向けては、やはりMicrosoftがトップランナーだと言えるだろう。

実用化に向けたDNAストレージの課題

DNAストレージの可能性は非常に魅力的ではあるものの、一般に商用利用されるようになるまでには、いくつかのハードルを突破しなければならない。課題は主に以下の3点だろう。

DNA自体の保存条件

  • DNAは乾燥させた状態で、光が当たらず湿気のない冷暗所に保管する必要があり、このような保存条件を満たす環境を整備すること

コスト

  • データの読み出しにDNAシーケンサが必要になること
  • Microsoftの実験では1,300万個超のDNAが使われており、それらを調達するだけで100万ドル近いコストがかかること(データを読み出すプロセスではDNAが化学的に破壊されてしまう場面が多くあり、DNAのコピーを大量複製することは容易であることからデータが読み出せなくなるという恐れは基本的にないものの、相応のコストがかかる)

技術

  • 記録可能なデータ量の飛躍的な増大(現在はMicrosoftによる200MBが世界記録だが、このままでは全く実用に向かない)
  • DNAにデータを書き込むプロセスの自動化(現在の書き込み速度は1秒当たり数百バイト程度である一方、一般的なHDDの書き込み速度は同数百万バイト)

技術的な部分については、前出の研究機関などでの取り組みを含めた遺伝子工学の今後の発展に期待するばかりだ。一方、ビジネス的な観点では、コスト面の課題をうまく克服できるかどうかが最も重要になるだろう。DNAストレージの有望なユースケースは、Microsoftが目標としているように、まずはアーカイブになると思われる。データの急増が続くことが確実な市場の状況を考えれば、現行のものを超えるストレージ技術に対する需要はそう遠くない将来に生じるだろう。DNAストレージがスムーズに実用化されるかどうかは、それまでの間にDNAストレージのデータ単価をどこまで下げられるかにかかっている。

DNAをデータ・ストレージとして活用するというアイディア自体は数十年前からあるものだが、最近の遺伝子工学の発展によって実現性が高まってきた。筆者は大学時代に「バイオインフォマティクス」という科目を履修した経験があるが、この分野は正に日進月歩であり、当時と比較しても関連技術の進歩は目覚ましい。今後もDNAストレージについては、イノベーションをもたらす可能性のある“next big thing”の一つとして注目し、動静を追っていきたい。

※この記事は会員サービス「InfoCom T&S」より一部無料で公開しているものです。

ITトレンド全般 年月別レポート一覧

2022 (23)
2021 (63)
2020 (61)
2019 (63)
2018 (78)
2017 (26)
2016 (25)
2015 (33)
2014 (1)
2013 (1)
2012 (1)
2010 (1)

InfoCom World Trend Report

会員限定レポートの閲覧や、InfoComニューズレターの最新のレポート等を受け取れます。

ICR|株式会社情報通信総合研究所 情報通信総合研究所は情報通信のシンクタンクです。
ページの先頭へ戻る
FOLLOW US
FacebookTwitterRSS