計測技術の進歩とそれによって生み出されるデータは、生物学・生命科学の発展の原動力となります。
近年、多種多様なオミクス計測技術の発達により、生物学・生命科学にこれまでにない規模の膨大なデータが日常的にもたらされてます。
この膨大なデータを活用することで、これまで決着がつかなかった古典的な問い、および、新たなデータによって初めて答えることができる新しい問いにアプローチすることができるとと考えられます。
一方で、現状では、これらのデータから獲得された知識は期待よりも少なく感じられます。
この原因として、データが生み出されても、データと生物学的な問いをつなぐバイオインフォマティクス技術や方法論が整っていないことがあります。
特に、(アセンブリやマッピングといった上流のタスクの部分に比べて)データと生物学的な問いをつなぐ下流のデータ解析の部分は技術開発が遅れています。
これは、生物学・生命科学の対象と目的が多様であるため、技術開発が現場の研究者のニーズに追いついていないことも一因と考えられます。
私は、情報生命科学的観点から、必要となるバイオインフォマティクス技術を開発しつつ、大量のデータから生物学的な問いにアプローチすること、そして、新たな生物学的知識を引き出すことを目指しています。
MOCCS
- MOCCS: Motif Centrality Analysis of ChIP-Seq
- ChIP-seqのデータから転写因子の認識配列を正確に抽出する解析手法
- MOCCS2
- MOCCSを偽陽性が少なくなるように改良した手法
Millefy
- Millefy
- Genome browser-like visualization of single-cell RNA-seq dataset
Others
- FastqSubsample
- FASTQファイルからリードをサブサンプリングするツール。リード数が多い場合でもメモリ使用量が少なくて済むのが特徴。