適用製品
ゲノム等の生体分子の配列情報の情報処理の分野
効果
リファレンス配列との比較を行う必要なく、次世代シーケンサーの配列解析のみから、新規の活性のある転移因子の転移を検出できる。配列自体も分からなかった新規の転移因子の新たな転移を正確に捉えることが可能である。
技術概要
配列中の転移因子を特定する方法であって、
(A)第1のゲノム配列データおよび第2のゲノム配列データから、一定長の配列を1塩基ずつずらして切り出し、第1のゲノム配列データからの切り出し配列のセットと第2のゲノム配列データからの切り出し配列のセットを生成するステップと、
(B)該切り出し配列のそれぞれについて、n塩基長の標的部位重複(TSD)に該当する配列を含む部分と、該TSDに該当する配列を含まない部分とに区別し、同一のTSDを含む切り出し配列のペアを選抜するステップと、
(C)該選抜されたペアから、対応する転移因子部分配列を有する切り出し配列のペアを選抜するステップと、
(D)該対応する転移因子部分配列を有する切り出し配列のペアから、該第1のゲノム配列データからの切り出し配列のセットと、該第2のゲノム配列データからの切り出し配列のセットとにおいて、該TSDが異なる配列を有する切り出し配列のペアを転移因子対応ペアとして選抜するステップと
を含む、方法。