« テレビでスポーツ観戦 | トップページ | ポスドクの給与 »

2010年2月21日 (日)

大量のシークエンスデータのマッピング

少しずつシークエンスデータがたまって来て、簡単な解析は自分で出来るようにと勉強中。
まだまだ次世代シークエンサーデータ解析のソフトは整ってないと言われていますが、解析の個々の段階を行うソフトはそれなりに存在はします。ただ、ほとんどがUNIXベースなのでそれなりに知識が無いと扱いにくく、GUIで直感的に目的の解析がすぐに行えません。シークエンスデータを扱う方法論がまだ確立していないので、個々の研究室でそれぞれ解析プログラムを組んで解析を行っている感じです。ゲノムアセンブリーとかChIP-Seqといった目的で次世代シークエンサーをつかう場合の方法論は確立されつつある(ChIP-Seqはもう少しかな)ので、ぼちぼちGUIで解析を行うわかりやすいソフトも出てきそうです。商用ではあるみたいですが。
日本でも統合TVなどちょっと変わった試みを行うことで有名(?)なライフサイエンス統合データベースセンター解析ソフトを作っているみたいですが、公開はしていません。

データを前にしてまず問題になるのが、マッピングの問題です。なので、まずこの段階からいろいろ調べています。"How to map billions of short reads onto genomes"という総説が去年に出ているくらいなのでまだ発展途上です。もちろん、1,000万とか2,000万あるデータを一から(時間的にも)BLASTにかける訳には行かないので、専用のソフトを使います。bowtieというソフトが今のところよく使われている様です。マッピングの原理は上記の総説にも書いてあるのですがまだよく理解しきれていません。
でもとりあえずはこのソフトでマッピング出来る環境までは作れたと思われます。

« テレビでスポーツ観戦 | トップページ | ポスドクの給与 »

研究」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/19472/47634223

この記事へのトラックバック一覧です: 大量のシークエンスデータのマッピング:

« テレビでスポーツ観戦 | トップページ | ポスドクの給与 »

2013年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

twitter

  • twitter

最近のトラックバック

無料ブログはココログ