実験的にやる方法はもちろんいろいろありますが、質問の趣旨は、ゲノム配列がわかったところで、どうやって遺伝子がいくつあると推定されるなんてことが言えるのかという事ではないでしょうか。 遺伝子領域の推測は、実際にいろいろな遺伝子がクローニングされ実験的に明らかにされてきたデータの蓄積から、法則性が見つけ出され、それをゲノム配列から見つけ出すプログラムを作って使っているわけです。 原理的には、 1.オープンリーディングフレーム(ORF)の抽出と確からしさの推測 タンパク質をコードしている配列は、コドン(アミノ酸1個をコードする3塩基の並び)がある程度連続しているはずです。コドンフレーム(枠組み)は1塩基ずつずれた3通りがあり得るのですが、正しいフレームは連続するのに対し、誤ったフレームは停止コドンが頻繁に入って有意なフレームを為すことができないことがほとんどです。もちろんタンパク質をコードしてい
![その塩基対が遺伝子であるかどうかの決め方](https://cdn-ak-scissors.b.st-hatena.com/image/square/ea33ccd265f5c490c2d513e7a4c44db9efeb5501/height=288;version=1;width=512/https%3A%2F%2Foshiete.xgoo.jp%2Fimages%2Fsp%2Fqa_recommend%2F2062_4.jpg)