基因是编码功能蛋白的,根据蛋白功能的不同,其大小也不相同,因此编码基因也不相同。
基因转录成mRNA后,经过翻译形成蛋白前体,三个碱基序列决定一个氨基酸,那么编码区序列是蛋白前体氨基酸数的三倍。
成熟的mRNA除了编码区外,还有5'和3'非翻译区,与翻译调节相关,因此成熟mRNA大小,比刚才计算的还大。
真核细胞的基因是有内含子的,从DNA转录后,还要经过剪接,因此DNA转录区域大于成熟mRNA长度。
基因转录是受到调控的,因此基因上游、下游还存在有些调节序列,因此基因的实际长度比刚才说的还要长。
因此基因的长度不仅取决于编码蛋白氨基酸的多少,还受翻译调节区、内含子序列、转录调节区等影响,一般不会太小,不可能只有几个BP,一般比较大,比如一些基因大小在15KB或者更大。