DNA 的蛋白质编码能力

本工具可计算蛋白质长度、蛋白质分子量或 DNA 长度。

DNA 的蛋白质编码能力是指其序列中仅占很小一部分(在人类中不到 2%)的区域,这些区域包含基因,提供合成蛋白质的指令。DNA 通过三联密码子(codon)来指定氨基酸,而绝大多数 DNA 属于非编码区域,但在调控层面发挥着关键作用。 蛋白质编码能力决定了理论上可生成的蛋白质数量,但诸如可变剪接等生物学过程,使得实际产生的蛋白质种类远多于基因数量。本工具仅用于对 DNA 编码能力进行非常基础的估算。

蛋白质编码能力的关键方面

  • 占比极小:
    蛋白质编码基因仅占整个基因组的一小部分,估计约为 DNA 总量的 1–2%。
  • 三联密码:
    DNA 使用由三个碱基组成的序列(密码子)来编码特定的氨基酸,而氨基酸是蛋白质的基本组成单元。
  • 基因与蛋白质:
    人类约有 19,000–20,000 个蛋白质编码基因,但由于可变剪接等机制,一个基因可以生成多种不同的蛋白质。
  • 非编码 DNA:
    其余约 98% 的 DNA,曾被称为“垃圾 DNA”,实际上在基因调控中至关重要,包括基因的开启与关闭(如启动子和增强子)。
  • 计算方式:
    一个简单公式描述了 DNA 长度与蛋白质长度之间的关系:编码的氨基酸数 = DNA 碱基数 / 3。相关工具可用于根据 DNA 长度估算蛋白质大小。

计算公式

其关系由以下公式描述:

编码的氨基酸数 = DNA 长度(碱基数) / 3
DNA 长度 = 3 × 氨基酸数量
预测蛋白质大小 = 氨基酸数量 × 0.11 kDa

0.11 kDa 是单个氨基酸的平均分子量

工作原理

  • 转录:
    蛋白质编码 DNA 序列(基因)被复制为信使 RNA(mRNA)。
  • 翻译:
    核糖体以密码子(三个碱基为一组)的方式读取 mRNA,并依次组装对应的氨基酸。
  • 蛋白质合成:
    由氨基酸组成的多肽链折叠形成具有功能的蛋白质。

重要意义

  • 功能性 DNA:
    尽管比例很小,编码 DNA 对生物功能至关重要,相关哺乳动物在功能性 DNA 的比例上高度相似。
  • 基因组复杂性:
    非编码区域,尤其是调控元件,决定了蛋白质在何时、何地被表达,使基因组的复杂性远超简单的编码序列。
Preview
BioCalculator-Preview