DNA 的蛋白質編碼能力是指其序列中僅佔極小一部分(在人類中不到 2%)的區域,這些區域包含基因,提供合成蛋白質的指令。DNA 透過三聯密碼子(codon)來指定胺基酸,而絕大多數 DNA 屬於非編碼區域,但在調控層面發揮關鍵作用。 蛋白質編碼能力決定了理論上可生成的蛋白質數量,但如可變剪接等生物學機制,使實際產生的蛋白質種類遠多於基因數量。本工具僅提供對 DNA 編碼能力的非常基礎估算。
蛋白質編碼能力的關鍵面向
- 比例極小:
蛋白質編碼基因僅佔整個基因組的一小部分,估計約為 DNA 總量的 1–2%。 - 三聯密碼:
DNA 使用由三個鹼基組成的序列(密碼子)來編碼特定的胺基酸,而胺基酸是蛋白質的基本組成單元。 - 基因與蛋白質:
人類約有 19,000–20,000 個蛋白質編碼基因,但由於可變剪接等機制,一個基因可產生多種不同的蛋白質。 - 非編碼 DNA:
其餘約 98% 的 DNA,曾被稱為「垃圾 DNA」,實際上在基因調控中至關重要,包括基因的啟動與關閉(如啟動子與增強子)。 - 計算方式:
一個簡單公式描述 DNA 長度與蛋白質長度之間的關係:編碼的胺基酸數 = DNA 鹼基數 / 3。相關工具可用於根據 DNA 長度估算蛋白質大小。
計算公式
其關係由以下公式描述:
編碼的胺基酸數 = DNA 長度(鹼基數) / 3
DNA 長度 = 3 × 胺基酸數量
預測蛋白質大小 = 胺基酸數量 × 0.11 kDa
DNA 長度 = 3 × 胺基酸數量
預測蛋白質大小 = 胺基酸數量 × 0.11 kDa
0.11 kDa 為單一胺基酸的平均分子量
運作原理
- 轉錄:
蛋白質編碼 DNA 序列(基因)被複製為信使 RNA(mRNA)。 - 翻譯:
核糖體以密碼子(三個鹼基為一組)的方式讀取 mRNA,並依序組裝對應的胺基酸。 - 蛋白質合成:
由胺基酸組成的多肽鏈摺疊形成具有功能的蛋白質。
重要性
- 功能性 DNA:
儘管比例極小,編碼 DNA 對生物功能至關重要,相關哺乳動物在功能性 DNA 的比例上高度相似。 - 基因組複雜性:
非編碼區域,尤其是調控元件,決定蛋白質在何時、何地被表現,使基因組的複雜性遠超單純的編碼序列。
Preview
