آنالیز بیوانفورماتیک کدونی ژنوم کلروپلاست گونه های دیپلوئید و مقایسه با ژنوم دو گونه تتراپلوئید پنبه

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار ، بخش تحقیقات علوم زراعی و باغی، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی، سازمان تحقیقات، آموزش و ترویج

2 کارشناس ارشد، زیست فناوری(بیوتکنولوژی)، دانشگاه آزاد اسلامی واحد ارومیه، ایران

3 کارشناس ارشد اصلاح نباتات، دانشکده کشاورزی، دانشگاه ارومیه، ایران

چکیده

تجزیه کاربردی کدون اهمیت ویژه‌ای در بهینه‌سازی سامانه بیان ژن‌ها در تولید پروتئین دارد. جنس گوسیپیوم مهمترین گیاه تولیدکننده الیاف در دنیای جدید می‌باشد. در این تحقیق توالی کامل ژنوم کلروپلاست دو گونه‌ G.thurberi و G.arboreum توسط نرم افزار کدونW مورد مطالعه و تجزیه قرار گرفت. تجزیه کدون‌های دارای ترادف (RSCU) برای 57 ژن کدکننده پروتئین در ژنوم کلروپلاست این دو گونه به منظور دستیابی به فاکتورهای دخیل در اریبی کدون صورت پذیرفت. تمامی کدون‌های ترجیح داده شده دارای بازهای آلی آدنین و تیمین در انتهای کدون بودند که با عنایت به غنای ژنوم کلروپلاست در خصوص این دو باز پدیده‌ای طبیعی است. آنالیز تطبیقی و روش برآورد تعداد موثر کدون‌ها به صورت نمودار تعداد کدون به منظور تجزیه کاربرد کدون‌های مترادف انجام گرفت. نمودارENC Vs GC3 ، عمده ژن‌های آنالیز شده را معادل یا دقیقا در سمت چپ منحنی قابل انتظار GC3 گروه‌بندی کرد که بیانگر تاثیر محدودیت‌های ترکیب کدونی در تنظیم استفاده ار کدون‌هاست. بر اساس تجزیه تطبیقی، اریبی مشاهده شده در ژنوم کلروپلاست گونه‌های مورد مطالعه با طول ژن، اریبی جهش در ژن‌ها، سطح هیدروپاتی ژن‌های پروتئینی، عملکرد ژن و انتخاب یا بیان ژن بصورت ماهرانه‌ای در کاربرد کدون‌ها تاثیرگذار است. نتایج این پژوهش در فراهم آوردن زمینه برای مطالعات تکامل ملکولی قابل استفاده خواهد بود.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Bioinformatics Codon Usage Analysis of Chloroplast Genomes in Some Diploid Species and Comparison with Two Tetraploid Species of Cotton

نویسندگان [English]

  • Farshid Talat 1
  • Samaneh Hasaninejad 2
  • Mehdi Badri Anarjan 3

1 Assistant Professor, Seed and plant improvement Research Department, West Azarbaijan Agricultural and Natural Resources Research and Education Center, AREEO, Urmia, Iran.

2 Master graduate of Biology (Biotechnology), Islamic Azad University of Urmia, Iran

3 Master graduate of Plant Breeding, Urmia University, Iran

چکیده [English]

Analysis of codon usage is very important to optimize the production of proteins in gene expression system. Gossypium spp. is the most important fiber crop in the modern world. In this research the complete nucleotide sequence of the chloroplast genomes of two wild cotton species was studied and analyzed using codon W software. Synonymous codon usage of 57 protein coding genes in chloroplast genome of G.thurberi and G.arboreum was analyzed to find out the possible factors contributing codon bias. All preferred synonymous codons were found to use A/T ending codons as chloroplast genomes are rich in AT. Correspondence analysis and method of effective number of codon as NC-plot were conducted to analyze synonymous codon usage. ENC Vs GC3 plot grouped majority of the analyzed genes on or just below the left side of the expected GC3 curve indicating the influence of base compositional constraints in regulating codon usage. According to the corresponding analysis, codon bias in the chloroplast genome of G.thurberi and G.arboreum are related to their gene length, mutation bias, gene hydropathic level of each protein, gene function and selection or gene expression only subtly affect codon usage. This study provided insights into the molecular evolution studies.

کلیدواژه‌ها [English]

  • Correspondence Analysis
  • Chloroplast Genome
  • NC Plot

آنالیز بیوانفورماتیک کدونی ژنوم کلروپلاست گونه­های دیپلوئید پنبه و مقایسه با ژنوم دو گونه تتراپلوئید

فرشید طلعت1*، سمانه حسنی­نژاد2 و مهدی بدری انرجان3

1 ایران، ارومیه، آموزش و ترویج کشاورزی، سازمان تحقیقات، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی، بخش تحقیقات علوم زراعی و باغی

2ایران، ارومیه، دانشگاه آزاد اسلامی واحد ارومیه، گروه زیست فناوری(بیوتکنولوژی)

3 ایران، ارومیه، دانشگاه ارومیه، دانشکده کشاورزی، گروه اصلاح نباتات

تاریخ دریافت: 10/2/97                تاریخ پذیرش: 25/10/97

چکیده

تجزیه کاربردی کدون اهمیت ویژه­ای در بهینه­سازی سامانه بیان ژن­ها در تولید پروتئین دارد. جنس گوسیپیوم مهمترین گیاه تولیدکننده الیاف در دنیای جدید می­باشد. در این تحقیق توالی کامل ژنوم کلروپلاست دو گونه­ G.thurberi و G.arboreumتوسط نرم­افزار کدونW  مورد مطالعه و تجزیه  قرار گرفت. تجزیه کدون­های داراری ترادف (RSCU) برای 57 ژن کدکننده پروتئین در ژنوم کلروپلاست این دو گونه بمنظور دستیابی به فاکتورهای دخیل در اریبی کدون صورت پذیرفت. تمامی کدون­های ترجیح داده شده دارای بازهای آلی آدنین و تیمین در انتهای کدون بودند که با عنایت به غنای ژنوم کلروپلاست در خصوص این دو باز پدیده­ای طبیعی است. آنالیز تطبیقی و روش برآورد تعداد موثر کدون­ها بصورت نمودار تعداد کدون بمنظور تجزیه کاربرد کدون­های مترادف انجام گرفت. نمودارENC Vs GC3 ، عمده ژن­های آنالیز شده را معادل یا دقیقا در سمت چپ منحنی قابل انتظار GC3 گروهبندی کرد که بیانگر تاثیر محدودیت­های ترکیب کدونی در تنظیم استفاده ار کدون­هاست. بر اساس تجزیه تطبیقی، اریبی مشاهده شده در ژنوم کلروپلاست گونه­های مورد مطالعه با طول ژن، اریبی جهش در ژن­ها، سطح هیدروپاتی ژن­های پروتئینی، عملکرد ژن و انتخاب یا بیان ژن بصورت ماهرانه­ای در کاربرد کدون­ها تاثیرگذار است. نتایج این پژوهش در فراهم آوردن زمینه برای مطالعات تکامل ملکولی قابل استفاده خواهد بود.  

واژه های کلیدی: آنالیز تطبیقی، ژنوم کلروپلاست، نمودارNC

* نویسنده مسئول، تلفن: 09104055682، پست الکترونیکی: f.talat@areeo.ac.ir

مقدمه

 

در بررسی­های تکامل ملکولی گیاهان، ژنوم کلروپلاست بدلیل اندازه کوچک، تعداد نسخه­های بالا، ساختار حفاظت شده گسترده و عملکرد شناخته شده بسیاری از ژن­های آن در سطح ملکولی برای آنالیزهای ترجیح کدونی بسیار مورد توجه قرار گرفته است (9). سازماندهی ژنوم کلروپلاست کاملاً حفاظت­شده می­باشد و از یک کروموزوم حلقوی با ساختار چهارجزئی تشکیل شده و دارای دو ناحیه تکرار معکوس (25 کیلوباز) می­باشد که منطقه تک نسخه بزرگ (80 کیلوباز) را از ناحیه تک نسخه کوچک (20کیلوباز) جدا می­کنند. اندازه این ژنوم حلقوی شکل از 35 تا 217 کیلوباز متغیر است اما این محدوده برای اکثر ژنوم­های پلاستید متعلق به موجودات فتوسنتزکننده 165-115 کیلوباز می­باشد (2). در مقایسه با ژنوم­های هسته­ای و میتوکندری، ژنوم پلاستید در میان گونه­ها کاملا حفاظت شده می­باشد (8) گرچه در مقایسه با توالی کامل کلروپلاست تفاوت­هایی نیز گزارش شده است (4 و 13) که این موضوع بطور عمده به گسترش یا عدم گسترش تکاملی و یا از دست دادن ناحیه تکرار معکوس، بازآرایی ژنوم و تکرارهای پراکنده نسبت داده شده است (4، 11 و 13). ژنوم کلروپلاست در گونه­های مختلف دارای سازماندهی بسیار محافظت­شده می­باشد که اکثر ژن­های آن در سطح ملکولی شناخته شده­اند و به همین دلیل برای مطالعات و بررسی­های تکامل ملکولی بسیار مناسب است. کلروپلاست یک محفظه ایده­آل برای تجمع پروتئین­های خاص و یا محصولات بیوسنتزی آنها است که در صورت انباشته شدن در سیتوپلاسم مضر خواهند بود و علاوه بر این خاموش کردن ژن در آن مشاهده نشده است (12). به همین دلیل ژنوم کلروپلاست برای بررسی برخی از صفات مهم زراعی از قبیل مقاومت در برابر علف­کش­ها، مقاومت در برابر حشرات، مقاومت به بیماری­ها و تحمل شوری مهندسی شده است. طلعت و وانگ (2015) با انجام آنالیزهای مقایسه­ای روی ژنوم کلروپلاست گونه دیپلوئید Gossypium thurberi و دو گونه آلوتتراپلوئید به این نتایج دست یافتند که ژنوم کلروپلاست G.thurberi دارای ساختار چهار جزئی حفاظت شده بطول 160264 جفت­باز بوده که نواحی LSC (Large Single Copy) و SSC (Small Single Copy) توسط دو ناحیه تکرار معکوس از هم جدا شده­اند. این ژنوم حاوی 113 ژن منفرد و 20 ژن دو نسخه­ای است. ژن­های منفرد کد کننده 79 پروتئین، 4 ژن RNA ریبوزومی و 30 ژن RNA ناقل هستند که در میان تمام ژن­های پلاستیدی تنها 18 ژن حاوی یک یا دو اینترون گزارش شدند و در مقایسه با DNA کلروپلاست دو گونه آلوتتراپلوئید، rps18 تنها ژن مضاعف شدهدرگونهG.thurberi  است (12). بات و همکاران (2014) با انجام آنالیزهای ژنومی ترجیح کدونی و بررسی اثر فشار جهشی، انتخاب طبیعی و ویژگی­های میزبان روی تکامل ویروس دریافتند که در کل گرایش ترجیح کدونی کمی وجود دارد و فاکتور اصلی اثرگذار فشار جهشی است که تحت تاثیر میزبان است. همچنین علاوه بر این انتخاب طبیعی، محیط و شرایط جغرافیایی نیز بر ترجیح کدونی اثر می­گذارند (1). این تحقیق با هدف مطالعه و مقایسه توالی کامل ژنوم کلروپلاست گونه­های دیپلوئید G.thurberi و G.arboreum با گونه­های تتراپلوئید G.barbadense و G.hirsutum گیاه پنبه، آنالیز ساختار ژنوم، محتوای ژن، سازماندهی توالی­های تکراری، ترجیح کدونی و مقایسه بین ژنوم­های موجود انجام گرفت.

مواد و روشها

توالی کامل ژنوم کلروپلاست گونه­های G.thurberi، G.arboreum، G.barbadense و G.hirsutum با فرمت  FASTA بترتیب با شماره دسترسی و طول NC_015204.1) و(160,264 ،HQ_325740.1)  و (160,230،NC_008641.1)  و (160.317 و NC_007944.1) و (160,301 از سایت NCBI دانلود شدند. برای شناسایی موقعیت هر یک از ژن­ها در هر چهار ژنوم کلروپلاست مورد بررسی با توجه به اطلاعات موجود در بانک ژن مربوط به هر ژنوم در سایت NCBI مونتاژی از توالی هر ژنوم به همراه ژن­هایی که در روی توالی مشخص شده­اند توسط word(2010) بدست آمد. اینترون­های مربوط به ژن­های حاوی اینترون نیز با رنگ مجزا مشخص شدند که با این کار هم موقعیت ژن­ها، نواحیIGS (Intragenic Spacer) و همچنین ژن­هایی که دارای اشتراکهستند نیز مشخص شدند. نقشه ساختار ژنوم و توزیع ژن با استفاده از نرم­افزار (http://ogdraw.mpimpgolm.mpg.de) OGDRAW (V1.1):  و با دادن اطلاعات مربوط به شماره دسترسی هر ژنوم رسم شد. برای تشخیص توالی­های تکراری و موقعیت آنها از نسخه آنلاین نرم­افزار (http://bibiserv.techfak.uni-bielfeld.de/reputer) REPuter استفاده شد. RSCU (Relative Synonymous Codon Usage) های کدون­های مختلف در هر نمونه ژنی توسط CodonW در نرم افزار Mobyle در آدرس (http://mobyle.pasteur.fr/cgibin/portal.py) محاسبه گردید. برای بدست آوردن درصد مربوط به نوکلئوتیدهای A، T، C، G و همچنین AT وGC در ژنوم­ها جهت تشکیل جدول محتوای GC از نرم افزار Visual Bioinformatics (V 2.1.0) استفاده شد. برای رسم نمودارهای مربوط به بحث کاربرد کدون و آنالیزهای تطابقی بترتیب از نرم­افزارهای (V.22) SPSS و Minitab (V.16) استفاده شد.

نتایج

محتوی ژنی: ژن­های کدکننده در ژنوم کلروپلاست G.thurberi، G.arboreum، G.barbadense و G.hirsutum در جدول 1 آمده است.

 

جدول 1-  ژن­های کد شونده توسط ژنوم کلروپلاست چهار گونه

Gene Name

Group

AccD

Subunit of Acetyl-CoA-Carboxylase

 

 

 

 

 

 

 

 

 

 

Protein Name

 

 

 

 

 

 

 

 

 

 

 

 

 

 

RNA Genes

 

RbcL

Large subunit of Rubisco

ndhA*, ndhB*§, ndhC, ndhD, ndhE, ndhF, ndhG, ndhH, ndhI, ndhJ, ndhK

Subunits of NADH-Dehydrogenase

atpA, atpB, atpE, atpF*, atpH, atpI

Subunits of ATP synthase

petA, petB*, petD*, petG, petL, petN ccsA

Subunits of Cytochrome b/f complex

psaA, psaB, psaC, psaI, psaJ, psbA, psbB, psbC, psbD, psbE, psbF, psbH,

psbI, psbJ, psbK, psbL, psbM, psbN, psbT, psbZ

subunits of Photosystem I and II

rpoA, rpoB, rpoC1*, rpoC2

DNA dependent RNA Polymerase

rpl14, rpl16*, rpl2*§, rpl20, rpl22, rpl23§, rpl32, rpl33, rpl36

Large subunit of Ribosome

rps11, rps12*§, rps14, rps15*, rps16*, rps18, rps19§, rps2, rps3, rps4,

rps7§, rps8

Small subunit of Ribosome

cemA, clpP**, matK

Others

ycf1§, ycf15§, ycf2§, ycf3**, ycf4

Function unknown

rrn16§, rrn23§, rrn4.5§, rrn5§

Ribosomal RNA Gene

trnA-UGC*§,trnC-GCA,trnD-GUC, trnE-UUC, trnF-GAA, trnfM-CAU, trnGUCC*,trnG-GCC, trnH-GUG, trnI-CAU§, trnI-GAU*§, trnK-UUU*, trnLCAA§, trnL-UAA*, trnL-UAG, trnM-CAU, trnN-GUU§, trnP-UGG, trnQ-UUG,trnR-ACG§, trnR-UCU, trnS-GCU,trnS-GGA,trnS-UGA, trnT-GGU,trnTUGU,trnV-GAC§, trnV-UAC*, trnW-CCA, trnY-GUA

transfer RNA gene

       

§ نمایانگر ژن­های موجود در ناحیه IR، * نمایانگر ژن­های با 1 اینترون و ** نمایانگر ژن­های با یک اینترون می­باشد.

 

نتایج نشان میدهند که G.thurberi حاوی 134 ژن، G.arboreum 128 ژن، G.barbadense و G.hirsutum دارای 129 ژن بوده که شامل 79 ژن کدکننده پروتئین، 4 ژن  RNAریبوزومی و 30 ژن  RNAناقل می­باشد که بعبارت دیگر میتوان گفت در کل 113 تک ژن و 18 ژن دو نسخه­ایواقع در ناحیه تکرار معکوس تقریبا مشمول هر چهار ژنوم مورد بررسی میباشند. در هر یک از ژنوم­های کلروپلاست G.thurberi، G.arboreum، G.barbadense و G.hirsutum پنج ژن با عملکرد ناشناخته بنام ycf شناسایی و بعنوان ژن­های ضروری گیاهان در نظر گرفته ­شده که در میان گونه­ها کاملاً محافظت شده­اند. با توجه به نتایج بدست آمده در مطالعات ژنوم کلروپلاست، دو ژن حائز اهمیت می­باشند یکی از آنها ژن rps12 میباشد و به 2 قطعه که یکی با اگزون انتهای ´5 واقع در LSC و دیگری با اگزون انتهای ´3 واقع در IR (Inverted Repeat) جدا می­گردد. ژن دیگر matk، 5/1 کیلوباز طول داشته و در ناحیه اینترون trnK/UUU شناسایی شده است که تنها ژن واقع در اینترون بوده و پروتئین maturase K را رمزدهی می­کند.

محتوی GC: محتوی GC از ویژگی­های مهم ژنوم کلروپلاست می­باشد درصد GC در ژنوم G.thurberi، G.arboreum، G.barbadense و G.hirsutum شبیه هم بوده و برابر2/37 درصد می­باشد. مناطق کدکننده و غیر کدکننده در هر چهار ژنوم دارای محتوی GC کمی بوده و بترتیب 4/40 و 1/33 درصد گزارش شد. تفاوت در محتوی GC برای چهار ناحیه ژنوم کلروپلاست چهار گونه تحت بررسی در جدول 2 آورده شده است و نتایج نشان داد که ناحیه IR از لحاظ GC غنی­ترین بود و میزان آن برای هر چهار گونه تقریباً  43 درصد گزارش شد درحالیکه GC درSSC وLSC برای گونه­های تحت بررسی G.thurberi، G.arboreum، G.barbadense و G.hirsutum بترتیب برابر 31و35 درصدبود. ژن­های rRNA دارای بیشترین محتوای GC حدود 5/55 درصد و توالی­های کد کننده پروتئینی کمترین GC حدود 3/37 درصد بودند و در منطقه غیرکدکننده محتوی GC در IGS و اینترون بترتیب برای هر گونه برابر با 58/35 و 75/36 درصد بود.

 

جدول2- محتوی GC ژنوم کلروپلاست  چهار گونه

G.thurberi

 

-

Coding

Region

-

-

Non

Coding

Region

-

-

-

-

-

Protein

tRNA

rRNA

Total

IGS

Intron

Total

Complete Genome

LSC

SSC

IR

Length

79740

2775

8970

91485

49915

20436

70351

160264

88737

20271

25628

Proportion

76/49

73/1

60/5

08/57

15/31

75/12

90/43

00/100

37/55

65/12

99/15

T%

05/31

14/23

32/22

34/30

32/34

28/32

73/33

83/31

15/33

43/34

25/28

A%

85/29

58/24

17/22

31/29

10/34

97/30

19/33

95/30

67/31

92/33

54/28

C%

28/19

13/26

7927

56/20

99/15

12/19

90/19

99/18

11/18

54/16

66/20

G%

42/18

16/20

71/27

76/19

58/15

63/17

18/16

23/18

09/17

09/15

29/22

A+T%

90/60

71/47

49/44

65/59

42/68

25/63

92/66

78/62

81/64

38/68

05/57

C+G%

69/37

29/52

51/55

35/40

58/31

75/36

08/33

22/37

19/35

62/31

95/42

G.arboreum

 

-

Coding

Region

-

-

Non

Coding

Region

-

-

-

-

-

Protein

tRNA

rRNA

Total

IGS

Intron

Total

Complete Genome

LSC

SSC

IR

Length

79253

2769

8349

90371

49333

20526

69859

160230

88721

20287

25611

Proportion

46/49

53/1

21/5

40/56

80/30

80/12

60/43

00/100

37/55

66/12

98/15

T%

40/31

80/22

30/22

20/30

40/34

00/32

70/33

80/31

20/33

90/33

50/28

A%

30/30

00/24

30/22

40/29

00/34

10/31

20/33

00/31

60/31

40/34

50/28

C%

30/19

20/27

70/27

40/20

00/16

00/19

80/16

80/18

10/18

10/15

50/21

G%

00/19

00/26

70/27

10/20

60/15

90/17

30/16

40/17

10/17

60/16

50/21

A+T%

70/61

70/46

50/44

60/59

40/68

10/63

90/66

80/62

80/64

20/68

00/57

C+G%

30/38

20/53

50/55

40/40

60/31

90/36

10/33

30/37

20/35

70/31

00/43

G.barbadense

 

-

Coding

Region

-

-

Non

Coding

Region

-

-

-

-

-

Protein

tRNA

rRNA

Total

IGS

Intron

Total

Complete Genome

LSC

SSC

IR

Length

78675

2791

9050

90516

48556

21245

69801

160317

88897

20036

25692

Proportion

07/49

74/1

64/5

46/56

28/30

27/13

53/43

00/100

45/55

49/12

03/16

T%

50/31

30/23

30/22

40/30

30/34

00/32

70/33

80/31

10/33

40/34

50/28

A%

20/30

90/23

30/22

30/29

10/34

20/31

20/33

90/33

70/31

80/33

50/28

C%

60/19

70/26

70/27

60/20

60/16

00/19

80/16

00/19

10/18

60/16

50/21

G%

70/18

10/26

70/27

70/19

60/19

80/17

20/16

20/18

10/17

30/15

50/21

A+T%

70/61

10/47

60/44

70/59

70/68

20/63

90/66

30/62

80/64

10/68

90/56

C+G%

30/38

80/52

40/55

30/40

60/31

80/36

10/33

20/37

20/35

90/31

10/43

G.hirsutum

 

-

 

Coding

Region

-

Non

Coding

Region

-

-

-

-

-

Protein

tRNA

rRNA

Total

IGS

Intron

Total

Complete Genome

LSC

SSC

IR

Length

78531

2801

9048

90380

48798

21123

69921

160301

88862

20509

25464

Proportion

98/48

74/1

64/5

38/56

44/30

20/13

61/43

00/100

43/55

79/12

88/15

T%

40/31

80/22

30/22

20/30

00/34

90/31

70/33

70/31

20/33

90/33

50/28

A%

40/30

90/23

30/22

40/29

90/33

30/31

20/33

00/31

60/31

40/34

50/28

C%

30/19

10/27

70/27

30/20

00/16

90/18

90/16

80/18

10/18

10/15

50/21

G%

00/19

20/26

70/27

10/20

60/15

90/17

30/16

40/18

10/17

50/16

50/21

A+T%

80/61

70/46

50/44

90/56

70/68

20/63

80/66

50/62

80/64

30/68

00/57

C+G%

20/38

30/53

50/55

40/40

60/31

80/36

20/33

20/37

20/35

70/31

50/43

                         

 

 

نمودار NC: نمودار NC (Number of Codons) برای هر چهار ژنوم مورد مطالعه مطابق با شکل 2 رسم شد و نتایج مربوط به آن برای تمام گونه­ها تقریباً یکسان بدست آمد به همین جهت تنها یک گونه G.thurberi را مرجع قرار داده و تجزیه و تحلیل بر اساس آن انجام گرفت. شکل 1 نشان می­دهد که تعداد قابل توجهی از نقاط روی منحنی قرار گرفته­اند و به سمت ناحیه­ای که از نظر GC فقیر است می­باشند که این از ترکیب نوکلئوتیدی شدید منشأ می­گیرد اما موضوع جالب توجه این است که اکثر نقاط با مقادیرNC کم در زیر منحنی قابل انتظار با فاصله زیاد قرار گرفته­اند و این نتایج نشان می­دهند که برخی ژن­ها  در G.thurberi کاربرد کدونی مستقل از ترکیب نوکلئوتیدی مشتق از فشار جهشی و متأثر از عوامل دیگری که مستقل از محدودیت­های ترکیبی می­باشند.

 

 

شکل 1- سازماندهی ژنی و ساختار ژنوم دو گونه دیپلوئید

 

شکل 2- نمودار NC  چهار گونه

یادداشت: از بالا و از چپ به راست بترتیب: G.thurberi، G.arboreum، G.barbadense وG.hirsutum

 

آنالیزهای تطبیقی: آنالیزهای تطبیقی برای دستیابی به فاکتورهای مسئول توزیع ژن­ها در نمودار آنالیز تطبیقی (COA=(Correspondence Analysis) Plot) بوسیله تعیین همبستگی بین چهار محور (axis4-axis1) با شاخص­های ترجیح کدونی برای 57 ژن کدکننده با طول بیش از 100 کدون در گونه­های مورد مطالعه انجام شد. نتایج در جدول 3 و شکل 3 نشان داده شده است..

 

جدول 3- همبستگی شاخص­های ترجیح کدونی با محورهای توزیع ژنی در چهار ژنوم

G.thurberi

-

ENc

CAI

Fop

T3s

C3s

A3s

G3s

GC3s

GC

L_sym

Gravy

Axis1

049/0-

070/0-

112/0

131/0-

203/0

050/0-

087/0-

105/0

108/0

092/0

012/0

Axis2

*294/0-

223/0

**380/0

169/0-

374/0**

085/0-

124/0-

252/0

294/0*

070/0-

261/0-

Axis3

260/0-

289/0*

132/0

177/0

007/0

137/0-

344/0-**

201/0-

099/0

095/0-

214/0

Axis4

001/0-

474/0**

299/0*

164/0

227/0

228/0-

198/0-

020/0

180/0

020/0

348/0**

G.arboreum

-

ENc

CAI

Fop

T3s

C3s

A3s

G3s

GC3s

GC

L_sym

Gravy

Axis1

209/0

358/0-**

372/0**

010/0-

252/0-

112/0

*268/0

059/0-

*264/0-

060/0

141/0

Axis2

189/0

168/0

143/0

**370/0

314/0-*

139/0

248/0-

*559/0-

*280/0-

143/0-

300/0-

Axis3

033/0

*526/0

*436/0

149/0

*341/0

057/0-

*392/0-

021/0-

245/0

013/0

**368/0

Axis4

*552/0

217/0

335/0

001/0

116/0

057/0-

290/0-

085/0-

089/0

161/0-

039/0

G.barbadense

-

ENc

CAI

Fop

T3s

C3s

A3s

G3s

GC3s

GC

L_sym

Gravy

 

Axis1

241/0-

078/0-

252/0-

036/0

*408/0-

220/0

036/0

*277/0-

213/0-

106/0-

023/0

 

Axis2

085/0

*457/0-

*519/0-

043/0

**426/0-

232/0

203/0

237/0-

**399/0-

014/0

109/0

 

Axis3

463/0**

253/0-

109/0-

214/0-

100/0

030/0-

475/0**

406/0**

046/0

220/0

194/0-

 

Axis4

078/0

442/0**

304/0

159/0

092/0

067/0-

277/0*

138/0-

123/0

021/0-

364/0*

 

G.hirsutum

 

-

ENc

CAI

Fop

T3s

C3s

A3s

G3s

GC3s

GC

L_sym

Gravy

 

Axis1

185/0-

097/0

033/0-

009/0

240/0-

180/0

030/0-

188/0-

052/0-

093/0-

059/0-

 

Axis2

131/0

212/0-*

450/0-**

083/0

485/0-**

226/0

206/0

275/0-*

379/0-**

005/0

186/0

 

Axis3

442/0-**

430/0**

229/0

*335/0

032/0-

084/0-

**529/0-

**422/0-

030/0-

214/0-

*325/0

 

Axis4

121/0-

*431/0-

*377/0-

105/0-

*305/0-

190/0

256/0

049/0-

243/0-

019/0-

288/0-

                           

 

 

شکل 3- نمودار COA برای چهار گونه

یادداشت: از بالا و از چپ به راست بترتیب: G.thurberi، G.arboreum، G.barbadense وG.hirsutum

 

طبق گزارشات نتایج مربوط به این آنالیز، در هر چهار ژنوم مورد مطالعه بسیار مشابه هم بود و لذا برای ممانعت از تکرار مطالب توضیحات مربوط به این آنالیز بر مبنای اعداد جدول و نمودار مربوط به ژنوم کلروپلاست G.thurberi صورت گرفت. محور اول 3/10 و سه محور بعدی بترتیب 93/7، 9 و 16/7 درصد از تغییرات ترجیح کدونی را بیان می­کند، همچنین نتایج نشان داد که محور دوم با  C3(r=0.374, p<0.01)، GC (r=0.294, p<0.05) و Fop (r=0.380, p<0.01) همبستگی مثبت نشان داد، محور سوم با  G3(r=-0.344, p<0.01) همبستگی مثبت و با CAI (r=0.289, p<0.05) همبستگی منفی داشت همچنین محور چهارم با  CAI(r=0.474, p<0.01) و Fop (r=0.299, p<0.05) همبستگی مثبت نشان داد که وجود ارتباط معنی­دار بین هر کدام از محورها و بازهای نوکلئوتیدی احتمال اثر ترکیب نوکلئوتیدی در شکل­گیری ترجیح کدونی را نشان می­دهد. با توجه به این در هر چهار گونه تعداد دو محور ارتباط معنی­دار با CAI (Frequency of Optimal Codon Usage) وFop  (Codon Adaptation Index) داشت پیش­بینی شد که سطوح بیان ژن بطور اندک الگوهای ترجیح کدونی را تحت تأثیر قرار دهد (انتخاب ضعیف) و نیز بدلیل معنی­داریGravy  تنها در یک محور در گونه­های G.barbadense وG.hirsutum نیروی انتخاب اثرگذار بر ترجیح کدونی ضعیف می­باشد. طبق نتایج بدست آمده ترکیب نوکلئوتیدی (مشتق از فشار جهشی) فاکتور مهم اثرگذار بر تغییرات ترجیح کدونی همتراز در ژنوم کلروپلاست این گونه­ها گزارش شد.

بحث و نتیجه گیری

نمودار NC که مقادیر NC عمود بر مقادیر GC3s می­باشد و محورهای  y و x را تشکیل می­دهند که برای نشان دادن تغییر ترجیح کدونی هم­تراز (SCU=Synonymous Codon Usage) بین شماری از ژن­ها در بین گونه­ها یا درون یک گونه استفاده می­شود (10). نمودار مقادیرNC عمود بر GC3s می­تواند برای کشف تنوع کاربرد کدون در میان ژن­ها موثر باشد و مقایسه توزیع واقعی ژن­ها با توزیع قابل انتظار نشان می­دهد که گرایش ترجیح کدونی تحت تاثیر چه عواملی به جز محدودیت­های ترکیبی می­تواند باشد و گرایش ترجیح کدونی بطور کامل تحت­تاثیرGC3 بوده باشد و مقادیرNC باید روی منحنی قابل انتظار بین GC3s وNC باشد (3). طبق آنالیزهای ترجیح کدونی برای چهار گونه موجود کدون پایان TAA با RSCU=1 بعنوان کدون پایان ترجیح داده شده مشابه با Alsophila  (5) و Panax schinseng Nees (7) گزارش شد. مقدار RSCU اغلب کدون­ها بیشتر از یک گزارش شده است که این نشان می­دهد این کدون­ها با تناوب بیشتری مورد استفاده قرار گرفته­اند. اغلب کدون­ها از A یا T در جایگاه سوم خود (بدون تشابه در جایگاه اول و دوم) استفاده می­کنند. بررسی ساختار کدون­ها نشان می­دهد محتوای A+T در جایگاه سوم 4/71 درصد می­باشد که بیشتر از مقدار آن در ناحیه کدکننده پروتئین و کل ژنوم در هر چهار ژنوم کلروپلاست می­باشد و این نشان داد کهچهار گونه مورد بررسی کدون­هایی را که در جایگاه سومشان A یا T دارند بیشتر ترجیح می­دهند. در بررسی نتایج آنالیزهای ترجیح کدونی عامل اثرگذار بر ترجیح کدونی در چهار گونه موجود ترکیب نوکلئوتیدی بهمراه انتخاب ضعیف گزارش شد که مشابه با یافته­های (10) بود. برخلاف نتیجه بدست آمده در پژوهش خو و همکاران (2011) در بررسی عامل اثرگذار بر ترجیح کدونی در ژنوم کلروپلاست Oncicidium gower بعلت معنی­دار بودن شاخص آمینواسیدی Gravy دریافتند که ترجیح کدونی متأثر از سطح هیدروپسی هر پروتئین می­باشد (14). مطالعات قبلی روی ترجیح کدونی عمدتا روی گرایش کدونی در ژنوم هسته­ای متمرکز بوده­اند و چنین بیان شده که گرایش کدونی منعکس کننده تعادل بین گرایشات جهشی و انتخاب طبیعی برای بهینه­سازی ترجمه می­باشد (6). تا به امروز مطالعات جامعی بر روی ژنوم کلروپلاست­های ثبت شده درNCBI  انجام نگرفته و این مطالعه می­تواند بعنوان یک پژوهش پیشرو در زمینه آنالیز ژنوم گونه­های زراعی پنبه ثبت شود و مطمئنا نتایج حاصل از این پژوهش در ادامه مطالعات بنیادی در این زمینه مفید واقع خواهد شد. چنین تصور می­شود که کدون­های بهینه برای کمک به دستیابی به سرعت­های بالا در ترجمه و دقت بالاتر است. در این تحقیق، به ارائه شواهدی پرداختیم که نشان می­دهد، انحراف کدونی در ژنوم کلروپلاستG.thurberi ، G.arboreum ،G.barbadense و G.hirsutumارتباط نزدیکی ترکیب نوکلئوتیدی ناشی از فشار جهشی دارد. تحقیقات بیشتر در مورد تجزیه و تحلیل مقایسه­ای گرایش کدونی و عوامل دخیل در شکل دادن به الگوهای ترجیح کدون در میان ژن­های میتوکندریایی، کلروپلاست و هسته در آینده، ممکن است بتواند به روشن شدن رابطه بین ژنوم هسته، کلروپلاست و میتوکندری درجنس گوسیپیومکمک کند، و این باعث فراهم آمدن یک تحقیق جامع و مفصل درباره فرضیه اندوسیمبیوتیک و یک چهارچوب از آن برای ساخت مدل­های قویتر جهت بهبود درک ما از تکامل مولکولی و بویژه چگونگی تفسیر داده­های مولکولی برای بازسازی الگوهای فیلوژنی می­شود.

سپاسگزاری

نگارندگان مقاله از مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی و دانشگاه آزاد اسلامی واحد ارومیه بدلیل حمایت از انجام پژوهش حاضر سپاسگزاری می­کنند.

1- Butt, A. M., Nasrullah, I. and Tong. Y. (2014). Genome-Wide analysis of codon usage and influencing factors in (Chikungunya viruses). PLOS ONE. 0090905.
2- Daniell, H., Wurdack, K. J., Kanagaraj, A., Lee, S. B., Saski, C. and Jansen. R. K. (2008). The complete nucleotide sequence of the cassava (Manihot esculenta) chloroplast genome and the evolution of atpF in Malpighiales: RNA editing and multiple losses of a group II intron. Journal of Theoretical and Applied Genetics. 116(5):723-737.
3- Duret, L. (2000). tRNA gene number and codon usage in the C.elegans genome are co-adapted for optimal translation of highly expressed genes. Journal of Trends in Genetics. 16:287–9.
4- Elizabeth, E. M., Lotzer, J. and Eberle, M. (1989). Codon usage in plant genes. Journal of Nucleic Acids Research. 17(2):477–98.
5- Gao, L., Yi, X., Yang, Y. X., Su, Y. J. and Wang, T. (2009). Complete chloroplast genome sequence of a tree fern (Alsophila spinulosa) insights into evolutionary changes in fern chloroplast genomes. BMC Evolutionary Biology. 10.1186/1471-2148-9-130.
6- Hershberg, R. and Petrov, D. A. (2008). Selection on Codon Bias. Journal of Annual Review of Genetics. 42.110807.091442.
7- Kim, K. J. and Lee, H. L. (2004). Complete chloroplast genome sequences from Korean ginseng (Panax schinseng Nees) and comparative analysis of sequence evolution among 17 vascular plants. Journal of DNA Research. 11(4):247-261.
8- Marais, G., Domazet-Loso, T., Tautz, D. and Charlesworth, B. (2004). Correlated evolution of synonymous and non-synonymous sites in (Drosophila). Journal of Molecular Evolution. 59:771–779.
9- Martin, D. P., Posada, D., Crandall, K. A. and Williamson, C. (2005). A modified boot scan algorithm for automated identification of recombinant sequences and recombination breakpoints. Journal of AIDS Research and Human Retroviruses. 21(1):98–102.
10- Nair, R. R., Nandhini, M. B., Monalisha, E., Murugan, K., Sethuraman, T., Nagarajan, S., Rao, N. S. P. Ganesh, D. (2012). Synonymous codon usage in chloroplast genome of (Coffea arabica). Journal of Bioinformation. 10.6026/97320630081096.
11- Sharp, P. M. and Li, W. H. (1986). Codon usage in regulatory genes in (Escherichia coli) does not reflect selection for ‘rare’ codons. Journal of Nucleic Acids Research. 14(19):7737–49.
12- Talat, F. and Wang, K. (2015). Comparative Bioinformatics Analysis of the Chloroplast Genomes of a Wild Diploid Gossypium and two Cultivated Allotetraploid Species. Iranian Journal of Biotechnology. 10.15171/ijb.1231.
13- Wright, F. and Bibb, M. J. (1992). Codon usage in the G+C rich Streptomyces genome. Journal of Gene. 10.1016/0378-1119(92)90669-G.
14- Xu, C., Cai, X., Chen, Q., Zhou, H., Cai, Y. and Ben, A. (2011). Factors Affecting Synonymous Codon Usage Bias in Chloroplast Genome of (Oncidium gower). Journal of Evolutionary Bioinformatics. 7 271– 278.
دوره 32، شماره 4
بهمن 1398
صفحه 862-871
  • تاریخ دریافت: 10 اردیبهشت 1397
  • تاریخ بازنگری: 30 مهر 1397
  • تاریخ پذیرش: 25 دی 1397