نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار ، بخش تحقیقات علوم زراعی و باغی، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی، سازمان تحقیقات، آموزش و ترویج
2 کارشناس ارشد، زیست فناوری(بیوتکنولوژی)، دانشگاه آزاد اسلامی واحد ارومیه، ایران
3 کارشناس ارشد اصلاح نباتات، دانشکده کشاورزی، دانشگاه ارومیه، ایران
چکیده
تجزیه کاربردی کدون اهمیت ویژهای در بهینهسازی سامانه بیان ژنها در تولید پروتئین دارد. جنس گوسیپیوم مهمترین گیاه تولیدکننده الیاف در دنیای جدید میباشد. در این تحقیق توالی کامل ژنوم کلروپلاست دو گونه G.thurberi و G.arboreum توسط نرم افزار کدونW مورد مطالعه و تجزیه قرار گرفت. تجزیه کدونهای دارای ترادف (RSCU) برای 57 ژن کدکننده پروتئین در ژنوم کلروپلاست این دو گونه به منظور دستیابی به فاکتورهای دخیل در اریبی کدون صورت پذیرفت. تمامی کدونهای ترجیح داده شده دارای بازهای آلی آدنین و تیمین در انتهای کدون بودند که با عنایت به غنای ژنوم کلروپلاست در خصوص این دو باز پدیدهای طبیعی است. آنالیز تطبیقی و روش برآورد تعداد موثر کدونها به صورت نمودار تعداد کدون به منظور تجزیه کاربرد کدونهای مترادف انجام گرفت. نمودارENC Vs GC3 ، عمده ژنهای آنالیز شده را معادل یا دقیقا در سمت چپ منحنی قابل انتظار GC3 گروهبندی کرد که بیانگر تاثیر محدودیتهای ترکیب کدونی در تنظیم استفاده ار کدونهاست. بر اساس تجزیه تطبیقی، اریبی مشاهده شده در ژنوم کلروپلاست گونههای مورد مطالعه با طول ژن، اریبی جهش در ژنها، سطح هیدروپاتی ژنهای پروتئینی، عملکرد ژن و انتخاب یا بیان ژن بصورت ماهرانهای در کاربرد کدونها تاثیرگذار است. نتایج این پژوهش در فراهم آوردن زمینه برای مطالعات تکامل ملکولی قابل استفاده خواهد بود.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Bioinformatics Codon Usage Analysis of Chloroplast Genomes in Some Diploid Species and Comparison with Two Tetraploid Species of Cotton
نویسندگان [English]
1 Assistant Professor, Seed and plant improvement Research Department, West Azarbaijan Agricultural and Natural Resources Research and Education Center, AREEO, Urmia, Iran.
2 Master graduate of Biology (Biotechnology), Islamic Azad University of Urmia, Iran
3 Master graduate of Plant Breeding, Urmia University, Iran
چکیده [English]
Analysis of codon usage is very important to optimize the production of proteins in gene expression system. Gossypium spp. is the most important fiber crop in the modern world. In this research the complete nucleotide sequence of the chloroplast genomes of two wild cotton species was studied and analyzed using codon W software. Synonymous codon usage of 57 protein coding genes in chloroplast genome of G.thurberi and G.arboreum was analyzed to find out the possible factors contributing codon bias. All preferred synonymous codons were found to use A/T ending codons as chloroplast genomes are rich in AT. Correspondence analysis and method of effective number of codon as NC-plot were conducted to analyze synonymous codon usage. ENC Vs GC3 plot grouped majority of the analyzed genes on or just below the left side of the expected GC3 curve indicating the influence of base compositional constraints in regulating codon usage. According to the corresponding analysis, codon bias in the chloroplast genome of G.thurberi and G.arboreum are related to their gene length, mutation bias, gene hydropathic level of each protein, gene function and selection or gene expression only subtly affect codon usage. This study provided insights into the molecular evolution studies.
کلیدواژهها [English]
آنالیز بیوانفورماتیک کدونی ژنوم کلروپلاست گونههای دیپلوئید پنبه و مقایسه با ژنوم دو گونه تتراپلوئید
فرشید طلعت1*، سمانه حسنینژاد2 و مهدی بدری انرجان3
1 ایران، ارومیه، آموزش و ترویج کشاورزی، سازمان تحقیقات، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی، بخش تحقیقات علوم زراعی و باغی
2ایران، ارومیه، دانشگاه آزاد اسلامی واحد ارومیه، گروه زیست فناوری(بیوتکنولوژی)
3 ایران، ارومیه، دانشگاه ارومیه، دانشکده کشاورزی، گروه اصلاح نباتات
تاریخ دریافت: 10/2/97 تاریخ پذیرش: 25/10/97
چکیده
تجزیه کاربردی کدون اهمیت ویژهای در بهینهسازی سامانه بیان ژنها در تولید پروتئین دارد. جنس گوسیپیوم مهمترین گیاه تولیدکننده الیاف در دنیای جدید میباشد. در این تحقیق توالی کامل ژنوم کلروپلاست دو گونه G.thurberi و G.arboreumتوسط نرمافزار کدونW مورد مطالعه و تجزیه قرار گرفت. تجزیه کدونهای داراری ترادف (RSCU) برای 57 ژن کدکننده پروتئین در ژنوم کلروپلاست این دو گونه بمنظور دستیابی به فاکتورهای دخیل در اریبی کدون صورت پذیرفت. تمامی کدونهای ترجیح داده شده دارای بازهای آلی آدنین و تیمین در انتهای کدون بودند که با عنایت به غنای ژنوم کلروپلاست در خصوص این دو باز پدیدهای طبیعی است. آنالیز تطبیقی و روش برآورد تعداد موثر کدونها بصورت نمودار تعداد کدون بمنظور تجزیه کاربرد کدونهای مترادف انجام گرفت. نمودارENC Vs GC3 ، عمده ژنهای آنالیز شده را معادل یا دقیقا در سمت چپ منحنی قابل انتظار GC3 گروهبندی کرد که بیانگر تاثیر محدودیتهای ترکیب کدونی در تنظیم استفاده ار کدونهاست. بر اساس تجزیه تطبیقی، اریبی مشاهده شده در ژنوم کلروپلاست گونههای مورد مطالعه با طول ژن، اریبی جهش در ژنها، سطح هیدروپاتی ژنهای پروتئینی، عملکرد ژن و انتخاب یا بیان ژن بصورت ماهرانهای در کاربرد کدونها تاثیرگذار است. نتایج این پژوهش در فراهم آوردن زمینه برای مطالعات تکامل ملکولی قابل استفاده خواهد بود.
واژه های کلیدی: آنالیز تطبیقی، ژنوم کلروپلاست، نمودارNC
* نویسنده مسئول، تلفن: 09104055682، پست الکترونیکی: f.talat@areeo.ac.ir
مقدمه
در بررسیهای تکامل ملکولی گیاهان، ژنوم کلروپلاست بدلیل اندازه کوچک، تعداد نسخههای بالا، ساختار حفاظت شده گسترده و عملکرد شناخته شده بسیاری از ژنهای آن در سطح ملکولی برای آنالیزهای ترجیح کدونی بسیار مورد توجه قرار گرفته است (9). سازماندهی ژنوم کلروپلاست کاملاً حفاظتشده میباشد و از یک کروموزوم حلقوی با ساختار چهارجزئی تشکیل شده و دارای دو ناحیه تکرار معکوس (25 کیلوباز) میباشد که منطقه تک نسخه بزرگ (80 کیلوباز) را از ناحیه تک نسخه کوچک (20کیلوباز) جدا میکنند. اندازه این ژنوم حلقوی شکل از 35 تا 217 کیلوباز متغیر است اما این محدوده برای اکثر ژنومهای پلاستید متعلق به موجودات فتوسنتزکننده 165-115 کیلوباز میباشد (2). در مقایسه با ژنومهای هستهای و میتوکندری، ژنوم پلاستید در میان گونهها کاملا حفاظت شده میباشد (8) گرچه در مقایسه با توالی کامل کلروپلاست تفاوتهایی نیز گزارش شده است (4 و 13) که این موضوع بطور عمده به گسترش یا عدم گسترش تکاملی و یا از دست دادن ناحیه تکرار معکوس، بازآرایی ژنوم و تکرارهای پراکنده نسبت داده شده است (4، 11 و 13). ژنوم کلروپلاست در گونههای مختلف دارای سازماندهی بسیار محافظتشده میباشد که اکثر ژنهای آن در سطح ملکولی شناخته شدهاند و به همین دلیل برای مطالعات و بررسیهای تکامل ملکولی بسیار مناسب است. کلروپلاست یک محفظه ایدهآل برای تجمع پروتئینهای خاص و یا محصولات بیوسنتزی آنها است که در صورت انباشته شدن در سیتوپلاسم مضر خواهند بود و علاوه بر این خاموش کردن ژن در آن مشاهده نشده است (12). به همین دلیل ژنوم کلروپلاست برای بررسی برخی از صفات مهم زراعی از قبیل مقاومت در برابر علفکشها، مقاومت در برابر حشرات، مقاومت به بیماریها و تحمل شوری مهندسی شده است. طلعت و وانگ (2015) با انجام آنالیزهای مقایسهای روی ژنوم کلروپلاست گونه دیپلوئید Gossypium thurberi و دو گونه آلوتتراپلوئید به این نتایج دست یافتند که ژنوم کلروپلاست G.thurberi دارای ساختار چهار جزئی حفاظت شده بطول 160264 جفتباز بوده که نواحی LSC (Large Single Copy) و SSC (Small Single Copy) توسط دو ناحیه تکرار معکوس از هم جدا شدهاند. این ژنوم حاوی 113 ژن منفرد و 20 ژن دو نسخهای است. ژنهای منفرد کد کننده 79 پروتئین، 4 ژن RNA ریبوزومی و 30 ژن RNA ناقل هستند که در میان تمام ژنهای پلاستیدی تنها 18 ژن حاوی یک یا دو اینترون گزارش شدند و در مقایسه با DNA کلروپلاست دو گونه آلوتتراپلوئید، rps18 تنها ژن مضاعف شدهدرگونهG.thurberi است (12). بات و همکاران (2014) با انجام آنالیزهای ژنومی ترجیح کدونی و بررسی اثر فشار جهشی، انتخاب طبیعی و ویژگیهای میزبان روی تکامل ویروس دریافتند که در کل گرایش ترجیح کدونی کمی وجود دارد و فاکتور اصلی اثرگذار فشار جهشی است که تحت تاثیر میزبان است. همچنین علاوه بر این انتخاب طبیعی، محیط و شرایط جغرافیایی نیز بر ترجیح کدونی اثر میگذارند (1). این تحقیق با هدف مطالعه و مقایسه توالی کامل ژنوم کلروپلاست گونههای دیپلوئید G.thurberi و G.arboreum با گونههای تتراپلوئید G.barbadense و G.hirsutum گیاه پنبه، آنالیز ساختار ژنوم، محتوای ژن، سازماندهی توالیهای تکراری، ترجیح کدونی و مقایسه بین ژنومهای موجود انجام گرفت.
مواد و روشها
توالی کامل ژنوم کلروپلاست گونههای G.thurberi، G.arboreum، G.barbadense و G.hirsutum با فرمت FASTA بترتیب با شماره دسترسی و طول NC_015204.1) و(160,264 ،HQ_325740.1) و (160,230،NC_008641.1) و (160.317 و NC_007944.1) و (160,301 از سایت NCBI دانلود شدند. برای شناسایی موقعیت هر یک از ژنها در هر چهار ژنوم کلروپلاست مورد بررسی با توجه به اطلاعات موجود در بانک ژن مربوط به هر ژنوم در سایت NCBI مونتاژی از توالی هر ژنوم به همراه ژنهایی که در روی توالی مشخص شدهاند توسط word(2010) بدست آمد. اینترونهای مربوط به ژنهای حاوی اینترون نیز با رنگ مجزا مشخص شدند که با این کار هم موقعیت ژنها، نواحیIGS (Intragenic Spacer) و همچنین ژنهایی که دارای اشتراکهستند نیز مشخص شدند. نقشه ساختار ژنوم و توزیع ژن با استفاده از نرمافزار (http://ogdraw.mpimpgolm.mpg.de) OGDRAW (V1.1): و با دادن اطلاعات مربوط به شماره دسترسی هر ژنوم رسم شد. برای تشخیص توالیهای تکراری و موقعیت آنها از نسخه آنلاین نرمافزار (http://bibiserv.techfak.uni-bielfeld.de/reputer) REPuter استفاده شد. RSCU (Relative Synonymous Codon Usage) های کدونهای مختلف در هر نمونه ژنی توسط CodonW در نرم افزار Mobyle در آدرس (http://mobyle.pasteur.fr/cgibin/portal.py) محاسبه گردید. برای بدست آوردن درصد مربوط به نوکلئوتیدهای A، T، C، G و همچنین AT وGC در ژنومها جهت تشکیل جدول محتوای GC از نرم افزار Visual Bioinformatics (V 2.1.0) استفاده شد. برای رسم نمودارهای مربوط به بحث کاربرد کدون و آنالیزهای تطابقی بترتیب از نرمافزارهای (V.22) SPSS و Minitab (V.16) استفاده شد.
نتایج
محتوی ژنی: ژنهای کدکننده در ژنوم کلروپلاست G.thurberi، G.arboreum، G.barbadense و G.hirsutum در جدول 1 آمده است.
جدول 1- ژنهای کد شونده توسط ژنوم کلروپلاست چهار گونه
Gene Name |
Group |
||
AccD |
Subunit of Acetyl-CoA-Carboxylase |
Protein Name
RNA Genes
|
|
RbcL |
Large subunit of Rubisco |
||
ndhA*, ndhB*§, ndhC, ndhD, ndhE, ndhF, ndhG, ndhH, ndhI, ndhJ, ndhK |
Subunits of NADH-Dehydrogenase |
||
atpA, atpB, atpE, atpF*, atpH, atpI |
Subunits of ATP synthase |
||
petA, petB*, petD*, petG, petL, petN ccsA |
Subunits of Cytochrome b/f complex |
||
psaA, psaB, psaC, psaI, psaJ, psbA, psbB, psbC, psbD, psbE, psbF, psbH, psbI, psbJ, psbK, psbL, psbM, psbN, psbT, psbZ |
subunits of Photosystem I and II |
||
rpoA, rpoB, rpoC1*, rpoC2 |
DNA dependent RNA Polymerase |
||
rpl14, rpl16*, rpl2*§, rpl20, rpl22, rpl23§, rpl32, rpl33, rpl36 |
Large subunit of Ribosome |
||
rps11, rps12*§, rps14, rps15*, rps16*, rps18, rps19§, rps2, rps3, rps4, rps7§, rps8 |
Small subunit of Ribosome |
||
cemA, clpP**, matK |
Others |
||
ycf1§, ycf15§, ycf2§, ycf3**, ycf4 |
Function unknown |
||
rrn16§, rrn23§, rrn4.5§, rrn5§ |
Ribosomal RNA Gene |
||
trnA-UGC*§,trnC-GCA,trnD-GUC, trnE-UUC, trnF-GAA, trnfM-CAU, trnGUCC*,trnG-GCC, trnH-GUG, trnI-CAU§, trnI-GAU*§, trnK-UUU*, trnLCAA§, trnL-UAA*, trnL-UAG, trnM-CAU, trnN-GUU§, trnP-UGG, trnQ-UUG,trnR-ACG§, trnR-UCU, trnS-GCU,trnS-GGA,trnS-UGA, trnT-GGU,trnTUGU,trnV-GAC§, trnV-UAC*, trnW-CCA, trnY-GUA |
transfer RNA gene |
||
§ نمایانگر ژنهای موجود در ناحیه IR، * نمایانگر ژنهای با 1 اینترون و ** نمایانگر ژنهای با یک اینترون میباشد.
نتایج نشان میدهند که G.thurberi حاوی 134 ژن، G.arboreum 128 ژن، G.barbadense و G.hirsutum دارای 129 ژن بوده که شامل 79 ژن کدکننده پروتئین، 4 ژن RNAریبوزومی و 30 ژن RNAناقل میباشد که بعبارت دیگر میتوان گفت در کل 113 تک ژن و 18 ژن دو نسخهایواقع در ناحیه تکرار معکوس تقریبا مشمول هر چهار ژنوم مورد بررسی میباشند. در هر یک از ژنومهای کلروپلاست G.thurberi، G.arboreum، G.barbadense و G.hirsutum پنج ژن با عملکرد ناشناخته بنام ycf شناسایی و بعنوان ژنهای ضروری گیاهان در نظر گرفته شده که در میان گونهها کاملاً محافظت شدهاند. با توجه به نتایج بدست آمده در مطالعات ژنوم کلروپلاست، دو ژن حائز اهمیت میباشند یکی از آنها ژن rps12 میباشد و به 2 قطعه که یکی با اگزون انتهای ´5 واقع در LSC و دیگری با اگزون انتهای ´3 واقع در IR (Inverted Repeat) جدا میگردد. ژن دیگر matk، 5/1 کیلوباز طول داشته و در ناحیه اینترون trnK/UUU شناسایی شده است که تنها ژن واقع در اینترون بوده و پروتئین maturase K را رمزدهی میکند.
محتوی GC: محتوی GC از ویژگیهای مهم ژنوم کلروپلاست میباشد درصد GC در ژنوم G.thurberi، G.arboreum، G.barbadense و G.hirsutum شبیه هم بوده و برابر2/37 درصد میباشد. مناطق کدکننده و غیر کدکننده در هر چهار ژنوم دارای محتوی GC کمی بوده و بترتیب 4/40 و 1/33 درصد گزارش شد. تفاوت در محتوی GC برای چهار ناحیه ژنوم کلروپلاست چهار گونه تحت بررسی در جدول 2 آورده شده است و نتایج نشان داد که ناحیه IR از لحاظ GC غنیترین بود و میزان آن برای هر چهار گونه تقریباً 43 درصد گزارش شد درحالیکه GC درSSC وLSC برای گونههای تحت بررسی G.thurberi، G.arboreum، G.barbadense و G.hirsutum بترتیب برابر 31و35 درصدبود. ژنهای rRNA دارای بیشترین محتوای GC حدود 5/55 درصد و توالیهای کد کننده پروتئینی کمترین GC حدود 3/37 درصد بودند و در منطقه غیرکدکننده محتوی GC در IGS و اینترون بترتیب برای هر گونه برابر با 58/35 و 75/36 درصد بود.
جدول2- محتوی GC ژنوم کلروپلاست چهار گونه
G.thurberi |
|
|||||||||||
- |
Coding |
Region |
- |
- |
Non |
Coding |
Region |
- |
- |
- |
- |
|
- |
Protein |
tRNA |
rRNA |
Total |
IGS |
Intron |
Total |
Complete Genome |
LSC |
SSC |
IR |
|
Length |
79740 |
2775 |
8970 |
91485 |
49915 |
20436 |
70351 |
160264 |
88737 |
20271 |
25628 |
|
Proportion |
76/49 |
73/1 |
60/5 |
08/57 |
15/31 |
75/12 |
90/43 |
00/100 |
37/55 |
65/12 |
99/15 |
|
T% |
05/31 |
14/23 |
32/22 |
34/30 |
32/34 |
28/32 |
73/33 |
83/31 |
15/33 |
43/34 |
25/28 |
|
A% |
85/29 |
58/24 |
17/22 |
31/29 |
10/34 |
97/30 |
19/33 |
95/30 |
67/31 |
92/33 |
54/28 |
|
C% |
28/19 |
13/26 |
7927 |
56/20 |
99/15 |
12/19 |
90/19 |
99/18 |
11/18 |
54/16 |
66/20 |
|
G% |
42/18 |
16/20 |
71/27 |
76/19 |
58/15 |
63/17 |
18/16 |
23/18 |
09/17 |
09/15 |
29/22 |
|
A+T% |
90/60 |
71/47 |
49/44 |
65/59 |
42/68 |
25/63 |
92/66 |
78/62 |
81/64 |
38/68 |
05/57 |
|
C+G% |
69/37 |
29/52 |
51/55 |
35/40 |
58/31 |
75/36 |
08/33 |
22/37 |
19/35 |
62/31 |
95/42 |
|
G.arboreum |
|
|||||||||||
- |
Coding |
Region |
- |
- |
Non |
Coding |
Region |
- |
- |
- |
- |
|
- |
Protein |
tRNA |
rRNA |
Total |
IGS |
Intron |
Total |
Complete Genome |
LSC |
SSC |
IR |
|
Length |
79253 |
2769 |
8349 |
90371 |
49333 |
20526 |
69859 |
160230 |
88721 |
20287 |
25611 |
|
Proportion |
46/49 |
53/1 |
21/5 |
40/56 |
80/30 |
80/12 |
60/43 |
00/100 |
37/55 |
66/12 |
98/15 |
|
T% |
40/31 |
80/22 |
30/22 |
20/30 |
40/34 |
00/32 |
70/33 |
80/31 |
20/33 |
90/33 |
50/28 |
|
A% |
30/30 |
00/24 |
30/22 |
40/29 |
00/34 |
10/31 |
20/33 |
00/31 |
60/31 |
40/34 |
50/28 |
|
C% |
30/19 |
20/27 |
70/27 |
40/20 |
00/16 |
00/19 |
80/16 |
80/18 |
10/18 |
10/15 |
50/21 |
|
G% |
00/19 |
00/26 |
70/27 |
10/20 |
60/15 |
90/17 |
30/16 |
40/17 |
10/17 |
60/16 |
50/21 |
|
A+T% |
70/61 |
70/46 |
50/44 |
60/59 |
40/68 |
10/63 |
90/66 |
80/62 |
80/64 |
20/68 |
00/57 |
|
C+G% |
30/38 |
20/53 |
50/55 |
40/40 |
60/31 |
90/36 |
10/33 |
30/37 |
20/35 |
70/31 |
00/43 |
|
G.barbadense |
|
|||||||||||
- |
Coding |
Region |
- |
- |
Non |
Coding |
Region |
- |
- |
- |
- |
|
- |
Protein |
tRNA |
rRNA |
Total |
IGS |
Intron |
Total |
Complete Genome |
LSC |
SSC |
IR |
|
Length |
78675 |
2791 |
9050 |
90516 |
48556 |
21245 |
69801 |
160317 |
88897 |
20036 |
25692 |
|
Proportion |
07/49 |
74/1 |
64/5 |
46/56 |
28/30 |
27/13 |
53/43 |
00/100 |
45/55 |
49/12 |
03/16 |
|
T% |
50/31 |
30/23 |
30/22 |
40/30 |
30/34 |
00/32 |
70/33 |
80/31 |
10/33 |
40/34 |
50/28 |
|
A% |
20/30 |
90/23 |
30/22 |
30/29 |
10/34 |
20/31 |
20/33 |
90/33 |
70/31 |
80/33 |
50/28 |
|
C% |
60/19 |
70/26 |
70/27 |
60/20 |
60/16 |
00/19 |
80/16 |
00/19 |
10/18 |
60/16 |
50/21 |
|
G% |
70/18 |
10/26 |
70/27 |
70/19 |
60/19 |
80/17 |
20/16 |
20/18 |
10/17 |
30/15 |
50/21 |
|
A+T% |
70/61 |
10/47 |
60/44 |
70/59 |
70/68 |
20/63 |
90/66 |
30/62 |
80/64 |
10/68 |
90/56 |
|
C+G% |
30/38 |
80/52 |
40/55 |
30/40 |
60/31 |
80/36 |
10/33 |
20/37 |
20/35 |
90/31 |
10/43 |
|
G.hirsutum |
|
|||||||||||
- |
|
Coding |
Region |
- |
Non |
Coding |
Region |
- |
- |
- |
- |
|
- |
Protein |
tRNA |
rRNA |
Total |
IGS |
Intron |
Total |
Complete Genome |
LSC |
SSC |
IR |
|
Length |
78531 |
2801 |
9048 |
90380 |
48798 |
21123 |
69921 |
160301 |
88862 |
20509 |
25464 |
|
Proportion |
98/48 |
74/1 |
64/5 |
38/56 |
44/30 |
20/13 |
61/43 |
00/100 |
43/55 |
79/12 |
88/15 |
|
T% |
40/31 |
80/22 |
30/22 |
20/30 |
00/34 |
90/31 |
70/33 |
70/31 |
20/33 |
90/33 |
50/28 |
|
A% |
40/30 |
90/23 |
30/22 |
40/29 |
90/33 |
30/31 |
20/33 |
00/31 |
60/31 |
40/34 |
50/28 |
|
C% |
30/19 |
10/27 |
70/27 |
30/20 |
00/16 |
90/18 |
90/16 |
80/18 |
10/18 |
10/15 |
50/21 |
|
G% |
00/19 |
20/26 |
70/27 |
10/20 |
60/15 |
90/17 |
30/16 |
40/18 |
10/17 |
50/16 |
50/21 |
|
A+T% |
80/61 |
70/46 |
50/44 |
90/56 |
70/68 |
20/63 |
80/66 |
50/62 |
80/64 |
30/68 |
00/57 |
|
C+G% |
20/38 |
30/53 |
50/55 |
40/40 |
60/31 |
80/36 |
20/33 |
20/37 |
20/35 |
70/31 |
50/43 |
|
نمودار NC: نمودار NC (Number of Codons) برای هر چهار ژنوم مورد مطالعه مطابق با شکل 2 رسم شد و نتایج مربوط به آن برای تمام گونهها تقریباً یکسان بدست آمد به همین جهت تنها یک گونه G.thurberi را مرجع قرار داده و تجزیه و تحلیل بر اساس آن انجام گرفت. شکل 1 نشان میدهد که تعداد قابل توجهی از نقاط روی منحنی قرار گرفتهاند و به سمت ناحیهای که از نظر GC فقیر است میباشند که این از ترکیب نوکلئوتیدی شدید منشأ میگیرد اما موضوع جالب توجه این است که اکثر نقاط با مقادیرNC کم در زیر منحنی قابل انتظار با فاصله زیاد قرار گرفتهاند و این نتایج نشان میدهند که برخی ژنها در G.thurberi کاربرد کدونی مستقل از ترکیب نوکلئوتیدی مشتق از فشار جهشی و متأثر از عوامل دیگری که مستقل از محدودیتهای ترکیبی میباشند.
شکل 1- سازماندهی ژنی و ساختار ژنوم دو گونه دیپلوئید
شکل 2- نمودار NC چهار گونه
یادداشت: از بالا و از چپ به راست بترتیب: G.thurberi، G.arboreum، G.barbadense وG.hirsutum
آنالیزهای تطبیقی: آنالیزهای تطبیقی برای دستیابی به فاکتورهای مسئول توزیع ژنها در نمودار آنالیز تطبیقی (COA=(Correspondence Analysis) Plot) بوسیله تعیین همبستگی بین چهار محور (axis4-axis1) با شاخصهای ترجیح کدونی برای 57 ژن کدکننده با طول بیش از 100 کدون در گونههای مورد مطالعه انجام شد. نتایج در جدول 3 و شکل 3 نشان داده شده است..
جدول 3- همبستگی شاخصهای ترجیح کدونی با محورهای توزیع ژنی در چهار ژنوم
G.thurberi |
|||||||||||||
- |
ENc |
CAI |
Fop |
T3s |
C3s |
A3s |
G3s |
GC3s |
GC |
L_sym |
Gravy |
||
Axis1 |
049/0- |
070/0- |
112/0 |
131/0- |
203/0 |
050/0- |
087/0- |
105/0 |
108/0 |
092/0 |
012/0 |
||
Axis2 |
*294/0- |
223/0 |
**380/0 |
169/0- |
374/0** |
085/0- |
124/0- |
252/0 |
294/0* |
070/0- |
261/0- |
||
Axis3 |
260/0- |
289/0* |
132/0 |
177/0 |
007/0 |
137/0- |
344/0-** |
201/0- |
099/0 |
095/0- |
214/0 |
||
Axis4 |
001/0- |
474/0** |
299/0* |
164/0 |
227/0 |
228/0- |
198/0- |
020/0 |
180/0 |
020/0 |
348/0** |
||
G.arboreum |
|||||||||||||
- |
ENc |
CAI |
Fop |
T3s |
C3s |
A3s |
G3s |
GC3s |
GC |
L_sym |
Gravy |
||
Axis1 |
209/0 |
358/0-** |
372/0** |
010/0- |
252/0- |
112/0 |
*268/0 |
059/0- |
*264/0- |
060/0 |
141/0 |
||
Axis2 |
189/0 |
168/0 |
143/0 |
**370/0 |
314/0-* |
139/0 |
248/0- |
*559/0- |
*280/0- |
143/0- |
300/0- |
||
Axis3 |
033/0 |
*526/0 |
*436/0 |
149/0 |
*341/0 |
057/0- |
*392/0- |
021/0- |
245/0 |
013/0 |
**368/0 |
||
Axis4 |
*552/0 |
217/0 |
335/0 |
001/0 |
116/0 |
057/0- |
290/0- |
085/0- |
089/0 |
161/0- |
039/0 |
||
G.barbadense |
|||||||||||||
- |
ENc |
CAI |
Fop |
T3s |
C3s |
A3s |
G3s |
GC3s |
GC |
L_sym |
Gravy |
||
|
Axis1 |
241/0- |
078/0- |
252/0- |
036/0 |
*408/0- |
220/0 |
036/0 |
*277/0- |
213/0- |
106/0- |
023/0 |
|
|
Axis2 |
085/0 |
*457/0- |
*519/0- |
043/0 |
**426/0- |
232/0 |
203/0 |
237/0- |
**399/0- |
014/0 |
109/0 |
|
|
Axis3 |
463/0** |
253/0- |
109/0- |
214/0- |
100/0 |
030/0- |
475/0** |
406/0** |
046/0 |
220/0 |
194/0- |
|
|
Axis4 |
078/0 |
442/0** |
304/0 |
159/0 |
092/0 |
067/0- |
277/0* |
138/0- |
123/0 |
021/0- |
364/0* |
|
|
G.hirsutum |
||||||||||||
|
- |
ENc |
CAI |
Fop |
T3s |
C3s |
A3s |
G3s |
GC3s |
GC |
L_sym |
Gravy |
|
|
Axis1 |
185/0- |
097/0 |
033/0- |
009/0 |
240/0- |
180/0 |
030/0- |
188/0- |
052/0- |
093/0- |
059/0- |
|
|
Axis2 |
131/0 |
212/0-* |
450/0-** |
083/0 |
485/0-** |
226/0 |
206/0 |
275/0-* |
379/0-** |
005/0 |
186/0 |
|
|
Axis3 |
442/0-** |
430/0** |
229/0 |
*335/0 |
032/0- |
084/0- |
**529/0- |
**422/0- |
030/0- |
214/0- |
*325/0 |
|
|
Axis4 |
121/0- |
*431/0- |
*377/0- |
105/0- |
*305/0- |
190/0 |
256/0 |
049/0- |
243/0- |
019/0- |
288/0- |
|
شکل 3- نمودار COA برای چهار گونه
یادداشت: از بالا و از چپ به راست بترتیب: G.thurberi، G.arboreum، G.barbadense وG.hirsutum
طبق گزارشات نتایج مربوط به این آنالیز، در هر چهار ژنوم مورد مطالعه بسیار مشابه هم بود و لذا برای ممانعت از تکرار مطالب توضیحات مربوط به این آنالیز بر مبنای اعداد جدول و نمودار مربوط به ژنوم کلروپلاست G.thurberi صورت گرفت. محور اول 3/10 و سه محور بعدی بترتیب 93/7، 9 و 16/7 درصد از تغییرات ترجیح کدونی را بیان میکند، همچنین نتایج نشان داد که محور دوم با C3(r=0.374, p<0.01)، GC (r=0.294, p<0.05) و Fop (r=0.380, p<0.01) همبستگی مثبت نشان داد، محور سوم با G3(r=-0.344, p<0.01) همبستگی مثبت و با CAI (r=0.289, p<0.05) همبستگی منفی داشت همچنین محور چهارم با CAI(r=0.474, p<0.01) و Fop (r=0.299, p<0.05) همبستگی مثبت نشان داد که وجود ارتباط معنیدار بین هر کدام از محورها و بازهای نوکلئوتیدی احتمال اثر ترکیب نوکلئوتیدی در شکلگیری ترجیح کدونی را نشان میدهد. با توجه به این در هر چهار گونه تعداد دو محور ارتباط معنیدار با CAI (Frequency of Optimal Codon Usage) وFop (Codon Adaptation Index) داشت پیشبینی شد که سطوح بیان ژن بطور اندک الگوهای ترجیح کدونی را تحت تأثیر قرار دهد (انتخاب ضعیف) و نیز بدلیل معنیداریGravy تنها در یک محور در گونههای G.barbadense وG.hirsutum نیروی انتخاب اثرگذار بر ترجیح کدونی ضعیف میباشد. طبق نتایج بدست آمده ترکیب نوکلئوتیدی (مشتق از فشار جهشی) فاکتور مهم اثرگذار بر تغییرات ترجیح کدونی همتراز در ژنوم کلروپلاست این گونهها گزارش شد.
بحث و نتیجه گیری
نمودار NC که مقادیر NC عمود بر مقادیر GC3s میباشد و محورهای y و x را تشکیل میدهند که برای نشان دادن تغییر ترجیح کدونی همتراز (SCU=Synonymous Codon Usage) بین شماری از ژنها در بین گونهها یا درون یک گونه استفاده میشود (10). نمودار مقادیرNC عمود بر GC3s میتواند برای کشف تنوع کاربرد کدون در میان ژنها موثر باشد و مقایسه توزیع واقعی ژنها با توزیع قابل انتظار نشان میدهد که گرایش ترجیح کدونی تحت تاثیر چه عواملی به جز محدودیتهای ترکیبی میتواند باشد و گرایش ترجیح کدونی بطور کامل تحتتاثیرGC3 بوده باشد و مقادیرNC باید روی منحنی قابل انتظار بین GC3s وNC باشد (3). طبق آنالیزهای ترجیح کدونی برای چهار گونه موجود کدون پایان TAA با RSCU=1 بعنوان کدون پایان ترجیح داده شده مشابه با Alsophila (5) و Panax schinseng Nees (7) گزارش شد. مقدار RSCU اغلب کدونها بیشتر از یک گزارش شده است که این نشان میدهد این کدونها با تناوب بیشتری مورد استفاده قرار گرفتهاند. اغلب کدونها از A یا T در جایگاه سوم خود (بدون تشابه در جایگاه اول و دوم) استفاده میکنند. بررسی ساختار کدونها نشان میدهد محتوای A+T در جایگاه سوم 4/71 درصد میباشد که بیشتر از مقدار آن در ناحیه کدکننده پروتئین و کل ژنوم در هر چهار ژنوم کلروپلاست میباشد و این نشان داد کهچهار گونه مورد بررسی کدونهایی را که در جایگاه سومشان A یا T دارند بیشتر ترجیح میدهند. در بررسی نتایج آنالیزهای ترجیح کدونی عامل اثرگذار بر ترجیح کدونی در چهار گونه موجود ترکیب نوکلئوتیدی بهمراه انتخاب ضعیف گزارش شد که مشابه با یافتههای (10) بود. برخلاف نتیجه بدست آمده در پژوهش خو و همکاران (2011) در بررسی عامل اثرگذار بر ترجیح کدونی در ژنوم کلروپلاست Oncicidium gower بعلت معنیدار بودن شاخص آمینواسیدی Gravy دریافتند که ترجیح کدونی متأثر از سطح هیدروپسی هر پروتئین میباشد (14). مطالعات قبلی روی ترجیح کدونی عمدتا روی گرایش کدونی در ژنوم هستهای متمرکز بودهاند و چنین بیان شده که گرایش کدونی منعکس کننده تعادل بین گرایشات جهشی و انتخاب طبیعی برای بهینهسازی ترجمه میباشد (6). تا به امروز مطالعات جامعی بر روی ژنوم کلروپلاستهای ثبت شده درNCBI انجام نگرفته و این مطالعه میتواند بعنوان یک پژوهش پیشرو در زمینه آنالیز ژنوم گونههای زراعی پنبه ثبت شود و مطمئنا نتایج حاصل از این پژوهش در ادامه مطالعات بنیادی در این زمینه مفید واقع خواهد شد. چنین تصور میشود که کدونهای بهینه برای کمک به دستیابی به سرعتهای بالا در ترجمه و دقت بالاتر است. در این تحقیق، به ارائه شواهدی پرداختیم که نشان میدهد، انحراف کدونی در ژنوم کلروپلاستG.thurberi ، G.arboreum ،G.barbadense و G.hirsutumارتباط نزدیکی ترکیب نوکلئوتیدی ناشی از فشار جهشی دارد. تحقیقات بیشتر در مورد تجزیه و تحلیل مقایسهای گرایش کدونی و عوامل دخیل در شکل دادن به الگوهای ترجیح کدون در میان ژنهای میتوکندریایی، کلروپلاست و هسته در آینده، ممکن است بتواند به روشن شدن رابطه بین ژنوم هسته، کلروپلاست و میتوکندری درجنس گوسیپیومکمک کند، و این باعث فراهم آمدن یک تحقیق جامع و مفصل درباره فرضیه اندوسیمبیوتیک و یک چهارچوب از آن برای ساخت مدلهای قویتر جهت بهبود درک ما از تکامل مولکولی و بویژه چگونگی تفسیر دادههای مولکولی برای بازسازی الگوهای فیلوژنی میشود.
سپاسگزاری
نگارندگان مقاله از مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی آذربایجان غربی و دانشگاه آزاد اسلامی واحد ارومیه بدلیل حمایت از انجام پژوهش حاضر سپاسگزاری میکنند.