به گزارش گروه دانشگاه خبرگزاری دانشجو؛ یک رویکرد جدید، که بهجای چند روز، چند دقیقه طول میکشد، پیشبینی میکند که یک توالی DNA خاص چگونه خود را در هسته سلول ترتیب میدهد.
هر سلول در بدن شما دارای توالی ژنتیکی یکسانی است، اما هر سلول تنها زیرمجموعهای از آن ژنها را بیان میکند. این الگوهای بیان ژن اختصاصی سلول، که تضمین میکند سلول مغزی با سلول پوست متفاوت است، تا حدی توسط ساختار سه بعدی ماده ژنتیکی تعیین میشود که دسترسی هر ژن را کنترل میکند.
شیمیدانان MIT اکنون با استفاده از هوش مصنوعی مولد راه جدیدی برای تعیین ساختارهای ژنوم سه بعدی ارائه کردهاند. تکنیک آنها میتواند هزاران ساختار را در عرض چند دقیقه پیشبینی کند، که آن را بسیار سریعتر از روشهای تجربی موجود برای تجزیه و تحلیل سازهها میکند.
با استفاده از این تکنیک، محققان میتوانند به راحتی بررسی کنند که چگونه سازماندهی سه بعدی ژنوم بر الگوها و عملکردهای بیان ژن تک تک سلولها تأثیر میگذارد.
بن ژانگ، دانشیار شیمی و نویسنده ارشد این مطالعه، میگوید: هدف ما تلاش برای پیشبینی ساختار ژنوم سهبعدی از توالی DNA زیرین بود. اکنون که ما میتوانیم این کار را انجام دهیم، که این تکنیک را با تکنیکهای آزمایشی پیشرفته همتراز میکند، واقعاً میتواند فرصتهای جالب زیادی را باز کند.
گرگ شوت و ژوهان لائو، دانشجویان فارغ التحصیل MIT، نویسندگان اصلی این مقاله هستند که امروز در Science Advances منتشر شده است.
از دنباله به ساختار
در داخل هسته سلول، DNA و پروتئینها مجموعهای به نام کروماتین را تشکیل میدهند که دارای چندین سطح سازماندهی است و به سلولها اجازه میدهد ۲ متر DNA را در هستهای که قطر آن تنها یک صدم میلی متر است، جمع کنند. رشتههای طولانی DNA به دور پروتئینهایی به نام هیستون میپیچد و ساختاری شبیه به مهرههای روی یک ریسمان ایجاد میکند.
برچسبهای شیمیایی که به عنوان تغییرات اپی ژنتیکی شناخته میشوند، میتوانند در مکانهای خاصی به DNA متصل شوند و این برچسبها، که بر اساس نوع سلول متفاوت هستند، بر تاخوردگی کروماتین و دسترسی به ژنهای مجاور تأثیر میگذارند. این تفاوتها در ساختار کروماتین به تعیین اینکه کدام ژن در انواع مختلف سلول یا در زمانهای مختلف در یک سلول خاص بیان میشوند، کمک میکند.
در طول ۲۰ سال گذشته، دانشمندان تکنیکهای آزمایشی را برای تعیین ساختار کروماتین توسعه دادهاند. یکی از تکنیکهای پرکاربرد، معروف به Hi-C، با پیوند دادن رشتههای DNA مجاور در هسته سلول کار میکند. سپس محققان میتوانند با خرد کردن DNA به قطعات بسیار کوچک و تعیین توالی آن تعیین کنند که کدام بخشها در نزدیکی یکدیگر قرار دارند.
این روش را میتوان بر روی جمعیتهای بزرگی از سلولها برای محاسبه یک ساختار متوسط برای یک بخش کروماتین، یا روی سلولهای منفرد برای تعیین ساختارهای درون آن سلول خاص استفاده کرد. با این حال، Hi-C و تکنیکهای مشابه کار فشرده هستند و تولید داده از یک سلول ممکن است حدود یک هفته طول بکشد.
برای غلبه بر این محدودیتها، ژانگ و دانشآموزانش مدلی را توسعه دادند که از پیشرفتهای اخیر در هوش مصنوعی مولد برای ایجاد راهی سریع و دقیق برای پیشبینی ساختارهای کروماتین در سلولهای منفرد بهره میبرد. مدل هوش مصنوعی که آنها طراحی کردهاند میتواند به سرعت توالیهای DNA را تجزیه و تحلیل کند و ساختارهای کروماتینی را که آن توالیها ممکن است در یک سلول تولید کنند، پیشبینی کند.
ژانگ میگوید: یادگیری عمیق در تشخیص الگو واقعاً خوب است. این به ما امکان میدهد بخشهای بسیار طولانی DNA، هزاران جفت باز را تجزیه و تحلیل کنیم و بفهمیم که اطلاعات مهم کدگذاری شده در آن جفتهای باز DNA چیست.
ChromoGen، مدلی که محققان ایجاد کردند، دو جزء دارد. مؤلفه اول، یک مدل یادگیری عمیق که برای "خواندن" ژنوم آموزش داده میشود، اطلاعات رمزگذاری شده در توالی DNA و دادههای دسترسی کروماتین را تجزیه و تحلیل میکند، که دومی به طور گسترده در دسترس است و نوع سلولی خاص است.
مؤلفه دوم یک مدل هوش مصنوعی مولد است که ترکیبات کروماتین دقیق از نظر فیزیکی را پیشبینی میکند و روی بیش از ۱۱ میلیون ترکیب کروماتین آموزش دیده است. این دادهها از آزمایشهایی با استفاده از Dip-C (نوعی از Hi-C) روی ۱۶ سلول از خطی از لنفوسیتهای B انسانی تولید شدند.
هنگامی که یکپارچه میشود، اولین جزء به مدل مولد اطلاع میدهد که چگونه محیط نوع خاص سلول بر تشکیل ساختارهای کروماتین مختلف تأثیر میگذارد، و این طرح به طور موثر روابط توالی-ساختار را به تصویر میکشد. برای هر دنباله، محققان از مدل خود برای تولید بسیاری از ساختارهای ممکن استفاده میکنند. به این دلیل که DNA یک مولکول بسیار نامنظم است، بنابراین یک توالی DNA منفرد میتواند منجر به بسیاری از ترکیبهای ممکن مختلف شود.
یک عامل پیچیدهکننده اصلی پیشبینی ساختار ژنوم این است که راهحل واحدی وجود ندارد که ما به دنبال آن هستیم. توزیعی از ساختارها وجود دارد، صرف نظر از اینکه به چه بخشی از ژنوم نگاه میکنید. Schuette میگوید، پیش بینی آن توزیع آماری بسیار پیچیده و با ابعاد بالا، کاری است که انجام آن فوق العاده چالش برانگیز است.
تجزیه و تحلیل سریع
پس از آموزش، این مدل میتواند پیشبینیهایی را در مقیاس زمانی بسیار سریعتر از Hi-C یا سایر تکنیکهای تجربی ایجاد کند.
Schuette میگوید: در حالی که ممکن است شش ماه آزمایش را برای بدست آوردن چند ده ساختار در یک نوع سلول اختصاص دهید، میتوانید هزار ساختار را در یک منطقه خاص با مدل ما در ۲۰ دقیقه تنها با یک GPU ایجاد کنید.
پس از آموزش مدل خود، محققان از آن برای ایجاد پیش بینی ساختار برای بیش از ۲۰۰۰ توالی DNA استفاده کردند، سپس آنها را با ساختارهای آزمایشی تعیین شده برای آن توالی مقایسه کردند. آنها دریافتند که ساختارهای تولید شده توسط مدل مشابه یا بسیار شبیه به آنچه در دادههای تجربی دیده میشود است.
ژانگ میگوید: ما معمولاً به صدها یا هزاران ترکیب برای هر دنباله نگاه میکنیم، و این به شما نمایش معقولی از تنوع ساختارهایی که یک منطقه خاص میتواند داشته باشد، میدهد. "اگر آزمایش خود را چندین بار در سلولهای مختلف تکرار کنید، به احتمال زیاد با ترکیب بسیار متفاوتی مواجه خواهید شد. این چیزی است که مدل ما سعی دارد پیشبینی کند.
محققان همچنین دریافتند که این مدل میتواند پیشبینیهای دقیقی برای دادههای انواع سلولی غیر از نمونهای که روی آن آموزش دیده بود، انجام دهد. این نشان میدهد که این مدل میتواند برای تجزیه و تحلیل اینکه چگونه ساختارهای کروماتین بین انواع سلولها متفاوت است و چگونه این تفاوتها بر عملکرد آنها تأثیر میگذارد مفید باشد. این مدل همچنین میتواند برای بررسی حالتهای کروماتین مختلف که میتواند در یک سلول وجود داشته باشد و اینکه چگونه این تغییرات بر بیان ژن تأثیر میگذارد، استفاده شود.
یکی دیگر از کاربردهای احتمالی میتواند کشف این باشد که چگونه جهشها در یک توالی DNA خاص، ترکیب کروماتین را تغییر میدهند، که میتواند روشن کند که چگونه چنین جهشهایی ممکن است باعث بیماری شوند.
ژانگ میگوید: سوالات جالب زیادی وجود دارد که فکر میکنم میتوانیم با این نوع مدل به آنها پاسخ دهیم.
محققان تمام دادهها و مدل خود را در دسترس دیگرانی که مایل به استفاده از آن هستند قرار دادهاند.