آخرین اخبار:
کد خبر:۱۲۲۲۵۸۷

هوش مصنوعی مولد/ شیمیدانان MIT به سرعت ساختار‌های ژنومی سه بعدی را محاسبه می‌کنند

شیمیدانان MIT اکنون با استفاده از هوش مصنوعی مولد راه جدیدی برای تعیین ساختار‌های ژنوم سه بعدی ارائه کرده‌اند.

به گزارش گروه دانشگاه خبرگزاری دانشجو؛ یک رویکرد جدید، که به‌جای چند روز، چند دقیقه طول می‌کشد، پیش‌بینی می‌کند که یک توالی DNA خاص چگونه خود را در هسته سلول ترتیب می‌دهد.

هر سلول در بدن شما دارای توالی ژنتیکی یکسانی است، اما هر سلول تنها زیرمجموعه‌ای از آن ژن‌ها را بیان می‌کند. این الگو‌های بیان ژن اختصاصی سلول، که تضمین می‌کند سلول مغزی با سلول پوست متفاوت است، تا حدی توسط ساختار سه بعدی ماده ژنتیکی تعیین می‌شود که دسترسی هر ژن را کنترل می‌کند.

شیمیدانان MIT اکنون با استفاده از هوش مصنوعی مولد راه جدیدی برای تعیین ساختار‌های ژنوم سه بعدی ارائه کرده‌اند. تکنیک آنها می‌تواند هزاران ساختار را در عرض چند دقیقه پیش‌بینی کند، که آن را بسیار سریع‌تر از روش‌های تجربی موجود برای تجزیه و تحلیل سازه‌ها می‌کند.

با استفاده از این تکنیک، محققان می‌توانند به راحتی بررسی کنند که چگونه سازماندهی سه بعدی ژنوم بر الگو‌ها و عملکرد‌های بیان ژن تک تک سلول‌ها تأثیر می‌گذارد.

بن ژانگ، دانشیار شیمی و نویسنده ارشد این مطالعه، می‌گوید: هدف ما تلاش برای پیش‌بینی ساختار ژنوم سه‌بعدی از توالی DNA زیرین بود. اکنون که ما می‌توانیم این کار را انجام دهیم، که این تکنیک را با تکنیک‌های آزمایشی پیشرفته همتراز می‌کند، واقعاً می‌تواند فرصت‌های جالب زیادی را باز کند.

گرگ شوت و ژوهان لائو، دانشجویان فارغ التحصیل MIT، نویسندگان اصلی این مقاله هستند که امروز در Science Advances منتشر شده است.

از دنباله به ساختار

در داخل هسته سلول، DNA و پروتئین‌ها مجموعه‌ای به نام کروماتین را تشکیل می‌دهند که دارای چندین سطح سازماندهی است و به سلول‌ها اجازه می‌دهد ۲ متر DNA را در هسته‌ای که قطر آن تنها یک صدم میلی متر است، جمع کنند. رشته‌های طولانی DNA به دور پروتئین‌هایی به نام هیستون می‌پیچد و ساختاری شبیه به مهره‌های روی یک ریسمان ایجاد می‌کند.

برچسب‌های شیمیایی که به عنوان تغییرات اپی ژنتیکی شناخته می‌شوند، می‌توانند در مکان‌های خاصی به DNA متصل شوند و این برچسب‌ها، که بر اساس نوع سلول متفاوت هستند، بر تاخوردگی کروماتین و دسترسی به ژن‌های مجاور تأثیر می‌گذارند. این تفاوت‌ها در ساختار کروماتین به تعیین اینکه کدام ژن در انواع مختلف سلول یا در زمان‌های مختلف در یک سلول خاص بیان می‌شوند، کمک می‌کند.

در طول ۲۰ سال گذشته، دانشمندان تکنیک‌های آزمایشی را برای تعیین ساختار کروماتین توسعه داده‌اند. یکی از تکنیک‌های پرکاربرد، معروف به Hi-C، با پیوند دادن رشته‌های DNA مجاور در هسته سلول کار می‌کند. سپس محققان می‌توانند با خرد کردن DNA به قطعات بسیار کوچک و تعیین توالی آن تعیین کنند که کدام بخش‌ها در نزدیکی یکدیگر قرار دارند.

این روش را می‌توان بر روی جمعیت‌های بزرگی از سلول‌ها برای محاسبه یک ساختار متوسط برای یک بخش کروماتین، یا روی سلول‌های منفرد برای تعیین ساختار‌های درون آن سلول خاص استفاده کرد. با این حال، Hi-C و تکنیک‌های مشابه کار فشرده هستند و تولید داده از یک سلول ممکن است حدود یک هفته طول بکشد.

برای غلبه بر این محدودیت‌ها، ژانگ و دانش‌آموزانش مدلی را توسعه دادند که از پیشرفت‌های اخیر در هوش مصنوعی مولد برای ایجاد راهی سریع و دقیق برای پیش‌بینی ساختار‌های کروماتین در سلول‌های منفرد بهره می‌برد. مدل هوش مصنوعی که آنها طراحی کرده‌اند می‌تواند به سرعت توالی‌های DNA را تجزیه و تحلیل کند و ساختار‌های کروماتینی را که آن توالی‌ها ممکن است در یک سلول تولید کنند، پیش‌بینی کند.

ژانگ می‌گوید: یادگیری عمیق در تشخیص الگو واقعاً خوب است. این به ما امکان می‌دهد بخش‌های بسیار طولانی DNA، هزاران جفت باز را تجزیه و تحلیل کنیم و بفهمیم که اطلاعات مهم کدگذاری شده در آن جفت‌های باز DNA چیست.

ChromoGen، مدلی که محققان ایجاد کردند، دو جزء دارد. مؤلفه اول، یک مدل یادگیری عمیق که برای "خواندن" ژنوم آموزش داده می‌شود، اطلاعات رمزگذاری شده در توالی DNA و داده‌های دسترسی کروماتین را تجزیه و تحلیل می‌کند، که دومی به طور گسترده در دسترس است و نوع سلولی خاص است.

مؤلفه دوم یک مدل هوش مصنوعی مولد است که ترکیبات کروماتین دقیق از نظر فیزیکی را پیش‌بینی می‌کند و روی بیش از ۱۱ میلیون ترکیب کروماتین آموزش دیده است. این داده‌ها از آزمایش‌هایی با استفاده از Dip-C (نوعی از Hi-C) روی ۱۶ سلول از خطی از لنفوسیت‌های B انسانی تولید شدند.

هنگامی که یکپارچه می‌شود، اولین جزء به مدل مولد اطلاع می‌دهد که چگونه محیط نوع خاص سلول بر تشکیل ساختار‌های کروماتین مختلف تأثیر می‌گذارد، و این طرح به طور موثر روابط توالی-ساختار را به تصویر می‌کشد. برای هر دنباله، محققان از مدل خود برای تولید بسیاری از ساختار‌های ممکن استفاده می‌کنند. به این دلیل که DNA یک مولکول بسیار نامنظم است، بنابراین یک توالی DNA منفرد می‌تواند منجر به بسیاری از ترکیب‌های ممکن مختلف شود.

یک عامل پیچیده‌کننده اصلی پیش‌بینی ساختار ژنوم این است که راه‌حل واحدی وجود ندارد که ما به دنبال آن هستیم. توزیعی از ساختار‌ها وجود دارد، صرف نظر از اینکه به چه بخشی از ژنوم نگاه می‌کنید. Schuette می‌گوید، پیش بینی آن توزیع آماری بسیار پیچیده و با ابعاد بالا، کاری است که انجام آن فوق العاده چالش برانگیز است.

تجزیه و تحلیل سریع

پس از آموزش، این مدل می‌تواند پیش‌بینی‌هایی را در مقیاس زمانی بسیار سریع‌تر از Hi-C یا سایر تکنیک‌های تجربی ایجاد کند.

Schuette می‌گوید: در حالی که ممکن است شش ماه آزمایش را برای بدست آوردن چند ده ساختار در یک نوع سلول اختصاص دهید، می‌توانید هزار ساختار را در یک منطقه خاص با مدل ما در ۲۰ دقیقه تنها با یک GPU ایجاد کنید.

پس از آموزش مدل خود، محققان از آن برای ایجاد پیش بینی ساختار برای بیش از ۲۰۰۰ توالی DNA استفاده کردند، سپس آنها را با ساختار‌های آزمایشی تعیین شده برای آن توالی مقایسه کردند. آنها دریافتند که ساختار‌های تولید شده توسط مدل مشابه یا بسیار شبیه به آنچه در داده‌های تجربی دیده می‌شود است.

ژانگ می‌گوید: ما معمولاً به صد‌ها یا هزاران ترکیب برای هر دنباله نگاه می‌کنیم، و این به شما نمایش معقولی از تنوع ساختار‌هایی که یک منطقه خاص می‌تواند داشته باشد، می‌دهد. "اگر آزمایش خود را چندین بار در سلول‌های مختلف تکرار کنید، به احتمال زیاد با ترکیب بسیار متفاوتی مواجه خواهید شد. این چیزی است که مدل ما سعی دارد پیش‌بینی کند.

محققان همچنین دریافتند که این مدل می‌تواند پیش‌بینی‌های دقیقی برای داده‌های انواع سلولی غیر از نمونه‌ای که روی آن آموزش دیده بود، انجام دهد. این نشان می‌دهد که این مدل می‌تواند برای تجزیه و تحلیل اینکه چگونه ساختار‌های کروماتین بین انواع سلول‌ها متفاوت است و چگونه این تفاوت‌ها بر عملکرد آنها تأثیر می‌گذارد مفید باشد. این مدل همچنین می‌تواند برای بررسی حالت‌های کروماتین مختلف که می‌تواند در یک سلول وجود داشته باشد و اینکه چگونه این تغییرات بر بیان ژن تأثیر می‌گذارد، استفاده شود.

یکی دیگر از کاربرد‌های احتمالی می‌تواند کشف این باشد که چگونه جهش‌ها در یک توالی DNA خاص، ترکیب کروماتین را تغییر می‌دهند، که می‌تواند روشن کند که چگونه چنین جهش‌هایی ممکن است باعث بیماری شوند.

ژانگ می‌گوید: سوالات جالب زیادی وجود دارد که فکر می‌کنم می‌توانیم با این نوع مدل به آنها پاسخ دهیم.

محققان تمام داده‌ها و مدل خود را در دسترس دیگرانی که مایل به استفاده از آن هستند قرار داده‌اند.

ارسال نظر
captcha
*شرایط و مقررات*
خبرگزاری دانشجو نظراتی را که حاوی توهین است منتشر نمی کند.
لطفا از نوشتن نظرات خود به صورت حروف لاتین (فینگیلیش) خودداری نمايید.
توصیه می شود به جای ارسال نظرات مشابه با نظرات منتشر شده، از مثبت یا منفی استفاده فرمایید.
با توجه به آن که امکان موافقت یا مخالفت با محتوای نظرات وجود دارد، معمولا نظراتی که محتوای مشابهی دارند، انتشار نمی یابد.
پربازدیدترین آخرین اخبار