به گزارش گروه دانشگاه خبرگزاری دانشجو، محققان با بررسی تعداد زیادی از DNA، ساختار شیمیایی و دادههای عملکردی، یک پلتفرم هدایت شونده با هوش مصنوعی ایجاد کردهاند که به طراحی، ساخت و آزمایش آنزیمهای جدید قدرتمند کمک میکند.
پروتئینها از رشتههایی از آمینو اسیدها ساخته شدهاند که شبیه رشتهای در تصویر بالا هستند. با استفاده از مدلهای یادگیری ماشینی، محققان توانستند هویت اسیدهای آمینه را روی رایانه طراحی کنند تا آنزیمهای پروتئینی را که مواد دارویی میسازند، مهندسی کنند. مولکول در مرکز تصویر بالا یک آنزیم مهندسی شده McbA است.
آنزیمها برای زندگی بسیار مهم هستند. آنها کاتالیزورهای کوچک طبیعت هستند. در روده به ما در هضم غذا کمک میکنند. آنها میتوانند عطر را تقویت کنند یا با انرژی کمتری لباسهای شسته شده را تمیز کنند. آنزیمها همچنین داروهای قوی برای درمان بیماری میسازند. دانشمندان به طور طبیعی مشتاق ایجاد آنزیمهای جدید هستند. آنها تصور میکنند که هر کاری از بیرون کشیدن گازهای گلخانهای از آسمان گرفته تا سموم مضر در محیط زیست انجام میدهند.
این جستجوی قدیمی برای آنزیمهای جدید بسیار سادهتر شد. تیمی از مهندسان زیستی و زیستشناسان مصنوعی یک گردش کار محاسباتی ایجاد کردهاند که میتواند هزاران آنزیم جدید را طراحی کند، نحوه رفتار آنها در دنیای واقعی را پیشبینی کند، و عملکرد آنها را در واکنشهای شیمیایی متعدد آزمایش کند - جریان کاری که در رایانه انجام میشود. نتایج آنها در مقاله جدیدی در مجله Nature Communications منتشر شده است.
مایکل جئوت، پروفسور مهندسی زیستی در دانشگاه استنفورد گفت: «ما یک فرآیند محاسباتی ایجاد کردهایم که به ما امکان میدهد آنزیمها را خیلی سریعتر مهندسی کنیم، زیرا لازم نیست از سلولهای زنده برای تولید آنزیمها استفاده کنیم، همانطور که اکنون چنین است.» و نویسنده ارشد مطالعه جدید. در عوض، ما از یادگیری ماشینی برای پیشبینی آنزیمهای طراح بسیار فعال استفاده میکنیم که از توالیهای DNA جهشیافته مدلسازیشده روی کامپیوتر بهجای ایجاد دست در آزمایشگاه مهندسی شدهاند. ما میتوانیم این آزمایشها را در چند روز به جای هفتهها یا، همانطور که اغلب اتفاق میافتد، ماهها انجام دهیم.
علم قدیمی، مدلهای جدید
از نظر تاریخی، دانشمندانی که برای مهندسی آنزیمهای جدید کار میکردند، باید با آنزیمی که از قبل برای طبیعت شناخته شده بود، کار میکردند. سپس، با استفاده از سلولهای واقعی و اصلاحشده ژنتیکی در آزمایشگاه، آنها به طور مکرر تغییراتی در آنزیمها ایجاد میکنند تا آنها را برای انجام شیمی مطلوبی که محققان امیدوارند به دست آورند، ترغیب کنند.
DNA مورد نیاز برای این انواع آنزیم باید از یک فروشنده شخص ثالث خریداری شود. سپس DNA باید به صورت دستی به سلولها منتقل شود تا آنزیمهای مورد نظر تولید شود و سپس باید در طیف وسیعی از واکنشهای شیمیایی خالص و آزمایش شوند. جیوت گفت: گاهی اوقات ممکن است هزاران تکرار - شاید حتی دهها یا صدها هزار - برای یافتن آنزیمی که ممکن است شیمی مورد نظر یک دانشمند را ارائه دهد، طول بکشد.
او میافزاید: اکنون میتوانیم همه این کارها را روی رایانه انجام دهیم. به جای انجام ۱۰۰۰۰ واکنش شیمیایی برای بهبود مکرر فعالیت آنزیم، میتوانیم از مدلهای یادگیری ماشین برای پیشبینی انواع بسیار فعال استفاده کنیم که هنوز هم به همان خوبی عمل میکنند.
علم مهندسی آنزیم جدید نیست، فقط کاربرد یادگیری ماشین در این زمینه است. جئوت و همکارانش آن را به عنوان "تکامل هدایت شده" میشناسند. آنها در حال کوتاه کردن فرآیندی هستند که خود طبیعت طی اعصار مختلف طی کرده است، زیرا DNA به طور تصادفی جهش مییابد و آنزیمهای جدیدی به وجود میآیند که گاهی اوقات نتایج مهمی را به همراه دارند. به هر حال، آنزیمها فقط پروتئینهایی هستند که از رشتههای طولانی اسیدهای آمینه تشکیل شدهاند. DNA تولید رشتهها را هدایت میکند.
جئوت گفت: ساختار پروتئینها - که از توالی آن اسیدهای آمینه در مولکول ایجاد میشود - است که منجر به عملکرد آنها میشود. تکامل هدایتشده یک میدان چند دههای است که توانایی جهش اسیدهای آمینه را برای تغییر عملکرد پروتئین ایجاد کرده است. ما فقط با استفاده از یادگیری ماشینی و رایانه، این روند را تسریع میکنیم. یکی از ویژگیهای کلیدی جریان کاری این تیم، توانایی سنتز و آزمایش آنزیمهای پروتئینی در سیستمهای بدون سلول بدون ارگانیسمهای دست نخورده زنده است که این روند را بیشتر تسریع میکند.
آینده محور
به عنوان اثبات مفهوم، جئوت و همکاران از ابزار جدید خود برای سنتز یک داروی مولکولی کوچک با بازده ۹۰ درصدی استفاده کردند - نسبت به بازده اولیه ۱۰ درصد - و نشان دادند که میتوان از آن برای ساخت چندین آنزیم تخصصی به صورت موازی برای ساخت ۸ آنزیم اضافی استفاده کرد. درمان او اکنون به دنبال یک شریک دارویی برای توسعه بیشتر این مدل است. به طور گستردهتر، گروه جوت علاقهمند به گسترش مدلهای یادگیری ماشینی او برای هدایت کاتالیزور یا عملکرد آنزیم در بسیاری از انواع مختلف واکنشهای شیمیایی است. در این مقاله، تیم تنها به تشکیل پیوند آمیدی، یک واکنش شیمیایی فراگیر که در بسیاری از زمینههای مختلف از داروسازی تا غذا مهم است، نگاه کرد. اما فرصتهای دیگری نیز وجود دارد.
وی ادامه داد: ما میتوانیم فرصتهای متعددی را در زمینه پایداری و اقتصاد زیستی کشف کنیم. میتوانید به دستههایی از مولکولها فکر کنید که سموم را از محیط تجزیه میکنند، فراهمی زیستی غذاهای غنی از پروتئین را افزایش میدهند، یا سایر مولکولهایی که فرآیندهای موجود را که نیاز به فشار بالا، اجزای پرهزینه، یا واکنشهای سمی دارند را انجام میدهند و آنها را سریعتر، ایمنتر و ارزانتر میکنند.
کار جئوت و همکارانش بدون موانع نبود، به ویژه کمبود داده. او گفت: دادههای عملکردی با کیفیت بالا و کمیت بالا همچنان یک چالش است. همه ما میدانیم که هوش مصنوعی به دادههای زیادی نیاز دارد و در این مرحله آن را وجود ندارد.
جئوت گفت: در زمینه تکامل هدایت شده و زیست کاتالیزور، تولید مقادیر زیادی داده برای انجام آن واکنشهای شیمیایی چیزی نیست که معمولاً در ادبیات علمی گزارش شده است. فرآیند تولید دادهها بسیار کند است. اما، همانطور که علم بیشتر و بیشتر از مدلهای یادگیری ماشین برای تسریع طراحی استفاده میکند، این نیازهای داده فقط افزایش مییابد و به کارهای آینده اشاره میکند. در این مطالعه، Jewett در نهایت توانست حدود ۳۰۰۰ جهش آنزیمی را در حدود ۱۰۰۰ محصول و حدود ۱۰۰۰۰ واکنش شیمیایی ارزیابی کند، اما نیازهای دادههای او مرتبهای بزرگتر است.
وی با ارائه یک مثال عینی برای مقیاس افزود: اگر من بخواهم یک آنزیم را برای آزمایش دهها هزار نوع جهش دهم، ممکن است مقالاتی در آنجا پیدا کنم، اما ممکن است دادههای جهش یافته را برای ده نوع گزارش کنند. نه صدها. نه هزاران. نه دهها هزار واکنش، بلکه ده. بنابراین، ما راهی برای رفتن در جبهه داده داریم، اما به آنجا خواهیم رسید. این اولین قدم است.