یادداشت
مدلهای یادگیری عمیق، آینده تحقیقات سلولهای بنیادی را شکل خواهند داد
محققان با توسعه روشهای یادگیری عمیق به نقش موثر آن در تحقیقات سلولهای بنیادی رسیدهاند.
امتیاز:
به گزارش پایگاه اطلاع رسانی بنیان، توانایی ما برای درک و کنترل زیستشناسی سلولهای بنیادی با پیشرفتهایی در دو جنبه افزایش مییابد، توانایی ما برای جمعآوری دادههای بیشتر برای توصیف وضعیت سلولی و توانایی ما برای درک این دادهها با استفاده از مدلهای یادگیری عمیق.
زیربنای هر مدلی داده است
یک نیاز حیاتی برای تولید مدلهای دقیق، دادههایی است که بر اساس آنها آموزش دیدهاند. پذیرش گسترده فناوریهای با کارایی بالا برای اندازهگیری بیان ژن و توالیهای ژنومی منجر به تولید مقادیر زیادی داده شده است. با این حال، نحوه تولید و به اشتراک گذاری این دادهها میتواند به طور چشمگیری بر کاربرد آنها برای آموزش مدلهای DL تأثیر بگذارد. اشتراکگذاری دادههای دسترسی آزاد، دادهها را به صورت عمومی در اختیار جامعه علمی قرار داده است. به طور معمول از انتشارات خواسته میشود که دادههای خام و پردازش شده جدید تولید شده خود را در مخازنی مانند Gene Expression Omnibus، آرشیو کوتاه خواندن، و آرشیو نوکلئوتید اروپا ذخیره کنند. با این حال، برای استفاده موثر از این منابع داده به عنوان یک کل برای آموزش یک مدل DL، باید مقدار قابل توجهی استانداردسازی و عادی سازی فایلهای خام و پردازش شده سپرده شده انجام شود. این برای در نظر گرفتن هر گونه اثرات دستهای، مانند خط لوله پردازش، پروتکل آزمایشی، و تفاوتهای بین فردی ضروری است.
مدلهای DL در حال حاضر به استفاده از دادههای عمومی کمک میکنند
با تولید دادههای توالی بیشتر، ترکیب دادهها از منابع متنوع به طور فزایندهای حیاتی میشود. بدون توانایی ترکیب دقیق دادهها، محققان مجبورند هر مجموعه داده را جداگانه تفسیر کنند و از این منبع رو به رشد استفاده نکنند. مدلهای DL در حال حاضر ثابت کردهاند که یک ابزار قدرتمند در یکپارچه سازی دادهها هستند. به عنوان مثال، ابزارهای متعدد مبتنی بر DL برای ادغام دادههای رونویسی تک سلولی توسعه یافتهاند، به عنوان مثال، scVI، trVAE، scANVI، scGen و expiMap. بسیاری از این ابزارها از یک مدل شبکه عصبی مبتنی بر رمزگذار خودکار استفاده میکنند که سعی میکند بیان ژن ورودی با ابعاد بالا را قبل از رمزگشایی آن به فضای ورودی اصلی در یک نمایش با ابعاد پایینتر رمزگذاری کند. سپس هدف مدل DL به حداقل رساندن تفاوت بین دادههای آموزشی اصلی و همتای رمزگذاری شده-رمزگشایی شده است. فرضیه این است که اگر مدل بتواند مجموعهای از وزنها را برای انجام این کار با دقت بالا پیدا کند، پس نمایش کمبعد رمزگذاریشده باید بسیاری از اطلاعات معنیدار را از ورودی با ابعاد بالاتر دریافت کند.
آینده دادهها و مدلها در تحقیقات سلولهای بنیادی
علیرغم پیشرفتهای متعدد تکنولوژیکی، پیچیدگی اکثر طرحهای تجربی نسبتاً بدون تغییر باقی مانده است. آزمایش معمولی اغلب شامل سلولهایی از یک «حالت پایدار» است که در معرض یک تغییر/اختلال واحد قرار میگیرند یا با یک «حالت اصلاحشده» مانند یک بیماری مقایسه میشوند. این طراحی به خوبی پاسخگوی سوالاتی است که ما (به عنوان انسان) پاسخ آنها را آسانتر میدانیم، مانند "تفاوت بین حالت ثابت و تغییر یافته چیست؟" این بدان معناست که علیرغم ارائه وضوح بالاتر و افزایش پیچیدگی دادهها، انواع سؤالاتی که به آنها پرداخته میشود با سرعت یکسانی تکامل نیافتهاند.
یکی از زمینههایی که احتمالاً در آینده نزدیک در آن اتفاق میافتد، دادههای تولید شده با استفاده از توالییابی فضایی و تک سلولی است. با هر نوآوری در رونویسی فضایی، وضوح فضایی یا حجم نمونه افزایش مییابد. بنابراین، باید روشهایی را پیش بینی کرد که میتوانند بیان ژن را با وضوح درون سلولی در مقیاس اندامی اندازه گیری کنند. به طور مشابه، هزینه هر سلول برای توالییابی تک سلولی کاهش مییابد، و اکنون میتوان روشهای بیشتری را به طور همزمان مشخص کرد. همچنین باید انتظار داشت که به طور معمول میلیونها مشاهدات، از روشهای متعدد، از فرآیندهای بیولوژیکی را در طول زمان جمعآوری کرد.
چالشهایی که باید بر آن غلبه کرد
رسیدن به نقطهای که DL به تحقیقات سلولهای بنیادی شکل میدهد، نیازمند غلبه بر چندین چالش است. این چالشها فقط محاسباتی و بیولوژیکی نیستند، بلکه اجتماعی/انسانی نیز هستند و برای غلبه بر آنها به ورودیهای چندین رشته نیاز دارند. اولاً، به عنوان یک زمینه، ما باید از اشتباهات انجام شده در استفادههای قبلی از DL درس بگیریم و اطمینان حاصل کنیم که سوگیریهای ما (خودآگاه و ناخودآگاه) از طریق دادههایی که تولید میکنیم و معیارهایی که تعریف میکنیم به این مدلها منتقل نمیشوند. بنابراین، دادههای تولید شده برای آموزش مدلهای DL باید گونههای ما را بیطرفانه و جامع نشان دهند، سیستمهای بیولوژیکی مختلف را پوشش دهند و زمینههای ژنتیکی متنوعی را در بر گیرند. این امر در حصول اطمینان از اینکه جوایز حاصل از اعمال DL تا حد امکان در آینده عادلانه باشد بسیار مهم خواهد بود.
برخی از جنبههای زیست شناسی سلولهای بنیادی آنها را از سایر انواع سلولهای بدن ما متمایز میکند و این تفاوتها میتواند در اجرای مدلهای DL در نظر گرفته شود. به عنوان مثال، سلولهای بنیادی پویا هستند، حس میکنند و به ریزمحیط پاسخ میدهند. به این ترتیب، مدلهای DL باید بتوانند ویژگیهای دینامیکی را ثبت کنند و دادههای مورد استفاده برای آموزش مدلها به وضوح کافی برای ثبت این تغییرات نیاز دارند. این امر پیچیده تر است زیرا تمایز و برنامه ریزی مجدد میتواند به صورت ناهمزمان و به ترتیبهای مختلف اتفاق بیفتد. به این ترتیب، مدلهای DL باید بتوانند رفتار تک تک سلولها را پیشبینی کنند، اما همچنین نحوه تأثیرگذاری مجموعه آنها در یک لحظه معین بر پویایی جهانی را نیز در بر گیرند. این ترکیب از سلسله مراتب و تعاملات متعدد، مدل سازی سلولهای بنیادی را در مقایسه با حالتهای سلولی پایدار و کاملاً متمایز که دینامیک آنها ساده تر است، دشوار میکند.
چالش دیگری که ما با آن روبرو هستیم این است که حتی با وجود پیشرفتهای مورد انتظار در فنآوریهای توالییابی، اندازهگیریهای ما فقط توصیفی جزئی و ناقص از وضعیت سلولی که در تلاش برای مدلسازی هستیم، ارائه میدهد. ما باید راههایی برای ارتباط مدلهای دیجیتال خود با همتایان "دنیای واقعی" آنها پیدا کنیم. این ممکن است شامل شبیهسازی آزمایشهای مشابه بر روی مدلهای دیجیتال و مقایسه آنها با آزمایشهای مشابه انجامشده بر روی سلولهای بیولوژیکی یا داشتن یک سری آزمایشهای عملکردی باشد که میتوانند در سیلیکون انجام شوند تا اطمینان حاصل شود که رفتار مدلهای سلولی دقیقاً آنچه را نشان میدهد.
به طور کلی، انتظار میرود که مدلهای DL به طور فزایندهای به بخشی از زرادخانه ابزارهای ما برای کشف زیست شناسی تبدیل شوند. با بهبود تولید داده و مدلهای DL، مدلهای DL قابل تعمیم سلول تکامل خواهند یافت. در نهایت، اینها به آزمایشهای سیلیکو اجازه میدهند تا جایگزین دیگری برای مدلهای in vitro و in vivo فعلی شوند. اگرچه آنها هرگز جایگزین آزمایشات آزمایشگاهی مرطوب یا کارهای حیوانی نخواهند شد، اما پتانسیل بسیار زیادی برای هدایت تمرکز بر اینها یا امکان آزمایش فرضیههایی دارند که هرگز از نظر تجربی امکان پذیر نیستند.
پایان مطلب/.