Yapay Zekanın Yeni Numarası: Kimya Yapmak

by Sultan Kapdan · Published 5 Temmuz 2022 · Updated 9 Temmuz 2022

Fotoğraf 1: Bazı proteinleri neyin parlattığını bulmak, kimyanın anlaşılmasını gerektirir.

Yapay zekâ, araştırmacıların modern bilimsel araçların ürettiği büyük miktarda veriyi analiz etmelerine izin vererek bilimin yapılma şeklini değiştirdi. Bir milyon bilgi samanlığında bir iğne bulabilir ve derin öğrenmeyi kullanarak bilgiyi verilerin kendisinden öğrenebilir. AI (artificial intelligence: yapay zekâ) gen avcılığı, tıp, ilaç tasarımı ve organik bileşiklerin oluşturulmasındaki ilerlemeleri hızlandırıyor.

Derin öğrenme, yeni verilerden bilgi çıkarmak için algoritmaları, genellikle büyük miktarda veri üzerinde eğitilmiş “sinir ağlarını” kullanır. Adım adım komutlarıyla geleneksel bilgi işlemden çok farklıdır. Derin öğrenme, geleneksel bilgisayar programlamasından çok daha az şeffaftır ve önemli sorular bırakır; sistem ne öğrendi ne biliyor?

Bir kimya profesörü olarak, öğrencilerin farklı fikirleri birleştirip birleştiremeyeceklerini ve yeni fikir ve kavramları sentezleyip sentezleyemeyeceklerini belirlemek için bilgilerini kanıtlayacak en az bir zor soruya sahip testler tasarlamayı seviyorum. Protein katlanma problemini çözen AI sağlayıcılarının simgesi AlphaFold için böyle bir soru tasarladık.

Protein Katlanması

Proteinler tüm canlı organizmalarda bulunur. Hücrelere yapı sağlar, reaksiyonları katalize eder, küçük molekülleri taşır, yiyecekleri sindirir ve çok daha fazlasını yapar. Bir ipteki boncuklar gibi uzun amino asit zincirlerinden oluşurlar. Ancak bir proteinin hücredeki işini yapabilmesi için, protein katlanması adı verilen bir süreç ile karmaşık üç boyutlu bir yapıya kıvrılması ve bükülmesi gerekir. Yanlış katlanmış proteinler hastalığa yol açabilir.

Christiaan Anfinsen, 1972’deki kimya Nobel kabul konuşmasında, bir proteinin üç boyutlu yapısını, yapı taşlarının yani amino asitlerin dizisinden hesaplamanın mümkün olması gerektiğini öne sürdü.

Tıpkı bu yazıdaki harflerin sırası ve aralığının ona anlam ve mesaj vermesi gibi, amino asitlerin sırası da proteinin kimliğini ve şeklini belirler ve bu da işlevini meydana getirir.

Fotoğraf 2: Bir amino asit zincirini (solda) ribozomdan çıkmasından milisaniyeler sonra, proteinin işlevi için gerekli olan en düşük enerjili 3D şekle (sağda) katlanır.

Amino asit yapı taşlarının doğal esnekliği nedeniyle, tipik bir protein, tahmini olarak 10’un 300’üncü kuvveti kadar farklı form meydana getirebilir. Bu, evrendeki atom sayısından daha büyük bir sayıdır. Üstelik bir milisaniye içinde, bir organizmadaki her protein kendi özel şekline katlanacaktır, bu katlanma proteini oluşturan tüm kimyasal bağların en düşük enerjili düzenlenmesi şeklindedir. Bir proteinde tipik olarak bulunan yüzlerce amino asitten sadece bir amino asidi değiştirdiğimizde yanlış katlanabilir ve artık çalışmayabilir.

AlphaFold

50 yıldır bilgisayar bilimcileri protein katlama problemini- çok az başarı ile- çözmeye çalıştılar. Daha sonra 2016 yılında Google’ın ana şirketi olduğu Alphabet‘in bir AI yan kuruluşu olan DeepMind, AlphaFold programını başlattı. Protein veri bankasını (PDB-Protein Data Bank), 150.000’den fazla proteinin deneysel olarak belirlenmiş yapılarını içeren eğitim seti olarak kullandı.

Beş yıldan kısa bir süre içinde AlphaFold protein katlama problemini- en azından en yararlı kısmı, yani amino asit dizisinden protein yapısını belirleme yönünden- yendi. AlphaFold, proteinlerin nasıl bu kadar hızlı ve doğru bir şekilde katlandığını açıklamaz. Yine de AI için büyük bir kazançtı çünkü sadece büyük bir bilimsel prestij kazanmakla kalmadı, aynı zamanda bu herkesin hayatını etkileyebilecek büyük bir bilimsel ilerlemeydi.

Bugün, AlphaFold2 ve RoseTTAFold gibi programlar sayesinde, benim gibi araştırmacılar, proteini oluşturan amino asitlerin dizisinden proteinlerin üç boyutlu yapısını bir veya iki saat içinde -ücretsiz olarak- belirleyebiliyorlar. AlphaFold2’den önce proteinleri kristalize etmek ve yapıları X-ışını Kristalografisini kullanarak çözmek zorundaydık, bu işlem aylar sürüyordu ve yapı başına on binlerce dolara mal oluyordu.

Artık Deepmind‘ın insanlarda, farelerde ve 20’den fazla diğer türde bulunan neredeyse tüm proteinlerin 3D yapılarını biriktirdiği AlphaFold Protein Yapı Veritabanına da erişebiliyoruz. Bugüne kadar bir milyondan fazla yapıyı çözdüler ve sadece bu yıl 100 milyon yapı daha eklemeyi planlıyorlar. Proteinlerin bilgisi birdenbire arttı. Bilinen tüm proteinlerin -aralarında yeni yararlı işlevlerle ilişkili birçok yeni benzersiz yapının da bulunduğu- yarısının yapısının 2022’nin sonuna kadar belgelenmesi muhtemeldir.

Bir Kimyager Gibi Düşünmek

AlphaFold2, proteinlerin birbirleriyle nasıl etkileşime gireceğini tahmin etmek için tasarlanmamıştır, ancak bireysel proteinlerin çoklu proteinlerden oluşan büyük kompleks birimler oluşturmak için nasıl birleştiğini modelleyebilmiştir. AlphaFold için zorlu bir sorumuz vardı; yapısal eğitim seti ona biraz kimya öğretti mi? Nadir ama önemli bir olay olarak amino asitlerin birbirleriyle reaksiyona girip girmeyeceğini söyleyebilir miydi?

Ben floresan proteinlerle ilgilenen hesaplamalı kimya alanındaki bir kimyagerim. Bunlar denizanası ve mercan gibi yüzlerce deniz organizmasında bulunan proteinlerdir. Parıltıları hastalıkları aydınlatmak ve incelemek için kullanılabilir.

Yapay Zekanın Yeni Numarası Kimya Yapmak

Fotoğraf 3: Floresan proteinleri eksprese eden nöronlar, iki meyve sineği larvasının beyin yapılarını ortaya çıkarır. (Wen Lu ve Vladimir I. Gelfand, Feinberg Tıp Fakültesi, Northwestern Üniversitesi)

Protein veri bankasında, 10’u “kırılmış” ve floresan vermeyen 578 floresan proteini vardır. Proteinler nadiren kendilerine saldırır, otokatalitik posttranslasyonel modifikasyon adı verilen bir süreçtir ve hangi proteinlerin kendileriyle reaksiyona girip hangilerinin vermeyeceğini tahmin etmek çok zordur.

Sadece önemli miktarda floresan protein bilgisine sahip bir kimyager, amino asit dizisini, onları floresan yapmak için gereken kimyasal dönüşümlere uğrayacak doğru amino asit dizisine sahip floresan proteinleri bulmak için kullanabilir. AlphaFold2’yi protein veri bankasında olmayan 44 floresan proteininin dizileriyle tanıştırdığımızda, sabit floresan proteinlerini kırık olanlardan farklı şekilde katladı.

Yapay Zekanın Yeni Numarası Kimya Yapmak

Fotoğraf 4: AlphaFold2, floresan proteinlerin amino asit dizisini (üstteki harfler) alabilir ve 3D şekillerini (ortada) tahmin edebilir. Bu şaşırtıcı değildir. Tamamen beklenmedik olan şey, hangi floresan proteinlerinin ‘kırıldığını’ ve floresan yapamayacağını da tahmin edebilmesidir. (Marc Zimmer)

Sonuç bizi şaşkına çevirdi: AlphaFold2 biraz kimya öğrenmişti. Floresan proteinlerdeki hangi amino asitlerin onları parlatan kimyayı yaptığını bulmuştu. Protein veri bankası eğitim setinin ve çoklu dizi hizalamalarının, AlphaFold2‘nin kimyagerler gibi “düşünmesini” ve proteini floresan yapmak için birbirleriyle reaksiyona girmesi gereken amino asitleri aramasını sağladığından şüpheleniyoruz.

Eğitim setinden biraz kimya öğrenen bir katlama programının daha da geniş etkileri vardır. Doğru soruları sorarak, diğer derin öğrenme algoritmalarından başka neler kazanılabilir? Yüz tanıma algoritmaları hastalıklar için gizli belirteçler bulabilir mi? Tüketiciler arasındaki harcama kalıplarını tahmin etmek için tasarlanan algoritmalar da küçük hırsızlık veya aldatma eğilimi bulabilir mi? Ve en önemlisi, bu yetenek- ve diğer AI sistemlerinin yeteneklerindeki benzer sıçramalar- istenilir mi?

Kaynak: theconversation.com

Yapay Zekanın Yeni Numarası: Kimya Yapmak

You may also like...

İnovatif Kimya Dergisi Son Sayısı

Yapay Zekanın Yeni Numarası: Kimya Yapmak

You may also like...

Aktif Karbon Üretimi konuşuldu

Organoid Hücre Atlası

Alglerden Yakıt Üretimi: Daha Verimli Biyoyakıtlara Doğru

İnovatif Kimya Dergisi Son Sayısı