BS Ekonomi Bağımsız Medyasını Destekleyin
Eğer abone iseniz giriş yapınız.
Tıbbın sanatının büyük bir kısmı, ayrıntılı sorgulama ve fiziksel muayene yoluyla bir hastanın hangi hastalığa yakalandığını belirlemeyi içerir. Çok daha zor, ama en az bunun kadar arzu edilen şey, bir hastanın gelecekte hangi hastalıklara yakalanabileceğini öngörmektir. 17 Eylül’de Nature dergisinde ayrıntıları yayımlanan yeni bir yapay zekâ (AI) modelinin arkasındaki ekip, tam da bunu yaptığını iddia ediyor.
Delphi-2M adlı model henüz hastanelerde kullanılmaya hazır değil, ancak yaratıcıları bir gün doktorların Alzheimer, kanser ve kalp krizi gibi her yıl milyonlarca kişiyi etkileyen 1.000’den fazla farklı hastalıktan hangilerine hastalarının yakalanabileceğini tahmin etmesini sağlamayı umuyor. Yüksek risk taşıyan hastaları işaretlemenin yanı sıra, sağlık otoritelerinin gelecekte ekstra bütçe ayırması gerekecek hastalık alanlarını belirlemeye de yardımcı olabilir.
Model, Cambridge’deki Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) ile Heidelberg’deki Alman Kanser Araştırma Merkezi ekipleri tarafından geliştirildi. İlham kaynağı, ChatGPT’yi çalıştıran GPT-5 gibi akıcı metin üretebilen büyük dil modelleri (LLM’ler). LLM’ler, internetteki devasa metin koleksiyonları üzerinde eğitilerek kalıpları tanıyor ve herhangi bir cümlede bir sonraki kelimeyi en olası şekilde seçebiliyor. Delphi-2M’nin yaratıcıları, insan sağlığına dair geniş veri kümeleriyle beslenen bir yapay zekânın da benzer öngörü gücüne sahip olabileceğini düşündü.
Mevcut LLM’lerin tasarımı birçok açıdan bu iş için uygundu. Ancak gereken en büyük değişikliklerden biri, bir hastanın yaşamındaki olaylar arasında geçen zamanı dikkate alacak şekilde modeli eğitmekti. Yazılı metinde kelimeler ardışık gelir; ancak hastalık öyküsünde teşhisler arasında böyle bir doğrudanlık yoktur. Örneğin, pozitif gebelik testinden sonra yüksek tansiyon görülmesi, iki olay arasındaki sürenin haftalar mı (gebeliği etkileyebilir) yoksa yıllar mı olduğuna bağlı olarak farklı yorumlanır.
Bu uyarlama, bir LLM’de kelimenin konumunu kodlayan kısmın, kişinin yaşını kodlayan bir yapı ile değiştirilmesiyle yapıldı. (Yanlışsız olmadı: modelin erken sürümlerinde bazen kişi öldükten sonra yeni teşhisler öngörülüyordu.)
Delphi-2M, daha sonra dünyanın en kapsamlı biyolojik veri setlerinden biri kabul edilen UK Biobank’ten alınan 400.000 kişinin verileri üzerinde eğitildi. Modele, Uluslararası Hastalık Sınıflandırması (ICD-10) kodlarının zamanlaması ve sırası verildi. Bu kodlar, Biobank verilerinde görülen 1.256 farklı hastalığı temsil ediyordu. Model, ardından Biobank’te kalan 100.000 kişi üzerinde doğrulandı ve daha sonra ünlü uzun vadeli ve ayrıntılı kayıtlarıyla bilinen Danimarka sağlık verileri üzerinde test edildi. Bu çalışmada 1978’e kadar giden 1,9 milyon Danimarkalıya ait veriler kullanılarak, UK Biobank’ten çok daha çeşitli ve temsili bir örnek elde edildi.
Modelin performansını değerlendirmek için araştırmacılar AUC (eğri altındaki alan) ölçümünü kullandı. Bu ölçümde 1 mükemmel tahminleri, 0,5 ise rastgele seçimden farksız sonucu ifade eder. Önceki bir teşhisten sonraki beş yıl içinde yapılan tahminlerde, Delphi-2M Britanya verilerinde ortalama 0,76, Danimarka verilerinde ise küçük bir düşüşle 0,67 değerine ulaştı. Sepsis sonrası ölüm gibi belirli bir olayı sıkça izleyen durumlar daha doğru tahmin edilirken, virüs kapmak gibi rastlantısal dış faktörlerden kaynaklananlar daha zor öngörüldü. Tahmin süresi uzadıkça doğruluk biraz daha azaldı: On yıl sonrasını tahmin etmeye çalıştığında ortalama 0,7 puan aldı.
Gerçek dünya uygulamaları şimdilik uzak görünüyor. Delphi-2M, doktorların hastaları için daha iyi sonuçlar elde edip etmediğini görebilmeleri için çok daha sıkı bir deneme sürecinden geçmeli. Bu süreç yıllar alabilir. Delphi-2M ekibi ayrıca, modele kronolojik teşhis listelerinden daha karmaşık verileri de alabilecek özellikler kazandırmaya çalışıyor. UK Biobank’te tıbbi görüntüler ve gen dizilimleri de bulunduğundan, bunların eklenmesi modelin doğruluğunu daha da artırabilir.
Delphi-2M etkileyici olsa da alanda tek değil. Örneğin, 2024’te Londra’daki King’s College’da geliştirilen Foresight adlı bir AI modeli de hastaların tıbbi geçmişlerini kullanarak gelecekteki sağlık olaylarını tahmin ediyor. (Projenin daha büyük versiyonu, NHS England’ın Foresight ekibine verileri verirken uygun izinleri almadığı yönündeki kaygılar nedeniyle Haziran’da durduruldu.) Harvard Üniversitesi’nde geliştirilen ETHOS modeli de benzer hedeflere sahip.
Hastalar Delphi-2M’nin doğrudan faydalarını hissetmek için beklemek zorunda kalsa da, modelin ön sürümü bile biyologlar için potansiyel bir hazine sunuyor. Tahmin tarzı, hangi hastalıkların kümelendiğini ortaya koyuyor; bu da hastalıklar arasındaki daha önce keşfedilmemiş ilişkileri işaret edebilir. Daha da güçlü yapay zekâ modelleri bu çalışmaları daha ileri götürebilir. EMBL’den genetikçi Ewan Birney heyecanını şöyle ifade ediyor: “Kendimi şeker dükkânındaki bir çocuk gibi hissediyorum.”