Yapay Zeka Acil Servis Tanılarında Doktorları Geride Bıraktı

Harvard ve Beth Israel Deaconess Tıp Merkezi’nden araştırmacılar, OpenAI’nin yeni nesil akıl yürütme modeli olan o1-preview’u acil servis triyaj sürecinde test etmiştir. Çalışma, yapay zeka modelinin gerçek acil servis vakalarında doktorlardan daha yüksek bir doğruluk oranı sağladığını göstermiştir.

Science dergisinde yayımlanan araştırmaya göre, o1-preview modeli, 76 acil servis vakasının %67,1’inde doğru tanı koymayı başarmıştır. Aynı vakalar üzerinde değerlendirilen iki uzman doktor ise sırasıyla %55,3 ve %50,0 oranında doğruluk sergilemiştir.

Yapay Zeka ve Tıbbi İş Birliği


Yapay Zeka Acil Servis Tanılarında Doktorları Geride Bıraktı

Araştırmacılar, elde edilen sonuçların yapay zekanın doktorların yerini alacağı anlamına gelmediğini vurgulamaktadır. Harvard’dan Arjun Manrai, bu teknolojinin tıbbı dönüştürecek bir potansiyele sahip olduğunu ancak hasta sonuçlarını iyileştirmek için daha fazla test gerektiğini belirtmiştir.

Çalışmaya katılan doktorlardan Adam Rodman, yapay zekanın tıbbi kararlardaki rolünün klinik karar destek araçlarına benzer bir yasal statüde olması gerektiğini ifade etmiştir. Rodman, doktorların kendi sorumluluklarını korumaya devam etmesi gerektiğini ve sistemin güvenilirliği için randomize kontrollü çalışmaların şart olduğunu savunmaktadır.

o1-preview modeli, standart sohbet botlarından farklı olarak sorunları yapılandırılmış adımlarla çözmek üzere tasarlanmıştır. Ancak araştırmacılar, modelin tıbbi görüntüleme ve sesli kanıtlar gibi çok modlu girdilerle çalışırken hala zorluklar yaşadığını kabul etmektedir.

Berkeley Üniversitesi’nden Yujin Potter, yapay zekanın halüsinasyon görme ve yanlış bilgi üretme risklerine dikkat çekerek güvenlik konusunun önemini hatırlatmıştır.

Teknolojik Sınırlar ve Güvenlik

o1-preview modeli, ChatGPT-4 gibi önceki modellere kıyasla daha karmaşık klinik vakalarda üstün performans göstermektedir. 143 karmaşık vakayı içeren testlerde, model vakaların %78,3’ünde doğru tanıyı diferansiyel listesine dahil etmeyi başarmıştır.

Araştırmacılar, modelin yardımcı olabilecek tanıları önerme konusunda %97,9 gibi yüksek bir başarı oranına ulaştığını belirtmektedir. Bu sonuçlar, arama motorlarını ve standart tıbbi kaynakları kullanma özgürlüğüne sahip doktorların %44,5’lik başarı oranını geride bırakmıştır.

İLGİLİ İÇERİK:  Microsoft, Deepfake'leri Tespit Etmek İçin Bir Araç Geliştirdi

Buna rağmen, uzmanlar Yapay zekanın tıbbi görüntüleme benchmarklarında hala yetersiz kaldığını ifade etmektedir. Gelecek on yılın en önemli araştırma alanlarından birinin, bu modellerin çok modlu entegrasyon yeteneklerini geliştirmek olacağı öngörülmektedir.

Yapay zeka sistemlerinin kendi hedeflerini belirleme ve kullanıcıyı manipüle etme potansiyeli, bağımsız araştırmacılar tarafından bir risk faktörü olarak değerlendirilmektedir. Buckley ve ekibi, modellerin halüsinasyon oranlarını resmi olarak ölçmediklerini ancak modelin sunduğu önerilerin büyük çoğunluğunun faydalı olduğunu savunmaktadır.

Araştırmacılar, modellerin halüsinasyon riski taşıdığını doğrularken, “güven ama doğrula” prensibinin önemini vurgulamaktadır. Yapay zekanın tıbbi teşhis süreçlerinde doktorlara yardımcı bir araç olarak kullanılması hakkında siz ne düşünüyorsunuz?

Rıfkı Erduran

Uzun zaman takipçisi olduğum teknodiot.com'da şimdi ise admin olarak görev yapmaktayım. Ayrıca oyun oynar, kripto paralara ilgi duyar ve araştırırım.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu