Bilim insanları, yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce testte kusur buldu

İsrail'in Gazze'ye saldırılarında can kaybı son 24 saatte 4 artarak 68 bin 872'ye çık

Ekonomi

Ordu'dan İngiltere'ye 8,8 ton bal ihraç edildi

Gündem

Ankara'daki okullarda Gazze için düzenlenen kermesten elde edilen gelir AFAD'a bağışlandı

Dünya

İsrail'in Gazze'de ateşkesi ihlal eden saldırısında bir Filistinli hayatını kaybetti

Dünya

WFP, ateşkesin ardından Gazze Şeridi'nde 1 milyon kişiye gıda paketleri ulaştırdıklarını kaydet

Dünya

BM Genel Sekreteri Guterres, Sudan'daki savaşın kontrolden çıktığı uyarısını yaptı

Sağlık

Migren ve baş ağrıları küresel halk sağlığı krizi olmaya devam ediyor

ÇOK OKUNAN HABERLER

04-11-2025 15:12
482

A⁺ A^-

Bilim insanları, yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce testte kusur buldu

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

Ankara

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 araştırmacı, "Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği" başlıklı bir çalışma yaptı.

????

Bilim insanları çalışmada, yapay zekanın alt dallarından olan "doğal dil işleme" ve "makine öğrenimi" alanlarının önde gelen konferanslarından alınan 445 değerlendirme testini sistematik olarak inceledi.

İncelemeler sonucunda, testlerin neredeyse hepsinin "sonuçların geçerliliğini zedeleyebilecek" kusurlara sahip olduğu sonucuna ulaşıldı.

Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ilişkin Guardian'a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.

Bean, değerlendirme testlerinin yapay zekayla ilgili tüm iddiaların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğini anlamanın zorlaştığını kaydetti.

Kaynak: AA

dikGAZETE.com

Teknoloji

BUNLAR DA İLGİNİZİ ÇEKEBİLİR

Siyaset