Yapay zekâ her yerde. Genellikle pek farkına varmadan da olsa yapay zekâ ile zaten pek çok alanda uzun yıllardır karşılaşıyorduk. Üzerinde oldukça uzun zamandır çalışılan bir teknoloji bu. Ancak geçtiğimiz son birkaç yıl içerisinde gösterdiği ciddi gelişim hızı, insanların ağzını açık bırakacak şeyleri kolaylıkla yapabilir hale gelmesi, günlük hayatı oldukça kolaylaştırabilir olması ve kullanımının kolaylığı ile beraber günümüzde popülerliği hiç olmadığı kadar artmış durumda. Bu bağlamda, yapay zekâ ile bağlantılı bazı terimlerin ne olduğu hakkında fikir sahibi olmak faydalı olacaktır diye düşünüyorum. Bu yazı serisinde, bu terimlerin üzerinden teknik detaylarda boğulmadan, olabildiğince sade bir dille geçiyor olacağız.

Overfitting (Aşırı Öğrenme / Ezberleme)

Overfitting, yapay zekâ modelinin aslında akıllıca değil, ezberci bir davranış göstermeye başlamasıdır. Model, kendisine gösterilen eğitim verilerini o kadar ayrıntılı öğrenir ki, yeni ve gerçek hayattan gelen verilerle karşılaştığında şaşırır. Daha iyi anlamak açısından bir öğrenci düşünün. Bu öğrenci, öğretmenin çözdüğü soruları birebir ezberliyor olsun. Sınavda aynı sorular gelirse tam not alır. Ancak soru biraz değiştiğinde ya da aynı soru farklı bir şekilde sorulduğunda cevap veremeyebilir. İşte bu durum, yapay zekâ alanında overfitting olarak adlandırılır.

Çimen ve Köpek

Eğitim aşamasında bulunan bir yapay zekâ modeli düşünelim. Bu modele çoğunlukla“parkta bulunan köpek” fotoğrafları gösterilmiş olsun. Model bu fotoğrafları çok iyi öğrenecektir. Ancak evde, kaldırımdaya da park dışında herhangi bir ortamda bulunan köpek fotoğrafları gösterildiğinde, fotoğrafta bir köpek bulunduğunu algılamak konusunda hata yapabilir. Bunun nedeni bir köpeğin neye benzediğini öğrenmek yerine fotoğraflarda bulunan ortamı ezberlemiş olmasıdır. Örneğin, parkta bulunan çimenleri sınıflandırma için bir özellik olarak kullanmayı öğrenmiş olabilir. Böyle bir durumda, evde bulunan bir köpek fotoğrafı ile karşılaşırsa, evde çimen olmadığı için fotoğrafta bulunan köpeği algılayamayabilir. Bu tarz hataları azaltmak için tek tip yerine daha çeşitli veri setleri kullanılabilir.