Yapay zekâ her yerde. Genellikle pek farkına varmadan da olsa yapay zekâ ile zaten pek çok alanda uzun yıllardır karşılaşıyorduk. Üzerinde oldukça uzun zamandır çalışılan bir teknoloji bu. Ancak geçtiğimiz son birkaç yıl içerisinde gösterdiği ciddi gelişim hızı, insanların ağzını açık bırakacak şeyleri kolaylıkla yapabilir hale gelmesi, günlük hayatı oldukça kolaylaştırabilir olması ve kullanımının kolaylığı ile beraber günümüzde popülerliği hiç olmadığı kadar artmış durumda. Bu bağlamda, yapay zekâ ile bağlantılı bazı terimlerin ne olduğu hakkında fikir sahibi olmak faydalı olacaktır diye düşünüyorum. Bu yazı serisinde, bu terimlerin üzerinden teknik detaylarda boğulmadan, olabildiğince sade bir dille geçiyor olacağız.

Reinforcement Learning

İnsanlık olarak pek çok şeyi deneme yanılma yoluyla öğreniyoruz. Yapay zekâ modellerinin eğitiminde de bu durumdan ilham alınmış. Reinforcement learning ya da dilimizdeki karşılığı ile pekiştirmeli öğrenme, yapay zekânın deneme yanılma yoluyla öğrendiği yöntemdir. Aynı biz insanlar gibi.

Nasıl Çalışır?

Sisteme bir hedef verilir. Örnek olarak bir satranç oyununu kazanma hedefi verildiğini düşünelim. Sistem, yaptığı her doğru hamlede “ödül”, yanlış yaptığı her hamlede ise “ceza” alır. Sistem satranç oynarken ilk başta tamamen rastgele hamleler yapacaktır. Ancak zamanla, binlerce tekrar sonucunda, hangi hamlelerin kazandırdığını, hangi hamlelerin ise kaybettirdiğini anlayarak ona göre hareket etmeye başlar. Dünyanın en iyi satranç oyuncularıyla bile boy ölçüşüp onları yenebilecek hale gelir.

Barış Baran ÇİÇEK