Bayes teoremi, yapay zekanın en popüler olasılık algoritmalarından biridir. Bayes teoreminin mantığını anlayabilmek için öncelikle olasılık kavramını anlamamız gerekmektedir. Kısaca olasılık kavramına değinelim.
Olasılık
Olasılık, bir olayın ne kadar muhtemel olduğunu ölçen matematiksel bir
kavramdır. Tesadüfi veya rastgele olaylar belirli koşullar altında tekrarlandığında
her zaman aynı sonuçları vermeyen olaylara denir. Olasılık değeri, 0 ile 1 arasında
bir değer alır. 0 olasılığı, olayın gerçekleşmesinin imkansız olduğunu, 1 olasılığı
ise olayın kesinlikle gerçekleşeceğini ifade eder.
Tesadüfi(Rastgele) Olayın Olasılığı
Bir zarı attığımızda, her bir yüzün gelme olasılığı eşit olduğundan, her yüzün
gelme olasılığı 1/6’dır. Zarın toplam yüzey sayısı 6 olduğundan, tüm zar yüzlerinin
gelme olasılığı toplamda 1(veya %100) olmalıdır.
Böylece, bu örnekten görüyoruz ki, bir deneyin sonucunda herhangi bir rastgele
olay, ya gerçekleşiyorsa yada gerçekleşmiyorsa o zaman bu deneyi aynı şartlarda
çok sayıda tekrar etmekle olayın deneylerde gerçekleşmesinin sayısının deneylerin
tekrarlanma sayısına orantısı ile bu rastgele olayı karakterize etmek olur.

Bayes Teoremi
Bayes teoremi, olasılık hesaplamalarında önemli bir role sahiptir. Bu teorem, veri
kümesindeki özelliklerin (d) verilen bir sınıfa ait olma olasılığını hesaplamak için
kullanılır. Sınıflandırma algoritmalarının en popüler algoritmalarından birisi olarak
tanımlayabiliriz.
Bayes teoremi formülü:

P ( C | D) = d olayı gerçekleştiğinde c olayının gerçekleşme olasılığı
P ( C ) = c olayının gerçekleşme olasılığı
P ( D | D ) = c olayı gerçekleştiğinde d olayının gerçekleşme olasılığı
P ( D ) = d olayının gerçekleşme olasılığı
Bayes Teoremi Hesaplama Adımları
- Prior Olasılık Hesaplaması (P(C)): İlk adım, olayın gerçekleşme olasılığını
bulmaktır. Bu hesaplama olayın gerçekleşme olasılığının, koşul bilinmeden
önceki varsayımsal olasılığıdır. - Likelihood Hesaplaması (P(D|C)): İkinci adım, olayın koşulunda başka bir
olayın gerçekleşme olasılığını hesaplamaktır. Bu, olayın gerçekleşme
durumunda diğer olayın gözlemlenen olasılığını ifade eder. - Evidence Hesaplaması (P(D)): Üçüncü adım, diğer olayın olasılığını
hesaplamaktır. Bu, olayın gözlemlenen olasılığını ifade eder. - Posterior Olasılık Hesaplaması (P(C|D)): Son adım, olayın gerçekleşme
olasılığını, verilen koşul altında (d koşulu altında) hesaplamaktır.
Naive Bayes Yöntemi
Naive Bayes sınıflandırma yönteminin temeli Naive Bayes teoremine dayanmaktadır.
Bu sebeple, algoritma ,olasılığa dayalı bir sınıflandırma yöntemidir. Algoritma, bir veri
için tüm olasılıkları hesaplar ve olasılık değeri en yüksek çıkan sonuca göre diğer
verilerin sınıflandırmasını yapar. Naive Bayes algoritması tembel bir öğrenme türüdür.
Her olasılığı ayrı ayrı hesapladığı için parametre yoğunluğuna bağlı olarak hesaplama
süreci uzun zaman alabilir.
Birçok uygulama zayıf özellikleri göz ardı ederken Bayer algoritması bu özellikleri
de dikkate alarak çok sayıda özellikten gelen bilgileri aynı anda kullanarak etkili bir
çözüm oluşturur.
Bayes teoreminde bulunan sınıf olasılıkları toplamı 1 olmak zorunda iken Naive Bayes
sınıflayıcı ile bulunan değerlerin toplamı (ihmal edilen paydadan dolayı) 1 olamaz.
Buna göre Bayes Teoremi ile bir durumun olası sonuçlarının olasılıkları bulunurken
Naive Bayes ile normalizasyonsuz olasılıklar üzerinden sınıflandırma yapılabilir.
Multinomial Naive Bayes
Multinomial Naive Bayes (MNB), bayes teoremine dayanan çok popüler ve verimli
bir makine öğrenme algoritmasıdır. Belgelerdeki kelime sayıları gibi ayrı verilerle
uğraşmamız gereken metin sınıflandırma görevlerini yaygın olarak kullanılır.
Naive Bayes, Bayes Teoremine dayalı olasılıksal bir algoritma ailesidir. “Saftır”
çünkü özellik bağımsızlığını varsayar. Özetlemek gerekirse bir özelliğin varlığının,
diğer bir özelliğin varlığını etkilemediği anlamına gelir.
Multinomial Naive Bayes , metin verilerinin olasılık dağılımını hesaplamak için
olasılıksal bir sınıflandırıcıdır. Bu durum algoritmayı, doğal dil işleme (NLP)
görevlerindeki ayrık frekansları veya olay sayılarını temsil eden özelliklere sahip
veriler için uygun hale getirir.
Multinomial dağılımın olasılık kütle fonksiyonu (PMF), bir belgedeki belirli bir
kelime sayısı kümesini gözlemleme olasılığını modellemek için kullanılır. Algoritmanın matematiksel modeli:

Tc : c sınıfı belgelerdeki toplam kelime sayısıdır.
Xi : D belgesindeki i kelimesinin sayısıdır.
θc,i : i kelimesinin c sınıfı bir belgede geçme olasılığıdır.
Naive Bayes Updateable
Sınıflandırma doğruluğunu daha da geliştirmek için Naive Bayes Updateable yöntemi
uygulanır. Bu yöntem, Naive Bayes sınıflandırıcının bir örneği veya bir toplu işlemi
aynı anda öğrenerek artan bir şeklidir. Bu durumda artımlı öğrenme süreci, eğitim
verilerinin her seferinde kademeli olarak artmasını sağlar.
Bayes Net(Bayes Ağı)
Bayes ağı, olasılık kavramını kullanarak belirsizlikleri hesaplamak için kullanılan
Olasılıksal Grafik Modelleme (PGM) tekniği kategorisine girer. Halk arasında İnanç
Ağları olarakta bilinen Bayes Ağları, belirsizlikleri modellemek için kullanılır.
Yönlendirilmiş Döngüsel Olmayan Grafik Nedir?
Yönlendirilmiş Döngüsel Olmayan Grafik, Bayes Ağını temsil etmek için
kullanılır ve diğer istatiksel grafikler gibi, DAG da bir dizi düğüm ve bağlantı
içerir; burada bağlantılar, düğümler arasındaki ilişkiyi belirtir.

Buradaki düğümler rastgele değişkenleri temsil eder ve kenarlar bu değişkenler
arasındaki ilişkiyi tanımlar. Peki bu grafikler neyi modelliyor? Bir DAG(Yönlendirilmiş Döngüsel Olmayan Grafik )’dan hangi
çıktıyı alabilirsiniz?
DAG(Yönlendirilmiş Döngüsel Olmayan Grafik), her rastgele değişkenin Koşullu Olasılık Dağılımına (CDP) dayalı olarak
meydana gelen bir olayın belirsizliğini modeller. Koşullu olasılık tablosu (CPT)
ağdaki her değişkenin CPD’sini temsil etmek için kullanılır.