Planlayın

Günümüzde büyük ölçekli ve çeşitli kaynaklardan toplanan dokümanların analizi, makine öğrenmesi yaklaşımlarıyla gerçekleştirilmekte ve bu yöntemler metin sınıflandırmada yaygın olarak kullanılmaktadır. Doğal dil işleme süreçlerinde, metinlerin ön işleme aşamasında genellikle kök bulma (stemming) yöntemi uygulanmaktadır. Bu işlem, kelimelerin eklerinden arındırılmasıyla özniteliklerin değerini artırmayı amaçlamaktadır. Ancak, Türkçe gibi eklemeli dillerde bu yöntem tam anlamıyla verimli olmayabilir.
Bu çalışmada, kelimelerin ekleriyle birlikte değerlendirilmesinin metin sınıflandırma başarısına etkisi incelenmiştir. Deneysel çalışmada, Next4biz CSM ürününe ait müşteri şikayet ve talep verileri kullanılmıştır. Derin öğrenme algoritmalarıyla analiz edilen verilerde, kök ve eklerin birlikte tutulmasının sınıflandırma doğruluğuna katkısı gözlemlenmiştir. Snowball stemmer kullanılarak yapılan işlem sonucunda bazı yanlış sınıflandırmalar tespit edilmiştir. Bunun üzerine önerilen model, Next4biz CSM ürününe entegre edilerek bulut tabanlı bir servis hâline getirilmiş ve farklı Next4biz müşterileri tarafından kullanılmaya başlanmıştır.
Sonuçlar, kök ve eklerin birlikte değerlendirilmesinin metin sınıflandırma süreçlerinde eklemeli diller için daha başarılı sonuçlar üretebileceğini göstermektedir.
Daha fazla bilgi için makalemizi aşağıda inceleyebilirsiniz: