Yakın anlamlı kavramların bulunması, kavramın
bir derlemdeki semantik anlamını yakalamamızı ve kavramın hangi bağlamda
kullanıldığını elde etmemizi sağlar. Kelime Uzayı Modeli; anlamsal olarak
benzer kelimeleri, vektör uzayında bir birine yakın dağılımla gösteren bir
modeldir. Her bir kelimenin bir vektörle temsil edildiği bu modelde oluşan
kelime vektörleri kelime yerleştirme (Word Embeddings) olarak adlandırılır. Kelime
vektörleri metin analizi gerçekleştiren özellikle yapay sinir ağlarını temel
alan Doğal Dil İşleme (DDİ) sistemlerinde girdi olarak kullanılır. Bu çalışmada,
veri seti olarak TBMM Genel Kurul görüşme tutanakları kullanılmış, Word2vec modeli ve GloVe modeli ile kelime
vektörleri çıkarılmıştır. Elde
edilen kelime vektörleri kullanılarak TBMM Genel Kurul tutanaklarında geçen
herhangi bir kavrama en yakın anlamlı kavramlar bulunmuştur. Literatürdeki
benzer çalışmalarda iki farklı kelime yerleştirme modellerinin bir kavramı
tamamen farklı bağlamda değerlendirdiği duruma rastlanılmamıştır. Bu çalışma
sonucunda, Word2vec ve GloVe modellerinin çıktılarının bir kavramın farklı
bağlamlarda kullanımını bulmak için değerlendirilebileceği görülmüştür. Çalışmada
derleme özgü analojilerin her iki modelde de bulunabildiği görülmüştür. Bu
çalışmadan elde edilen sonuçlar TBMM Genel Kurul tutanaklarında arama yaparken benzer kavramların
anahtar kelime olarak önerilmesi için kullanılacaktır.
Primary Language | Turkish |
---|---|
Subjects | Computer Software |
Journal Section | Articles |
Authors | |
Publication Date | July 31, 2018 |
Submission Date | March 6, 2018 |
Published in Issue | Year 2018 Volume: 11 Issue: 3 |