In this study, quantitative features and readability of columns belong to 18 columnists who write for the newspapers having the highest circulation of Türkiye. 12262 columns published between the years 2017-2021 on the following topics: education, economy, health, sports and life were analysed with the developed software and Natural Language Processing techniques. Average number of sentences, words, syllables and letters of columns, average word number of sentences, average syllable and letter numbers of words were determined, and readability of texts were identified by Ateşman, Çetinkaya-Uzun and Bezirci-Yılmaz formulas, and the results were presented. Data obtained as a result of processing columns were evaluated in terms of category, newspaper and author.
The columns consist of averagely 42.08 sentences, 429.88 words, 1166.32 syllables and 2699.44 letters. Moreover, the average word number of sentences is 10.22, whereas the average syllable number of words is 2.71 and the average letter number of words is 6.28. The average readability of columns were as follows respectively according to Ateşman, Çetinkaya-Uzun and Bezirci-Yılmaz: 63.16 (medium difficulty), 38.40 (educational reading) and 11.87 (high school 11-12.class). According to Ateşman formula, the level of the columns was predominantly easy (43.91%), whereas there is no text at the level of very easy. According to Çetinkaya-Uzun, the columns were predominantly at the level of independent reading (69.32%). Furthermore, according to Bezirci-Yılmaz the texts were mostly at the level of secondary school (30.00%), high school (29.58%) and academic (27.81%), there is no text at the level of primary school 1-2.class
Average number of sentences is the only quantitative feature in which the difference is over 50% between the categories. Despite this, it was found out that the difference between newspapers and authors exceeds 50% in all quantitative features except average number of syllables and letters of words. It was seen that the difference in quantitative features was more evident in authors compared to category and newspaper. It was revealed that the newspaper has more decisive influence than the category, the author has more decisive influence than both the category and the newspaper in terms of readability in all 3 formulas. On the other hand, it was found out that 9 authors in 4 newspapers and 3 categories have been writing columns highly above the average educational level of Türkiye, at the undergraduate/academic level.
Newspaper Column Natural Language Processing Quantitative Feature Readability
Bu çalışmada Türkiye’nin tirajı en yüksek gazetelerinde yazan 18 köşe yazarına ait yazıların nicel özellikleri ve okunabilirlikleri incelenmiştir. 2017-2021 yılları arasında eğitim, ekonomi, sağlık, spor ve yaşam kategorilerinde yayımlanan 12262 köşe yazısı geliştirilen yazılım ve Doğal Dil İşleme teknikleri kullanılarak işlenmiştir. Köşe yazılarının ortalama cümle, kelime, hece ve harf sayıları, cümlelerin ortalama kelime, kelimelerin ortalama hece ve harf sayıları tespit edilmiş, yazı okunabilirlikleri Ateşman, Çetinkaya-Uzun ve Bezirci-Yılmaz formülleriyle belirlenmiş ve sonuçlar sunulmuştur. Köşe yazılarının işlenmesi neticesinde elde edilen veriler kategori, gazete ve yazar bağlamında değerlendirilmiştir.
Köşe yazıları ortalama 42.08 cümle, 429.88 kelime, 1166.32 hece ve 2699.44 harften oluşmaktadır. Ayrıca, yazılardaki cümlelerin ortalama kelime sayısı 10.22 iken kelimelerin ortalama hece sayısı 2.71 ve harf sayısı 6.28’dir. Köşe yazılarının ortalama okunabilirlikleri Ateşman, Çetinkaya-Uzun ve Bezirci-Yılmaz’a göre sırasıyla 63.16 (orta güçlükte), 38.40 (eğitsel okuma) ve 11.87’dir (lise 11-12.sınıf). Ateşman formülüne göre yazılar ağırlıklı olarak kolay (%43.91) düzeydeyken çok kolay olan hiç yazı bulunmamaktadır. Çetinkaya-Uzun’a göre yazılar yoğun olarak bağımsız okuma (%69.32) düzeyindedir. Bezirci-Yılmaz’a göre ise yazılar daha çok ortaokul (%30.00), lise (%29.58) ve akademik (%27.81) seviyelerdedir; ilkokul 1-2.sınıf seviyesinde yazı bulunmamaktadır.
Kategoriler arası farkın %50’nin üstünde olduğu tek nicel özellik ortalama cümle sayısıdır. Buna karşın kelimelerin ortalama hece ve harf sayısı dışındaki bütün nicel özelliklerde gazete ve yazarlar arası farkın %50’nin üstüne çıktığı tespit edilmiştir. Nicel özelliklerdeki farklılığın kategori ve gazeteye oranla yazarlarda daha belirgin olduğu görülmüştür. 3 formülde de gazetenin kategoriden, yazarınsa hem kategori hem de gazeteden okunabilirlik açısından daha belirleyici etkiye sahip olduğu ortaya konmuştur. Öte yandan 3 kategori ve 4 gazetedeki 9 yazarın Türkiye’deki ortalama eğitim seviyesinin hayli üzerinde; lisans/akademik düzeyde yazılar kaleme aldıkları belirlenmiştir.
Gazete Köşe Yazısı Doğal Dil İşleme Nicel Özellik Okunabilirlik
Birincil Dil | Türkçe |
---|---|
Konular | İletişim ve Medya Çalışmaları |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Erken Görünüm Tarihi | 29 Nisan 2023 |
Yayımlanma Tarihi | 30 Nisan 2023 |
Yayımlandığı Sayı | Yıl 2023Sayı: 25 |