|
Author
|
:
Çağlayan YILMAZ
-
|
|
Type |
:
|
Printing Year |
:
|
Number |
:
|
Page |
:
|
DOI Number: |
:
|
Cite : |
Çağlayan YILMAZ -, (). DOĞAL DİLLERDEKİ İŞARETLEME SÜRECİNE BİLGİ KURAMI AÇISINDAN BAKIŞ (TÜRKÇE ÖRNEĞİNDE). International Journal Of Eurasia Social Sciences, , p. . Doi: .
|
|
Summary
Bu çalışmada, Türkçedeki anlam birimlerinin bilgi kuramı temelinde işaretlenmesi için bir yöntem önerilmiştir. Bunun için öncelikle, bilgi kuramında, iletilerdeki sembollerin bilgi değerini ölçmek için önerilen yöntem ve bu yöntemin kuramsal temeli açıklanmıştır. Bu kuramsal temelden hareketle metinlerdeki kullanım sıklıkları üzerinden birkaç Türkçe sözcüğün bilgi değeri ölçülmüş ve bu değerler üzerinden her bir anlam biriminin işaretlenmesi için gereken işaret sayısı belirlenmiştir. Bu uygulamanın yapılabilmesi için gerekli olan veriler, yine bu çalışmanın sahibi tarafından daha önce yapılmış bir çalışma için hazırlanmış olan derlemden alınmıştır. Ayrıca bu derlemden yararlanılarak Türkçe anlam birimlerinin ortalama bilgi değeri (entropisi) hesaplanmış ve bu değer üzerinden, alfabedeki harf sayısıyla sözcükleri işaretlemek için gerekli olan işaret sayısı arasındaki ilişkiye bağlı olarak, Türkçede anlam birimlerini işaretlemek üzere önerilerde bulunulmuştur. Son olarak çalışmanın kuram ve uygulama bakımından, tartışılmasında fayda görülen kusurlarından bahsedilmiştir.
Keywords
bilgi kuramı, bilgi değeri, entropi, işaret, işaretleme
Abstract
In this study, a method for coding the morphemes in Turkish on the basis of the information theory is proposed. For this purpose, the method proposed for measuring the informational value of symbols in messages and the theoretical basis of this method are explained first within the framework of the information theory. Based on this theoretical basis, the informational values of several Turkish words are measured by considering the frequency of their use in texts; and the code number necessary for coding each morpheme is determined based on these values. The necessary data required for making this application are taken from a corpus which has been prepared for a previous study by the author of this study. The average informational values (entropy) of Turkish morphemes are calculated by using this corpus and suggestions are made for coding morphemes in Turkish, depending on the relation between the letter number in the alphabet and the necessary number for coding the words by considering this value. Finally, the errors of the study in terms of theory and practice, which are found useful to be discussed, are mentioned.
Keywords
informational theory, informational value, entropy, code, coding