Place for some configs

Bu sayfa en iyi google chrome ve mozilla firefox tarayıcılarıyla görüntülenir.


Amaç

Bilişim teknolojisinin ve bilgisayar bilimlerinin hızla gelişimi, bilgisayarı her alanda daha yaygın kullanılır bir araç haline getirmiştir. Öyle ki, günümüzde belirli alanlar için bilgisayarın vazgeçilmez olduğu görülmektedir. Bilgi teknolojisinde ve bilgisayar bilimlerinde yaşanan bu hızlı gelişmeler, dil araştırmalarının da bilgisayar destekli olmasını gerektirmiş, tüm bu gelişmeler, diğer bir adlandırmayla Doğal Dil İşleme (DDİ) çalışmalarının bir mühendislik alanına dönüşmesini sağlamıştır. Günümüzde Türkiye’de de bilgisayar destekli dil çalışmalarının ivme kazandığı gözlenmektedir. Son on yılda Türkiye’de, güvenilir ve hızlı erişilebilir bir ortamda sözlükbilim ve sözdizimi ile ilgili çalışmalar bu anlamda öne çıkmaktadır. Bu çalışmalar, Türkçenin sıklığı yüksek yapılarını ortaya koymayı ve böylelikle özellikle yabancı dil ve ana dili öğretiminde, kolay ve hızlı öğretmeyi amaçlayan verilere ulaşmayı hedefleyen çalışmalar olarak dikkat çekmektedir.

Bilgisayar bilimlerinin sunduğu olanaklar doğrultusunda bilgisayarlı dilbilimde derlem (corpus) ya da bütünce olarak adlandırılan yapı, belirli amaçlar doğrultusunda yazılı veya sözlü dile dayalı ürünlerin birtakım ölçünlenmiş işaretlemelerle bir araya getirilmesinden oluşan bütün olarak dil çalışmalarında yerini almıştır (Say vd. 2002). Var olan biçimiyle derlemler içlemleri ve amaçlılıklarıyla koşut olarak yazılı ve/ya sözlü içeriğe sahip ve belirli bir dilde dilsel çeşitliliği yansıtabilen genel derlemler (general corpora); petrokimya derlemi ya da bilgisayar bilimleri derlemi benzeri özel alan derlemleri (specialized corpora); belirli bir yazı dilini, belirli dönem ve örneklemlerle içeren yazılı derlemler (written corpora); genel derlemlerin içleminde ya da bağımsız olarak sözlü dili temsil için tasarımlanan sözlü derlemler (spoken corpora); eş süremli olarak dilsel veriler içeren eş süremli derlemler (synchronic corpora); belirli bir dilin farklı zaman aralıklarıyla içlemlendiği art süremli derlemler (diachronic or historical corpora); yine ana dili ve yabancı dil olarak belirli bir dilin öğretiminde temel verilerin derlenmesi amaçlı tasarımlanan öğrenici derlemleri (learner corpora) ve diğer derlem türlerinden daha hacimli ve ayrıntılandırılmış, kapsamlı derlemlerden olan izlem derlemleri (monitor corpora) olarak karşımıza çıkmaktadır (McEnery, vd. 2006).

Projenin amacı, 7. yy.’ın sonlarından başlayarak yazılı ürünlerle izleyebildiğimiz Türk yazı dilinin Eski Türkçe ve Karahanlı Türkçesi dönemlerinde yazılan metinleri derleyerek, söz konusu dönem metinlerinin söz varlığını, bilgisayarlar aracılığıyla araştırmacıların kolaylıkla erişebileceği dil malzemesi haline getirmek ve Türkçe için bir art süremli/tarihsel derlem oluşturmaktır.

Bunun yanı sıra, Türkçenin yazıya ilk geçirildiği dönem olan Eski Türkçe ve Karahanlı Türkçesinin söz varlığını bilgisayarlarca okunabilir-işlenebilir hale getirmek; söz varlığı ve sözdizimi açıdan ilgili dönemin Türkçesini sayısal platforma taşımak; 7.-13. yüzyıllar Türkçesiyle ilgili olarak araştırmacıların erişimine açık bir platform oluşturarak araştırmacılara dönemle ilgili dilsel malzemeye erişim kolaylığı sağlamak; söz konusu dönemlerin söz varlığına ve sözdizimi özelliklerine ilişkin karşılaştırmalı ve istatistiksel çalışmalar yapmaya olanak sağlanmak; kültür tarihi araştırmalarında söz varlığının izleğinde katkıda bulunmak; “Türkçenin Tarihsel Sözlüğü”nün hazırlanmasında Türkçenin ilk ürünlerini bu anlamda yordanabilir hale getirmek diğer amaçlar arasında sayılabilir.

Eski Türkçe ve Karahanlı Türkçesinin tarihsel derlemi yaklaşık 600 yıllık bir dönemin yazılı ürünlerinden oluşan sözcükbirimsel ve sözdizimsel olarak işaretlenmiş, ayrıca dönem, saha, tür vb. yönlerden ayrıntılı olarak veri girişleri yapılmış ve sorgulanabilen 400-450 bin sözcüklük bir derlem olacaktır. Bu anlamda, proje dünyada oldukça geniş bir sahada varlık sürdürmüş bir dil olan Türkçenin ilk ürünlerini konu edinmesi bakımından oldukça önem taşımaktadır. Oluşturulacak derlem, söz konusu dönem Türkçesinin söz varlığının ortaya konulması açısından son derece önemli bir çalışma olacaktır. Ayrıca, eş süremli ve art süremli olarak Türk dili ile ilgili karşılaştırmalı çalışmalarda araştırmacıların dilsel verilere ulaşımını kolaylaştıracak, etimoloji (köken bilgisi) çalışmalarında ve yukarıda belirttiğimiz gibi “Türkçenin Tarihsel Sözlüğü”nün hazırlanması ile kültür tarihi çalışmalarında kullanılabilecek önemli ölçüde dilsel veri yordanabilir hale getirilmiş olacaktır.

Bu sayfa en iyi google chrome ve mozilla firefox tarayıcılarıyla görüntülenir.