türkçe konuşma ve konuşmacı tanımaya yönelik veri tabanı
Transkript
türkçe konuşma ve konuşmacı tanımaya yönelik veri tabanı
ANKAR A ÜNİVERSİTESİ SAĞLIK BİLİMLERİ EN STİTÜSÜ TÜRKÇE KONUŞMA VE KONUŞMACI TANIMAYA YÖNELİK VERİ TABANI ÖRNEKLEMİNİN OLUŞTURULMASI Levent GÜNER Ekim 1999 ANKARA iii ÖNSÖZ Bu tez çalışmasında ülkemiz için yeni sayılabilecek Adli Amaçlı Konuşma ve Konuşmacı Tanıma algoritmalarının geliştirilmesi için Türkçe veri tabanı örneklemi yapılmıştır. Gelecekte oluşturulacak bir Türkçe veri tabanının oluşturulmasına yön verebileceği düşünülmüştür. Bundan sonra bu konu üzerinde yapılacak çalışmalara yardımcı olmasını dilerim. Yüksek Lisans eğitimime başlamama aracı olan değerli eğitmenim Prof.Dr.Tülin SÖYLEMEZOĞLU’na ve dilbilimini bana sevdiren, bu tezi oluşturmamda bana yardımcı olan değerli eğitmenim ve danışmanım Prof.Dr.İclâl ERGENÇ’e ve beni her konuda destekleyen sevgili eşim Dilek’e sonsuz teşekkür ederim. iv İÇİNDEKİLER Kabul ve Onay ii Önsöz iii İçindekiler iv Şekiller vii Çizelgeler viii 1. GİRİŞ 1 1.1 Tezin konusu ve amacı 1 1.2 Tezin önemi 1 1.3 Çeşitli Üniversiteler ve Kuruluşlar Tarafından Oluşturulan Veri Tabanı Toplama Teknikleri ve Kullanım Yerleri 4 1.3.1 ATIS Veri Tabanı 5 1.3.2 BRAMSHILL Veri Tabanı 6 1.3.3. HCRC Map Task Veri Tabanı 6 1.3.4. KING Veri Tabanı 7 1.3.5 MACROPHONE Veri Tabanı 7 1.3.6 OGI SPELLED ve SPOKEN Veri Tabanı 8 1.3.7 PHONEBOOK Veri Tabanı 9 1.3.8. DARPA RESOURCE MANAGEMENT (RM1) Veri Tabanı 10 1.3.9 ROAD RALLY Veri Tabanı 10 1.3.10. SWITCHBOARD Veri Tabanı 12 1.3.11. SPIDRE Veri Tabanı 12 1.3.12. SWITCHBOARD EXCERPTS Veri Tabanı 13 1.3.13. TI46 Veri Tabanı 13 1.3.14. TIDIGITS Veri Tabanı 14 v 1.3.15. TIMIT VE NTIMIT Veri Tabanı 15 1.3.16. YOHO Veri Tabanı 16 1.3.17. POLYPHONE Veri Tabanı ve Standartları 17 1.4. Veri Tabanı Toplama Tekniği 19 2. KONUŞMA ve SES ÖZELLİKLERİ 20 2.1. Seslerin Oluşumu 20 2.1.2. Konuşma Dilinin Özellikleri 29 2.1.3. Türkçenin Ses Özellikleri 33 2.1.4. Türkçede Sesler 36 3. VERİ ÇÖZÜMLEME 41 3.1. Okutulacak ve Spontan Olarak Söyletilecek Verilerin oluşturulması 41 4. UYGULAMA 47 4.1. Türkçe-POLYPHONE Veri Tabanı Örnekleminin Oluşturulması 49 4.2. Konuşmacıların Demografik Dağılımı 56 4.3. Konuşmacılardan Kaydedilecek Materyalin Seçimi 59 4.4. Kağıttan Okunacak Materyal 60 4.4.1. Konuşmacı Kodu 61 4.4.2. Sayı Dizileri 62 4.4.3. Telefon Numarası 62 4.4.4. Ard Arda Ayrık Rakam Dizisi 62 4.4.5. Reel Sayılar 63 4.4.6. Tarih 63 4.4.7. Saat 63 4.4.8. Yer (Şehir) Adı 64 4.4.9. Uygulama Sözcüğü 64 4.4.10. Harf Harf Söylenen Sözcük 64 vi 4.4.11. Uygulama Sözcüğü Geçen Tümce 64 4.4.12. Ayrık Sözcük 65 4.4.13. Fonetik Açıdan Zengin Tümce 65 4.4.14. Sözcük Yakalama Amaçlı Sözce 65 4.5. Spontan Söylenecek Materyal 66 5. BULGULAR 69 6. SONUÇ VE DEĞERLENDİRME 74 6.1. Hukuki İnceleme 74 6.2. Veri Tabanı Örneklemini Oluşturan Seslerin İncelenmesi 77 ÖZET 78 SUMMARY 79 KAYNAKLAR 80 vii ŞEKİLLER DİZ İNİ Şekil 1.1 Oluşturulacak veri tabanının kullanım alanları. 3 Şekil 2.1 Konuşmanın sinir sistemiyle olan ilişkisi 21 Şekil 2.2 Ses yolunun şematik gösterimi 22 Şekil 2.3 Ses yolu tüp modeli 23 Şekil 2.4 Kaynak filtre modeli 24 Şekil 2.5 Gırtlağın yandan kesiti 27 Şekil 2.4 "i" ve "a" Seslerinin çıkartılmasında ses yolunun aldığı şekil 28 Şekil 2.5 Ünlü dörtgeni 38 Şekil 4.1 Şehiriçi kayıt sırasında kullanılan hatların durumunu gösteren diyagram. 49 Şekil 4.2 Şehirlerarası kayıt sırasında kullanılan hatların durumunu gösteren diyagram. 50 Şekil 6.1 Aynı kişiye ait bir hafta arayla alınmış seslerin karşılaştırılması 78 Şekil 6.2 Aynı tümceyi kullanan farklı konuşmacıların , seslerinin karşılaştırılması 79 Şekil 6.3 Konuşmacının sesini perdeleyerek (farklı bir sesi taklit ederek) kaydedilmiş sesinin özgün konuşmasıyla karşılaştırılması 81 viii Ç İZ E LG E L ER D İZ İN İ Çizelge 3.1 POLYPHONE standardına göre oluşturulan veri tabanlarının toplam sözce sayısı 38 Çizelge 3.2 POLYPHONE veri tabanında kağıttan okunan materyalin dökümü 40 Çizelge 3.3 POLYPHONE veri tabanlarında spontan olarak söyletilen Mataryalin dökümü 41 Çizelge 4.1 Veri örneklerinin toplandığı yer ve kayıt şekillerini gösteriri çizelge 47 Çizelge 4.2 Ses örneği alınan deneklerin, cinsiyet, yaş eğitim düzeyi ve büyüdükleri yerleri (lehçe kriteri için) gösterir çizelge 54 Çizelge 4.3 Türkçe-POLYPHONE veri tabanı örnekleminde kağıttan okutulan sözcüklerin dökümü 57 Çizelge 4.4 Türkçe-POLYPHONE veri tabanı örnekleminde spontan olarak söyletilecek sözcelerin dökümü 64 Çizelge 5.1 Değişik diller için toplanan ses örnekleri ile yapılan örneklemin karşılaştırılması 66 Çizelge 5.2 POLYPHONE standardına göre oluşturulan veri tabanları ile Türkçe veri tabanı örnekleminin karşılaştırılması 68 1 1. GİRİŞ 1 . 1 . Te z i n K o n u s u v e Ö n e m i Adli bilim al anında, i nsan sesi yol uyl a işl enen suçl arın ortaya çıkartıl abilmesi teknolojiyl e bi rlikte içi n son bilimsel yıll arda metotlar ilerleyen kullanılmaya b a ş l a n m ı ş t ı r. D ü n y a d a k i b u g e l i ş m e l e r T ü r k i y e ’ y e d e yansımış ve bir çok bilim adamı ses tanıma ve ses onayl ama gibi ses işleme konus unda çal ışmaya b a ş l a m ı ş t ı r. F a k a t b u a r a ş t ı r m a l a r ı n b ü y ü k ç o ğ u n l u ğ u yabancı dilde hazırl anmış veri t a b a nl a r ı üzeri nde bilimi, konuşma y a p ı l m a k t a d ı r. Son yıllarda suç araştırma kayıtları bilimsel olarak i ncelenmeye başl amış ve bu al anda yoğun araştırmalar yapılarak bazı ti cari ürünl er p i y a s a y a s ü r ü l m ü ş t ü r. Ül kemi zde bu al anda çalışmalar olmasına rağmen mevcut bir Türkçe ol uşturul an veri si stemleri n tabanı ol mamasından Türkçe ses dol ayı tanıma al goritmalarında performanslarının ne kadar iyi yada kötü ol duğu konus unda sağl ıklı bi r tespi t yapılması m ü m k ü n o l a m a m ı ş t ı r. Bi r ol uşturul acak sistemi n performansını konuşmacı tanıma arttırmak al gori tması i çi n değişik ci nsiyet, lehçe ve yaş g rupl arından topl anan sesl erle 2 e ğ i t i l m e l i d i r. B u n e d e n l e k o n u ş m a v e k o n u ş m a c ı t a n ı m a konul arında araştırma zengi n bir konuşma (Demirekler ve yapılabilmesi veri tabanına ark.,1995). Bu i çi n yeteri nce sahi p ol unmal ıdır konunun önemi , ses araştırmalarında öncül ük eden ülkel erde 1980’li yılların başl arında İngili zce fark olmak edil miş ve üzere 1990 çeşi tli batı başlarında b a ş ta dilleri farklı içi n a m a ç l a r a y ö n e l i k b i r ç o k v e r i ta b a n ı o r t a y a ç ı k a r ı l m ı ş t ı r. Ol uşturul acak böyle Şekil 1.1’de bir açıkl andığı veri gibi tabanıyl a bir aşağıda çok alanda k u l l a n ı l a b i l e c e k t i r. Türkiye Türkçesi içi n standart konuşma veri tabanı henüz mevcut ol maması nedeni yle Türkçe konuşma ve konuşmacı tanıma konul arında araştırma yapan herkes kendi v e r i s i ni kendi toplamakta ve bu işl em bi r standarda oturtul madığından dolayı çok vakit kaybına neden o l m a k ta d ı r. Bunun sonuc u ol arak aynı al goritmalar üzeri nde çal ışan ve iki farklı veri tabanında geli şti rilen benzer sisteml er bi rbirl eri yle k a r ş ı l a ş t ı r ı l a m a m a k t a , h a n g i s i ni n d a h a b a ş a r ı l ı o l d u ğ u s o n u ç l a r a b a k a r a k a nl a ş ı l a m a m a k t a d ı r. B ü t ü n b u n l a r a e k o l a r a k , b ö y l e b i r v e r i ta b a n ı n ı n b u l u n m a m a s ı T ü r k ç e konus unda hazırl anmış araştırma ol an y a pa n l a r ı n veri yabancı t a b a nl a r ı n a ç a l ı ş m a l a r ı n a n e d e n o l m a k t a d ı r. diller bağl ı i çi n kal arak 3 Ses Etkileşimli telefon arama merkezleri Bitmiş Uygulamalar Ses arşivlemesinde düzeltme ve dosyalamada güvenli ses servisleri Geliştirme Kısa tümceler üzerinde tanıma Uygulama Alanları Uzun tümce üzerinde tanıma Konuşmacı tanıma Kelime yakalama Uygulama, veri tabanları üzerinde değerlendirme Güçlü konuşma analizi Teknoloji ve Araştırma Güçlü Karar - Anlaşılır modeller - Çoklu bölüm - Konuşma zenginleştirme - Denetimsiz eşitleme Yazılım geliştirmede Teknolojinin desteği Konuya dayalı ses dizini HMMs ve Hybrid Sistemler - Güvenirliliğin ölçümü - Varsayım testi Güçlü Konuşma Modelli - Çoklu-eğilim - Model uyarlama - Çeşitli sesletim - Dil modeli - Konuşmacı karakterleri - Alışılmış parolalar Ş e k i l 1 . 1 . O l u ş t u r u l a c a k v e r i ta b a n ı n ı n k u l l a n ı m al anl arı. 1.3. Ç e ş i t l i Ü n i v e r s i t e l e r v e K u r u l u ş l a r Ta r a f ı n d a n Oluşturulan Ve r i Ta b a n ı To p l a m a Te k n i k l e r i ve K u l l a n ı m Ye r l e r i Bu böl ümde kurul muş P e n n s y l v a ni a ol an LCD Üniversitesi ( L i n g ui s t i c Data bünyesi nde Consorti um) 4 tarafından topl ama ol uşturul an çeşitli tekni kleri ve dillere ait veri P O LY P H O N E tabanı standartları i n c e l e n e c e k t i r. Son yıllarda bil gisayarla konuşma ve konuşmacı t a n ı m a , o p t i k k a r a k t e r t a n ı m a , s e s s e n t e zi , d o ğ a l d i l i ş l e m e g i b i u y g u l a m a a l a nl a r ı n a g i t t i k ç e a r t a n b i r i l g i m e v c u t t u r. Ö t e y a n d a n , g e n i ş i n s a n k i t l e l e r i ta r a f ı n d a n kull anıl an bütün dill eri n çok karmaşık ve zengi n yapılar ol duğunda n dol ayı yukarıda sözü edil en ses uygul amal arın başarılı sonuç verebil mesi i çi n bilgi sayar al goritmaları çok büyük miktarlarda veri ile eğitmek gerekmektedi r ( Bernstei n et al ., 1995). Bu nedenl e, çeşi tli dünya dilleri içi n veri tabanl arı ol uşturmak ve ol uşturul an veri tabanını dağıtmak içi n 60’ın üstünde üni versi te ve şirketi n üye k u r u l m u ş t u r. Li ngui stic anıl an konsorsi yum bu olduğu bir ko nsorsiyum Consorti um(LDC) Data P e n n s y l v a ni a adıyl a Üni versitesi b ü n y e s i n d e k u r u l m u ş o l u p b a ş ta İ n g i l i z c e o l m a k ü z e r e İspanyol ca, Fransızca, Flamanca, Al manca, Japonca ve Çi nce gi bi çeşi tli dünya dilleri ile il gili veri tabanı o l u ş t u r m a v e d a ğ ı t m a f a a l i y e t l e r i n d e b u l u n m a k t a d ı r. Çal ışmaya ışık tutması açısından önceli kle LCD tarafından dağıtımı teknikl eri i ncelenerek tabanl arıyla il gili yapılan bil giler konuşma aşağıda veri tabanı konuşma v e r i l m i ş t i r. A nl a t ı l a n veri veri t a b a n l a r ı n ı n t a m a m ı n a y a k ı n s e s v e r i l e r i ni e ğ i t m e v e test grupl arı ol mak üzere i ki ye ayrılarak aynı veri tabanı üzeri nde çal ışan araştırmacıl arın el de ettikl eri 5 sonuçl arı bir biri yle karşıl aştırılma olanağı sağl amış o l a c a k t ı r. 1 . 3 . 1 AT I S Ve r i Ta b a n ı AT I S ( A i r Tr a v e l I n f o r m a t i o n S y s t e m ) h a v a d o l a ş ı m ı b i l g i s i s t e m l e r i v e r i ta b a n ı , ö z e l b i r b a ğ l a m l a s ı n ı r l a n m ı ş ol an doğal konuşmal arı i çeri r ( Te x a s Instruments, 1999). Bu veri tabanı ile konuşmacıya bağımlı konuşma t a n ı m a a m a ç l a r ı i ç i n d ü ş ü n ü l m ü ş t ü r. S ö z ü e d i l e n ö z e l b a ğ l a m h a v a y o l c u l u ğ u b i l g i s i s t e m i y l e i l g i l i d i r. U ç a k y o l c ul u ğ u i l e i l g i l i b i l g i s o r m a k , r e z e r v a s y o n y a p t ı r m a k gi bi amaçlara yöneli k tümcel eri n yer al dığı veri tabanı 10 konuşmacıdan 16 kHz örnekleme hızında, 16 bi t’e ni cemlenerek yak ın konuşma ile Sennhei ser HMD414 ve Crown PCC-160 model iki farklı mikrofonla t o p l a n m ı ş t ı r. AT I S v e r i t a b a n ı t e s t v e e ğ i t i m s i s t e m l e r i ol arak bili nen AT S 0 , AT I S 2 ve AT I S 3 olarak g e l i ş t i r i l m i ş t i r. 1.3.2. B R AM S H I L L Ve r i Ta b a n ı B u v e r i ta b a n ı n d a h e r b i r k o n u ş m a c ı d a n a l ı n a n s t a n d a r t bazı test cüml el eri ve serbest konuşma bul unmaktadır (Police St a ff Coll ege, 1979). Karşıl ıklı konuşma 6 bi çi mi nde gerçekleşti rilen serbest konuşmal arda, her bi r konuşmacı çi fti ne, üzeri nde konuşacakl arı fotoğraflar verilmi ş ve her bi r çiftte yer al an konuşmacılardan kaydedilen sesl er ayrı ayrı kütükl er hali nde organi ze e d i l m i ş t i r. ci nsiyet, Bu yaş, kütüklere b o y, kilo, ek ol arak doğum yeri konuşmacının gibi özellikl er üzeri nde konuştuğu fotoğrafın kodu, tümcel eri n çeviri y a z ı m ı v e d i y a l o g o l u ş t u r a n i k i nc i k o n u ş m a c ı n ı n k i m l i ğ i d e a y r ı k ü t ü k l e r h a l i n d e v e r i l m i ş t i r. İ n g i l i z İ n g i l i zc e s i n e yönelik bu veri tabanında sesl er 10 kHz’de örnekl enmi ş v e 1 6 b i t ’ e ni c e m l e n m i ş t i r. 1.3.3. 128 H C R C M a p Ta s k Ve r i Ta b a n ı tane diyal ogdan ol uşan bu veri tabanı çeşitli hari talar üzeri nde ol uşturul an diyal ogları i çermektedir ( H u m a n C o m m u n i c a t i o n s R e s e a r c h C e n t e r, 1 9 9 2 ) . Y ü z yüze yapıl an veya yüz yüze yapıl mayan diyalogl ara ek o l a r a k S G M L ( St a n d a r t G e n e r a l i z e d M a r k u p L a n g u a g e ) f o r m a t ı n d a y a p ı l m ı ş ç e v i r i y a z ı m l a r, h a r i t a l a r v e v e r i tabanını kull anacak ki şilere yöneli k bazı yardımcı programl ar da 8 diskten (CD -ROM) ol uşan veri tabanına d a h i l d i r. Ve r i tabanında sesler çi ft kanal ol arak k H z ’ d e ö r n e k l e n m i ş v e 1 6 b i t ’ e n i c e m l e n m i ş t i r. 20 7 1 . 3 . 4 . K I N G Ve r i Ta b a n ı Ta m a m ı e r k e k o l a n 2 6 N e w J e r s e y v e 2 6 S a n D i e g o kökenli konuşmacıdan konuşmacı tanıma topl anan KING araştırmaları içi n veri tabanı geliştiril miştir ( I T T. , 1 9 8 7 ) . H e r b i r k o n u ş m a c ı i l e a y r ı k a y ı t s e a n s ı yapıl mış ve aynı konuşma hem geni ş hem de dar bantlı ol arak k a y d e d i l m i ş t i r. Dar bantl ı kayıtta, konuşma standart bir tel efon aparatından geçi rilerek yerel bi r santral a, oradan da yi ne yerel uzak bi r santrala yollanmış, sonra santral a getiril erek geri dönen anal og s i n y a l d e n k a y ı t y a p ı l m ı ş t ı r. G e ni ş b a n t l ı k a y ı t i s e y i n e a y n ı k o n u ş m a n ı n s e s s i z b i r o d a d a t e l e f o n a hi z e s i n e t a k ı l a n k a l i t e l i b i r m i k r o f o n d a n e l d e e d i l m i ş h a l i d i r. H e r iki kayıt da 8 kHz örnekl eme hızında 16 bi t doğrusal ni cemleme k ul l a n ı l a r a k y a p ı l m ı ş t ı r. Her bi r seansta konuşmacıya üzeri nd e konuşacağı bir konu veril miş ve her bi r seansta yaklaşık 30 s a ni y e l i k ses verisi a l ı n m ı ş t ı r. 1.3.5. M AC R O P H O N E Ve r i Ta b a n ı 1994 yılında tamaml anan ve yakl aşık 5000 Amerikalı dan al ınan 200.000 sözceyi kapsayan bi r veri tabanıdır (SRI Internati onal , 1995). Ve r i kanallarından 8 kHz 8 -bit u-l aw tabanı T1 telefon o l a r a k k a y d e d i l m i ş t i r. Her bir denekten, 45 adet kağıttan okunan soruya yanıt, 3 4 a d e t k a ğ ı t t a n o k u n a n s ö z c ü k v e 11 a d e t s p o n t a n soru/yanıt vermesi i s t e n m i ş t i r. D e n e k l e r e demografik 8 b i l g i l e r, ş e hi r i s i m l e r i , ç a l ı ş t ı ğ ı y e r g i b i b a z ı b i l g i l e r s o r u l m u ş / o k u t u l m u ş t u r. 1.3.6. O G I S P E L L E D v e S P O K E N Ve r i Ta b a n ı Te l e f o n ü z e r i n d e n o t o m a t i k s o r u s o r u p (prompti ng) ve kayıt y a pa n bi r komut veren sistem tarafından k a y d e d i l e n b u v e r i t a b a n ı n d a 3 6 5 0 ’ d e n f a zl a k o n u ş m a bul unmaktadır ( Oregon Konuşmacılara adl arı, büyüd ükl eri, ve Graduate nereden evet \hayır ti pinde Insti tute, (1994). aradıkl arı, nerede cevap verecekleri b a z ı s o r u l a r s o r u l m u ş t u r. A y r ı c a a d l a r ı v e s o y a d l a r ı harf, harf söylemeleri ( s p e l l i ng ) , tarafından sistem söyl enen bazı sözcükl eri tekrarlamal arı ve yi ne sistem tarafından söyl enen bazı sözcükl eri açıklamaları i s t e n m i ş t i r. O r e g o n G r a d u a t e I n s t i t u t e ’ d e ( O G I ) y a p ı l a n bu kayıtl arda her bir soru ya da emre ( prompt) verilen yanıt ayrı bi r konuşmacının konuşmanı n (ti me kütük hali nde ci nsi yeti , konuşmanın zaman-çakışmal ı aligned o r t h o g r a p hi c t a b a n ı n d a v e r i l m i ş t i r. o r g a ni z e edil miş kali tesi ortagrafi k transcri ption) ve ve çevri yazım da veri 9 1.3.7. P H O N E B O O K Ve r i Ta b a n ı A y r ı k s ö z c ü k t a n ı m a s i s t e m l e r i n i n ö n e m i ni k o r u y a c a ğ ı varsayımından hareketle telefon üzeri nden kaydedilen büyük bi r ayrık sözcük veri tabanıdır ( Piterlli, et al., 1995). Ayrık konuşma sözcük veril eriyl e tanıma s i s t e m l e r i ni n eği tilmesini n ayrık devaml ı sözcükl erle eği tilmesi ne göre daha kötü sonuçl ar vermesi bu veri tabanının ol uşturul ması i çi n bir başka yönl endi rme k a y n a ğ ı o l m u ş t u r. A y r ı c a , s ö z c ü k s i s t e m l e r i ni n ( w o r d systems) spotti ng eği timi nde de k ul l a n ı l a b i l i r. Phonebook’ta yer al an sözcükler Ameri kan İngili zcesi ni n b ü t ü n s e s b i r i m l e r i ni ( p h o n e m e ) m ü m k ü n o l d u ğ u k a d a r f a z l a b a ğ l a m d a k a p s a y a c a k b i ç i m d e s e ç i l m i ş t i r. To p l a m 23 saatlik ses kaydı i çeren bu veri tabanı ayrıca çeşitli konuşmacı ve telefon hat k a r a k t e r i s t i k l e r i ni de y a n s ı t m a k t a d ı r. Ve r i t a b a n ı n d a 7 9 7 9 s ö z c ü k s e ç i l e r e k bi r havuz ol uşturul muş ve her bi ri demografi k açıdan A B D n ü f u s u n u i y i t e m s i l e t t i ğ i d ü ş ü n ü l e n , o r t a l a m a 11 . 7 yeti şki n konuşmacı tarafından s e s l e n d i r i l m i ş t i r. Ve r i t a b a n ı n d a t o p l a m 9 3 6 6 7 s ö z c ü k y e r a l m ı ş t ı r. S e s l e r sayısal ol arak doğrudan bi r T1 tel efon hattından 8 kHz örneklenerek k a y d e d i l m i ş t i r. 8 bit mu-l aw sayısal formatın da 10 1.3.8. D a r pa R e s o u r c e M a n a g e m e n t ( R M 1 ) Ve r i Ta b a n ı Deni zcilikl e tümceleri n (Naval yer Resource aldığı bu veri Management) tabanı il gili konuşmacıdan bağımsız ve konuşmacıya bağıml ı konuşma tanımaya yönelik ol arak Research hazırlanmıştır Project (Defense 1987). A g e n c y, Advanced Konuşmacıdan bağımsız konuşma tanıma böl ümünde 160 konuşmacının her bi ri nden alınan bi r kaç tümce b ul u n m a k t a d ı r. Konuşmacıya bağımlı konuşma tanıma araştırm al arında kull anıl ması planl anan böl ümünü i se 12 konuşmacını n her bi ri nden Konuşmacılar al ınan 612 tümceleri tümce yazıl ı o l u ş t u r m a k t a d ı r. meti nden o k u m u ş t u r. K a y ı t l a r ç o k d ü ş ü k a r k a p l a n g ü r ü l t ü s ü o l a n b i r o r ta m d a Sennhei ser SN414 kHz’de sonra mikrofon il e yapılmış ve örneklenerek 16 aşağı-örnekleme bit’e ses 20 n i c e m l e n m i ş t i r. (down-sampli ng) Daha yol uyl a 16 kHz’de düşürül en ses veril eri , her bi r tümce ayrı bir k ü t ü k o l u ş t u r a c a k b i ç i m d e o r g a n i z e e d i l m i ş t i r. T ü m c e u z u n l u k l a r ı y a k l a ş ı k o l a r a k 3 - 5 s a n i y e a r a s ı n d a d ı r. 1 . 3 . 9 R O AD R AL LY Ve r i Ta b a n ı B u v e r i ta b a n ı , d o ğ a l k o n u ş m a i ç i n d e s ö z c ü k y a k a l a m a araştırmaları düşünül erek hazırl anmıştır ( National I n s t i t u t e o f St a n d a r t a n d Te c h n o l o g y, 1 9 9 1 ) . K o n u ş m a l a r iki k i ş i ni n bi r ralli planl aması konusu etrafında d ö n m e k t e d i r. A y r ı o d a l a r a o t u r t u l a n i k i k i ş i y e b i r e r y o l 11 hari tası verilmiş, belirli puanlama kriterleri ne göre (örneği n dağ yoll arı ya da i kincil yolların otoyollara göre daha yüksek puan getirmesi gibi ) hari tada işaretl enen i ki nokta arasında bi rbi rl eri yle kon uşarak bir g ü z e r g a h b e l i r l e m e l e r i i s t e n m i ş t i r. B u v e r i ta b a n ı i k i böl ümden o l u ş m a k t a d ı r. adı St o ne h e n g e verilen b ö l ü m d e d i y a l o g u o l u ş t u r a n i k i k o n u ş m a c ı n ı n h e r b i r i ni n sesi mikrofonla al ınıp 300 Hz -3300 Hz bant geni şliği nde bi r PCM FIR süzgeci nden geçi rile rek stereo bir teyp c i h a z ı n ı n i k i k a n a l ı n a a y r ı a y r ı k a y d e d i l m i ş t i r. D a h a sonra ses başına olmayan ortalama 3 böl üml er dakika ayıklanarak süren ses konuşmacı kütükl eri elde e d i l m i ş t i r. B u b ö l ü m d e 9 6 k o n u ş m a c ı b u l u n m a k t a d ı r. Ve r i 2 8 t a b a n ı n ı n W a t e r l o o a d ı v e r i l e n i k i n c i b ö l ü m d e ise benzeri kayıtlar doğrudan telefon hatl arı üzeri nden y a p ı l m ı ş t ı r. B u b ö l ü m d e b i r i n c i b ö l ü m d e k i l e r d e n f a r k l ı 56 konuşmacı örnekleme kütükl er yer hızı hali nde a l m a k t a d ı r. ve 16 bit Ses verileri nicemleme d ü z e n l e n m i ş t i r. Sözcük çal ışmal arında kullanıl mak üzere, önemli 10 kHz k ul l a n ı l a r a k yakalama bir böl ümü hari tadaki yer i siml eri nden ol uşan 20 sözcük seçilmiş ve er bir ses kütüğünde bunl arın geçti ği yerler i ş a r e t l e n m i ş t i r. S ö z c ü ğ ü n b a ş l a n g ı ç n o k t a s ı v e ö r n e k sayısı ci nsi nden uzunl uğun un yer al dığı bu kütükl er ses k ü t ü k l e r i i l e b i r l i k t e v e r i t a b a n ı n ı o l u ş t u r m a k t a d ı r. 12 1 . 3 . 1 0 . S W I T C H B O AR D Ve r i Ta b a n ı Aral arında konuşma bul unduğ u çeşi tli üzere ol uşturan üzeri nden, ve ses konuşmacı araştırmal arında SW I T C H B O A R D ; tamamen tanımanın bil gisayar da kullanılmak telefon h atl arı deneti mi nde otomatik o l a r a k t o p l a n m ı ş b i r v e r i t a b a n ı d ı r ( Te x a s I n s t r u m e n t s , 1993). Her bi ri 6 daki ka süren 2430 diyoloğun b u l u n d u ğ u S W I T C H B O A R D ç o k b ü y ü k b i r v e r i t a b a n ı d ı r. To p l a m 240 Ameri kan saatli k ses İ n g i l i zc e s i ni n i çeren bütün bu ana veri tabanı nda lehçel eri ne sahip 5 0 0 ’ d e n f a zl a k o n u ş m a c ı n ı n 3 m i l y o n d a n f a z l a s ö z c ü ğ ü b u l u n m a k t a d ı r. S e s l e r T 1 t e l e f o n h a t t ı n d a n d o ğ r u d a n sayısal olarak 8 kHz ve 8 bi t mu -l aw kodl anmış b i ç i m i n d e t o p l a n m ı ş t ı r. 1 . 3 . 11 . S P I D R E Ve r i Ta b a n ı SW ITCHBOARD veri tabanının çok büyük ol ması yüzünden, burada yer alan konuşmaların bir böl ümü s e ç i l e r e k , ö z e l l i k l e k o n u ş m a c ı ta n ı m a u y g u l a m a l a r ı n d a kull anıl mak üzere SPIDRE adı verilen yeni bir veri t a b a n ı h a z ı r l a n m ı ş t ı r ( Te x a s I n s t r u m e n t s , 1 9 9 4 ) . K a n a l k a r a k t e r i s t i ğ i ni n k o n u ş m a c ı t a n ı m a d a k i ö n e m i ü z e r i n e SW ITCHBOARD içi nden en az üç ayrı telefon aparatı k u l l a n a n 4 5 k o n u ş m a c ı , k o n u ş m a c ı t a n ı m a u y g ul a m a l a r ı i ç i n h e d e f k i t l e o l a r a k s e ç i l m i ş t i r. 13 1 . 3 . 1 2 . S W I T C H B O AR D E X C E R P T S Ve r i Ta b a n ı SW ITCHBOARD ve ri tabanından kredi kartı konusundaki di yal ogl ar seçilerek, sözcük yakal ama uygulamalarına yönelik olan bu veri ta b a n ı ol uşturul muştur ( Te x a s Instruments, 1993). Eği tme amacıyl a kullanılmak üzere 35 diyal og i ç e r m e k t e d i r. Daha sonra test amacına y ö n e l i k 1 0 d i y a l o g d a h a e k l e n m e s i p l a n l a n m a k t a d ı r. 1 . 3 . 1 3 . T I 4 6 Ve r i Ta b a n ı Ayrık sözcük tanıma çal ışmal arı içi n tasarıml anan b u veri tabanında, yarısı erkek yarısı kadın ol mak üzere topl am 16 konuşmacıdan bul unmaktadır ( National alınan 46 ayrık sözcük Institute of St a n d a r t and Te c h n o l o g y, 1 9 9 1 ) . S ö z c ü k l e r 0 - 9 a r a s ı r a k a m l a r, A - Z arası harfleri n tek tek seslendi rilmi ş hali “YES”, “NO” ve b u n l a r a e k o l a r a k “ E N T E R ” , “ S TO P ” v e “ E R A S E ” g i b i 8 e m i r s ö z c ü ğ ü d ü r. H e r b i r s ö z c ü ğ ü n h e r b i r k o n u ş m a c ı d a n 26 ayrı kaydı a l ı n m ı ş t ı r. Sesler Te x a s Instruments tarafından, akustik i zol asyonu olan bir kabi nde, El ectroVo i c e R E - 1 6 c a r d i o i d s d i n a m i k m i k r o f o n l a t o p l a n m ı ş t ı r. Kayıtların konuşmacının nefes sesl eri nden etkilenmemesi amacıyl a mi krofon konuşmacının ağzını n t a m ö n ü n e d e ğ i l b i r a z y a n ı n a y e r l e ş t i r i l m i ş t i r. 14 1 . 3 . 1 4 . T I D I G I T S Ve r i Ta b a n ı Ard arda gelen rakamların ( connected di gits) konuşmacıdan bağımsız tanınabilmesi amacına yönelik bu veri tabanı toplam tarafından Instruments ol uşmaktadır 326 topl anan (Leonard Konuşmacıların 111 ’ i konuşmacıdan ve erkek, rakam di zileri nden Doddi gton, 11 4 ’ ü Te x a s kadın 1993). 101’i ise ç o c u k t u r. L e h ç e d e d e n g e l i b i r d a ğ ı l ı m i ç i n A B D 2 1 b ö l g e y e a y r ı l m ı ş v e s i y a hl a r d a d a h i l e d i l i nc e 2 2 g r u p t a d e n g e l i b i r l e h ç e d a ğ ı l ı m ı s a ğ l a nm a y a ç a l ı ş ı l m ı ş t ı r. H e r bi r konuşmacıdan, ayrık ol arak söyl enmi ş 22 rakam ve h e r b i r i f a r k l ı o l m a k ü z e r e 11 ’ e r t a n e i k i l i , ü ç l ü , d ö r t l ü , beşli ve yedili rakam grubu (ard arda söylenmi ş rakam) a l ı n m ı ş t ı r. RE244-B Sesl er isi mli akustik bi r i zo l a s y o nl u kabi nde El ectro Tr a c o u s t i c s Vo i c e RE-16 c a r d i o i d s m i k r o f o nl a a l ı n m ı ş v e m i k r o f o n k o n u ş m a c ı n ı n ağzının 2-4 i nç uzağına y e r l e ş t i r i l m i ş t i r. 20 kHz örnekleme hızıyl a toplanan veril er 12.5 kHz'e i ndi rilerek bi r anali z-sentez LPC di nl eyiciler tarafından di nl enerek konuşmacının d i z i s i ni söyl eyip Konuşmacı sistemi ne sadece s e n t e zl e n e n kendi si ne söylemediğine hatal arının uygul anmış bir verilen karar böl ümü ve ses rakam v e r i l m i ş t i r. düzenl enmi ş, d ü z e l t i l e m e y e nl e r v e r i t a b a n ı n d a n ç ı k a r t ı l m ı ş t ı r. 15 1 . 3 . 1 5 . T I M I T v e N T I M I T Ve r i Ta b a n ı B u v e r i ta b a n ı a k u s t i k - f o n e t i k ç a l ı ş m a l a r ı v e k o n u ş m a tanıma çalışmalarını destekl emek üzere hazırl anmıştır ( N a t i o n a l I n s t i t u t e o f Sta n d a r t a n d Te c h n o l o g y, 1 9 9 1 ) . Ve r i t a b a n ı , A B D ’ ni n 8 t a n e l e h ç e g r u b u n u t e m s i l e d e n 6 3 0 k o n u ş m a c ı n ı n h e r b i r i n d e n a l ı n a n 1 0 t ü m c e , y a ni t o p l a m 6 3 0 0 t ü m c e i ç e r m e k t e d i r. T ü m c e l e r ü ç g r u b a a y r ı l m ı ş t ı r. B i r i n c i g r u b a , l e h ç e f a r k l a r ı n ı ö n e ç ı k a r a c a k b i ç i m d e s e ç i l m i ş 2 t ü m c e b ul u n m a k t a d ı r v e b u i k i t ü m c e 6 3 0 k o n u ş m a c ı n ı n h e r b i r i t a r a f ı nd a n o k u n m u ş t u r. İ k i n c i g r u p t a , g e ni ş b i r i k i l i s e s ( d i p h o n e ) k a ps a m ı s a ğ l a y a c a k bi çi mde seçilen ( phoneti cally compact) 450 tümce b u l u n m a k t a d ı r. H e r b i r k o n u ş m a c ı b u g r u p t a n 5 t ü m c e okumuş ve tarafından her bi r tümce o k u n m u ş t u r. de 7 Üçünc ü deği şik grupta konuşmacı ise fonetik açıdan çeşitlilik arz eden ( phoneti cally-di verse) 1890 t ü m c e b u l u n m a k t a d ı r. Ç e ş i t l i m e t i n l e r d e n d e r l e n e n b u tümceler tümce tipi ve foneti k bağl am açısından zengi n ol acak ve çok sayıda al ofon i çerecek biçimde s e ç i l m i ş t i r. H e r k o n u ş m a c ı b u g r u p t a n ü ç t a n e o k u m u ş , her bir tümce o k u n m u ş t u r. ise Ses yal nız bi r kütükl eriyle konuşmacı tarafından bi rlikte t ü m c e ni n ortografik, sözcük bazında ve ses bazında çeviri yazımı d a a y r ı k ü t ü k l e r h a l i n d e v e r i l m i ş t i r. S ö z c ü k b a z ı n d a işaretl eme ile her bir sözcüğün örnek sayısı ci nsi nden başl angıç ve bi tiş noktal arı v e r i l m i ş t i r. Fonetik işaretl emede i se aynı işl em tümcedeki bütün sesl er i çi n y a p ı l m ı ş , e k o l a r a k t ü m c e ni n b a ş v e s o n u n d a k i s e s içermeyen böl gel er h ile i ş a r e t l e n m i ş t i r. 6300 16 tümceni n tamamı fonetik işaretleri ni n tek tek konması ç o k z a h m e t l i , u z u n v e p a h a l ı b i r s ü r e ç t i r. Ö t e y a n d a n devamlı konuşma tanıma si steml eri i çi n bu tür i ş a r e t l e n m i ş v e r i t a b a n l a r ı z o r u n l u b i r g e r e k s i ni m d i r. Dol ayısıyla, sessi z bir ortamda kaydedilen TIMIT tümceleri telefon sisteml eri nden geçi rilerek yeni bir veri t a b a n ı o l u ş t u r u l m u ş t u r. S e s l e r i n t e l e f o n b a n t g e ni ş l i ğ i n e sahi p olduğu ve telefon si stemi nde ol abilecek her türl ü bozul maya ve gürül tüye maruz kal dığı bu yeni veri t a b a n ı N T I M I T o l a r a k a d l a n d ı r ı l m ı ş t ı r. N T I M I T t e l e f o n üzeri nden devamlı konuşma tanıma uygul amal arı içi n kull anıl maktadır (Nynex Sci ence and Te c h n o l o g y, 1992). TIMIT tümceleri hareketli bir araç tel efonuyl a s e s l e n d i r i l m i ş v e b u y e n i v e r i ta b a n ı C T I M I T (Own and George, adı 1995) v e r i l m i ş t i r. CTIMIT henüz LDC t a r a f ı n d a n d a ğ ı t ı l a n v e r i ta b a nl a r ı a r a s ı n d a d e ğ i l d i r. 1 . 3 . 1 6 . Y O H O Ve r i Ta b a n ı Konuşmacının gerçekten i ddi a ettiği kişi ol up ol madığını anl amaya, yani konuşmacı doğrul amaya ( speaker veri fication) yönelik sistemler için tasarıml anan bu veri t a b a n ı , a r d a r d a s ö y l e n e n ü ç a d e t “ t hi r t y - f o u r ” , “ s i x t y one” gi bi iki basamaklı sayıl ardan ol uşmaktadır ( ö r n e ğ i n 3 6 - 4 5 - 8 9 ) ( I T T. , 1 9 8 9 ) . Y O H O v e r i ta b a n ı n d a 108 erkek 30 kadın ol mak üzere topl am 138 k o n u ş m a c ı n ı n h e r b i r i n d e n 1 3 6 t a n e ü ç l ü s a y ı d i zi s i a l ı n m ı ş t ı r. H e r b i r k o n u ş m a c ı d a n a l ı n a n 1 3 6 s a y ı d i zi s i 1 4 a y r ı s e a n s t a k a y d e d i l m i ş t i r. K o n u ş m a c ı l a r ı n k o d l a r ı , 17 ci nsiyetleri ve coğrafi k ö k e nl e r i de ayrı kütükl erde v e r i l m i ş t i r. S e s k ü t ü k l e r i ni n ö r n e k l e m e h ı z ı 8 k H z o l u p , her bi r örnek 12 bit doğrusal ni c e m l e n m i ş ancak k ü t ü k l e r d e 1 6 b i t o l a r a k v e r i l m i ş t i r. 1 . 3 . 1 7 . P O LY P H O N E Ve r i Ta b a n ı v e S ta n d a r t l a r ı Çeşi tli dünya d i l l e r i ni kapsayan ve çeşitli ses a r a ş t ı r m a l a r ı i ç i n k ul l a n ı l a b i l e c e k t i c a r i a ç ı d a n ö n e m e sahi p bi r veri tabanı ol uşturulması fikri 1992 yılında COCOSDA Database (Coordi nati ng Commi ttee Assessment ,1994) tarafından öneril miş adı for verilen v e P O LY P H O N E adı Sp e e c h bi r komite veril en bu p r o j e h a k k ı n d a b a z ı s t a n d a r t l a r o l u ş t u r u l m u ş t u r. P O LY P H O N E üzeri nden çeşitli topl anan diller i çi n verilerden telefon hatları o l u ş t u r u l m u ş t u r. P O LY P H O N E v e r i ta b a nl a r ı n ı n h e r d i l i ç i n o d i l i k o n u ş a n ül kede bi r uygul amada kurumca ol uşturulması k ul l a n ı l a c a k yöntem planl anmış üzeri ne ve bazı s t a n d a r t l a r k o n m u ş t u r. P O LY P H O N E s t a n d a r t l a r ı n ı n e n önemlileri şunl ardır: Eğer mümkünse kayıtlar T1 veya ISDN gi bi sayısal hatl ardan doğrudan s ayısal ol arak yapıl malıdır. Ve r i l e r o ül k e d e k ul l a n ı l a n s ı k ı ş t ı r m a f o r m a t ı n a ( m u law veya A-law) sadık kal ınarak kaydedilmeli ve veri 18 tabanını kull anacak ki şileri n bu sıkıştırma verileri d o ğ r u s a l h a l e ç e v i r m e l e r i i ç i n t a b l o l a r v e r i l m e l i d i r. Ve r i t a b a n ı n d a e n a z 5 0 0 0 k o n u ş m a c ı v e 1 2 5 , 0 0 0 s e s örneği yer 100’erli a l m a l ı d ı r. grupl ar Konuşmal ardan hali nde 500 tanesi 5 test grubu olarak ile 50 arasında sözce a y r ı l m a l ı d ı r. Her bir konuşmacıdan 25 a l ı n m a l ı d ı r. Sözceler arasında az sayıda spontan konuşma ve ayrıca konuşmacının kayıtla ilgili yorumunun yer a l d ı ğ ı b i r b ö l ü m d e b ul u n m a l ı d ı r. Her bi r sözce, içermeyen bi rer başında böl üml e ve sonunda birlikte ayrı konuşma bir kütükte s a k l a n m a l ı d ı r. Sözceler arasında t ü m c e l e r, normal harf harf s ö y l e n e n s ö z c ü k l e r, ç e ş i t l i b i ç i m l e r d e k i r a k a m d i zi l e r i ve sayıl ar ve içi nde sayı geçen sözcel er yer a l m a l ı d ı r. Sözceler kapsamalı, dahili nde dili n üçl ü i kili sesleri ni s e s l e r i ni mümkün ol duğu ise kadar %100 prati k f a zl a oranında sınırl amal ar kapsayacak b i ç i m d e s e ç i l m e l i d i r. Her bi r sözceni n ortografi g çeviri yazımı verilmeli, ayrıca sözcel er ve konuşmacıl arın özellikl eri de ses v e r i l e r i y l e b i r l i k t e v e r i t a b a n ı n a d a h i l e d i l m e l i d i r. 19 B u t e z i n a m a c ı y u k a r ı d a b a h s e d i l e n ç e ş i t l i ül k e l e r e a i t veri tabanl arı konuşmacı tanımaya y a p m a k ” t ı r. kull anıl an al anda i ncenelerek El de i nsan sıkıntısı “Türkçe yönelik edil ecek sesi veri çekilen veri konuşma tabanı sonuçl ar ta b a n l a r ı bi r veri ile örnekl emi dünyada i ncel enerek tabanı ve bu standardı o l u ş t u r u l m a s ı a m a ç l a n m ı ş t ı r. B u v e r i t a b a n ı n d a n e l d e edil ecek farklı spektrografi k zamanl arda anali z alınan yapılarak d e ğ i ş i k l i k l e r i n c e l e n e c e k t i r. sesler sesler üzeri nde üzeri ndeki 20 2. KONUŞMA ve SES ÖZELLİKLERİ 2.1. Seslerin Oluşumu Bi r konuşma i nsan tarafında ol uşturul urken, her şey den ö n c e b i r k o n t r o l s i s t e m i ( s i ni r a ğ l a r ı ) y a r d ı m ı y l a b e y i n e ul aştırılır ve düze nl enen bir şeyi n mesaj söylenmesi ne konuşma organl arı karar v e r i l i r, ( m e k a ni z m a s ı ) t a r a f ı n d a n ü r e t i l i r. B e y i n t a r a f ı nd a n b i r ç o k o l a y a a i t bil giler a l g ı l a n ı r, i ş l e ni r, d e p o l a n ı r v e k a r a r v e r i l e r e k k o n u ş m a o l u ş t u r u l u r ( Hollien, 1990, s.:43). Ş e k i l 2 . 1 ' d e b i r k o n u ş m a n ı n s i ni r s i s t e m i y l e i l i ş k i s i bi r di yagramla tarafından karar kontrol v e r i l i r, sol unum konuşma a n l a t ı l m ı ş t ı r. ses si stemi i çi n gerekli uyarıl ır gerek li m e k a ni z m a s ı i çi n Burada ve ses ol an tarafından ötüml ü konuşma beyi n üreti mi ne enerji kaynağı s a ğ l a n m a k t a d ı r, ( voi ce) sesl er sol uk b o r u s u ( l a r y n x ) i ç i n d e b ul u n a n s e s t e l l e r i ( v o c a l c o r d s ) bu enerjiyl e ti treşerek gırtlak, burun, ağız, dil ve d u d a ğ ı n y a r d ı m ı y l a s e s i ü r e t i r l e r. Güç Kaynağı ol uşabil mesi (Solunum i çi n yardımıyla hava konuşmanı n kaburgal ar Bir olan enerji gerekli i l e s a ğ l a n ı r. H a v a ni teliği ne arası Sistemi): kasl ar göre ve si ni r karın konuşmanı n akci ğerl er çıkışı yani şiddeti sistemi kasl arı g ö ğ ü s a t ı ş ı y l a a y a r l a n ı r ( Hollien, 1990, s.:44). yol uyl a uy arılarak Hava akışı 21 s ı r a s ı n d a k a s l a r i k i t ü r l ü k a s ı l m a y a p a r. B i r i n c i s i , h e r heceye denk gel en hece kasıl ması, i ki ncisi de cüml ede vurgunun keli medeki y e r i ni beli rtmek içi n vurgu k a s ı l m a l a r ı d ı r. Sinir Sistemi (Nervous System) Kontrol Sistemi Güç Kaynağı (Enerji) Ses Değiştiricisi (Articulation) Ses Jenaratörü (Ses Kaynağı) Solunum Sistemi Gırtlak Sistemi (Respiratory System) (Laryngeal System) Ses Yolu (Vocal Tract) Konuşma Ş e k i l 2 . 1 . K o n u ş m a n ı n s i ni r s i s t e m i y l e o l a n i l i ş k i s i ( Hollien, 1990.s.:44) Ses Kaynağı (Gırtl ak Sistemi) : Konuşma i çi n i çi n gerekli ol an enerji akciğerl erden sağl andıktan sonra, s e s a ğ ı l ı n d a n g e ç e n h a v a s e s t e l l e r i ni h a r e k e t g e ç i r i . Konuşma hava başl adığında basıncı a r ta r ve ses ses telleri k a pa n ı r, telleri a ç ı l ı r, ciğerdeki bu açılma k a p a n m a s e s t e l l e r i n i n t i t r e ş m e s i n e n e d e n o l u r. N o r m a l konuşmada sani yede 60 ses dönü t e l l e r i ni n (oktav) açıl ıp -kapanma ile a r a s ı n d a d ı r ( Hollien, 1990, s.:46-48). 360 dönü (2 sıkl ığı oktav) 22 S e s Yo l u ( Vo c a l Tr a c t ) : S e s y o l u ü ç b ö l ü m d e n o l u ş u r. Bi ri nci si hemen gırtlağın (pharynx). İki nci si (larynx) geni z boşl uğu üstünde ( nasal boğaz cavity) ve üçünc üsü i se ağız (dil, dudak ve di şl er). Bu üç böl ümün bi r biri yle olan i rtibatı dik bir tüpe benzer (Şekil 2.2). Şekil 2.2. 1990). Ses yol unun şematik gösterimi (Rossi ng, Doğal sesli harfleri n ol uşumunda ses yol unun basi t modeli, ses telleri nden başlayıp dudaklara uzana n u z u n l u ğ u L i l e g ö s t e r i l e n ( Ş e k i l 2 . 3 ) b i r t ü p t ü r. Fo= c / a L (c:havada sesi n hızı) olmak üzere tüp Fo, 3 F1, 5 Fo 23 . . . . . . s o n s u z f r e k a n s r e z o n a n s l a r ı n a s a h i p t i r. N o r m a l b i r ses yol u L=17cm, c=340 m/s değeri nde rezonans f r e k a n s l a r ı 5 0 0 H z , 1 0 0 H z , 1 5 0 0 H z . . . . . b u l u n u r ( Owens, 1993, s.:5,6). R e z o n a n s f r e k a n s ı f o r m a n t f r e k a n s ı o l a r a k k u l l a n ı l ı r. Ş e k i l 2 . 3 . S e s y o l u t ü p m o d e l i ( Owens, 1993, s.:5) Ses yol unun konuşmanı n her anında farkl ı şekil al masından dol ayı farklı formant frekansl arı ü r e t i l e c e k t i r b u n e d e n l e d e f a r k l ı s e s l e r o l u ş a c a k t ı r. B u sesl eri n ol uşumu Owens ( 1 9 9 0 ) ' n a g ö r e k a y n a k f i l t r e modeli nde si nyal ses kaynağından periyodik işaretl er (pul s) veya yol unun rasgel e rezo nans gürültül er değerl eri ne hali nde benzer ç ı k a r, ses değerler ile z a m a n d e ğ i ş i m l i f i l t r e l e r l e f i l t r e l e n i r. F i l t r e ni n f r e k a n s k a r a k t e r i s t i ğ i ta r a f ı n d a n k a y n a k s p e k t r u m u n ç o ğ a l m a s ı i l e k o n u ş m a s i n y a l i ni n f r e k a n s s p e k t r u m u e l d e e d i l i r. B u durum ötüml ü ve ötümsüz sesl er i çi n şekil 3.4 kaynak fil tre modeli nde g ö s t e r i l m i ş t i r. A v ve An ö t ü m s ü z d a l g a l a r ı n ş i d d e t i ni ta n ı m l a r. ötüml ü ve 24 Ş e k i l 2 . 4 . K a y n a k f i l t r e m o d e l i ( Owens, 1993, s.:7) Ses yol u sonsuz rezona ns değeri ne ve formant f r e k a n s ı n a s a hi p o l m a s ı n a r a ğ m e n 1 0 0 H z i l e 3 , 5 k H z arası frekans y e t e r l i d i r. al anını Çünkü formantl arın i çeren ko nuşma g e nl i k l e r i , ilk 3 4 formant si nyalleri ndeki yüksek ötümsüz veya sesl eri n kaynağı t a r a f ı n d a n y a k l a ş ı k 1 2 d B / o k t a v k a d a r a z a l ı r. Ö t ü m s ü z k a y n a k l a r d a s p e k t r u m d ü z v e g e n i ş t i r. Ş e k i l d e k i k a y n a k fil tre modeli konuşma ol uşum i ş l e m i ni ol dukça b a s i t l e ş t i r i r. S ı z m a l ı s e s l e r ö t ü m l ü v e n e f e s l i s e s l e r l e aynı derecede vokal alanın rezonansı ile filtre e d i l e m e z l e r. D o l a y ı s ı y l a k a y n a k f i l t r e m o d e l i s ı z m a l ı s e s l e r i ç i n t a m d o ğ r u d e ğ i l d i r. 25 Ses yol unun teori k m o d e l l e r i ni n i ncel emesi nden sonra gerçekte bi r sesi n ol uşumuna kat kı sağl ayan ses organlarının neler ol duğu (Şekil 2.5) ve görevl eri nden bahsedersek: G e n i z B o ş l u ğ u ( 1 ) : Yu t a k deli ği ne kadar u z a n ı r. boşl uğu biti mi nden buru n Uzunluğu 10 cm kadardır ( D e m i r c a n , 1 9 9 6 , s . : 1 0 ) . G e ni z s e s l e r i ni n a y r ı o l u ş u , g e n i z b o ş l u ğ u n d a k i d a l g a d e ğ i ş i m i n d e n m e y d a n a g e l i r. Dudaklar (2): Ses yol unun en dış ucunda dudakl ar b u l u n u r. Ü s t - d u d a k v e a l t - d u d a k b i r l i k t e s e s ç ı k a r t t ı ğ ı gi bi (p,b,m gi bi), yal nızca al t -dudak üst-di şlere karşı da kull anıl abilir (f,v gi bi) (Demircan, 1996, s.:8 ). Dişler (3): Sesl eti mde yal nızca üst -di şl er k u l l a n ı l ı r. Ü s t - d i ş l e r, d i l - u c u v e a l t - d u d a k l a b i r l i k t e f , v s e s l e r i ni ç ı k a r m a k i ç i n k ul l a n ı l ı r. G e ni z ( m , n ) s e s l e r i n d e n ( v, f ) sesl eri ne geçi ş zor ol duğundan, bu konumda m -n ayrımı o r t a d a n k a l k a r. O b a ğ l a m d a , b i r t ü r m o l a n a l t d u d a k ü s t d i ş g e ni z ü n s ü z ü ç ı k a r ı l ı r ( D e m i r c a n , 1 9 9 6 , s . : 9 ) . Damak(4,5,6): damak, önden arkaya doğru di ş -seti (4, the alveolar ridge ), sert damak(5, the hard palate), yumuşak-damak(6, the s o ft palate or vell um) diye b ö l ü n ü r. Diş-seti(4), sert-damaktan önce fakat di şlerden sonra g e l i r, d i l i n d o ğ r u s u v e u c u i l e b i r l i k t e k ul l a n ı l m a k t a d ı r. 26 Burada da ses yol u ya kapanır (t,d,n gi bi) ya da daraltıl ır (s,z gi bi). damak(5) , Sert sesletmede dili n önüyl e birlikte k u l l a n ı l ı r. D i l - u c u , s e r t - d a m a k l a b i t i ş e r e k s e s y o l u n u kapayabilir daral abilir ya (ş,j da sızmaya gi bi) /y/ sesi neden olacak çıkarılırken kadar dil -ucu ile d a m a k a r a s ı n d a k i a r a l ı k , s ı z m a o l m a y a c a k k a d a r a ç ı l ı r. /i ,ü,e,ö/ ünl ül eri içi nse, bu aralık derece derece daha geni ş ol ur(Demircan, 1996, s.:9 ). Yu m u ş a k - d a m a k ( 6 ) ( k ü ç ü k d i l ) , i k i a y r ı g ö r e v y a p a r, y a al çal arak geni z yol unu açar (m,n gibi ), veya yukarı kal karak g e ni z yol unu kapatır(a,p,s gi bi). Böylece sesl er ağız sesl eri (a,p,s gi bi), geni z sesl eri(m,n gi bi) di ye iki ye bi rlikte a y r ı l ı r. ya ağız İki nci yol unu görevi i se, kapatmak dili n (k,g arkasıyl a gibi ) ya da geni şletmektir (o,a gibi ) (Demi rcan, 1996, s.:8 ). Dil (7): En oynak en oynak ses organı olan dil, s e s l e t i m d e d a m a k i l e b i r l i k t e g ö r e v y a p a r. Ç ı k a r ı l a n sesl ere göre önden arkaya doğru ş u böl üml ere ayrılır; uç, orta, art. Dil üç türl ü devi nir;ağız yol unu kapar(t,d,k,g...gibi ), ağız yol unu daraltır (i ,ü...gi bi), diş seti ne çarpar (r gibi) (Demi rcan, 1996, s.:8 ). Ağız boşluğu (8): Ses yol unun en önemli böl ümü a ğ ı z d ı r. S e s d e ğ i ş i m l e r i d i l i n , y u m u ş a k d a m a ğ ı n d u r u m u v e ç e n e a ç ı k l ı ğ ı d e ğ i ş t i r i l e r e k s a ğ l a n ı r. 27 Yu ta k B o ş l u ğ u ( 9 ) : S e s t e l l e r i y l e y e m e k b o r u s u ü s t ucundan başl ayıp ağız ve geni z boşl uğunu n b a ş l a n g ı c ı n a k a d a r s ü r e r. G ö r e v l i , d i l i n k ö k ü n ü g e r i y e ç e k e r e k g ı r t l a ğ ı n y u k a r ı d o ğ r u o y n a t a r a k y u t a k y a nl a r ı n ı k a s a r a k d e ğ i ş t i r i r. ( D e m i r c a n , 1 9 9 6 , s . : 1 0 ) Ş e k i l 2 . 5 . G ı r t l a ğ ı n y a n d a n k e s i t i ( Hollien, 1990, s.:52) 1 , g e ni z b o ş l u ğ u - 2 , d u d a k l a r - 3 , d i ş l e r - 4,damak önü5,sert damak-6,yumuşak damak ya da küçük dil- 7,dil-8, ağız boşluğu- 9, yutak boşluğu- 10, gırtlak kapağı- 11, gırtlak12, yemek borusu-13, yutak ön duvarı- 14, boyun kemiği. 28 Ses organl arının kısaca g ö r e v l e r i ni a nl a t t ı k t a n sonra bu organl arın bi r sesi sesleti mi ndeki ses yol unu n a l d ı ğ ı ş e k i l i k ı s a c a i n c e l e y e l i m . " i " v e " a " s e s l e r i ni n çıkartıl masında ses yol unun al dığı Şekil 2.6'de gösteril m i ş t i r. Şekil 2.6. "i" ve "a" sesl eri ni n çıkartılmasında ses y o l u n u n a l d ı ğ ı ş e k i l ( F r y, 1 9 7 9 . S . : 7 7 ) . Burada "i " harfi i çi n dil orta tarafı damağa çok yakı n ve s e s y o l u ç o k u z u n d u r, b u n a k a r ş ı n d i l u z u n l u ğ u ç o k k ı s a d ı r ( F r y, 1 9 7 9 ) . Sp e k t r a l g ö s t e r i m d e b i r i n c i f o r m a n t f r e k a n s ı F1 1 2 0 H z ' l i k s k a l a d a 360 Hz, iki nci formant 29 frekansı F2 2 2 8 0 tamamen f a r k l ı d ı r. yakl aşmış bi ri nci H z ' d i r. ses Dil yol u formant "a" sesl eti mi nde gırtlak çeperi ne k ı s a l m ı ş t ı r. frekansı yatay Sp e k t r a l F1 7 2 0 Hz, ses yol u olarak gösterimde i ki nci formant f r e k a n s ı F2 1 2 0 0 H z ' d i r. Formant frekansı, konuşma anında vokal alanı n farklı şekiller al masından dolayı farklı rezonansl ar o l u ş u r v e f a r k l ı s e s l e r o l u ş u r, h e r b i r f a r k l ı r e z o n a n s a formant frekansı rezanansta n d e ni r. dol ayı Sürekli konuşmada konuşmanı n her farkl ı anı nda farkl ı f o r m a n t f r e k a n s ı ü r e t i l e c e k t i r. K o n u ş m a n ı n o l u ş u m u n d a formant frekansl arı sesl etil miş herkes olsaydı hi ç tarafından ki mse bir aynı biri ni Hz'l erde sesi nden tanıyamayacaktı. Bu nedenle herkesi n kendi ne özgün formant frekansl arı vardır ve bu o k i ş i ni n ses k a r a k t e r i s t i ğ i ni o l u ş t u r u r. 2.2. Konuşma Dilinin Özellikleri K o n u ş m a d i l i ni i n c e l e m e d e n ö n c e , k o n u ş m a d i l i - y a z ı d i l i ayrımını i ncel emekte yarar v a r d ı r. İnsanın ayrıcal ık bel gesi ol arak görebileceği mi z dil, onun dış dünyayla ve d i ğ e r b i r e y l e r l e i l i ş k i l e r i ni b e l i r l e y e n , y a n s ı t a n ; i n s a n v e topl umdan teknik ayrı gi bi ol uşturan k i ş i l i ğ i ni n düşünül emeyecek bütün bir a l a nl a r l a k u r u m d u r. ilgisi K i ş i ni n b e l i r g i nl e ş m e s i n d e olan bilim, b ul u n a n ruhsal ve ve ve sanat, onl arı topl umsal düşünce ni n ol uşmasında önemli işl evi ol an dil, başkal arını etkileme, 30 yönl endi rme, aktarmanın yanı sıra, belli amaçl arla g e r ç e k l i ğ e i l i ş k i n d e n e y i m l e r i a k ta r m a n ı n y a n ı s ı r a b e l l i amaçl arl a gerçekliğe şu ya da bu görüntüy ü vermek i çi n başvurul an yöntemleri n de başında gelir (Ergenç, 1995, s.:28). Her dil konuşul duğunda topl um i çi nde kendi ne özgü bi r eki n ve uygarlık çevresi nde biçi mlenirken, dış dünyayı topl umsal, ruhsal ve fizi ksel gerçekli ği özgün b i r b i ç i m d e y o r u m l a r, k a v r a m l a ş t ı r ı r v e y a p ı l a ş t ı r ı r. Bili ndi ği gibi dili n i ki yönü vardır; konuşma dili ve yazı dili. sesl erden Gerçekte ol uşan bir dil ol gusu düzl eme yazıdan b a ğ l a n ı r. bağımsız, Bu a çıdan k o n u ş m a d i l i b i r u l u s u n , b i r d i l b i r l i ğ i n i n d i l i ni n y a z ı y l a i l i ş k i l i o l m a y a n v e ç e ş i t l i s ö y l e y i ş ö z e l l i k l e r i ni t a ş ı y a n y ö n ü d ü r. B u n e d e n l e y a z ı ç o k s o n r a b ul u n d u ğ u i ç i n t e m e l o l m a ni t e l i ğ i t a ş ı r. Ya z ı d i l i i s e , s ö zl ü b i l d i r i ş i m aracı, dili görsel ve tek boyutl u bi r düzen i çi nde sunan, u z a k t a n b i l d i r i ş i m s a ğ l a m a k , b i l d i r i l e r i n y i t i p g i t m e s i ni önl emek gi bi amaçlarla kullanıl an bi r düzgü, bir a n l a t ı m , k ı s a c a s ı i k i n c i l b i r d i z g e d i r. S a u s s u r e ’ y e g ö r e “Dil ve yazı birbi ri nden ayrı i ki göstergel er di zgesi dir. Ya z ı n ı n b i r i c i k v a r l ı k n e d e n i , d i l i g ö s t e r m e k t i r. ” İki ncil di zge, zamanla önem kazanarak kendi ne özgü yeni bi r gerçeklik düzl emi yaratırken, genellikle d i l i d u r a ğ a n l a ş t ı r ı r, g e l e n e ğ i k o r u r. H e r t ü r l ü b i l d i r i ni n , bu arada eki nsel ve yazınsal değerl eri n başlıca aktarım a r a c ı d u r u m u n a g i r e r e k k u r u m l a ş ı r. Ta r i h s e l k o ş ul l a r ı n 31 etki siyl e konuşma diliyle yazı dili arasında büyük bi r kopukl ukta g ö r ül e b i l i r. Ya z ı y l a söyleyi ş arasındaki kopukl uğun en ö nemli nedeni, dili n evri m geçirmesi ne karşın, yazının deği şmede n ol duğu gi bi kalması sonucu i k i d i z g e a r a s ı n d a k i k o ş u t l u ğ u n o r t a d a n k a l k m a s ı d ı r. Ya z ı d i l i n d e n f a r k l ı o l a r a k k o n u ş m a d i l i ni n k e n d i n e ö z g ü ö z e l l i k l e r i v a r d ı r. A n l a m a y ı r ı c ı g ü ç t e o l a n b u ö z e l l i k l e r, yazılı m e t i nl e r d e k i kull anıl an ‘sözcük’ durakl ardan, aral arını d i n l e y i c i ni n belirlemede d i k k a t i ni çekmek i ç i n k i m i s ö z ö b e k l e r i ni ö n e ç ı k a r m a k ü z e r e n e f e s i m i z i yoğunl aştırmamıza kadar uzana n geni ş bi r yelpazede y e r a l m a k ta d ı r. B i l i n ç l i b i r a n a d i l i k o n u ş u c u s u n u n d ü ş ü n c e l e r i ni , duygul arını karşısındaki ne sunarke n; onu etkilemek, d i k k a t i n i ç e k m e k a m a c ı y l a a n a d i l i ni n t ü m o l a n a k l a r ı n ı kull anması b e k l e ni r. Bunun i çi n de d i l i ni n i şleyiş ö z e l l i k l e r i n i b i l m e k v e o nl a r ı d o ğ r u b i ç i m d e u y g u l a m a k z o r u n d a d ı r. Ö z e l l i k l e i ş i v e a m a c ı g e r e ğ i g e n i ş k i t l e l e r e s e s l e n e n l e r i n e l l e r i n d e k i e n ö n e m l i g ü ç b u d u r. A n c a k , bu b e k l e n t i ni n her zaman i stenilen düzeyde g e r ç e k l e ş t i ğ i ni s ö y l e m e k z o r d u r. K u l l a n ı l a n m e t i n n e denli iyi ol ursa olsun, sunuş kötüyse amaçlanan etki y a r a t ı l a m a z . B u n u n t e r s i d e s ö z k o n u s u d u r. İ ç e r i ğ i p e k dol gun olmayan bir bildiri , etkili bir konuşmayl a bekl enenden öte sonuçl ara ul aşabilir (Ergenç, 1990, s: 1 5 7 - 1 6 4 ) . H i ç b i r y a z ı d i z g e s i , k o n u ş m a d i l i nd e k i t o n y ü k s e k l i ğ i ni v e v u r g u n u n a n l a m t a ş ı y a n d e ğ i ş i m l e r i ni yansıtamaz. Bi r gerçekleşebil me -si konuşmanın eksi ksi z biçi mde içi n koşullar şunl ardır; gereken 32 konuşma ortamı, konuşmayı konuşmanı n amacı, di nl eyeni n tepki si, konuşmanı n temel o ana payl aşan k i ş i l e r, sunul an bil gilere kadar konuşmada düşünsel k ul l a n ı l a n destekleri ve araç, iletişi mi n bi çi mi. Bi r konuşmanın ol uşum unda ana koşul hi ç k u ş k u s u z d i l s e l i ç e r i k t i r. B i r k o n u y u e t k i l e y i c i b i ç i m d e k a r ş ı d a k i n e a k ta r m a ç a b a s ı , ç o k e s k i l e r e d a y a n ı r v e bunun öğretisi ne eski çağl ardan beri sözbilim ( rhetori c) d e n m i ş t i r. İ . Ö . 8 5 - 8 4 y ı l l a r ı n d a Ç i ç e r o , s ö z b i l i m i n g e n e l ol arak üç amacı olduğunu söyl emi ş, bunl arı öğretmek (docere), i nandırmak(movere), (debatere) ol arak ve s ı r a l a m ı ş t ı r. hoşnut Çi çero’nun etmek sözbi lim ü z e r i n d e k i b ul g u v e s a p ta m a l a r ı n ı y a z d ı ğ ı y ı l l a r d a h e r çeşi t söyl ev ve söylemi n genel ol arak şu 5 ana aşamadan ol uşması ge rekti ği öne sürül üyordu (Ergenç, 1995, s.:14): Bul uş (i nventi o) Düze n (di spositi o) Seçi m (elecuti o) Bell eğe alma (memori a) Sunuş (acti o, pronunti atio) Bi r konuşmanın gerçekleşti rilmesi bul unması g e r e k i r. konuşmacıyl a içi n tam çeşitli Bunl arın i l g i l i d i r. ve etkili k o ş ul l a r ı n bi r böl ümü Konuşmacı, bi çimde bir arada doğrudan konuşmasının amacını i yi belirlemeli, konusunun sınırl arını i yi çi zerek 33 ona bağlı kal mal ı ol anakl arını ve konuş ma t a n ı m a l ı d ı r. konuşmanı n başarısını sıralanabili r; konuya amacı Buna etkileyen bağlı konuş ul an kişi , iletişi m kalma, olan dilin dayanarak bir koşull ar şöyle konuşma amacı, İleti şim o r ta m ı , aracı, ortam koşulları, konuşmanın düş ünsel desteği ne bağlı kalma (Ergenç, 1995, s.:14 -15). 2.3. Türkçe’nin Ses Özellikleri Bi r dili başka dillerden ayıran en ö nemli özelliklerden bi ri ses d ü z e n i d i r. Biçi msel sınırl andırmal arda bağl antılı diller ( aggl uti nati ve language ) grubuna gi ren Türkçe’ni n ses açısından başlıca ö z e l l i k l e r i ni şöyle sıralayabiliri z; Ünl üsü bol bir dil ol an Türkçe’ni n e n ti pik özelliği , benzeşme (assimilati on) adı verilen ünl ü ve ünsüz uyuml arıdır (vowel and consonant harmony ). Sözcüğün il k sesl emi ndeki (öncül deki) ünl ünün çıkış yeri ve çıkış biçimi açısından taşıdığı özellikl eri sonraki (ardıldaki) sesl emde b ul u n a n ünl ü ye ul aştırarak k e n d i s i n e b e n z e t m e s i o l a r a k t a nı m l a y a b i l e c e ğ i m i z ü n l ü uyum u kurall arı, s ö y l e y i ş l e r i ni dilimi ze de gi ren etkil eyerek yabancı en sözcükl eri n az çabayl a s e s l e t i m l e r i ni s a ğ l a m a k t a d ı r ( E r g e n ç , 1 9 9 5 , s . : 1 6 ) . o-tu-ruş-l a-rı-nı i-çi -le-me-di-ği n-den ku-ru-tul -mak-ta-dır baş-l a-dı-ğı-mız-da 34 sûret>surat dîvâr> duvar hâste> hasta Türkçe de ünsüz benzeşmesi, kök ya da gövdeleri n son sesi ndeki ünsüzün kendi si nden sonra gel en eki n başındaki ünsüzl e ötüm ( sonori ty) açısından b e n z e ş m e s i d i r. ağaç+ta okul+dan ev+de si rk+ten dal +gın er+dem seç+ki n yön+tem Türkçe’ni n ses açısından bir başka özelliği i se sözcüğün ö n sesi nde birden çok üns üzün bi r arada b u l u n m a s ı d ı r. A y n ı s e s l e m i ç i n d e ö n y a d a s o n s e s t e bi rden f a zl a ünsüzün bul unması biçi mi nde t a n ı m l a y a b i l e c e ğ i m i z ü n s ü z y ı ğ ı l m a s ı , b ul u n d u ğ u d i l i n sesl em düzeneği yl e sesl em yapısının yığılmasına i zi n sıkı sıkıya kuralları vermez. b a ğ l a n t ı l ı d ı r. gereği Bağlantılı Türkçe önseste bir dil ünl ü olması nedeni yl e, ancak sonsesi nde ünsüz yığıl ması olan bi r bi çi mbi rime yığılması eklenmesi yle dedi ğimi z ol ayla içseste ol uşan karşıl aşabiliri z ünsü z (Ergenç, 1995, s.:17). abart-mak çıkart-mak si lk-mek dol durt-mak kork-mak dürt-mek 35 Sonseste ünsüz yığıl masını i çeren sözc ükl eri n bi r kısmı Türkçe’ni n sesl em sonunda kabul edilen ünsü z yığılmal arına örnek verilecek ol ursak: kıskanç i nanç iğrenç eri nç sevi nç tunç gül ünç çel enk kepenk özerk erk sarp basınç hınk kürk turp ant kent tont ast üst hi şt hoşt Önseste ünsüz yığılmasının bul unduğu yabanc ı kökenli sözcükl eri n sesleti mi nde zorl ukl a karşılaşıldığı içi n söyleyiş kol aylığı sağl amak amacıyl a ya sözcüğün başına ya da ünsüzl eri n arasına bir ünl ü koyarak s e s l e m l e r e a y ı r m a y o l u n a g i d i l i r. Y ı l l a r ö n c e d i l i m i z e gi rmiş, önsesi nde ünsü z yığıl masının yer al dığı s ö z c ü k l e r, b u y ö n t e m l e y e ni b i r b i ç i m e s o k u l m u ş v e b u y e n i b i ç i m y a z ı m a d a y a n s ı t ı l m ı ş t ı r. stati on>istasyon scutari >Üsküdar scal a>iskel e stavroz>istavroz Bugün dilimi zde k ul l a n d ı ğ ı m ı z ö n v e i ç s e s i n d e ünsüz yığıl ması olan s özcükl eri sesletirken genellikle ünsüzl eri n arasına bi r ünl ü koymaktayız. Bu durum a i ç s e s t ü r e t m e s i ( e p e n t h e s i s ) o l a r a k t a a d l a n d ı r ı l ı r. 36 tren~tiren, fren~firen, pl an~pilan, gri p~gıri p, pl aj~pilaj , kral~kıral , santral ~santıral, el ektri k~elektiri k, Sonsesi nde ünsüz sözcükl erde de yığıl ması aynı durum ol an yabancı kökenli yaşanmaktadır (Ergenç, 1995, s.:18). Türkçe’de Sesler 2.3.1. K o n u ş m a o r g a nl a r ı m ı z ı n ( a k c i ğ e r, a ğ ı z , b u r u n , b o ğ a z boşl uğuyl a sol uk) uyum i çi nde ve düzenl i çalışmasıyl a anl amlı sözc ükl er ve tümceler ol uşturmak i çi n ağzımızdan çıkardığımız biri mlere düzenli sesler denir ve ünl üler ( vowel) ve ünsüzl er (consonant) olmak üzere iki ye ayrıl ır (Ergenç, 1995, s.:18). Ü n l ü l e r ö z g ü r v e g ü r ü l t ü s ü z s e s l e r d i r. B i r d i ğ e r tanımıyl a akci ğerden gel en sol uğun hi çbi r sürtünme ve engellemeye çıkardığı s e s l e r d i r. organlarının daral ma uğramadan Bu herhangi ol madığı dili n sesl er bir i çi n üstünden geçerken çıkartılırken konuşma yerinde kapanma g ü r ü l t ü s ü z d ü r l e r. ya da Ü n l ül e r i n ç ı k a r ı l ı ş ı n d a e n ö n e m l i g ö r e v i ü s t l e n e n o r g a nl a r d i l , çene ve d u d a k l a r d ı r. ayrımlanması Türkçe’ni n bu nedenl e o r g a nl a r ı n ünl ül eri ni tanımlayabiliri z: Bu bu ünl ül eri n durum una sınıflandırmaya tanımsal göre göre y a p ı l ı r. şöyle 37 Çene açısının durumuna göre: G e n i ş ü n l ül e r ( w i d e v o w e l ) a , e , o , ö Dar ünl ül er (narrow vowel) ı,i,u,ü Dudakların biçimine göre: Düz ünl ül er (unrounded vowel ) ı,i,a,e Yu v a r l a k ü n l ü l e r ( r o u n d e d v o w e l ) o , ö , u , ü Dilin devinimine göre: Arkadil ünl üleri (back vowel ) ı,a,o,u Öndil ünl ül eri (front vowel ) i ,e,ö,ü Öndil ünl ül eride kendi aral arında iki ye ayrıl ır: Yu v a r l a k ö n d i l ü n l ü l e r i ö , ü Düz ö ndil ünl ül eri e,i Arkadil ünl üleri arasında yer al an /ı/ ünl üsü çıkış yeri açısından ortadil (midi um vowel ) ünl üsü ol arak da g ö r ü l e b i l m e k t e d i r. Her dili n sesl eri ni n özelli ği bi rbiri n den farkl ı ol duğunda n daha sağl ıkl ı bi r betiml eme yapabilmek içi n ünl ü dörtgeni ( vowel quadrilateral ) (Şekil2.7) denilen ve ünl ül eri n çıkarılışında dili n ağız boşl uğundaki durumun u g ö s t e r e n b i r d ü z l e m d e n y a r a r l a n ı l m a k t a d ı r. 38 i y u ı Y e U Ø ε o ǽ œ Ï a Ş e k i l 2 . 7 . Ü nl ü d ö r t g e ni ( E r g e n ç , 1 9 9 5 , s . : 1 9 ) K o n u ş m a s e s l e r i ni n i k i n c i b ü y ü k k ü m e s i o l u ş t u r a n ü n s ü z l e r, engelli s e s l e r d i r. Çıkarıl ışları sırasında k o n u ş m a o r g a nl a r ı n ı n h e r h a n g i b i r y e r i n d e a l ı k o n u l u r l a r v e b u n u n s o n u c u o l a r a k b i r s ür t ü n m e y a d a p a t l a m a bi çi mi nde o l u ş u r l a r. Ünsüzl er çıkış biçi mleri ne, yerl eri ne ve ses telleri ni n durumuna göre sınıfl andırıl ır (Ergenç, 1995, s.:18). Çıkış biçimlerine göre; Patl amal ı üns üzl er (plosi ve)b,d,g,p,t,k Geni z üns üzl eri (nasal) m,n Çarpmalı ünsüzl er (rolled) r Ya n d a r a l m a ü n s ü z l e r i ( l a t e r a l ) l S ü r t ü n ü c ü ü n s ü z l e r ( f r i k a t i v e ) c , ç , f , h , j , s , ş , v, y, z Çıkış yerlerine göre; 39 Çi ft dudak üns üzl eri (bil abi al) b,p,m Dudak-di ş ünsüzl eri (labiodental ) f,v Dil ucu dişardı ünsüzl eri (dental ) d,t D i l u c u - d i ş e t i ü n s ü z l e r i ( p a l a t o - a l v e o l a r ) n , r, s , z Dil -öndamak ünsüzl eri (alveo -palatal ) c,ç,j,ş,y Dil ucu-öndamak ünsüzl eri (api cal/pal atal)l Dil -artdamak ünsüzl eri (velar) k,g Gırtlak ünsüzl eri (glottaş) h Ses tellerinin titreşimine göre; Ö t ü m l ü ü n s ü z l e r ( v o i c e d ) b , c , d , g , j , l , m , n , r, v, y, z Ötümsüz ünsüzl er(voi celess) ç,f,h,k,p,s,ş,t Öl çünl ü (standart) Türkçe’deki ünl ü ve üns üzl eri n b i r b ö l ü m ü n ü n k o n u ş m a o r g a nl a r ı n d a k i o l u ş u m y e r l e r i n e g ö r e d e ğ i ş k e l e r i ( v a r i a n t ) b u l u n m a k t a d ı r. A nl a m a y ı r t edi ci güçte ol mayan dağılıml arının b i r b i r l e r i ni n belli yeri ne bu olmasına değişkeleri n dildeki karşın zaman k ul l a n ı l a b i l m e k t e d i r. kimi Anlam farkı yaratmayan bu durum, öl çünl ü söyl eyişi n dışında bir görünüm sergilemektedir (Ergenç, 1995, s.:20). Türkçe’ni n seslem yapısı gereği , aynı sesl em içi ndeki iki ünl ünün bi r arada bulunması yabancı kökenli s ö z c ü k l e r d ı ş ı n d a s ö z k o n u s u d e ğ i l d i r. B u n e d e n l e y a z ı dili nde ünl ü konuşma kayması dili nde ki mi (di phthong) ünsüzl eri n y o k t u r. söyl eyi ş Ancak, s ırasında sesl etil memeleri nedeniyl e, “tek sesmi ş gi bi çıkarılan ya d a b a ş l a n g ı ç t a d u y u l a n s e s i n b i t i ş i n d e y e r i ni b i r b a ş k a sese bırakması” olarak ta n ı m l a y a b i l e c e ğ i m i z ünl ü 40 kaymaların Türkçe’ni n konuşma dili nde var olduğu s e s y a z a r l a r l a y a p ı l a n ö l ç ü m l e r s o n u c u k a n ı t l a n m ı ş t ı r. Öl çünl ü Türkçe de var ol an sesleri n genel görünüm ünü n dışındaki özellikleri i çi n bu konuda yazıl mış yapıtlara başvurul abilir (Ergenç, 1995, s.:22). 41 3. GERÇ VE YÖNTEM Bu böl ümde Türkçe veri tabanı ol uşturul masın da uygul anacak en uygun veri tabanını n beli rlenmesi içi n bi ri nci böl ümde P O LY P H O N E i ncel enen standartları veri tabanları karşıl aştırılmış ve ile veri tabanının örnekl emi i çi n gerekli ol an sözl ü ve yazıl ı m a t e r y a l l e r o l u ş t u r u l m u ş t u r. Ayrıca, ol uşturul acak konuşma ve konuşmacı T Ü R K Ç E - P O LY P H O N E ses tanıma veri içi n tabanı ö r n e k l e m i n e d e n P O LY P H O N E s t a n d a r t l a r ı s e ç i l d i ğ i v e neden tel efon hattı üzeri nden al ınması gerekti ği a n l a t ı l m ı ş t ı r. 3.1. Okutulacak ve S p o n ta n Olarak Söyletilecek Ve r i n i n O l u ş t u r u l m a s ı Bi ri nci böl ümde a nl a t ı l a n çeşitli ül k e l e r e ai t veri t a b a n l a r ı , P O LY P H O N E p r o j e s i n d e n ö n c e t o p l a n d ı ğ ı i ç i n o l u ş t u r u l a n s t a n d a r t l a r ı n d ı ş ı n d a k a l m ı ş t ı r. B u n e d e n l e standart kapsamında veya buna yakın şekil de toplanan d ö r t v e r i ta b a n ı i l e i l g i l i v e r i l e r k a r ş ı l a ş t ı r m a l ı o l a r a k Ç i z e l g e 3 . 1 . ’ d e v e r i l m i ş t i r. B u n l a r A m e r i k a n İ n g i l i z c e s i içi n yürütül en MACROPHONE (Bernstei n et al.,1995), Japonca içi n yürütül en “ Vo i c e Across Japan ( VA J ) ( St a p l e s e t a l . , ( 1 9 9 4 ) , A B D ’ d e k i İ s p a n y o l c a k o n u ş u l a n k i ş i l e r i ç i n y ü r ü t ü l e n “ Vo i c e A c r o s s H i s p a ni c ” ( VA H A ) 42 (Muthusamy et al ., (1995) ve Flemenkçe i çi n yürütül en “ D u t c h P O LY P H O N E ” ( B o v e s e t a l . , 1 9 9 3 ) p r o j e l e r i d i r. O r t a y a ç ı k a n v e r i ta b a nl a r ı a y r ı n t ı l ı o l a r a k i n c e l e n m i ş t i r. Ve r i t a b a n ı o l u ş t u r u l m a s ı i ç i n s e s ö r n e ğ i a l ı n a c a k ki şilere okutul acak materyali n seçi mi, kağıttan okuna n v e s p o n t a n s ö y l e t i l e n o l a r a k i k i y e a y r ı l m ı ş t ı r. H e r b i r veri tabanında yer al an sözceleri n topl am sayısı ve okuna n ve spontan söyl etil en sözcükl eri n sayısı çi zelge 3 . 1 ’ d e v e r i l m i ş t i r. Çizelge 3.1 P O LY P H O N E s ta n d a r d ı n a göre o l u ş t u r u l a n v e r i ta b a nl a r ı n ı n t o p l a m s ö z c e s a y ı s ı . Macrophone Okuna n sözce Sp o n t a n sözce To p l a m sözce P O LY P H O N E VAJ VAH A Dutch Polyphone 34 10 36 32 11 4 9 18 45 14 45 50 standardına göre kağıttan okunan ve spontan olarak söyl etil en materyali n dükümü oriji nali ne uygun ol arak sırasıyla çi zelge 3.2 ve çi zel ge 3.3’de v e r i l m i ş t i r. 43 Sp o n t a n ol arak konuşmacılara yanıtl anan gönderilen sorul arın meti n bir böl ümü kağıtl arında yer al makta, dol ayısıyl a konuşmacı ne söyl eyeceği ni daha önceden ise p l a n l a y a b i l m e k t e d i r. kayıt işl emi sırasında Sorul arın di ğer doğrudan böl ümü konuşmacıya s o r u l m a k t a d ı r. Çi zelge 3.1’de fark edil diği gibi Japonca içi n yürütül en VA J projesi P O LY P H O N E k a r ş ı l a m a m a k t a d ı r. s ta n d a r d ı n ı P O LY P H O N E tam ol arak s ta n d a r d ı n d a k o n u ş m a c ı b a ş ı n a e n a 2 5 s ö z c e a l ı n m a s ı ö n g ö r ül ü r k e n VA J v e r i t a b a n ı n d a 1 4 s ö z c e y e r a l m a k ta d ı r. VA J v e r i t a b a n ı , b u n u n d ı ş ı n d a b a z ı n o k t a l a r d a d a P O LY P H O N E standardını nedeni VA J tam ol arak p r o j e s i ni n k a r ş ı l a m a m a k t a d ı r. P O LY P H O N E Bunu n s ta n d a r d ı b e l i r l e n m e d e n ö n c e b a ş l a m ı ş o l m a s ı d ı r. B u n a r a ğ m e n s ö z k o n u s u v e r i t a b a n ı d a P O LY P H O N E ç e r ç e v e s i i ç i n d e d e ğ e r l e n d i r i l m e k t e d i r. 44 Ç i z e l g e 3 . 2 P O LY P H O N E v e r i ta b a n ı n d a k a ğ ı t t a n okuna n materyali n dökümü. Macrophone Ko nu ş ma c ı nı n Kodu(sayı) Sayı dizileri xxxxxx-xxxx gibi Banka veya kedi kartı no’su Te l e f o n n o ’ s u VA J Dutch Po l yp ho ne VA H A 1 - 1 1 2 6 1 - - - 2 1 - - 4 1 - 1 ta ne 6 r ak a ml ık di zi 1/6 ( to pla m7 ) ( 4 ta ne si $ ) - ¾ 0 /2 (t opl a m2 ) ( to pla m7 ) ( 1 tan esi $) ( 3 ta ne si DFL) Kesir (1/4,7/10 gibi) 1 - - - Alf an ü me rik di zi - - 1 (8 karakter) - Ta r i h 1 - 1 1 Saat 1 - - 1 Ye r ( ş e h i r ) a d ı 2 - - 2 6 - 12 4 2 - 1 3 3 - - - 3 - - - - - - 4 7 4 8 5 34 10 36 32 Ard arda ayrık rakam di zisi Doğal sayılar ( biri msi z /biri mli) Uy gul a ma sözcüğü (çek,bilet, vb.) Harf,harf söylenen sözcük Şu işte çal ışan ş u ki şi tipinde sözcük Şu adresteki şu ki şi tipinde sözcük İ çin de u y gula ma sözcüğü olan t ü mc e Fonetik açıdan z e ngin t ü mc e TOPLAM SÖZCE S AY I S I - 1 45 Çizelge 3.3 P O LY P H O N E veri t a b a nl a r ı n d a spontan ol arak söyletile n Mataryali n dökümü. Macrop hone VA J VA H A Dutch Po l yp ho ne Evet/Hayır türünde yanıtı olan sorular Bir(yaşadığınız) şehir adı söyleyin 5 2 4 5 1 - - 1 B u gün ün ta ri hi ne di r? 1 - - - Şu an saat kaç 1 - 1 1 Doğum tarihiniz nedir? 1 - - 1 Ka p ı nu ma r an ız n edir ? 1 - - 1 Bildiği niz t elef on n u ma ral arı - 2 1 1 Bir isi m söyleyi niz. - - 1 1 Sokağınızın adı nedir? - - - 1 P o s ta ko du nu z ne di r? - - - 1 Hangi şehirde büyüdünüz? - - - 1 Cinsiyetini z nedir? - - - 1 Ya ş ı n ı z k a ç ? - - - 1 Eği ti m sevi yeniz nedir ?(1,2,3) - - - 1 Adınızı harf harf söyl eyini z - - - 1 Evde konuşul an dil nedir? - - 1 - Hangi sıkl ıkta seyahat edersi niz? Bu kayıt hakkındaki y or u mu n uz n edir ? - - 1 - 1 - - 1 11 4 9 18 T O P L A M S Ö Z C E S AY I S I 46 Ol uşturul an Türkçe Ve r i P O LY P H O N E standardını Ta b a n ı karşılama Ö r n e k l e m i ni n durumu aşağıda mevcut hatl arla a ç ı k l a n m ı ş t ı r. Kayıtlar Türki ye y a p ı l m ı ş t ı r. de İstanbul k ul l a n ı l a n ve Bursa'dan al ınan kayıtlar I S D N h a t ü z e r i n d e n , Va n ' d a n a l ı n a n k a y ı t l a r ı n a n a l o g h a t ü z e r i n d e n a n o l o g k a y ı t c i h a z l a r ı y l a y a p ı l m ı ş t ı r. Ve r i l e r tabanını X .W AV formatında k a y d e d i l m i ş t i r. Ve r i kull anacak ki şileri n bu sıkıştırma verileri d o ğ r u s a l h a l e ç e v i r m e l e r i i ç i n t a b l o l a r v e r i l m e l i d i r. Ve r i t a b a n ı n d a 5 5 k o n u ş m a c ı d a n 5 3 9 0 s e s ö r n e ğ i y e r a l m ı ş t ı r. Te s t g r u b u a y r ı l m a m ı ş t ı r. H e r b i r k o n u ş m a c ı d a n 4 9 s ö z c e a l ı n m ı ş t ı r. Sözceler arasında spontan konuşma böl ümü mevcut ol up, konuşmacıl ardan kayıtl a ilgili yorum alınmamış t ı r. Her bi r içermeyen sözce, bi rer başında böl üml e ve sonunda birlikte ayrı konuşma bir kütükte s a k l a n m ı ş t ı r. Sözceler arasında t ü m c e l e r, normal harf harf s ö y l e n e n s ö z c ü k l e r, ç e ş i t l i b i ç i m l e r d e k i r a k a m d i zi l e r i v e s a y ı l a r v e i ç i n d e s a y ı g e ç e n s ö z c e l e r y e r a l m ı ş t ı r. 47 H e r b i r s ö z c e n i n o r t o g r a f i g ç e v i r i y a z ı m ı v e r i l m i ş t i r. Sözceler ve konuşmacıl arın özellikl eri ses veril eriyle b i r l i k t e v e r i t a b a n ı n a d a h i l e d i l m i ş t i r. Dünyada mi krofon/telefon hattı üzeri nden kaydedilen veri tabanl arının bazıl arı biri nci a ç ı k l a n m ı ş t ı r. Bu veri t a b a nl a r ı n ı n böl ümde ol uşturul masında kull anıl an yöntemler amacına göre birbirl eri ne yakın ol masına rağmen b u n l a r ı n a r a s ı n d a n P O LY P H O N E v e r i t a b a n ı s e ç i l m i ş t i r. T ü r k ç e i ç i n o l u ş t u r u l a c a k v e r i t a b a n ı ö r n e k l e m i ni n mümkün olduğu kadar P O LY P H O N E s t a n d a r t l a r ı n ı k a r ş ı l a m a s ı a m a ç l a n m ı ş t ı r. P O LY P H O N E standardında bir veri t a b a nı örnekl emi seçimi n gerekçesi daha öncede açıklandığı gi bi konuşma ve konuşmacı tanıma, konuşmacıdan bağımsız olarak hem ayrık sözcük, hem bağlantıl ı sözcük, hem de devaml ı konuşma tanıma al goritmaların a l a nl a r ı n d a ol uşturul acak denenmesi nde a m a ç l a n m ı ş t ı r. Ya n i , sözcük s i s t e m l e r i ni n e ğ i t i m i tanıma ayrık kullanılabilmesi sözcükl er koyarak ayrık s a ğ l a n a b i l i r, a r d arda söylenen sayı di zileri koyarak bağlantıl ı sözcük t a n ı m a s i s t e m l e r i n i n e ğ i t i m i s a ğ l a n a b i l i r, f o n e t i k a ç ı d a n zengi n tümceler koyarak devaml ı konuşma tanıma s i s t e m l e r i ni n e ğ i t i l m e s i s a ğ l a n a b i l i r, h a r f h a r f s ö y l e n e n sözcükl erle yapıl abileceği ünsüz- ünl ü gibi (CV) spontan ç i f t l e r i ni n sözcel er de a n a l i zi içermesi sağl anarak okuma ve doğal konuşma arasındaki farklar i r d e l e n e b i l i r. 48 Yu k a r ı d a s a y ı l a n s i s t e m l e r d ı ş ı n d a , k o n u ş m a c ı y a okutul acak sorul ara uygun verilen m e t i nl e r l e yanıtl arla veya s o r ul a c a k uygun sözcük yakal ama ( word- s p o t t i n g ) s i s t e m l e r i ni n e ğ i t i l m e s i m ü m k ü n o l a b i l e c e k t i r. P O LY P H O N E standartlarında bi r veri tabanı örneklemi nde konuşmacı sayısı, yaş grubu ve eği tim düzeyi açısından yapıl abileceği nden ayrıca yaş parametreni n yeteri nce çeşitli büyük l ehçe ve ci nsiyete veri tabanı ve bağl ı bir örnekleme ağız farkl arının, ol arak örneklemi nde yer bi r çok al masını s a ğ l a m a k m ü m k ü n d ü r. Adli vakal arda, (kişiye hakaret, sözl ü ci nsel taci z, r ü ş v e t v e y a nl ı ş i h b a r g i b i ) s u ç l u l a r ı n s o n d ö n e m l e r d e en fazl a kullandıkl arı yöntem tel efon k u l l a n m a k t ı r. Dol ayısıyla tel efon üzeri nden konuşma ve konuşmacı tanıma a n a l i zl e r i , suçl unun ortaya çıkarıl masında f a z l a s ı y l a ö n e m k a z a n m ı ş t ı r. F a k a t b u t ü r a n a l i zl e r v e s u ç l u n u n y a k a l a n m a s ı a k u s t i k i zo l a s y o n o d a d a y a d a l a b o r a t u a r k o ş ul l a r ı n d a a l ı n a n s e s l e r ü z e r i n d e k o n u ş m a ve konuşmacı tanıma işl emi ne göre çok daha zor ve p r o b l e m l i d i r. Ç ü n k ü , tel efon hatl arından kaynakl anan g ü r ü l t ü v e b o z u l m a g i b i e t m e n l e r, f a r k l ı m i k r o f o n v e h a t k a r a k t e r i s t i k l e r i ni n y a n s ı y a c a k t ı r. ses Şi mdi ye ü z e r i ne kadar bu kaçınıl maz tür ol arak anali zl er geli şti rilen al gori tmal arın, ol uşturul an bu veri i çi n ta b a n ı örneklemi ile eğitilen si stemleri n, bu ti p çevre etkileri ne k a r ş ı y e t e r i n c e d i r e n ç l i o l a c a k l a r ı d ü ş ü n ü l m ü ş t ü r. 49 3.2. T ü r k ç e - P O LY P H O N E Ve r i Ta b a n ı Ö r n e k l e m i n i n Oluşturulması P O LY P H O N E veri tabanı ö n e r m e k t e d i r, yapıl an 5000 çal ışma ki şiden bi r ol uşumun u örneklem ol ması n e d e n i y l e 5 5 d e n e k k ul l a n ı l m ı ş t ı r. Yi n e P O LY P H O N E standardında belirtildiği gi bi bunl arın yaş, ci nsiyet ve lehçe ol arak düzgün dağıl ımına di kkat e d i l m i ş t i r. D e n e k l e r i n y a ş o r ta l a m a s ı 2 9 ’ d u r. Deneklerden alınan ses örnekleri ne ait kayıt b i l g i l e r i ( t e l e f o n c i n s i g i b i ) Ç i z e l g e 4 . 1 . ’ d e v e r i l m i ş t i r. Burada tel efon, s antral ve hat ci nsleri ses kaydının karakteristi k ö z e l l i k l e r i ni n değişmesi nde en önemli f a k t ö r o l d u ğ u i ç i n t ü m a y r ı n t ı l a r v e r i l m i ş t i r. To p l a m 2 9 sayısal, 22 Analog ve 4 sayısal santral a bağl ı i ç hat t e l e f o n g ö r ü ş m e s i y a p ı l m ı ş t ı r. Ç i z e l g e d e k i A n k a r a ’ d a n al ınan ses kayıtl arı, doğrudan eri şilen tel efonlardır (telefonsayısal şehir santralıtelefon),Şekil 4.1’de g ö s t e r i l m i ş t i r. Te l e f o n Kabl ol u Hat Sayısal Santral Kabl ol u Hat Te l e f o n Ş e k i l 3 . 1 . Ş e hi r i ç i k a y ı t s ı r a s ı n d a k u l l a n ı l a n h a t l a r ı n durum unu gösteren di yagram. 50 İstanbul , Va n ve Bursa’dan alınan kayıtl ar sayısal santral aracıl ığıyl a alınmıştır ( telefonbina içi sayısal santralsayısal santralı bina şehir santraltelefon). Santral içi aracılığıyl a sayısal ul a ş ı l a n t e l e f o n l a r ı n h a t ö z e l l i ğ i ş e k i l 5 . 2 ’ d e g ö s t e r i l m i ş t i r. Kablolu Sayısal Santral Hat Te l e f o n Uydu Sayısal/Analog Ye r Santral İstasyonu Kablolu Hat Te l e f o n Ş e k i l 3 . 2 . Ş e hi r l e r a r a s ı k a y ı t s ı r a s ı n d a hatl arın durumunu gösteren di yagram. Şekil de gösteril en k a b l o s u d u r. kabl o Üzeri nden k ul l a n ı l a n TD -PoP-0,5x2x200 aynı anda 200 yer altı görüşme y a p ı l a b i l m e k t e d i r. K a y ı t l a r b i r e r h a f t a a r a y l a a l ı n m a y a ç a l ı ş ı l m ı ş t ı r. Bazı kayıtların zamanda alımı y a p ı l m ı ş t ı r. bi r haftadan Bunun daha nedeni ise sonraki bir denekl ere z a m a n ı n d a u l a ş ı l a m a m a s ı d ı r. B i r i n c i k a y d ı y a p ı l a n 5 51 deneği n iki nci ses kaydında denekl ere u l a ş ı l a m a d ı ğ ı n d a n k a y d e d i l m e m i ş t i r. H e r n e k a d a r b u gerçekleşemediyse de bi ri nci kayıtl arının kull anıl abilir o l m a s ı n d a n d o l a y ı ö r n e k l e m e e k l e n m i ş t i r. Ç i z e l g e 3 . 4 Ve r i ö r n e k l e r i ni n t o p l a n d ı ğ ı y e r v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e . Kod Alındığı 1nci No. Ta r i h i Ye r Kayıt 2nci Kayıt Ta r i h i Te l e f o n Cihazının Cinsi B a ğ la n tı K u r u la n Sa ntra l Cinsi 01 An ka ra 14.06.1999 21.06.1999 N E TA Ş Sayısal 02 Ankara 13.06.1999 22.06.1999 PANAPHO NE Sayısal 03 An ka ra 13.06.1999 23.06.1999 Omeg a 820 Sayısal 04 An ka ra 13.06.1999 25.06.1999 N E TA Ş Sayısal 05 An ka ra 13.06.1999 25.06.1999 N E TA Ş Sayısal 06 An ka ra 13.06.1999 20.06.1999 SONY Sayısal 07 An ka ra 13.06.1999 20.06.1999 SONY Sayısal 08 An ka ra 13.06.1999 20.06.1999 ELİT Sayısal 09 An ka ra 14.06.1999 21.06.1999 T E L E TA Ş - Sayısal+ Hitit Dahili Abone 010 An ka ra 14.06.1999 21.06.1999 T E L E TA Ş - Sayısal+ Hitit Dahili Abone 0 11 An ka ra 14.06.1999 22.06.1999 SHERON Sayısal 012 An ka ra 14.06.1999 21.06.1999 SHERON Sayısal+ Dahili Abone 52 Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e . Kod Alındığı 1nci No. Ta r i h i Ye r Kayıt 2nci Kayıt Ta r i h i Te l e f o n Cihazının Cinsi B a ğ la n tı K u r u la n Sa ntra l Cinsi 013 An ka ra 14.06.1999 21.06.1999 Q G PA S S E T S a y ı s a l 014 An ka ra 14.06.1999 22.06.1999 T E L E TA Ş 015 Bursa 15.06.1999 22.06.1999 016 Bursa 15.06.1999 22.06.1999 017 Bursa 15.06.1999 30.06.1999 018 Bursa 15 .06.1999 Alına mad ı 019 Bursa 15 .06.1999 Alına mad ı 020 Bursa 15.06.1999 22.06.1999 021 Va n 15.06.1999 22.06.1999 022 Va n 15.06.1999 22.06.1999 023 Va n 15.06.1999 22.06.1999 024 Va n 15.06.1999 22.06.1999 025 Va n 15.06.1999 22.06.1999 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit-480 Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal Analog Analog Analog Analog Analog 53 Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e . Kod Alındığı 1nci No. Ta r i h i Ye r Kayıt 2nci Kayıt Ta r i h i 026 Va n 15.06.1999 22.06.1999 027 Va n 15.06.1999 22.06.1999 028 Va n 15.06.1999 22.06.1999 029 Va n 15.06.1999 22.06.1999 030 Va n 15.06.1999 22.06.1999 031 Va n 15.06.1999 22.06.1999 032 Va n 15.06.1999 22.06.1999 033 Va n 15.06.1999 22.06.1999 Te l e f o n Cihazının Cinsi T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş - B a ğ la n tı K u r u la n Sa ntra l Cinsi Analog Analog Analog Analog Analog Analog Analog Analog Hitit -480 034 Va n 15.06.1999 22.06.1999 035 Va n 15.06.1999 22.06.1999 036 Va n 15.06.1999 22.06.1999 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 Analog Analog Analog 54 Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e . Kod Alındığı 1nci No. Ta r i h i Ye r Kayıt 2nci Kayıt Ta r i h i 037 Va n 15.06.1999 22.06.1999 038 Va n 15.06.1999 22.06.1999 039 Bursa 15.06.1999 22.06.1999 040 Bursa 15.06.1999 22.06.1999 041 Bursa 15.06.1999 22.06.1999 042 Bursa 15.06.1999 30.06.1999 043 Bursa 15.06.1999 22.06.1999 044 Bursa 16.06.1999 22.06.1999 045 Bursa 16.06.1999 30.06.1999 046 Bursa 16.06.1999 30.06.1999 047 Bursa 16 .06.1999 Alına mad ı Te l e f o n Cihazının Cinsi T E L E TA Ş Hitit -480 T E L E TA Ş Hitit -480 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 ERICSSON TD-1 B a ğ la n tı K u r u la n Sa ntra l Cinsi Analog Analog Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal Sayısal 55 Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e . Kod Alındığı 1nci No. Ta r i h i Ye r Kayıt 2nci Kayıt Ta r i h i Te l e f o n Cihazının Cinsi ERICSSON 048 Bursa 16 .06.1999 Alına mad ı 049 An ka ra 16.06.1999 22.06.1999 050 An ka ra 16.06.1999 22.06.1999 051 Bursa 052 TD-1 B a ğ la n tı K u r u la n Sa ntra l Cinsi Sayısal ERICSSON Sayısal+Dah TD-1 ili Abone ERICSSON Sayısal+Dah TD-1 ili Abone 16.06.1999 22.06.1999 SIMENS Analog Bursa 16.06.1999 22.06.1999 SIMENS Analog 053 Bursa 16.06.1999 22.06.1999 SIMENS Analog 054 Bursa 16 .06.1999 Alına mad ı SIMENS Analog 055 İstanbul 20.06.1999 31.06.1999 PA N A S O N I C Sayısal Adli bilim (Forensi k) alanında i nsan sesi tanıması/ onayl amasına yönelik bi r al goritmanın geliştiril mesi ne yardımcı ol acak bu ses veri tabanı örnekl emi kaydında SONY TCM-5000EV markalı profesyonel ol mayan herkesi n bul abileceği bir tel efo n hattına bağl anabilir 56 k a y ı t c i h a z ı k ul l a n ı l m ı ş t ı r. B u n u n n e d e n i , a d l i v a k a l a r d a delil olarak sunul an ses kasetl erin profesyonel ol mayan c i h a z l a r v e k i ş i l e r c e k a y d e d i l m e s i n d e n d o l a y ı d ı r. S e s kayıtları TDK IECII/TYPE II SF100 markalı kasetl ere k a y d e d i l m i ş t i r. K a y ı t s e v i y e s i s e s ş i d d e t i n e g ö r e m i n - 1 , m a x - 2 ‘ d e t u t u l m u ş t u r. Ve r i toplama i şlemi bitti kten s o n r a ; s e s l e r b i l g i s a y a r o r t a m ı n a S O N Y Tc - D 5 M k a s e t ç a l a r ı y l a b i l g i s a y a r o r t a m ı n a a t ı l m ı ş t ı r. Sound Forge 4 . 0 . ( S o ni c F o u n d r y I n c . , 1 9 9 6 ) s e s i ş l e m e y a z ı l ı m ı y l a “ w a v ” f o r m a t ı n d a k a y d e d i l m i ş t i r. K a y ı t 8 k H z , 8 b i t ’ d e n i c e m l e n e r e k i ş l e n m i ş t i r. Konuşmacıların Demografik Dağılımı 3.3. Konuşmacıların sırasıyl a ci nsi yet, yaş, eğitim düzeyi ve lehçe deği şiklikl eri ne p l a n l a n m ı ş t ı r. göre Konuşmacıl ara dengeli ait dağılımı demografig bilgiler Ç i z e l g e 4 . 2 . ’ d e v e r i l m i ş t i r. Çi zelgeden Ege’den 3, İç de g ö r ül d ü ğ ü Anadol u’dan gi bi 29, Marmara’dan 8, K a r a d e ni z ’ d e n 5, Akdeni z’den 5 ve Doğu Anadol u’dan 5 denekten topl am 5 5 s e s ö r n e ğ i a l ı n m ı ş t ı r b u n l a r ı n 11 ' i b a y a n , 4 4 ’ ü e r k e k k o n u ş m a c ı d ı r. B u r a d a k o n u ş m a c ı l a r ı n d o ğ d u k l a r ı y e r l e r d e ğ i l b ü y ü d ü k l e r i y e r l e r g ö z ö n ü n e a l ı n m ı ş t ı r. B u n u n nedeni ise ül k e m i z i nsanl arının iş b ul m a n e d e ni y l e meml eketl eri nden uzakl aşmal arı, çocukl arın yerl eşil en yerde büyümel eri ve oranın ş i v e s i ni k ul l a n m a l a r ı d ı r. 57 D e n e k l e r i n i k i s i i l k o k ul , 3 3 ' ü lise ve 20'si yüksek okul m e z u n u d u r. Çizelge 3.5 Ses örneği alınan denekl eri n, ci nsi yet, yaş eğiti m düzeyi ve büyüdükleri yerleri (l ehçe kri teri içi n) gösterir çi zel ge. K o n u şma cı Kodu Cinsiyeti Ya ş ı Eğitim Büyüdüğü Düzeyi Şehir 01 Erkek 30 Üni versi te Te k i r d a ğ 02 Erkek 30 Üni versi te Kayseri 03 Bayan 21 Üni versi te Ankara 04 Erkek 25 Li se Çorum 05 Bayan 24 Li se Karaman 06 Erkek 33 Li se Bursa 07 Erkek 39 Üni versi te To k a t 08 Erkek 31 Li se Ankara 09 Bayan 27 Üni versi te Mersi n 010 Bayan 26 Üni versi te Ankara 0 11 Erkek 28 Üni versi te İzmi t 012 Bayan 26 Üni versi te İzmi r 013 Erkek 40 Üni versi te Si vas 014 Erkek 30 Üni versi te İzmi t 015 Erkek 30 Li se Bal ıkesi r 016 Erkek 28 Li se Ordu 017 Erkek 29 Li se Ankara 018 Erkek 29 Li se Si vas 019 Erkek 26 Üni versi te Adana 020 Erkek 22 Li se Amasya 021 Erkek 31 Li se To k a t 58 Ç i z e l g e 3 . 5 ( D e v a m ı ) S e s ö r ne ğ i a l ı n a n d e n e k l e r i n , ci nsiyet, yaş eğiti m düzeyi ve büyüdükl eri yerl eri (lehçe kri teri içi n) gösterir çi zel ge. K o n u şma cı Kodu Cinsiyeti Ya ş ı Eğitim Büyüdüğü Düzeyi Şehir 022 Erkek 30 Li se Osmaniye 023 Bayan 26 Li se Kırıkkal e 024 Erkek 27 Üni versi te El azığ 025 Bayan 29 Üni versi te Ankara 026 Bayan 29 Li se Ankara 027 Erkek 28 Li se Ordu 028 Erkek 20 İ l k o k ul Ri ze 029 Bayan 30 Li se Ankara 030 Bayan 27 Üni versi te Ankara 031 Erkek 21 İ l k o k ul Ankara 032 Erkek 36 Üni versi te Afyon 033 Erkek 26 Li se Aksaray 034 Erkek 25 Üni versi te Ankara 035 Erkek 29 Li se Afyon 036 Erkek 33 Li se Kırıkkal e 037 Erkek 23 Li se Mersi n 038 Erkek 37 Üni versi te Mal atya 039 Erkek 34 Li se Gazi antep 040 Erkek 21 Li se E s k i ş e hi r 041 Erkek 32 Li se Konya 042 Erkek 30 Li se Ankara 043 Erkek 21 Li se Ankara 59 Ç i z e l g e 3 . 5 ( D e v a m ı ) S e s ö r ne ğ i a l ı n a n d e n e k l e r i n , ci nsiyet, yaş eğiti m düzeyi ve büyüdükl eri yerl eri (lehçe kri teri içi n) gösterir çi zel ge. K o n u şma cı Kodu 3.4. Ya ş ı Cinsiyeti Eğitim Büyüdüğü Düzeyi Şehir 044 Erkek 29 Üni versi te Kırıkkal e 045 Erkek 34 Li se Kayseri 046 Erkek 32 Li se N e v ş e hi r 047 Erkek 32 Li se Ankara 048 Erkek 28 Li se E s k i ş e hi r 049 Erkek 28 Li se Osmaniye 050 Erkek 31 Li se Bol u 051 Bayan 25 Üni versi te E s k i ş e hi r 052 Bayan 18 Li se E s k i ş e hi r 053 Erkek 53 Li se E s k i ş e hi r 054 Erkek 18 Li se Bursa 055 Erkek 34 Üni versi te İstanbul Konuşmacılardan Kaydedilecek Materyalin Seçimi Konuşmacıdan topl anacak materyal P O LY P H O N E s t a n d a r d ı n d a b e l i r t i l d i ğ i g i b i h e m k a ğ ı t ta n o k u n a n h e m d e s p o n t a n o l a r a k s ö y l e t i l e n s ö z c e l e r d e n s e ç i l m i ş t i r. Böyl ece okuma ve doğal konuşma arasındaki farkl arın i ncel enmesi ne ol anak tanınmış ol acağı gibi , konuşma tanıma si steml eri farkl ı tipte söylenen sö zcel er üzeri nde 60 de d e n e n e b i l e c e k t i r. T ü r k ç e - P O LY P H O N E veri tabanı örneklemi nde 32’si kağıttan okunan, 17’i spontan ol arak söyl etil en topl am 49 sözce bul unmasına karar v e r i l m i ş t i r. K a ğ ı t ta n O k u n a c a k M a t e r y a l 3.5. K a ğ ı t t a n o k u n a c a k m a t e r y a l ç i z e l g e 4 . 3 ’ d e v e r i l m i ş t i r. Çizelge 3.6. örneklemi nde dökümü. T ü r k ç e - P O LY P H O N E kağıttan okutul an veri tabanı sözcükl eri n Adet Açıklama ve örnek Konuşmacı kodu 1 S a y ı d i zi l e r i 3 Te l e f o n n u m a r a s ı 1 Ard arda ayrık rakam di zi si 2 Reel sayılar 3 Ta r i h 1 Saat 1 Ye r ( ş e h i r ) a d ı 3 Uygul ama sözcüğü 4 01-50 arası bir sayı 312-231-763 68-99-20 7-5-1-2-1-3-4-8 0-212-456-38-79 Ye d i - d ö r t - a l t ı - ü ç - b e ş - i k i - b i r seki z Dokuz-dört-sıfır-yedi-i ki-altıüç Seki z-beş-bi r 4 kilo, 2 metre, 9 santi m Ya l n ı z c a b i r i ni o k u y u n u z . 10 KASIM 1938 13 EKİM 1974 31 AĞUSTOS 1995 Ya l n ı z c a b i r i ni o k u y u n u z . İki yi beş geçiyor Seki z on al tı Dokuza on var A n k a r a , İ z m i r, İ s t a n b u l Bil et, Rezervasyon, Hesap, Kredi kart 61 Ç i z e l g e 3 . 6 . ( D e v a m ı ) T ü r k ç e - P O LY P H O N E v e r i tabanı örnekl emi nde kağıttan okutul an sözcükl eri n dökümü. Adet Açıklama ve örnek Harf harf söylenen sözcük 2 Uygul ama sözcüğü geçen tümce 2 Ayrık sözcük 2 Fonetik açıdan zengi n tümce 5 Sözcük yakal ama amaçl ı sözce 2 To p l a m 3.5.1. A-N-K-A-R-A , B-E-G-Ü-M Mavi trene i ki bilet i stiyorum. Otel rezervasyonu yaptırmak isti yorum Bankadan kredi kartı aldım. Ci mbomun maçına gelir mi si n? A-B-F-8-C I-E-5-D-K Cumhurbaşkanı Sül eyman D e m i r e l G a zi a n t e p e g i t t i . Çıkrıkçılar yokuşunda bi r camcı dükkanında Pazar günü tüp patl adı. Milli Eğiti m Bakanı Şubat tatili nde öğrencilere fazla ev ö d e v i v e r i l m e m e s i ni i s t e d i . Hemen İstanbul ’a gitmem g e r e k i y o r. Ankara’dan İstanbul’a hep trenle giderim. 32 Konuşmacı Kodu Konuşmacı kodu, ses örneği topl anırken sesi alınan d e n e k l e r i n g e r ç e k i s i m l e r i ni s ö y l e m e s i k o n u s u n d a b i r 62 t e d i r g i n l i k y a r a t m a m a s ı i ç i n i s i m l e r i s o r ul m a m ı ş b u n u n yeri ne iki basamaklı bi r kod numarası okuması i s t e n m i ş t i r. Ö r n e ğ i n s ı f ı r - o n i k i g i b i . 3.5.2. Sayı Dizileri S a y ı d i zi s i o l a r a k k r e d i k a r t n u m a r a l a r ı n ı a n d ı r a n ü ç e r l i , iki şerli ve bi rerli sayıl ar o k u t u l m u ş t u r. Konuşmacı b u n l a r ı ü ç e r l i , i k i ş e r l i v e b i r e r l i o k u m u ş t u r. B u d i z i l e r seçilirken, rakaml arın dengeli dağıl ımı na dikkat e d i l m i ş t i r. 3.5.3. Te l e f o n N u m a r a s ı Böl ünmüş on konuşmacıya bir basamaklı okutulmuş. bi r telefon Te l e f o n numarası numaralarının okunması büyük bir çoğunl uk tarafından şehirl er arası içi n s ı f ı r, al an kodu(üç’l ü bi r numara) ve telefon n u m a r a s ı n ı n ( ü ç - i k i - i k i g r u p l u ) s ö y l e n m e s i i l e i l e t i l i r. B u nedenl e denekleri n hepsi nden telefon numaral arının bu ş e k i l d e o k u n m a s ı i s t e n m i ş t i r. 3.5.4. A r d Ar d a Ay r ı k R a k a m D i z i s i Konuşmacıların kendil eri ne verilen kağıtta yer al an 8, 7 ve 3 rakamlı bir d i zi y i tek tek rakamlar hali nde o k u m a l a r ı i s t e n m i ş t i r. ( ö r n e ğ i n 4 - 2 - 3 - 6 - 9 - 8 i ç i n d ö r t - i k i üç-altı-dokuz-seki z gi bi). 63 3.5.5. Reel Sayılar İki tanesi biri mli ol acak bi çimde seçilmi ş reel sayıl ar k o n u ş m a c ı l a r a o k u t u l m u ş t u r. Ö r n e ğ i n 4 k i l o , 2 m e t r e g i b i . S a y ı l a r ı n o l m a s ı t e r c i h e d i l m i ş t i r. B i r i m l e r l i r a , g r a m , k i l o , k i l o g r a m , t o n , l i t r e , s a ni y e , d a k i k a , g ü n , hafta, yıl , milim, milimetre, santim, santi metre, metre, k i l o m e t r e , v e l i t r e o l a r a k s e ç i l m e l i d i r. 3.5.6. Gün Ta r i h ve ay isiml eri dengeli dağılmış olarak o k u t u l m u ş t u r. Ö r n e ğ i n “ 1 0 K a s ı m 1 9 3 8 ” g i b i . 3.5.7. Saat Bi rçok dil de ol duğu gi bi Türkçe’de de saat çeşitli b i ç i m l e r d e s ö y l e n m e k t e d i r. B u n u n i ç i n k o n u ş m a c ı l a r a dağıtıl an kağıtl arda saati n çeşitli bi çiml erde yazılışına d i k k a t e d i l m i ş t i r. Ö r n e ğ i n , “ İ k i y i b e ş g e ç i y o r ” , “ S e k i z - o n al tı”, “Dokuza on var”. 64 3.5.8. Ye r ( ş e h i r ) Ad ı Ş e h i r a d l a r ı b i r ç o k u y g u l a m a d a b ü y ü k ö n e m e s a hi p ol duğunda n konuşmacılara Türkiye’deki yerleşim olarak en büyük uygul ama il isi mleri o k u t u l m u ş t u r. sözcükl eri içi nde en Bunun çok nedeni k ul l a n ı l ı y o r o l m a s ı n d a n d ı r. 3.5.9. Uygulama Sözcüğü Te l e f o n v a s ı t a s ı y l a o t o m a t i k o l a r a k y a p ı l a n k o n u ş m a tanıma t a b a nl ı uygul amal ar sözcükl er ve rezervasyon, uygul amal arda örneklem de banka hesabı geçebilecek yer a l m ı ş t ı r. gibi anahtar U y g ul a m a sözcükl eri “bilet”, “rezervasyon”, “hesap”, “kredi kartı”, “ m a ç ” , “ t r e n ” g i b i d i r. 3.5.10. Har Harf Söylenen Sözcük Ve r i l e n s ö z c ü k l e r i k o n u ş m a c ı l a r ı n h a r f , h a r f s ö y l e m e l e r i i s t e n m i ş t i r. Sözcükleri n dengeli olarak dağıl masına d i k k a t e d i l m i ş t i r. 3 . 5 . 11 . U y g u l a m a S ö z c ü ğ ü G e ç e n T ü m c e Bu tümceler içl eri nde yukarıda ayrıntıları açıkl anan u y g u l a m a s ö z c ü k l e r i g e ç e c e k b i ç i m d e s e ç i l m i ş t i r. B i r 65 t ü m c e b i r d e n f a z l a u y g u l a m a t ü m c e s i i ç e r m i ş t i r. Ö r n e ğ i n “Mavi trene bir bilet istiyorum” tümcesi hem bil et hem d e t r e n u y g u l a m a s ö z c ü k l e r i ni i ç e r m e k t e d i r. 3 . 5 . 1 2 . Ay r ı k S ö z c ü k Ayrık sözcük tanıma si steml eri içi n konuşmacıdan eli ndeki kağıtta yazıl ı ol an ayrık sözcükleri okunması i s t e n m i ş t i r. Ayrık sözcükl er Türkçe’ni n ikili ses k o m b i n a s y o nl a r ı n ı m ü m k ü n o l d u ğ u n c a g e n i ş b i r b i ç i m d e i ç e r m e s i n e d i k k a t e d i l m i ş i t i r. 3 . 5 . 1 3 . F o n e t i k Aç ı d a n Z e n g i n T ü m c e B u b ö l ü m d e k o n u ş m a c ı l a r a T ü r k ç e ’ ni n b ü t ü n i k i l i s e s k o m b i n a s y o nl a r ı mümkün olduğu kadar deği şik bağl amlarda kapsayan ve mümkün ol duğu kadar zengi n tümceler o k u t u l m u ş t u r. Bunl arın yanında tümce seçi mi nde, tümcel eri n çok uzun ol mamasına (80 harfl e s ı n ı r l ı o l m a s ı ) d i k k a t e d i l m i ş t i r. 3 . 5 . 1 4 . S ö z c ü k Ya k a l a m a A m a ç l ı S ö z c e Kağıttan okutul an materyali n son böl ümünde, sözcük yakal ama si steml eri sözcükl eri n önceden geçtiği belirtildiği içi n, iki tümce gibi şehir i çi nde yakalanacak o k u t u l m u ş t u r. isi mleri Daha yakalanacak 66 hedef sözcük ki tlesi olarak düşünül ürse, bu böl ümde, içi nde şehir ismi geçen iki tümce o k u t u l m u ş t u r. Bürünsel (prosodi c) açıdan zenginli k sağl amak amacıyl a b u t ü m c e l e r d e ş e h i r i s i m l e r i ni n t ü m c e n i n b a ş , o r t a v e son tarafında yakl aşık eşit oranda geçmesi ne dikkat e d i l m i ş t i r. 3.6. S p o n ta n S ö y l e t i l e c e k M a t e r y a l Sp o n t a n o l a r a k y a n ı t l a n a n s o r u l a r ı n d ö k ü m ü Ç i z e l g e 4.4’de v e r i l m i ş t i r. sorul acak bi rkaç Burada sorul ar defa denekl ere verilmiş, okuyarak kayıt daha önceden başlamadan verecekleri yanıtl ara ol arak yanıtl aması önce hazırl ıkl ı o l m a l a r ı i s t e n m i ş t i r. Denekleri n sorul ar doğru şunl ardır: beli rlenmesi kayıt içi n “Bugünün dağılımının doğru nedi r?” denekl eri n ve eği tilmi ş t a r i hi n i n t a r i hi yapıl abil mesi i nsanl arın eğiti m tepki ve i çi n doğru olarak nedi r?”, “doğum s e v i y e l e r i ni organi ze istenen yaş ta r i ni z öl çmek ve yetenekl eri ni n ö l ç ü m ü i ç i n “ e ğ i t i m s e v i y e ni z n e d i r ? ” s o r ul a r ı n a d o ğ r u yanıt verilmesi al ınırken de i s t e n m i ş t i r. doğru alarak Bu yanıtla r söyl enmesi i ki nci defa i s t e n m i ş t i r. Bunl arın dışında kal an di ğer sorul ar biri nci ve i ki nci k a y ı t i ç i n k o n u ş m a c ı n ı n i s t e ğ i n e b ı r a k ı l m ı ş t ı r. 67 Ç i z e l g e 3 . 7 T ü r k ç e - P O LY P H O N E v e r i ta b a n ı örneklemi nde spontan olarak söyletil ecek sözceleri n dökümü. Ad e t Aç ı kla ma v e Örn e k E v e t / H a y ı r Ya n ı t l ı s o r u 5 Ya ş a d ı ğ ı n ı z Ş e h r i n i s m i ? 1 Bugünün tari hi nedir? 1 Şu anda saat kaç? 1 D o ğ u m t a r i hi n i z n e d i r ? 1 Ya ş ı n ı z k a ç ? 1 Kapı numaranız? 1 Ve y a b i r s a y ı s ö y l e y i n . Te l e f o n n u m a r a n ı z 1 Ve y a h e r h a n g i b i r tel efon numarası o l a b i l i r. nedi r? B i r i s i m s ö y l e y i ni z 1 Hangi şehirde büyüd ünüz? C i n s i y e t i ni z n e d i r ? 1 E ğ i t i m s e v i y e ni z n e d i r ? E n s e v d i ğ i ni z T V programı nedi r? To p l a m E v l i m i s i ni z ? Çocuğun var mı? Babanız sağ mı? Yu r t d ı ş ı n d a bul undunuz mu? Ya b a n c ı d i l b i l i y o r musunuz? 1 1 1 17 orta öğretim =1 Li se =2 Üni versi te =3 68 Eği tim sevi yesi hakkındaki soruya beklenen yanıt 1,2 ve 3 olmak üzere k i ş i ni n hangi eğiti m kategori si ne g i r d i ğ i n e i l i ş k i n b i r s a y ı d ı r. K o n u ş m a c ı n ı n b u s o r u y a hazırl ıklı olması içi n bu d a ğ ı t ı l a n m e t i n d e y a z ı l m ı ş t ı r. soru hakkında açıkl ama 69 5 . B U L G U L AR T ü r k ç e K o n u ş m a v e K o n u ş m a c ı Ta n ı m a y a Y ö n e l i k Ve r i Ta b a n ı Ö r n e k l e m i b i r i n c i b ö l ü m d e i n c e l e n e n 1 6 a d e t çeşi tli dillere Çi zelge ait veri 5.1.’de tabanıyla v e r i l m i ş t i r. ol an k arşıl aştırması Bu 16 veri tabanı P O LY P H O N E s t a n d a r t l a r ı n ı n b i r k ı s m ı n ı k a r ş ı l ı y o r o l s a da yapılan örneklemi n standartl ara uygunl uğu açısından bi r fiki r vermesi içi n karşıl aştırması v e r i l m i ş t i r. Ç i z e l g e d e v e r i çi zelgede tabanını n kul lanım amacı, ö r n e k l e n d i ğ i f r e k a n s , ni c e m l e m e s a y ı s ı v e d e n e k s a y ı s ı v e r i l m i ş t i r. Ya p ı l a n al ınan Türkçe sesler 8 örnekl emde Khz’de tel efon örnekl enmi ş, üzeri nden 8 bi t’de n i c e m l e n m i ş t i r. Ç i z e l g e ni n s o n u n d a o l u ş t u r u l a n T ü r k ç e ö r n e k l e m i n d e ğ e r l e r i v e r i l m i ş t i r. B u r a d a n d a g ö r ü l e c e ğ i gi bi veri tabanı bi r örneklem olmasına rağmen, birçok veri tabanındaki denek t a b a n l a r ı n d a n f a z l a d ı r. ve sözce sayısı di ğer veri 70 Çizelge 5.1. Deği şik diller içi n topl anan ses örnekleri il e yapıl an örnekl emi n karşılaş tırılması. Kayıt şekli Khz Bit Kayıt cinsi Den ek Sayı sı Cümle sa yı sı Hava dol aşımı bil gi si stemleri 16 16 Ya k ı n mi krofon 10 - Konuşmacı tanıma 10 16 Mi krofon 50 - Hari talar üzeri nde çeşitli 20 bil gileri n tanımlanması 16 St e r o Mi krofon 128 - 52 - İn cel en en Ve ri tab anı Kull an ım alanı AT I S Ve r i Ta b a n ı BRAMSHILL Ve r i Ta b a n ı HCRC Map Ta s k Ve r i Ta b a n ı K I N G Ve r i Ta b a n ı Konuşmacı tanıma 8 16 Te l e f o n MACROPHO N E Ve r i Ta b a n ı Konuşmacı tanıma 8 8 Te l e f o n OGI SPELLED ve SPOKEN Ve r i Ta b a n ı Konuşmacı tanıma 8 8 Te l e f o n 125 - PHONEBOO K Ve r i Ta b a n ı Ayrık sözcük tanıma 8 8 Te l e f o n 12 7979 Sözcük D A R PA RESOURCE MANAGEME NT (RM1) Ve r i Ta b a n ı Deni zcilikl e ilgili Konuşmacıdan bağımlı, konuşmacıdan bağımsız 20 16 Mi krofon 160 - 90 5000 Sözcük 71 Çizelge 5.1. (Devamı) Değişi k diller içi n toplanan ses örnekleri il e yapıl an örnekl emi n karşılaştırılması. İn cel en en Ve ri tab anı ROAD R A L LY Ve r i Ta b a n ı Kull an ım alanı Kayıt şekli Khz Bit Doğal konuşma içi nde sözcük 10 yakal ama Kayıt cinsi Den ek Sayı sı Cümle sa yı sı 16 St e r o Mi krofon 56 20 Sözcük SW ITCHB O A R D Ve r i Ta b a n ı Konuşma ve konuşmacı tanıma 8 8 Te l e f o n 500 3000 Sözcük SPIDRE Ve r i Ta b a n ı Konuşmacı tanıma 8 8 Te l e f o n 45 - SW ITCHBOARD EXCERPTS Ve r i Ta b a n ı Sözcük yakal ama 8 16 Mi krofon - 35 diyalog T I 4 6 Ve r i Ta b a n ı S ö z c ü k Ta n ı m a 8 16 Mi krofon 16 46 TIDIGITS Ve r i Ta b a n ı Konuşmacıdan bağımsız tanıma 20 12.5 Mi krofon 326 33 sözcük TIMIT VE N T I M I T Ve r i Ta b a n ı Konuşma tanıma 8 8 Te l e f o n 630 6300 tümce Y O H O Ve r i Ta b a n ı Konuşmacı doğrulama 8 12 Mi krofon 138 136 sözcük TÜRKÇE VERİ TA B A N I ÖRNEKLEMİ Konuşma ve konuşmacı tanıma 8 8 Te l e f o n 55 49 sözcük 72 T ü r k ç e K o n u ş m a v e K o n u ş m a c ı Ta n ı m a y a Y ö n e l i k Ve r i Ta b a n ı hazırl anan Örnekl emi bazı veri P O LY P H O N E t a b a nl a r ı ile standarda karşıl aştırıl ması Ç i z e l g e 5 . 2 . ’ d e v e r i l m i ş t i r. B u r a d a o k u n a n s ö z c e i l e spontan sözce m i k ta r l a r ı VA J veri tabanı hariç bir bi rl eri ne yakın ol masına rağmen k ull anıl an denek sayısı M a c r o p h o n e v e r i t a b a n ı n d a 5 0 0 0 , VA J v e r i t a b a n ı n d a y a k l a ş ı k 2 5 0 0 , VA H A v e r i ta b a n ı 9 1 5 , D u t c h P o l y p h o n e v e r i ta b a n ı n d a 5 0 5 0 d i r. Çizelge 5.2. P O LY P H O N E s ta n d a r d ı n a g ö r e ol uşturul an veri tabanl arı il e Türkçe veri tabanı ö r n e k l e m i ni n k a r ş ı l a ş t ı r ı l m a s ı . Macrop -hone VAJ VAH A Dutch Türkçe Poly- Ve r i p h o n e Ta b a n ı Örneklemi Okuna n sözce Sp o n t a n sözce To p l a m sözce 34 10 36 32 32 11 4 9 18 17 45 14 45 50 49 Ve r i t o p l a m a d a s o r u c e v a p b ö l üm ü n d e t o p l a m 1 3 s o r u s o r ul m u ş t u r, s o r u l a r a b a z ı d e n e k l e r i n v e r d i k l e r i hatal ı cevaplar nedeni yle sesler bil gisayarda i şlenirken bu böl üml er ç ı k a r t ı l m ı ş t ı r. Bunun nedeni ; sorul ar 73 d e n e k l e r e s o r ul d u ğ u n d a v e r i l e n y a n l ı ş y a n ı t l a r ı n v e y a okumaların tekrar edil mesi bu nedenl e ol uşan l üzums uz k o n u ş m a l a r ı n v e r i t a b a n ı n ı k i r l e t m e s i d i r. S e s l e r i n C D ’ y e kaydedilirken sesl eri n bi r işl enmiş hali birde işlenmemi ş hali k a y d e d i l m i ş t i r. üzeri nde çal ışacak Bunun nedeni , bu içi n ilgi nç i nsanl ar veri tabanı olabilecek k a y ı t l a r ı n b ul u n a b i l e c e ğ i v e b i r u y g u l a m a d a i ş l e n m i ş bi r ses ile i şlenmemi ş ses arasındaki bi r ilişki k u r u l a b i l e c e ğ i d ü ş ü n ü l m ü ş t ü r. S e s k a y ı t l a r ı n ı n t o p l a m ı 2 3 0 M b o l u p b i r C D - R O M ’ a y a z ı l m ı ş t ı r. 74 6. SONUÇ VE DEĞERLENDİRME Bu tezi n konus u ol an Türkçe veri tabanı örnekl emiyl e ne amaçl andığı bi ri nci böl ümde bahsedilmi şti . Bu veri tabanı bi ze farkl ı zamanl arda al ınan sesl eri n zaman içi nde ne gi bi değişi klikler göstereceği ve aynı k e l i m e l e r i k o n u ş m u ş o l s a d a hi k i ş i l e r a r a s ı n d a k i s e s benzerli ği/farkl ılıklarını ortaya koymayı s a ğ l a m ı ş t ı r. A y r ı c a s e s a n a l i z i ni n h u k u k a l a n ı n d a k a b ul e d i l i r l i ğ i ni n n e o l m a s ı g e r e k t i ğ i i n c e l e n m i ş t i r. 6.1. Hukuki İnceleme Son yıll arda ilerleyen teknol ojiyle beraber i nsan sesi yol uyl a i şlenen suçl arda da büyük bi r artış meydana g e l m i ş t i r. S u ç ç e ş i t l i l i ğ i v e y o ğ u n l u ğ u i s e c i n s e l t a c i z , t e h d i t v e r ü ş v e t o l a y l a r ı n d a o r t a y a ç ı k m a k t a d ı r. B u t i p suçl arl a yoğun ol arak karşılaşan mahkemel er bu tür delilleri nasıl değerlendi recekl eri kanunda açık ol arak yer almadığı içi n veya hangi şartl ar al tında el de edilen s e s l e r i n d e l i l n i t e l i ğ i o l a c a ğ ı ta r t ı ş m a s ı n ı b a ş l a t m ı ş t ı r. Bili ndi ği gi bi ceza mahkemesi nde, maddi gerçek a r a ş t ı r ı l ı r. B u n e d e nl e h e r ş e y d e l i l d i r. H a k i m k a r a r ı n ı d e l i l l e r l e d o ğ r u d a n d o ğ r u y a t e m a s a g e ç e r e k v e r i r, b u durum vasıtasızlık ilkesi olarak anıl ır (CMUK Md.254, 1983). 75 Ceza yargılamaları mevzuatı konusunda yazıl an bir çok kitapta bant kayıtlarının ispat gücü konusund a y a z a r l a r ı n f a r k l ı d ü ş ü n c e l e r d e o l d u ğ u g ö r ü l m e k t e d i r. B i r k ı s ı m y a z a r, b a n t k a y ı t l a r ı n ı n d e l i l o l a m a y a c a ğ ı a n c a k b i r k e ş i f o l a b i l e c e ğ i ( Ye n e r, 1 9 9 8 ) y a z m a k ta d ı r. D i ğ e r bi r görüş ise hukuka uyg un şekil de elde edilen ve topl umun y üksek çıkarlarının haklı kılınması hali nde, bu gi bi d e l i l l e r i n k u l l a n ı l a b i l e c e ğ i ni ve her türl ü delili n ( b a n t k a y ı t l a r ı d a hi l ) g e ç e r l i o l d u ğ u n u b e l i r t m e k t e d i r ( Yu r t c a n , 1 9 9 4 ) . Buradan konuda savunan da ol dukça görül düğü gi bi farklı görüşl er hukukç ul arın geli şen hu k u k i v a r. al anda bu Bi ri nci görüşü teknol ojiyl e sesler ü z e r i n d e h e r n e k a d a r o y n a n a b i l e c e ğ i ni s ö y l e s e l e r d a h i bunl arın tespi ti nde b u l u n a b i l e c e ğ i ni de hesaba gelişen teknol ojiyl e katmadıkl arı birlikte g ö r ü l m e k t e d i r. İ k i n c i g ö r ü ş i s e t a m a m e n k a t ı l m a k g e r e k i y o r, ç ü n k ü b i r ol ayın aydınl atıl ması içi n kanuni yol dan el de edilen her t ü r l ü d e l i l d e ğ e r l e n d i r i l m e l i v e k a b u l e d i l m e l i d i r. Ya n i b i r o l a y ı n n a s ı l m e y d a n a g e l d i ğ i ni , h a k a r e t , t e h d i t , ş a n t a j ve buna benzer ol ayların kimler tarafından ve nasıl yapıl dığı bant kayıtlardan el de edil ebiliyorsa neden bi r d e l i l o l a r a k k a b u l e d i l m e k i s t e n m e d i ğ i ni a n l a m a k z o r. H e r d e l i l i n a r k a s ı n d a b i r m a s um s a n ı ğ ı n o l a b i l e c e ğ i u n u t u l m a m a l ı d ı r. A d l i v a k a ni t e l i ğ i k a z a n m ı ş o l a y l a r d a d e l i l o l a r a k i ncel enen ses kayıtl arı bi r çoğu sami mi ortaml arda kayıt 76 e d i l m i ş t i r. Sanık konumunda ol an şahsın s e s i ni d e ğ i ş t i r m e s i / p e r d e l e m e s i m ü m k ü n d e ğ i l d i r. B ö y l e o l m a s ı d u r u m u n d a d a h i ç e ş i t l i b i l i m s e l m e t o t l a r k ul l a n ı l a r a k k i ş i y e ö z g ü n s e s ö z e l l i k l e r i b u l u n a b i l i r. İ n s a n s e s i ni n d e l i l o l a r a k d e ğ e r l e n d i r m e s i b i r ç o k ül ke tarafından k u l l a n ı l m a k ta d ı r (Ameri ka, Almanya, F r a n s a , İ ta l y a , İ n g i l t e r e . . . g i b i ) . D ü n y a d a k i b u g e l i ş m e l e r Türkiye’ye de yansımış ve bir çok adli ol ayda s es delil o l a r a k k ul l a n ı l m ı ş t ı r. Bili m adamlarımız konuşmacı tanıma ve konuşma onayl ama gi bi ses işl eme konusunda ki çal ışmalarını hızl ı bi r şekilde s ü r d ü r m e k t e d i r l e r. Türki ye de bu k o n u d a ç a l ı ş m a y a pa n t ü m ü n i v e r s i t e l e r “ S i n y a l İ ş l e m e ve U y g ul a m a l a r ı (Sİ U)” başlığı al tında kurul tayl ar düze nl eyi p, bu alanda kendilerini n yaptığı çal ışmaları ve dünyadaki yapmış geli şmel eri oldukl arı a n l a t m a k t a d ı r l a r. araştırmalar kendi Fakat çevrel eri nden a l d ı k l a r ı b i r k a ç s e s ü z e r i n d e o l m a k t a d ı r. Ya n i t i c a r i v e adli al anında uygulama denenebil eceği bir yabancı hazırl anmış dilde Türkçe geli ştirilen veri veri tabanı si steml eri n olmadığı t a b a nl a r ı i çi n üzeri nde y a p m a k ta d ı r l a r, t a b i b u n u n s o n u c u n d a d a i s t e n e n v e r i m a l ı n a m a m a k ta d ı r. Bu tezi n sonucunda elde edilecek olan Türkçe ve ri tabanı örnekl emi ile yukarıda bahsedilen b i r a z d a o l s a g i d e r i l e b i l e c e ğ i d ü ş ü n ü l m ü ş t ü r. sıkıntının 77 6 . 2 . Ve r i Ta b a n ı Örneklemini Oluşturan Seslerin İncelenmesi Bu çal ışma sonuc unda 43 erkek ve 12 bayan birer hafta a r a y l a i k i d e f a s e s ö r n e k l e r i a l ı n m ı ş t ı r. K o n u ş m a c ı l a r ı n bi r hafta sonra sesl eri nde meydana gel en değişi klikler (perde, formant i n c e l e n m i ş t i r. frekansı, Bunl ara ai t spektrogram,...gibi ) i ncel emel er aşağıda v e r i l m i ş t i r. Şekil 6.1.’de spektrografi k i ncelemede; üsteki ilk al ınan ses, al ttaki i se bir hafta sonra aynı ortamda al ınmış sesi n parametri k eşleşmede özellikl e biri nci ol madığı s p e k t r o g r a m ı d ı r. çok ses arasındaki farkl ılıklar ol duğu, formant frekansl arında bir değişi mi n g ö zl e n m i ş t i r. “Cumhurbaşkanı az İki Burada Sül eyma n kull anıl an Demi rel”di r bu tümce tümceni n u z u n l u ğ u 2 s a n i y e d i r. Şekil 6.2. konuşmacının Parametrik aynı tümceyi spektrografi k eşl eşmel erde kullanan incel emesi farklılıkl ar farkl ı iki y a p ı l m ı ş t ı r. olduğu, özelli kle bi ri nci ve iki nci formant frekanslarında değişimi n fazla o l d u ğ u g ö z l e n m i ş t i r. B u r a d a k ul l a n ı l a n t ü m c e “ C u m h u r Başkanı Sül eyman Demi rel ”dir bu tümce ni n uzunl uğu 2 s a n i y e d i r. 78 Şekil 6.1. Aynı ki şiye ait bir hafta arayla al ınmış sesl eri n karşıl aştırıl ması 79 Şekil 6.2. Aynı tümceyi kulla nan k o n u ş m a c ı l a r ı n s e s l e r i ni n k a r ş ı l a ş t ı r ı l m a s ı farklı 80 Ses parametrel eri doğal süreç i çersi nde çeşitli d e ğ i ş m e l e r e u ğ r a m a k t a d ı r. B u d e ğ i ş i k l i k m a t e m a t i k s e l ortal amal arı hesapl anarak kişi ye özgün bir o r ta l a m a s o n u c u n b u l u n a b i l m e k t e d i r. Konuşma taklidi , perdel eme gibi konuşmacını n s e s i ni d e ğ i ş t i r m e e ğ i l i m l e r i m üm k ü n o l m a s ı n a r a ğ m e n kendi sesi ne özgün karakterl eri n tespi ti mümkündür (Şekil 6.3). Üsteki spektrogram konuşmacının normal sesi , altta ki spektrogram perdel enmi ş (takli t) sese a i t t i r. B i r k o n u ş m a c ı n ı n n o r m a l y a p ı l a n k a y ı t t a n s o n r a s e s i ni d e ğ i ş t i r m e s i i s t e n m i ş a y n ı s o r ul a r s o r u l m u ş v e aynı materyal o k u t u l m u ş t u r. Buradaki amaç, k o n u ş m a c ı l a r s e s l e r i ni n e k a d a r d e ğ i ş t i r m e e ğ i l i m i n d e ol sa da i ki ses arasındaki benze rli k farkı , bu sesi taklit etmeğe çalışan o l a c a k t ı r. Burada parametrel erdeki di nl eyerek konuşmacının farkından unutul maması benzerli k vardığı sonuç) gereken daha bi r yanında işi tsel tanı’nın da az konuda (uzmanı n çok önemli o l d u ğ u d u r. K e k e l e m e g i b i k o n u ş m a b o z u k l u k l a r ı h e r n e kadar parametrik i ncel emede tespi t edilse de ses -rengi gi bi sübj ekti f e d i l e b i l m e k t e d i r. bil giler ancak işi tsel yol ile tespit 81 Şekil 6.3. Konuşmacının (farklı bir sesi sesini perdel eyerek t a k l i t e d e r e k ) k a y d e d i l m i ş s e s i ni n özgün konuşmasıyl a karşıl aştırılması 82 Günüm üz teknol oji siyl e adli amaçlı (ticari uygul amal ar hari ç) otomatik konuşmacı tanıma programı h a l e n y o k t u r. B u n u n b a ş l ı c a n e d e n i i s e , ş u a n d a m e v c u t ol an veya geliştirilen al gori tmal ar temi z sesleri t a n ı m a y a v e o n a y l a m a y a y ö n e l i k t i r. O y s a k i d e l i l o l a r a k ortaya konul an gürül tül eri n sesler doğal ortaml arda alınmış arka (kayıt ci hazının iç gürül tüsü, telefon hatlarının doğal gürül tüsü, çevre gürül tüsü, ...gibi ) y o ğ u n o l d u ğ u s e s l e r d i r. D o l a y ı s ı y l a d e v a m l ı d e ğ i ş e n a r k a g ü r ü l t ül e r i s e s k a y d ı n ı e t k i l i y e c e k t i r. G ü r ü l t ü d e k i bu deği şiml er düzg ün periyotta ol madığı içi n k o n u ş m a n ı n h e r s a n i y e s i n d e f a r k l ı e t k i l e r g ö s t e r e c e k t i r. Bu nedenl e adli amaçlı konuşmacı tanıma ve onayl ama işl eri parametri k ve i şitsel anali z ol arak bir uzma n t a r a f ı n d a n m a n u e l y a p ı l m a k t a d ı r. Sonuç ol arak telefon üzeri nden el de edil en bu v e r i l e r, k ı s a t ü m c e ü z e r i n d e t a n ı m a , k e l i m e y a k a l a m a , konuşmacı tanıma s i s t e m l e r i ni n ve uzun tümce al goritmalarının üzeri nde tanıma denenmesi nde büyük yarar sağlayacağı ve bunun da ne kadar başarıl ı ol duğu ancak çeşi tli ses al gori tmaları k u r u l u ş l a r ı n c a b e l i r l e n e b i l e c e k t i r. gelişti ren bilim 83 Ö ZET Türkçe Konuşma ve Konuşmacı Tanımaya Yönelik Veri Tabanı Örnekleminin Oluşturulması Günümüzde teknolojinin gelişmesiyle birlikte Adli Bilimde, insan sesi yoluyla işlenen suçların ortaya çıkartılabilmesi için bilimsel metotlar kullanılmaya başlanmıştır. Dünyadaki bu gelişmeler Türkiye’ye de yansımış ve bir çok bilim adamı ses tanıma ve ses onaylama gibi ses işleme konusunda araştırmalara başlamıştır. Bu araştırmaların büyük çoğunluğu yabancı dilde hazırlanmış veri tabanları üzerinde yapılmaktadır. Bu çalışma sonucunda hazırlanan Türkçe veri tabanı örneklemiyle bu alanda ihtiyaç duyulan bir veri tabanı standardının belirlenmesine çalışılmıştır. Veri tabanı örnekleminin hazırlanmasında bir çok veri tabanı incelenmiş ve bunların arasından COCOSDA (Coordinating Committee for Speech Database Assessment) adı verilen bir komite tarafından önerilen ve POLYPHONE adı verilen veri tabanı hazırlama standartları kullanılmıştır. Veri tabanı örneklemi, telefon hatları üzerinden birer hafta arayla 55 denekten alınmıştır. Ses kayıtları telefon hattına bağlanan bir teyp aracılığıyla yapılmış ve bu kayıt daha sonra bilgisayar ortamında işlenerek 8 kHz'de örneklenmiş, 8 bit'de nicemlenerek x.wav formatında CD-ROM'a yazılmıştır. Sonuç olarak, değişik cinsiyet, lehçe ve yaş gruplarından toplanan bu veri tabanı örneklemi Türkçe konuşma ve konuşmacı tanımaya yönelik hazırlanacak ses algoritmalarının denenmesinde ve geliştirilmesinde kullanılabilecektir. Veri tabanı örnekleminin ne kadar başarılı olduğunun, çeşitli ses tabanlı algoritmalar geliştiren bilimsel kuruluşlarca belirlenebileceği sonucuna varılmıştır. Anahtar Sözcükler : Konuşma ve konuşmacı tanıma, ses algoritması, POLYPHONE standardı. 84 SUMM AR Y Production of Data Base Sampling for Turkish Speech and Speaker Recognition Today, with the improvement in technology, scientific methods are put into use for the purpose of enlightening crimes committed by using human voice. This improvement around the globe found its reflections in Turkey too, and numerous scientists began researches on voice processing topics like voice recognition, and voice verification. Most of these researches are based on databases which are prepared in a foreign language. With the help of the Turkish database prepared as a result of this work, it is aimed that a database standard, which is a need in this area, is set. In preparing this database sampling, many database are examined, and among those a database preparing standard which is named POLYPHONE, and advised by COCOSDA (Coordinating Committee for Speech Database Assessment) is used. Database samples are recorded from 55 subjects with 1-week intervals, using telephone lines. Recording is made via a tape recorder connected to the telephone line. Then this recording, through the process in a computer, is sampled at 8 kHz, and after quantified in 8 bits is written on a CD-ROM. As a result, this database sampling gathered from various sex, dialect, and age groups will be an asset to be used in testing and improving voice algorithms which will be prepared for Turkish speech, and speaker recognition. It is concluded that, how successful this database sampling is can be determined by the scientific organizations that produce different voice-based algorithms. Key words: Speech and speaker recognition, voice algorithm, POLYPHONE standard. 85 KAYNAKL AR 1. ALİKAŞİFOĞLU,K., DOĞU, E. (1983). Ceza Mahkemeleri Usulü Kanunu. Ankara: Seçkin Kitapevi,s.:237. 2. BERNSTEİN, J., TAUSSING, K., GODFREY, J.( 1995 ). MACROPHONE: An American English Telephone Speech Corpus for The POLYPHONE Project, Proc., Detroit, ICASSP’94, p.:I-81. 3. BOVES, L., BOGAART, L., BOS, L. (1993). Dessign and Recording of Large Data Bases for Use in Speaker Verification and Identification. Proc.ESCA Workshop on Automatic Speaker Recognition, Identification and Verification, , Martigny, Switzerland, p.:43-46. 4. BROWN K.L., GEORGE E.B. (1995). CTIMIT: A Speech Corpus For The Cellular Environment with Applications to Automatic Speech Recognition. Proc.ICASSP’95. Detroit. pp.105-108. Erişim:[http://www.ldc.upenn.edu/readme_ files/ctimit.readme.html]. Erişim Tarihi:11 Haziran 1999 5. COCOSDA . (1994) Institute of Information Sciences and Electronics University of Tsukuba, Meeting in Yokohama. Erişim: [http://www.milab.is.tsukuba.ac.jp/ococosda/cosda94or.html].Erişim Tarihi:11 Haziran 1999 6. DEFENCE ADVANCED RESEARCH PROJECT AGENCY(DARPA). (1987). DARPA Resource Management Continuous Speech Database RM1. NIST [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/rm1.readme.html] Erişim Tarihi:11 Haziran 1999 7. DEMİRCAN,Ö. (1996). Türkçe’nin Sesdizimi.İstanbul, s.:8-10. 8. DEMİREKLER,M. BİNGÖL,S. KAYHAN,S. (1995). Türkçe Konuşma ve Konuşmacı Tanıma Amaçlarına Yönelik Veri Tabanları Hazırlanması için Bir Standart Önerisi. TÜBİTAK-BİLTEN,1:1-6. 9. ERGENÇ,İ. (1990). Konuşma Dilinde Sözdizimiyle Bürün Olgularının İlişkisi Üzerine:IV.Dilbilim Sempozyumu Bildirileri, 1:157-164. 10. ERGENÇ, İ. (1995). Konuşma Dili ve Türkçe’nin Söyleyiş Sözlüğü. Ankara, s.:11-28. 11. FRY, D.B. (1979). The Physics of Speech, Cambridge Uni.press, p.: 77. 12. HOLLIEN,H.(1990). The Acoustics of Crime. Plenum, New York, p.:43-45. 13. HUMAN COOMUNICATION RESEARCH CENTER (1992). The HCRC Map Task Corpus Version 1.0. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/hcrc.readme.html]. Erişim Tarihi:11 Haziran 1999 14. ITT. (1987). King-92 Corpus for Speaker Verification. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu /readme_files/king.readme. html]. Erişim Tarihi:11 Haziran 1999 15. ITT. (1989). YOHO Speaker Verivacation. Linguistic Data Consortium. [Electronic Journal]. Erişim:[http://www.ldc.upenn.edu/readme_files/yoho.readme.html]. Erişim Tarihi:11 Haziran 1999 86 16. LEONARD R,G., DODDIGTON R,G. (1993). A Speaker-Independent Connected-Digit Database. TIICRL [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/ readme_ files/tidigits.readme.html]. Erişim Tarihi:11 Haziran 1999 17. MUTHUSAMY, Y., HOLLIMAN, E., WHEATLEY, B., PICONE, J., GODFREY, J. (1995). Voice Across Hispanic America : A Telephone Speech Corpuse of American Spanish. Proc.ICASSP’94, Detroit, p.:I-85-88. 18. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). The Road Rally World-Spotting Corpora. RDRALLY1. Linguistic Data Consortium [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/road_rally.readme.html]. Erişim Tarihi:11 Haziran 1999 19. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). World Speech Database Speaker-Depended Isolated World Corpus. NIST [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/ti46.readme.html]. Erişim Tarihi:11 Haziran 1999 20. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). Acoustic-Phonetic Continuous Speech Corpus. Linguistic Data Consortium [Electronic Journal], June 1999. Erişim: [http://morph.ldc.upenn.edu/readme_files/timit.readme.html]. Erişim Tarihi:11 Haziran 1999 21. NYNEX SCEINCE AND TECHNOLOGY. (1992). NTIMIT Speech Corpus CD-ROMs. Linguistic Data Consortium [Electronic Journal], June 1999. Erişim: http://morph.ldc. upenn.edu/readme_files/ntimit.readme.html]. Erişim Tarihi:11 Haziran 1999 22. OREGON GRADUAT INSTUTE. (1994). The Spelled and Spoken Word Telephone Corpus. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc. upenn.edu/readme_files/ogispell.readme.html]. Erişim Tarihi:11 Haziran 1999 23. OWENS, F.,J. (1993). Signal Processing of Speech. London, The Macmillan Press.,p.:5,6. 24. PITERLLI, J.F., FONG, C., LEUNG H.C. (1995) Phonebook Final Report. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim:[http://www.ldc. upenn.edu/readme_ files/phonebook.html]. Erişim Tarihi:11 Haziran 1999 25. POLICE STAFF COLLEGE. (1979). Bramshill Speech Collection. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim: http://www.ldc.upenn.edu/ readme_files/ bhill.readme.html]. Erişim Tarihi:11 Haziran 1999 26. ROSSING, T.D. (1990) The Science of Sound. USA. 2nd Ed., p.:312. 27. Sound Forge 4.0. 1996. S o n i c F o u n d r y I n c . 28. SRI INTERNATIONAL. (1995). Macrophone Corpus. LDC at the University of Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/ readme_files/macrophone.readme.html ]. Erişim Tarihi:11 Haziran 1999 29. STAPLES, T., PICONE, J., ARAI, N., (1994). The Voice Across Japan Database- The Japanese contribution to POLYPHONE. Proc.ICASSP’94, Adelaide, Australia, p.:I-89-92. 87 30. TEXAS INSTRUMENTS. (1993). Switchboard Corpus of Recorded Telephone Conversation. NIST [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/ldc/news/newsletter/ v1.2/Switch.html]. Erişim Tarihi:11 Haziran 1999 31. TEXAS INSTRUMENTS. (1993). Switchboard Credit Card. NIST [Electronic Journal], June 1999. Erişim: [http://morph.ldc.upenn.edu/Catalog/LDC93S8.html]. Erişim Tarihi:11 Haziran 1999 32. TEXAS INSTRUMENTS. (1994). Speaker Identification Research Corpus. NIST [Electronic Journal], June 1999. Erişim: http://www.ldc.upenn.edu/readme_files/ spidre.readme.html]. Erişim Tarihi:11 Haziran 1999 33. TEXAS INSTRUMENTS. (1999). ATIS Speaker-Dependent Training Data. NIST [Electronic Journal], June 1994. Erişim: http://www.ldc.upenn.edu/readme_files/atis/ sspcrd.readme.html]. Erişim Tarihi:11 Haziran 1999 34. YENER, O. (1998). Ceza Yargılaması Polis ve Jandarma Mevzuatı. Ankara :Adil Yay.Evi,s.:113. 88 ÖZ GEÇMİŞ 30 Ocak 1963 yıl ında Bandırmada orta ö r e n i m i ni Bandırmada, t a m a m l a m ı ş t ı r. 1 9 8 0 - 1 9 8 4 Okul u El ektronik lise yılları Böl ümünde d o ğ m u ş t u r. İ l k v e ö ğ r e ni m i ni arasında öğrenim Konyada Kara görmüş Harp ve M u h a b e r e Te ğ m e n o l a r a k 1 9 8 4 y ı l ı n d a m e z u n o l m u ş t u r. Mezuni yeti nden sonra çeşi tli yerlerde böl ük komutanl ığı g ö r e v l e r i ni yapmış ve 1993 yıl ında yeni kurul an Kri mi nal Daire Başkanlığına Ses anali z Şube Müdür ü ol arak a ta n m ı ş t ı r. İtalya Jandarma Suç Araştırma L a b o r a t u v a r l a r ı n d a e ğ i t i m i ni ta m a m l a d ı k t a n s o n r a 1 9 9 5 y ı l ı n d a S e s a n a l i z l a b o r a t u v a r ı n ı k u r m u ş t u r. L e v e n t G Ü N E R , e v l i v e b i r ç o c u k b a b a s ı d ı r.