türkçe konuşma ve konuşmacı tanımaya yönelik veri tabanı

Transkript

türkçe konuşma ve konuşmacı tanımaya yönelik veri tabanı
ANKAR A ÜNİVERSİTESİ
SAĞLIK BİLİMLERİ EN STİTÜSÜ
TÜRKÇE KONUŞMA VE KONUŞMACI
TANIMAYA YÖNELİK VERİ TABANI
ÖRNEKLEMİNİN OLUŞTURULMASI
Levent GÜNER
Ekim 1999
ANKARA
iii
ÖNSÖZ
Bu tez çalışmasında ülkemiz için yeni sayılabilecek Adli Amaçlı Konuşma ve
Konuşmacı Tanıma algoritmalarının geliştirilmesi için Türkçe veri tabanı
örneklemi yapılmıştır. Gelecekte oluşturulacak bir Türkçe veri tabanının
oluşturulmasına yön verebileceği düşünülmüştür. Bundan sonra bu konu
üzerinde yapılacak çalışmalara yardımcı olmasını dilerim.
Yüksek Lisans eğitimime başlamama aracı olan değerli eğitmenim
Prof.Dr.Tülin SÖYLEMEZOĞLU’na ve dilbilimini bana sevdiren, bu tezi
oluşturmamda bana yardımcı olan değerli eğitmenim ve danışmanım
Prof.Dr.İclâl ERGENÇ’e ve beni her konuda destekleyen sevgili eşim Dilek’e
sonsuz teşekkür ederim.
iv
İÇİNDEKİLER
Kabul ve Onay
ii
Önsöz
iii
İçindekiler
iv
Şekiller
vii
Çizelgeler
viii
1.
GİRİŞ
1
1.1
Tezin konusu ve amacı
1
1.2
Tezin önemi
1
1.3
Çeşitli Üniversiteler ve Kuruluşlar Tarafından Oluşturulan Veri
Tabanı Toplama Teknikleri ve Kullanım Yerleri
4
1.3.1
ATIS Veri Tabanı
5
1.3.2
BRAMSHILL Veri Tabanı
6
1.3.3.
HCRC Map Task Veri Tabanı
6
1.3.4.
KING Veri Tabanı
7
1.3.5
MACROPHONE Veri Tabanı
7
1.3.6
OGI SPELLED ve SPOKEN Veri Tabanı
8
1.3.7
PHONEBOOK Veri Tabanı
9
1.3.8.
DARPA RESOURCE MANAGEMENT (RM1) Veri Tabanı
10
1.3.9
ROAD RALLY Veri Tabanı
10
1.3.10.
SWITCHBOARD Veri Tabanı
12
1.3.11.
SPIDRE Veri Tabanı
12
1.3.12.
SWITCHBOARD EXCERPTS Veri Tabanı
13
1.3.13.
TI46 Veri Tabanı
13
1.3.14.
TIDIGITS Veri Tabanı
14
v
1.3.15.
TIMIT VE NTIMIT Veri Tabanı
15
1.3.16.
YOHO Veri Tabanı
16
1.3.17.
POLYPHONE Veri Tabanı ve Standartları
17
1.4.
Veri Tabanı Toplama Tekniği
19
2.
KONUŞMA ve SES ÖZELLİKLERİ
20
2.1.
Seslerin Oluşumu
20
2.1.2.
Konuşma Dilinin Özellikleri
29
2.1.3.
Türkçenin Ses Özellikleri
33
2.1.4.
Türkçede Sesler
36
3.
VERİ ÇÖZÜMLEME
41
3.1.
Okutulacak ve Spontan Olarak Söyletilecek Verilerin oluşturulması
41
4.
UYGULAMA
47
4.1.
Türkçe-POLYPHONE Veri Tabanı Örnekleminin Oluşturulması
49
4.2.
Konuşmacıların Demografik Dağılımı
56
4.3.
Konuşmacılardan Kaydedilecek Materyalin Seçimi
59
4.4.
Kağıttan Okunacak Materyal
60
4.4.1.
Konuşmacı Kodu
61
4.4.2.
Sayı Dizileri
62
4.4.3.
Telefon Numarası
62
4.4.4.
Ard Arda Ayrık Rakam Dizisi
62
4.4.5.
Reel Sayılar
63
4.4.6.
Tarih
63
4.4.7.
Saat
63
4.4.8.
Yer (Şehir) Adı
64
4.4.9.
Uygulama Sözcüğü
64
4.4.10.
Harf Harf Söylenen Sözcük
64
vi
4.4.11.
Uygulama Sözcüğü Geçen Tümce
64
4.4.12.
Ayrık Sözcük
65
4.4.13.
Fonetik Açıdan Zengin Tümce
65
4.4.14.
Sözcük Yakalama Amaçlı Sözce
65
4.5.
Spontan Söylenecek Materyal
66
5.
BULGULAR
69
6.
SONUÇ VE DEĞERLENDİRME
74
6.1.
Hukuki İnceleme
74
6.2.
Veri Tabanı Örneklemini Oluşturan Seslerin İncelenmesi
77
ÖZET
78
SUMMARY
79
KAYNAKLAR
80
vii
ŞEKİLLER DİZ İNİ
Şekil 1.1
Oluşturulacak veri tabanının kullanım alanları.
3
Şekil 2.1
Konuşmanın sinir sistemiyle olan ilişkisi
21
Şekil 2.2
Ses yolunun şematik gösterimi
22
Şekil 2.3
Ses yolu tüp modeli
23
Şekil 2.4
Kaynak filtre modeli
24
Şekil 2.5
Gırtlağın yandan kesiti
27
Şekil 2.4
"i" ve "a" Seslerinin çıkartılmasında ses yolunun
aldığı şekil
28
Şekil 2.5
Ünlü dörtgeni
38
Şekil 4.1
Şehiriçi kayıt sırasında kullanılan hatların
durumunu gösteren diyagram.
49
Şekil 4.2
Şehirlerarası kayıt sırasında kullanılan hatların
durumunu gösteren diyagram.
50
Şekil 6.1
Aynı kişiye ait bir hafta arayla alınmış seslerin
karşılaştırılması
78
Şekil 6.2
Aynı tümceyi kullanan farklı konuşmacıların ,
seslerinin karşılaştırılması
79
Şekil 6.3
Konuşmacının sesini perdeleyerek
(farklı bir sesi taklit ederek) kaydedilmiş
sesinin özgün konuşmasıyla karşılaştırılması
81
viii
Ç İZ E LG E L ER D İZ İN İ
Çizelge
3.1 POLYPHONE standardına göre oluşturulan
veri tabanlarının toplam sözce sayısı
38
Çizelge
3.2 POLYPHONE veri tabanında kağıttan okunan
materyalin dökümü
40
Çizelge
3.3 POLYPHONE veri tabanlarında spontan olarak
söyletilen Mataryalin dökümü
41
Çizelge
4.1 Veri örneklerinin toplandığı yer ve kayıt şekillerini
gösteriri çizelge
47
Çizelge
4.2 Ses örneği alınan deneklerin, cinsiyet, yaş eğitim
düzeyi ve büyüdükleri yerleri (lehçe kriteri için)
gösterir çizelge
54
Çizelge
4.3 Türkçe-POLYPHONE veri tabanı örnekleminde
kağıttan okutulan sözcüklerin dökümü
57
Çizelge
4.4 Türkçe-POLYPHONE veri tabanı örnekleminde
spontan olarak söyletilecek sözcelerin dökümü
64
Çizelge
5.1 Değişik diller için toplanan ses örnekleri ile
yapılan örneklemin karşılaştırılması
66
Çizelge 5.2
POLYPHONE standardına göre oluşturulan veri
tabanları ile Türkçe veri tabanı örnekleminin
karşılaştırılması
68
1
1. GİRİŞ
1 . 1 . Te z i n K o n u s u v e Ö n e m i
Adli bilim al anında, i nsan sesi yol uyl a işl enen suçl arın
ortaya
çıkartıl abilmesi
teknolojiyl e
bi rlikte
içi n
son
bilimsel
yıll arda
metotlar
ilerleyen
kullanılmaya
b a ş l a n m ı ş t ı r. D ü n y a d a k i b u g e l i ş m e l e r T ü r k i y e ’ y e d e
yansımış ve bir çok bilim adamı ses tanıma ve ses
onayl ama
gibi
ses
işleme
konus unda
çal ışmaya
b a ş l a m ı ş t ı r. F a k a t b u a r a ş t ı r m a l a r ı n b ü y ü k ç o ğ u n l u ğ u
yabancı
dilde
hazırl anmış
veri
t a b a nl a r ı
üzeri nde
bilimi,
konuşma
y a p ı l m a k t a d ı r.
Son
yıllarda
suç
araştırma
kayıtları bilimsel olarak i ncelenmeye başl amış ve bu
al anda yoğun araştırmalar yapılarak bazı ti cari ürünl er
p i y a s a y a s ü r ü l m ü ş t ü r.
Ül kemi zde bu al anda çalışmalar olmasına rağmen
mevcut
bir Türkçe
ol uşturul an
veri
si stemleri n
tabanı
ol mamasından
Türkçe
ses
dol ayı
tanıma
al goritmalarında performanslarının ne kadar iyi yada
kötü
ol duğu
konus unda
sağl ıklı
bi r
tespi t
yapılması
m ü m k ü n o l a m a m ı ş t ı r.
Bi r
ol uşturul acak
sistemi n
performansını
konuşmacı
tanıma
arttırmak
al gori tması
i çi n
değişik
ci nsiyet, lehçe ve yaş g rupl arından topl anan sesl erle
2
e ğ i t i l m e l i d i r. B u n e d e n l e k o n u ş m a v e k o n u ş m a c ı t a n ı m a
konul arında
araştırma
zengi n bir konuşma
(Demirekler
ve
yapılabilmesi
veri
tabanına
ark.,1995).
Bu
i çi n
yeteri nce
sahi p ol unmal ıdır
konunun
önemi ,
ses
araştırmalarında öncül ük eden ülkel erde 1980’li yılların
başl arında
İngili zce
fark
olmak
edil miş
ve
üzere
1990
çeşi tli
batı
başlarında
b a ş ta
dilleri
farklı
içi n
a m a ç l a r a y ö n e l i k b i r ç o k v e r i ta b a n ı o r t a y a ç ı k a r ı l m ı ş t ı r.
Ol uşturul acak
böyle
Şekil 1.1’de
bir
açıkl andığı
veri
gibi
tabanıyl a
bir
aşağıda
çok
alanda
k u l l a n ı l a b i l e c e k t i r.
Türkiye Türkçesi içi n standart konuşma veri tabanı
henüz mevcut ol maması nedeni yle Türkçe konuşma ve
konuşmacı tanıma konul arında araştırma yapan herkes
kendi
v e r i s i ni
kendi
toplamakta
ve
bu
işl em
bi r
standarda oturtul madığından dolayı çok vakit kaybına
neden
o l m a k ta d ı r.
Bunun
sonuc u
ol arak
aynı
al goritmalar üzeri nde çal ışan ve iki farklı veri tabanında
geli şti rilen
benzer
sisteml er
bi rbirl eri yle
k a r ş ı l a ş t ı r ı l a m a m a k t a , h a n g i s i ni n d a h a b a ş a r ı l ı o l d u ğ u
s o n u ç l a r a b a k a r a k a nl a ş ı l a m a m a k t a d ı r. B ü t ü n b u n l a r a
e k o l a r a k , b ö y l e b i r v e r i ta b a n ı n ı n b u l u n m a m a s ı T ü r k ç e
konus unda
hazırl anmış
araştırma
ol an
y a pa n l a r ı n
veri
yabancı
t a b a nl a r ı n a
ç a l ı ş m a l a r ı n a n e d e n o l m a k t a d ı r.
diller
bağl ı
i çi n
kal arak
3
Ses Etkileşimli telefon arama merkezleri
Bitmiş
Uygulamalar
Ses arşivlemesinde düzeltme ve dosyalamada
güvenli ses servisleri
Geliştirme
Kısa
tümceler
üzerinde
tanıma
Uygulama
Alanları
Uzun
tümce
üzerinde
tanıma
Konuşmacı
tanıma
Kelime
yakalama
Uygulama,
veri tabanları
üzerinde
değerlendirme
Güçlü
konuşma
analizi
Teknoloji
ve
Araştırma
Güçlü Karar
- Anlaşılır modeller
- Çoklu bölüm
- Konuşma
zenginleştirme
- Denetimsiz
eşitleme
Yazılım
geliştirmede
Teknolojinin
desteği
Konuya
dayalı ses
dizini
HMMs ve
Hybrid Sistemler
- Güvenirliliğin ölçümü
- Varsayım testi
Güçlü Konuşma
Modelli
- Çoklu-eğilim
- Model uyarlama
- Çeşitli sesletim
- Dil modeli
- Konuşmacı karakterleri
- Alışılmış parolalar
Ş e k i l 1 . 1 . O l u ş t u r u l a c a k v e r i ta b a n ı n ı n k u l l a n ı m
al anl arı.
1.3.
Ç e ş i t l i Ü n i v e r s i t e l e r v e K u r u l u ş l a r Ta r a f ı n d a n
Oluşturulan
Ve r i
Ta b a n ı
To p l a m a
Te k n i k l e r i
ve
K u l l a n ı m Ye r l e r i
Bu
böl ümde
kurul muş
P e n n s y l v a ni a
ol an
LCD
Üniversitesi
( L i n g ui s t i c
Data
bünyesi nde
Consorti um)
4
tarafından
topl ama
ol uşturul an
çeşitli
tekni kleri
ve
dillere
ait
veri
P O LY P H O N E
tabanı
standartları
i n c e l e n e c e k t i r.
Son yıllarda bil gisayarla konuşma ve konuşmacı
t a n ı m a , o p t i k k a r a k t e r t a n ı m a , s e s s e n t e zi , d o ğ a l d i l
i ş l e m e g i b i u y g u l a m a a l a nl a r ı n a g i t t i k ç e a r t a n b i r i l g i
m e v c u t t u r. Ö t e y a n d a n , g e n i ş i n s a n k i t l e l e r i ta r a f ı n d a n
kull anıl an bütün dill eri n çok karmaşık ve zengi n yapılar
ol duğunda n
dol ayı
yukarıda
sözü
edil en
ses
uygul amal arın başarılı sonuç verebil mesi i çi n bilgi sayar
al goritmaları çok büyük miktarlarda veri ile eğitmek
gerekmektedi r ( Bernstei n et al ., 1995). Bu nedenl e,
çeşi tli dünya dilleri içi n veri tabanl arı ol uşturmak ve
ol uşturul an veri tabanını dağıtmak içi n 60’ın üstünde
üni versi te
ve
şirketi n
üye
k u r u l m u ş t u r.
Li ngui stic
anıl an
konsorsi yum
bu
olduğu
bir
ko nsorsiyum
Consorti um(LDC)
Data
P e n n s y l v a ni a
adıyl a
Üni versitesi
b ü n y e s i n d e k u r u l m u ş o l u p b a ş ta İ n g i l i z c e o l m a k ü z e r e
İspanyol ca, Fransızca, Flamanca, Al manca, Japonca ve
Çi nce
gi bi
çeşi tli
dünya
dilleri ile il gili
veri
tabanı
o l u ş t u r m a v e d a ğ ı t m a f a a l i y e t l e r i n d e b u l u n m a k t a d ı r.
Çal ışmaya ışık tutması açısından önceli kle LCD
tarafından
dağıtımı
teknikl eri
i ncelenerek
tabanl arıyla
il gili
yapılan
bil giler
konuşma
aşağıda
veri
tabanı
konuşma
v e r i l m i ş t i r.
A nl a t ı l a n
veri
veri
t a b a n l a r ı n ı n t a m a m ı n a y a k ı n s e s v e r i l e r i ni e ğ i t m e v e
test
grupl arı
ol mak
üzere
i ki ye
ayrılarak
aynı
veri
tabanı üzeri nde çal ışan araştırmacıl arın el de ettikl eri
5
sonuçl arı bir biri yle karşıl aştırılma olanağı sağl amış
o l a c a k t ı r.
1 . 3 . 1 AT I S Ve r i Ta b a n ı
AT I S ( A i r Tr a v e l I n f o r m a t i o n S y s t e m ) h a v a d o l a ş ı m ı b i l g i
s i s t e m l e r i v e r i ta b a n ı , ö z e l b i r b a ğ l a m l a s ı n ı r l a n m ı ş
ol an
doğal
konuşmal arı
i çeri r
( Te x a s
Instruments,
1999). Bu veri tabanı ile konuşmacıya bağımlı konuşma
t a n ı m a a m a ç l a r ı i ç i n d ü ş ü n ü l m ü ş t ü r. S ö z ü e d i l e n ö z e l
b a ğ l a m h a v a y o l c u l u ğ u b i l g i s i s t e m i y l e i l g i l i d i r. U ç a k
y o l c ul u ğ u i l e i l g i l i b i l g i s o r m a k , r e z e r v a s y o n y a p t ı r m a k
gi bi amaçlara yöneli k tümcel eri n yer al dığı veri tabanı
10 konuşmacıdan 16 kHz örnekleme hızında, 16 bi t’e
ni cemlenerek yak ın konuşma ile Sennhei ser HMD414 ve
Crown
PCC-160
model
iki
farklı
mikrofonla
t o p l a n m ı ş t ı r. AT I S v e r i t a b a n ı t e s t v e e ğ i t i m s i s t e m l e r i
ol arak
bili nen
AT S 0 ,
AT I S 2
ve
AT I S 3
olarak
g e l i ş t i r i l m i ş t i r.
1.3.2.
B R AM S H I L L Ve r i Ta b a n ı
B u v e r i ta b a n ı n d a h e r b i r k o n u ş m a c ı d a n a l ı n a n s t a n d a r t
bazı test cüml el eri ve serbest konuşma bul unmaktadır
(Police
St a ff
Coll ege,
1979).
Karşıl ıklı
konuşma
6
bi çi mi nde gerçekleşti rilen serbest konuşmal arda, her bi r
konuşmacı çi fti ne, üzeri nde konuşacakl arı fotoğraflar
verilmi ş
ve
her
bi r
çiftte
yer al an konuşmacılardan
kaydedilen sesl er ayrı ayrı kütükl er hali nde organi ze
e d i l m i ş t i r.
ci nsiyet,
Bu
yaş,
kütüklere
b o y,
kilo,
ek
ol arak
doğum
yeri
konuşmacının
gibi
özellikl er
üzeri nde konuştuğu fotoğrafın kodu, tümcel eri n çeviri
y a z ı m ı v e d i y a l o g o l u ş t u r a n i k i nc i k o n u ş m a c ı n ı n k i m l i ğ i
d e a y r ı k ü t ü k l e r h a l i n d e v e r i l m i ş t i r. İ n g i l i z İ n g i l i zc e s i n e
yönelik bu veri tabanında sesl er 10 kHz’de örnekl enmi ş
v e 1 6 b i t ’ e ni c e m l e n m i ş t i r.
1.3.3.
128
H C R C M a p Ta s k Ve r i Ta b a n ı
tane
diyal ogdan
ol uşan
bu
veri
tabanı
çeşitli
hari talar üzeri nde ol uşturul an diyal ogları i çermektedir
( H u m a n C o m m u n i c a t i o n s R e s e a r c h C e n t e r, 1 9 9 2 ) . Y ü z
yüze yapıl an veya yüz yüze yapıl mayan diyalogl ara ek
o l a r a k S G M L ( St a n d a r t G e n e r a l i z e d M a r k u p L a n g u a g e )
f o r m a t ı n d a y a p ı l m ı ş ç e v i r i y a z ı m l a r, h a r i t a l a r v e v e r i
tabanını
kull anacak
ki şilere
yöneli k
bazı
yardımcı
programl ar da 8 diskten (CD -ROM) ol uşan veri tabanına
d a h i l d i r.
Ve r i
tabanında
sesler
çi ft
kanal
ol arak
k H z ’ d e ö r n e k l e n m i ş v e 1 6 b i t ’ e n i c e m l e n m i ş t i r.
20
7
1 . 3 . 4 . K I N G Ve r i Ta b a n ı
Ta m a m ı e r k e k o l a n 2 6 N e w J e r s e y v e 2 6 S a n D i e g o
kökenli
konuşmacıdan
konuşmacı
tanıma
topl anan
KING
araştırmaları
içi n
veri
tabanı
geliştiril miştir
( I T T. , 1 9 8 7 ) . H e r b i r k o n u ş m a c ı i l e a y r ı k a y ı t s e a n s ı
yapıl mış ve aynı konuşma hem geni ş hem de dar bantlı
ol arak
k a y d e d i l m i ş t i r.
Dar
bantl ı
kayıtta,
konuşma
standart bir tel efon aparatından geçi rilerek yerel bi r
santral a, oradan da
yi ne
yerel
uzak bi r santrala yollanmış, sonra
santral a
getiril erek
geri
dönen
anal og
s i n y a l d e n k a y ı t y a p ı l m ı ş t ı r. G e ni ş b a n t l ı k a y ı t i s e y i n e
a y n ı k o n u ş m a n ı n s e s s i z b i r o d a d a t e l e f o n a hi z e s i n e
t a k ı l a n k a l i t e l i b i r m i k r o f o n d a n e l d e e d i l m i ş h a l i d i r. H e r
iki kayıt da 8 kHz örnekl eme hızında 16 bi t doğrusal
ni cemleme
k ul l a n ı l a r a k
y a p ı l m ı ş t ı r.
Her
bi r
seansta
konuşmacıya üzeri nd e konuşacağı bir konu veril miş ve
her
bi r
seansta
yaklaşık
30
s a ni y e l i k
ses
verisi
a l ı n m ı ş t ı r.
1.3.5.
M AC R O P H O N E Ve r i Ta b a n ı
1994 yılında tamaml anan ve yakl aşık 5000 Amerikalı
dan al ınan 200.000 sözceyi kapsayan bi r veri tabanıdır
(SRI
Internati onal ,
1995).
Ve r i
kanallarından 8 kHz 8 -bit u-l aw
tabanı
T1
telefon
o l a r a k k a y d e d i l m i ş t i r.
Her bir denekten, 45 adet kağıttan okunan soruya yanıt,
3 4 a d e t k a ğ ı t t a n o k u n a n s ö z c ü k v e 11 a d e t s p o n t a n
soru/yanıt
vermesi
i s t e n m i ş t i r. D e n e k l e r e
demografik
8
b i l g i l e r, ş e hi r i s i m l e r i , ç a l ı ş t ı ğ ı y e r g i b i b a z ı b i l g i l e r
s o r u l m u ş / o k u t u l m u ş t u r.
1.3.6.
O G I S P E L L E D v e S P O K E N Ve r i Ta b a n ı
Te l e f o n ü z e r i n d e n o t o m a t i k s o r u s o r u p
(prompti ng)
ve
kayıt
y a pa n
bi r
komut veren
sistem
tarafından
k a y d e d i l e n b u v e r i t a b a n ı n d a 3 6 5 0 ’ d e n f a zl a k o n u ş m a
bul unmaktadır
( Oregon
Konuşmacılara
adl arı,
büyüd ükl eri,
ve
Graduate
nereden
evet \hayır
ti pinde
Insti tute,
(1994).
aradıkl arı,
nerede
cevap
verecekleri
b a z ı s o r u l a r s o r u l m u ş t u r. A y r ı c a a d l a r ı v e s o y a d l a r ı
harf,
harf
söylemeleri
( s p e l l i ng ) ,
tarafından
sistem
söyl enen bazı sözcükl eri tekrarlamal arı ve yi ne sistem
tarafından
söyl enen
bazı
sözcükl eri
açıklamaları
i s t e n m i ş t i r. O r e g o n G r a d u a t e I n s t i t u t e ’ d e ( O G I ) y a p ı l a n
bu kayıtl arda her bir soru ya da emre ( prompt) verilen
yanıt
ayrı
bi r
konuşmacının
konuşmanı n
(ti me
kütük
hali nde
ci nsi yeti ,
konuşmanın
zaman-çakışmal ı
aligned
o r t h o g r a p hi c
t a b a n ı n d a v e r i l m i ş t i r.
o r g a ni z e
edil miş
kali tesi
ortagrafi k
transcri ption)
ve
ve
çevri yazım
da
veri
9
1.3.7.
P H O N E B O O K Ve r i Ta b a n ı
A y r ı k s ö z c ü k t a n ı m a s i s t e m l e r i n i n ö n e m i ni k o r u y a c a ğ ı
varsayımından hareketle telefon üzeri nden kaydedilen
büyük bi r ayrık sözcük veri tabanıdır ( Piterlli, et al.,
1995).
Ayrık
konuşma
sözcük
veril eriyl e
tanıma
s i s t e m l e r i ni n
eği tilmesini n
ayrık
devaml ı
sözcükl erle
eği tilmesi ne göre daha kötü sonuçl ar vermesi bu veri
tabanının
ol uşturul ması
i çi n
bir
başka
yönl endi rme
k a y n a ğ ı o l m u ş t u r. A y r ı c a , s ö z c ü k s i s t e m l e r i ni n ( w o r d
systems)
spotti ng
eği timi nde
de
k ul l a n ı l a b i l i r.
Phonebook’ta yer al an sözcükler Ameri kan İngili zcesi ni n
b ü t ü n s e s b i r i m l e r i ni ( p h o n e m e ) m ü m k ü n o l d u ğ u k a d a r
f a z l a b a ğ l a m d a k a p s a y a c a k b i ç i m d e s e ç i l m i ş t i r. To p l a m
23 saatlik ses kaydı i çeren bu veri tabanı ayrıca çeşitli
konuşmacı
ve
telefon
hat
k a r a k t e r i s t i k l e r i ni
de
y a n s ı t m a k t a d ı r. Ve r i t a b a n ı n d a 7 9 7 9 s ö z c ü k s e ç i l e r e k
bi r havuz ol uşturul muş ve her bi ri demografi k açıdan
A B D n ü f u s u n u i y i t e m s i l e t t i ğ i d ü ş ü n ü l e n , o r t a l a m a 11 . 7
yeti şki n
konuşmacı
tarafından
s e s l e n d i r i l m i ş t i r.
Ve r i
t a b a n ı n d a t o p l a m 9 3 6 6 7 s ö z c ü k y e r a l m ı ş t ı r. S e s l e r
sayısal ol arak doğrudan bi r T1 tel efon hattından 8 kHz
örneklenerek
k a y d e d i l m i ş t i r.
8
bit
mu-l aw
sayısal
formatın
da
10
1.3.8.
D a r pa R e s o u r c e M a n a g e m e n t ( R M 1 ) Ve r i
Ta b a n ı
Deni zcilikl e
tümceleri n
(Naval
yer
Resource
aldığı
bu
veri
Management)
tabanı
il gili
konuşmacıdan
bağımsız ve konuşmacıya bağıml ı konuşma tanımaya
yönelik
ol arak
Research
hazırlanmıştır
Project
(Defense
1987).
A g e n c y,
Advanced
Konuşmacıdan
bağımsız konuşma tanıma böl ümünde 160 konuşmacının
her
bi ri nden
alınan
bi r
kaç
tümce
b ul u n m a k t a d ı r.
Konuşmacıya bağımlı konuşma tanıma araştırm al arında
kull anıl ması planl anan böl ümünü i se 12 konuşmacını n
her
bi ri nden
Konuşmacılar
al ınan
612
tümceleri
tümce
yazıl ı
o l u ş t u r m a k t a d ı r.
meti nden
o k u m u ş t u r.
K a y ı t l a r ç o k d ü ş ü k a r k a p l a n g ü r ü l t ü s ü o l a n b i r o r ta m d a
Sennhei ser SN414
kHz’de
sonra
mikrofon il e yapılmış ve
örneklenerek
16
aşağı-örnekleme
bit’e
ses 20
n i c e m l e n m i ş t i r.
(down-sampli ng)
Daha
yol uyl a
16
kHz’de düşürül en ses veril eri , her bi r tümce ayrı bir
k ü t ü k o l u ş t u r a c a k b i ç i m d e o r g a n i z e e d i l m i ş t i r. T ü m c e
u z u n l u k l a r ı y a k l a ş ı k o l a r a k 3 - 5 s a n i y e a r a s ı n d a d ı r.
1 . 3 . 9 R O AD R AL LY Ve r i Ta b a n ı
B u v e r i ta b a n ı , d o ğ a l k o n u ş m a i ç i n d e s ö z c ü k y a k a l a m a
araştırmaları
düşünül erek
hazırl anmıştır
( National
I n s t i t u t e o f St a n d a r t a n d Te c h n o l o g y, 1 9 9 1 ) . K o n u ş m a l a r
iki
k i ş i ni n
bi r
ralli
planl aması
konusu
etrafında
d ö n m e k t e d i r. A y r ı o d a l a r a o t u r t u l a n i k i k i ş i y e b i r e r y o l
11
hari tası
verilmiş,
belirli
puanlama
kriterleri ne
göre
(örneği n dağ yoll arı ya da i kincil yolların otoyollara
göre
daha
yüksek
puan
getirmesi
gibi )
hari tada
işaretl enen i ki nokta arasında bi rbi rl eri yle kon uşarak bir
g ü z e r g a h b e l i r l e m e l e r i i s t e n m i ş t i r. B u v e r i ta b a n ı i k i
böl ümden
o l u ş m a k t a d ı r.
adı
St o ne h e n g e
verilen
b ö l ü m d e d i y a l o g u o l u ş t u r a n i k i k o n u ş m a c ı n ı n h e r b i r i ni n
sesi mikrofonla al ınıp 300 Hz -3300 Hz bant geni şliği nde
bi r PCM FIR süzgeci nden geçi rile rek stereo bir teyp
c i h a z ı n ı n i k i k a n a l ı n a a y r ı a y r ı k a y d e d i l m i ş t i r. D a h a
sonra
ses
başına
olmayan
ortalama
3
böl üml er
dakika
ayıklanarak
süren
ses
konuşmacı
kütükl eri
elde
e d i l m i ş t i r. B u b ö l ü m d e 9 6 k o n u ş m a c ı b u l u n m a k t a d ı r.
Ve r i 2 8 t a b a n ı n ı n W a t e r l o o a d ı v e r i l e n i k i n c i b ö l ü m d e
ise benzeri kayıtlar doğrudan telefon hatl arı üzeri nden
y a p ı l m ı ş t ı r. B u b ö l ü m d e b i r i n c i b ö l ü m d e k i l e r d e n f a r k l ı
56
konuşmacı
örnekleme
kütükl er
yer
hızı
hali nde
a l m a k t a d ı r.
ve
16
bit
Ses
verileri
nicemleme
d ü z e n l e n m i ş t i r.
Sözcük
çal ışmal arında kullanıl mak üzere, önemli
10
kHz
k ul l a n ı l a r a k
yakalama
bir böl ümü
hari tadaki yer i siml eri nden ol uşan 20 sözcük seçilmiş
ve
er
bir
ses
kütüğünde
bunl arın
geçti ği
yerler
i ş a r e t l e n m i ş t i r. S ö z c ü ğ ü n b a ş l a n g ı ç n o k t a s ı v e ö r n e k
sayısı ci nsi nden uzunl uğun un yer al dığı bu kütükl er ses
k ü t ü k l e r i i l e b i r l i k t e v e r i t a b a n ı n ı o l u ş t u r m a k t a d ı r.
12
1 . 3 . 1 0 . S W I T C H B O AR D Ve r i Ta b a n ı
Aral arında
konuşma
bul unduğ u
çeşi tli
üzere
ol uşturan
üzeri nden,
ve
ses
konuşmacı
araştırmal arında
SW I T C H B O A R D ;
tamamen
tanımanın
bil gisayar
da
kullanılmak
telefon
h atl arı
deneti mi nde
otomatik
o l a r a k t o p l a n m ı ş b i r v e r i t a b a n ı d ı r ( Te x a s I n s t r u m e n t s ,
1993).
Her
bi ri
6
daki ka
süren
2430
diyoloğun
b u l u n d u ğ u S W I T C H B O A R D ç o k b ü y ü k b i r v e r i t a b a n ı d ı r.
To p l a m
240
Ameri kan
saatli k
ses
İ n g i l i zc e s i ni n
i çeren
bütün
bu
ana
veri
tabanı nda
lehçel eri ne
sahip
5 0 0 ’ d e n f a zl a k o n u ş m a c ı n ı n 3 m i l y o n d a n f a z l a s ö z c ü ğ ü
b u l u n m a k t a d ı r. S e s l e r T 1 t e l e f o n h a t t ı n d a n d o ğ r u d a n
sayısal
olarak
8
kHz
ve
8
bi t
mu -l aw
kodl anmış
b i ç i m i n d e t o p l a n m ı ş t ı r.
1 . 3 . 11 . S P I D R E Ve r i Ta b a n ı
SW ITCHBOARD
veri
tabanının
çok
büyük
ol ması
yüzünden, burada yer alan konuşmaların bir böl ümü
s e ç i l e r e k , ö z e l l i k l e k o n u ş m a c ı ta n ı m a u y g u l a m a l a r ı n d a
kull anıl mak
üzere
SPIDRE adı verilen yeni
bir
veri
t a b a n ı h a z ı r l a n m ı ş t ı r ( Te x a s I n s t r u m e n t s , 1 9 9 4 ) . K a n a l
k a r a k t e r i s t i ğ i ni n k o n u ş m a c ı t a n ı m a d a k i ö n e m i ü z e r i n e
SW ITCHBOARD içi nden en az üç ayrı telefon aparatı
k u l l a n a n 4 5 k o n u ş m a c ı , k o n u ş m a c ı t a n ı m a u y g ul a m a l a r ı
i ç i n h e d e f k i t l e o l a r a k s e ç i l m i ş t i r.
13
1 . 3 . 1 2 . S W I T C H B O AR D E X C E R P T S Ve r i Ta b a n ı
SW ITCHBOARD ve ri tabanından kredi kartı konusundaki
di yal ogl ar seçilerek, sözcük yakal ama uygulamalarına
yönelik
olan
bu
veri
ta b a n ı
ol uşturul muştur
( Te x a s
Instruments, 1993). Eği tme amacıyl a kullanılmak üzere
35
diyal og
i ç e r m e k t e d i r.
Daha
sonra
test
amacına
y ö n e l i k 1 0 d i y a l o g d a h a e k l e n m e s i p l a n l a n m a k t a d ı r.
1 . 3 . 1 3 . T I 4 6 Ve r i Ta b a n ı
Ayrık sözcük tanıma çal ışmal arı içi n tasarıml anan b u
veri tabanında, yarısı erkek yarısı kadın ol mak üzere
topl am
16
konuşmacıdan
bul unmaktadır
( National
alınan
46
ayrık
sözcük
Institute
of
St a n d a r t
and
Te c h n o l o g y, 1 9 9 1 ) . S ö z c ü k l e r 0 - 9 a r a s ı r a k a m l a r, A - Z
arası harfleri n tek tek seslendi rilmi ş hali “YES”, “NO” ve
b u n l a r a e k o l a r a k “ E N T E R ” , “ S TO P ” v e “ E R A S E ” g i b i 8
e m i r s ö z c ü ğ ü d ü r. H e r b i r s ö z c ü ğ ü n h e r b i r k o n u ş m a c ı d a n
26
ayrı
kaydı
a l ı n m ı ş t ı r.
Sesler
Te x a s
Instruments
tarafından, akustik i zol asyonu olan bir kabi nde, El ectroVo i c e R E - 1 6 c a r d i o i d s d i n a m i k m i k r o f o n l a t o p l a n m ı ş t ı r.
Kayıtların
konuşmacının
nefes
sesl eri nden
etkilenmemesi amacıyl a mi krofon konuşmacının ağzını n
t a m ö n ü n e d e ğ i l b i r a z y a n ı n a y e r l e ş t i r i l m i ş t i r.
14
1 . 3 . 1 4 . T I D I G I T S Ve r i Ta b a n ı
Ard
arda
gelen
rakamların
( connected
di gits)
konuşmacıdan bağımsız tanınabilmesi amacına yönelik
bu
veri
tabanı
toplam
tarafından
Instruments
ol uşmaktadır
326
topl anan
(Leonard
Konuşmacıların
111 ’ i
konuşmacıdan
ve
erkek,
rakam
di zileri nden
Doddi gton,
11 4 ’ ü
Te x a s
kadın
1993).
101’i
ise
ç o c u k t u r. L e h ç e d e d e n g e l i b i r d a ğ ı l ı m i ç i n A B D 2 1
b ö l g e y e a y r ı l m ı ş v e s i y a hl a r d a d a h i l e d i l i nc e 2 2 g r u p t a
d e n g e l i b i r l e h ç e d a ğ ı l ı m ı s a ğ l a nm a y a ç a l ı ş ı l m ı ş t ı r. H e r
bi r konuşmacıdan, ayrık ol arak söyl enmi ş 22 rakam ve
h e r b i r i f a r k l ı o l m a k ü z e r e 11 ’ e r t a n e i k i l i , ü ç l ü , d ö r t l ü ,
beşli ve yedili rakam grubu (ard arda söylenmi ş rakam)
a l ı n m ı ş t ı r.
RE244-B
Sesl er
isi mli
akustik
bi r
i zo l a s y o nl u
kabi nde
El ectro
Tr a c o u s t i c s
Vo i c e
RE-16
c a r d i o i d s m i k r o f o nl a a l ı n m ı ş v e m i k r o f o n k o n u ş m a c ı n ı n
ağzının
2-4
i nç
uzağına
y e r l e ş t i r i l m i ş t i r.
20
kHz
örnekleme hızıyl a toplanan veril er 12.5 kHz'e i ndi rilerek
bi r
anali z-sentez
LPC
di nl eyiciler
tarafından
di nl enerek
konuşmacının
d i z i s i ni
söyl eyip
Konuşmacı
sistemi ne
sadece
s e n t e zl e n e n
kendi si ne
söylemediğine
hatal arının
uygul anmış
bir
verilen
karar
böl ümü
ve
ses
rakam
v e r i l m i ş t i r.
düzenl enmi ş,
d ü z e l t i l e m e y e nl e r v e r i t a b a n ı n d a n ç ı k a r t ı l m ı ş t ı r.
15
1 . 3 . 1 5 . T I M I T v e N T I M I T Ve r i Ta b a n ı
B u v e r i ta b a n ı a k u s t i k - f o n e t i k ç a l ı ş m a l a r ı v e k o n u ş m a
tanıma çalışmalarını destekl emek üzere hazırl anmıştır
( N a t i o n a l I n s t i t u t e o f Sta n d a r t a n d Te c h n o l o g y, 1 9 9 1 ) .
Ve r i t a b a n ı , A B D ’ ni n 8 t a n e l e h ç e g r u b u n u t e m s i l e d e n
6 3 0 k o n u ş m a c ı n ı n h e r b i r i n d e n a l ı n a n 1 0 t ü m c e , y a ni
t o p l a m 6 3 0 0 t ü m c e i ç e r m e k t e d i r. T ü m c e l e r ü ç g r u b a
a y r ı l m ı ş t ı r. B i r i n c i g r u b a , l e h ç e f a r k l a r ı n ı ö n e ç ı k a r a c a k
b i ç i m d e s e ç i l m i ş 2 t ü m c e b ul u n m a k t a d ı r v e b u i k i t ü m c e
6 3 0 k o n u ş m a c ı n ı n h e r b i r i t a r a f ı nd a n o k u n m u ş t u r. İ k i n c i
g r u p t a , g e ni ş b i r i k i l i s e s ( d i p h o n e ) k a ps a m ı s a ğ l a y a c a k
bi çi mde
seçilen
( phoneti cally
compact)
450
tümce
b u l u n m a k t a d ı r. H e r b i r k o n u ş m a c ı b u g r u p t a n 5 t ü m c e
okumuş
ve
tarafından
her
bi r
tümce
o k u n m u ş t u r.
de
7
Üçünc ü
deği şik
grupta
konuşmacı
ise
fonetik
açıdan çeşitlilik arz eden ( phoneti cally-di verse) 1890
t ü m c e b u l u n m a k t a d ı r. Ç e ş i t l i m e t i n l e r d e n d e r l e n e n b u
tümceler tümce tipi ve foneti k bağl am açısından zengi n
ol acak
ve
çok
sayıda
al ofon
i çerecek
biçimde
s e ç i l m i ş t i r. H e r k o n u ş m a c ı b u g r u p t a n ü ç t a n e o k u m u ş ,
her
bir
tümce
o k u n m u ş t u r.
ise
Ses
yal nız
bi r
kütükl eriyle
konuşmacı
tarafından
bi rlikte
t ü m c e ni n
ortografik, sözcük bazında ve ses bazında çeviri yazımı
d a a y r ı k ü t ü k l e r h a l i n d e v e r i l m i ş t i r. S ö z c ü k b a z ı n d a
işaretl eme ile her bir sözcüğün örnek sayısı ci nsi nden
başl angıç
ve
bi tiş
noktal arı
v e r i l m i ş t i r.
Fonetik
işaretl emede i se aynı işl em tümcedeki bütün sesl er i çi n
y a p ı l m ı ş , e k o l a r a k t ü m c e ni n b a ş v e s o n u n d a k i s e s
içermeyen
böl gel er
h
ile
i ş a r e t l e n m i ş t i r.
6300
16
tümceni n tamamı fonetik işaretleri ni n tek tek konması
ç o k z a h m e t l i , u z u n v e p a h a l ı b i r s ü r e ç t i r. Ö t e y a n d a n
devamlı
konuşma
tanıma
si steml eri
i çi n
bu
tür
i ş a r e t l e n m i ş v e r i t a b a n l a r ı z o r u n l u b i r g e r e k s i ni m d i r.
Dol ayısıyla,
sessi z
bir
ortamda
kaydedilen
TIMIT
tümceleri telefon sisteml eri nden geçi rilerek yeni bir veri
t a b a n ı o l u ş t u r u l m u ş t u r. S e s l e r i n t e l e f o n b a n t g e ni ş l i ğ i n e
sahi p olduğu ve telefon si stemi nde ol abilecek her türl ü
bozul maya ve gürül tüye
maruz
kal dığı bu yeni
veri
t a b a n ı N T I M I T o l a r a k a d l a n d ı r ı l m ı ş t ı r. N T I M I T t e l e f o n
üzeri nden devamlı konuşma tanıma uygul amal arı içi n
kull anıl maktadır
(Nynex
Sci ence
and
Te c h n o l o g y,
1992). TIMIT tümceleri hareketli bir araç tel efonuyl a
s e s l e n d i r i l m i ş v e b u y e n i v e r i ta b a n ı C T I M I T (Own and
George,
adı
1995)
v e r i l m i ş t i r.
CTIMIT
henüz
LDC
t a r a f ı n d a n d a ğ ı t ı l a n v e r i ta b a nl a r ı a r a s ı n d a d e ğ i l d i r.
1 . 3 . 1 6 . Y O H O Ve r i Ta b a n ı
Konuşmacının gerçekten i ddi a ettiği kişi ol up ol madığını
anl amaya,
yani
konuşmacı
doğrul amaya
( speaker
veri fication) yönelik sistemler için tasarıml anan bu veri
t a b a n ı , a r d a r d a s ö y l e n e n ü ç a d e t “ t hi r t y - f o u r ” , “ s i x t y one”
gi bi
iki
basamaklı
sayıl ardan
ol uşmaktadır
( ö r n e ğ i n 3 6 - 4 5 - 8 9 ) ( I T T. , 1 9 8 9 ) . Y O H O v e r i ta b a n ı n d a
108
erkek
30
kadın
ol mak
üzere
topl am
138
k o n u ş m a c ı n ı n h e r b i r i n d e n 1 3 6 t a n e ü ç l ü s a y ı d i zi s i
a l ı n m ı ş t ı r. H e r b i r k o n u ş m a c ı d a n a l ı n a n 1 3 6 s a y ı d i zi s i
1 4 a y r ı s e a n s t a k a y d e d i l m i ş t i r. K o n u ş m a c ı l a r ı n k o d l a r ı ,
17
ci nsiyetleri
ve
coğrafi
k ö k e nl e r i
de
ayrı
kütükl erde
v e r i l m i ş t i r. S e s k ü t ü k l e r i ni n ö r n e k l e m e h ı z ı 8 k H z o l u p ,
her
bi r
örnek
12
bit
doğrusal
ni c e m l e n m i ş
ancak
k ü t ü k l e r d e 1 6 b i t o l a r a k v e r i l m i ş t i r.
1 . 3 . 1 7 . P O LY P H O N E Ve r i Ta b a n ı v e S ta n d a r t l a r ı
Çeşi tli
dünya
d i l l e r i ni
kapsayan
ve
çeşitli
ses
a r a ş t ı r m a l a r ı i ç i n k ul l a n ı l a b i l e c e k t i c a r i a ç ı d a n ö n e m e
sahi p bi r veri tabanı ol uşturulması fikri 1992 yılında
COCOSDA
Database
(Coordi nati ng
Commi ttee
Assessment ,1994)
tarafından öneril miş
adı
for
verilen
v e P O LY P H O N E
adı
Sp e e c h
bi r
komite
veril en bu
p r o j e h a k k ı n d a b a z ı s t a n d a r t l a r o l u ş t u r u l m u ş t u r.
P O LY P H O N E
üzeri nden
çeşitli
topl anan
diller
i çi n
verilerden
telefon
hatları
o l u ş t u r u l m u ş t u r.
P O LY P H O N E v e r i ta b a nl a r ı n ı n h e r d i l i ç i n o d i l i k o n u ş a n
ül kede
bi r
uygul amada
kurumca
ol uşturulması
k ul l a n ı l a c a k
yöntem
planl anmış
üzeri ne
ve
bazı
s t a n d a r t l a r k o n m u ş t u r. P O LY P H O N E s t a n d a r t l a r ı n ı n e n
önemlileri şunl ardır:
 Eğer mümkünse kayıtlar T1 veya ISDN gi bi sayısal
hatl ardan doğrudan s ayısal ol arak yapıl malıdır.
 Ve r i l e r o ül k e d e k ul l a n ı l a n s ı k ı ş t ı r m a f o r m a t ı n a ( m u law veya A-law) sadık kal ınarak kaydedilmeli ve veri
18
tabanını
kull anacak ki şileri n bu sıkıştırma verileri
d o ğ r u s a l h a l e ç e v i r m e l e r i i ç i n t a b l o l a r v e r i l m e l i d i r.
 Ve r i t a b a n ı n d a e n a z 5 0 0 0 k o n u ş m a c ı v e 1 2 5 , 0 0 0 s e s
örneği
yer
100’erli
a l m a l ı d ı r.
grupl ar
Konuşmal ardan
hali nde
500
tanesi
5
test
grubu
olarak
ile
50
arasında
sözce
a y r ı l m a l ı d ı r.
 Her
bir
konuşmacıdan
25
a l ı n m a l ı d ı r.
 Sözceler arasında az sayıda spontan konuşma ve
ayrıca
konuşmacının
kayıtla
ilgili
yorumunun
yer
a l d ı ğ ı b i r b ö l ü m d e b ul u n m a l ı d ı r.
 Her
bi r
sözce,
içermeyen
bi rer
başında
böl üml e
ve
sonunda
birlikte
ayrı
konuşma
bir
kütükte
s a k l a n m a l ı d ı r.
 Sözceler
arasında
t ü m c e l e r,
normal
harf
harf
s ö y l e n e n s ö z c ü k l e r, ç e ş i t l i b i ç i m l e r d e k i r a k a m d i zi l e r i
ve
sayıl ar
ve
içi nde
sayı
geçen
sözcel er
yer
a l m a l ı d ı r.
 Sözceler
kapsamalı,
dahili nde
dili n
üçl ü
i kili
sesleri ni
s e s l e r i ni
mümkün
ol duğu
ise
kadar
%100
prati k
f a zl a
oranında
sınırl amal ar
kapsayacak
b i ç i m d e s e ç i l m e l i d i r.
 Her bi r sözceni n ortografi g çeviri yazımı verilmeli,
ayrıca sözcel er ve konuşmacıl arın özellikl eri de ses
v e r i l e r i y l e b i r l i k t e v e r i t a b a n ı n a d a h i l e d i l m e l i d i r.
19
B u t e z i n a m a c ı y u k a r ı d a b a h s e d i l e n ç e ş i t l i ül k e l e r e a i t
veri
tabanl arı
konuşmacı
tanımaya
y a p m a k ” t ı r.
kull anıl an
al anda
i ncenelerek
El de
i nsan
sıkıntısı
“Türkçe
yönelik
edil ecek
sesi
veri
çekilen
veri
konuşma
tabanı
sonuçl ar
ta b a n l a r ı
bi r
veri
ile
örnekl emi
dünyada
i ncel enerek
tabanı
ve
bu
standardı
o l u ş t u r u l m a s ı a m a ç l a n m ı ş t ı r. B u v e r i t a b a n ı n d a n e l d e
edil ecek
farklı
spektrografi k
zamanl arda
anali z
alınan
yapılarak
d e ğ i ş i k l i k l e r i n c e l e n e c e k t i r.
sesler
sesler
üzeri nde
üzeri ndeki
20
2. KONUŞMA ve SES ÖZELLİKLERİ
2.1. Seslerin Oluşumu
Bi r konuşma i nsan tarafında ol uşturul urken, her şey den
ö n c e b i r k o n t r o l s i s t e m i ( s i ni r a ğ l a r ı ) y a r d ı m ı y l a b e y i n e
ul aştırılır
ve
düze nl enen
bir
şeyi n
mesaj
söylenmesi ne
konuşma
organl arı
karar
v e r i l i r,
( m e k a ni z m a s ı )
t a r a f ı n d a n ü r e t i l i r. B e y i n t a r a f ı nd a n b i r ç o k o l a y a a i t
bil giler
a l g ı l a n ı r, i ş l e ni r, d e p o l a n ı r v e k a r a r v e r i l e r e k
k o n u ş m a o l u ş t u r u l u r ( Hollien, 1990, s.:43).
Ş e k i l 2 . 1 ' d e b i r k o n u ş m a n ı n s i ni r s i s t e m i y l e i l i ş k i s i
bi r
di yagramla
tarafından
karar
kontrol
v e r i l i r,
sol unum
konuşma
a n l a t ı l m ı ş t ı r.
ses
si stemi
i çi n
gerekli
uyarıl ır
gerek li
m e k a ni z m a s ı
i çi n
Burada
ve
ses
ol an
tarafından
ötüml ü
konuşma
beyi n
üreti mi ne
enerji
kaynağı
s a ğ l a n m a k t a d ı r,
( voi ce)
sesl er
sol uk
b o r u s u ( l a r y n x ) i ç i n d e b ul u n a n s e s t e l l e r i ( v o c a l c o r d s )
bu
enerjiyl e
ti treşerek
gırtlak,
burun,
ağız,
dil
ve
d u d a ğ ı n y a r d ı m ı y l a s e s i ü r e t i r l e r.
Güç
Kaynağı
ol uşabil mesi
(Solunum
i çi n
yardımıyla hava
konuşmanı n
kaburgal ar
Bir
olan
enerji
gerekli
i l e s a ğ l a n ı r. H a v a
ni teliği ne
arası
Sistemi):
kasl ar
göre
ve
si ni r
karın
konuşmanı n
akci ğerl er
çıkışı yani şiddeti
sistemi
kasl arı
g ö ğ ü s a t ı ş ı y l a a y a r l a n ı r ( Hollien, 1990, s.:44).
yol uyl a
uy arılarak
Hava akışı
21
s ı r a s ı n d a k a s l a r i k i t ü r l ü k a s ı l m a y a p a r. B i r i n c i s i , h e r
heceye denk gel en hece kasıl ması, i ki ncisi de cüml ede
vurgunun
keli medeki
y e r i ni
beli rtmek
içi n
vurgu
k a s ı l m a l a r ı d ı r.
Sinir Sistemi
(Nervous System)
Kontrol Sistemi
Güç Kaynağı
(Enerji)
Ses Değiştiricisi
(Articulation)
Ses Jenaratörü
(Ses Kaynağı)
Solunum Sistemi
Gırtlak Sistemi
(Respiratory System)
(Laryngeal System)
Ses Yolu
(Vocal Tract)
Konuşma
Ş e k i l 2 . 1 . K o n u ş m a n ı n s i ni r s i s t e m i y l e o l a n i l i ş k i s i
( Hollien, 1990.s.:44)
Ses
Kaynağı
(Gırtl ak
Sistemi)
:
Konuşma
i çi n
i çi n
gerekli ol an enerji akciğerl erden sağl andıktan sonra,
s e s a ğ ı l ı n d a n g e ç e n h a v a s e s t e l l e r i ni h a r e k e t g e ç i r i .
Konuşma
hava
başl adığında
basıncı
a r ta r
ve
ses
ses
telleri
k a pa n ı r,
telleri
a ç ı l ı r,
ciğerdeki
bu
açılma
k a p a n m a s e s t e l l e r i n i n t i t r e ş m e s i n e n e d e n o l u r. N o r m a l
konuşmada
sani yede
60
ses
dönü
t e l l e r i ni n
(oktav)
açıl ıp -kapanma
ile
a r a s ı n d a d ı r ( Hollien, 1990, s.:46-48).
360
dönü
(2
sıkl ığı
oktav)
22
S e s Yo l u ( Vo c a l Tr a c t ) : S e s
y o l u ü ç b ö l ü m d e n o l u ş u r.
Bi ri nci si
hemen
gırtlağın
(pharynx).
İki nci si
(larynx)
geni z
boşl uğu
üstünde
( nasal
boğaz
cavity)
ve
üçünc üsü i se ağız (dil, dudak ve di şl er). Bu üç böl ümün
bi r biri yle olan i rtibatı dik bir tüpe benzer (Şekil 2.2).
Şekil 2.2.
1990).
Ses yol unun şematik
gösterimi
(Rossi ng,
Doğal sesli harfleri n ol uşumunda ses yol unun basi t
modeli,
ses
telleri nden
başlayıp
dudaklara
uzana n
u z u n l u ğ u L i l e g ö s t e r i l e n ( Ş e k i l 2 . 3 ) b i r t ü p t ü r. Fo= c / a L
(c:havada
sesi n
hızı)
olmak
üzere
tüp
Fo,
3 F1,
5 Fo
23
. . . . . . s o n s u z f r e k a n s r e z o n a n s l a r ı n a s a h i p t i r. N o r m a l b i r
ses
yol u
L=17cm,
c=340
m/s
değeri nde
rezonans
f r e k a n s l a r ı 5 0 0 H z , 1 0 0 H z , 1 5 0 0 H z . . . . . b u l u n u r ( Owens,
1993, s.:5,6). R e z o n a n s f r e k a n s ı f o r m a n t f r e k a n s ı o l a r a k
k u l l a n ı l ı r.
Ş e k i l 2 . 3 . S e s y o l u t ü p m o d e l i ( Owens, 1993, s.:5)
Ses yol unun konuşmanı n her anında farkl ı şekil
al masından
dol ayı
farklı
formant
frekansl arı
ü r e t i l e c e k t i r b u n e d e n l e d e f a r k l ı s e s l e r o l u ş a c a k t ı r. B u
sesl eri n ol uşumu
Owens ( 1 9 9 0 ) ' n a g ö r e k a y n a k f i l t r e
modeli nde si nyal ses kaynağından periyodik işaretl er
(pul s)
veya
yol unun
rasgel e
rezo nans
gürültül er
değerl eri ne
hali nde
benzer
ç ı k a r,
ses
değerler
ile
z a m a n d e ğ i ş i m l i f i l t r e l e r l e f i l t r e l e n i r. F i l t r e ni n f r e k a n s
k a r a k t e r i s t i ğ i ta r a f ı n d a n k a y n a k s p e k t r u m u n ç o ğ a l m a s ı
i l e k o n u ş m a s i n y a l i ni n f r e k a n s s p e k t r u m u e l d e e d i l i r. B u
durum ötüml ü ve ötümsüz sesl er i çi n şekil 3.4 kaynak
fil tre
modeli nde
g ö s t e r i l m i ş t i r. A v
ve An
ö t ü m s ü z d a l g a l a r ı n ş i d d e t i ni ta n ı m l a r.
ötüml ü
ve
24
Ş e k i l 2 . 4 . K a y n a k f i l t r e m o d e l i ( Owens, 1993, s.:7)
Ses yol u sonsuz rezona ns değeri ne ve formant
f r e k a n s ı n a s a hi p o l m a s ı n a r a ğ m e n 1 0 0 H z i l e 3 , 5 k H z
arası
frekans
y e t e r l i d i r.
al anını
Çünkü
formantl arın
i çeren
ko nuşma
g e nl i k l e r i ,
ilk
3
4
formant
si nyalleri ndeki
yüksek
ötümsüz
veya
sesl eri n
kaynağı
t a r a f ı n d a n y a k l a ş ı k 1 2 d B / o k t a v k a d a r a z a l ı r. Ö t ü m s ü z
k a y n a k l a r d a s p e k t r u m d ü z v e g e n i ş t i r. Ş e k i l d e k i k a y n a k
fil tre
modeli
konuşma
ol uşum
i ş l e m i ni
ol dukça
b a s i t l e ş t i r i r. S ı z m a l ı s e s l e r ö t ü m l ü v e n e f e s l i s e s l e r l e
aynı
derecede
vokal
alanın
rezonansı
ile
filtre
e d i l e m e z l e r. D o l a y ı s ı y l a k a y n a k f i l t r e m o d e l i s ı z m a l ı
s e s l e r i ç i n t a m d o ğ r u d e ğ i l d i r.
25
Ses
yol unun
teori k
m o d e l l e r i ni n
i ncel emesi nden
sonra gerçekte bi r sesi n ol uşumuna kat kı sağl ayan ses
organlarının neler ol duğu (Şekil 2.5) ve görevl eri nden
bahsedersek:
G e n i z B o ş l u ğ u ( 1 ) : Yu t a k
deli ği ne
kadar
u z a n ı r.
boşl uğu biti mi nden buru n
Uzunluğu
10
cm
kadardır
( D e m i r c a n , 1 9 9 6 , s . : 1 0 ) . G e ni z s e s l e r i ni n a y r ı o l u ş u ,
g e n i z b o ş l u ğ u n d a k i d a l g a d e ğ i ş i m i n d e n m e y d a n a g e l i r.
Dudaklar (2): Ses yol unun en dış ucunda dudakl ar
b u l u n u r. Ü s t - d u d a k v e a l t - d u d a k b i r l i k t e s e s ç ı k a r t t ı ğ ı
gi bi (p,b,m gi bi), yal nızca al t -dudak üst-di şlere karşı da
kull anıl abilir (f,v gi bi) (Demircan, 1996, s.:8 ).
Dişler
(3):
Sesl eti mde
yal nızca
üst -di şl er
k u l l a n ı l ı r.
Ü s t - d i ş l e r, d i l - u c u v e a l t - d u d a k l a b i r l i k t e f , v s e s l e r i ni
ç ı k a r m a k i ç i n k ul l a n ı l ı r. G e ni z ( m , n ) s e s l e r i n d e n ( v, f )
sesl eri ne geçi ş zor ol duğundan, bu konumda m -n ayrımı
o r t a d a n k a l k a r. O b a ğ l a m d a , b i r t ü r m o l a n a l t d u d a k ü s t d i ş g e ni z ü n s ü z ü ç ı k a r ı l ı r ( D e m i r c a n , 1 9 9 6 , s . : 9 ) .
Damak(4,5,6): damak, önden arkaya doğru di ş -seti (4,
the alveolar ridge ), sert damak(5, the hard palate),
yumuşak-damak(6,
the
s o ft
palate
or
vell um)
diye
b ö l ü n ü r.
Diş-seti(4), sert-damaktan önce fakat di şlerden sonra
g e l i r, d i l i n d o ğ r u s u v e u c u i l e b i r l i k t e k ul l a n ı l m a k t a d ı r.
26
Burada
da
ses
yol u
ya
kapanır
(t,d,n
gi bi)
ya
da
daraltıl ır (s,z gi bi).
damak(5) ,
Sert
sesletmede
dili n
önüyl e
birlikte
k u l l a n ı l ı r. D i l - u c u , s e r t - d a m a k l a b i t i ş e r e k s e s y o l u n u
kapayabilir
daral abilir
ya
(ş,j
da
sızmaya
gi bi)
/y/
sesi
neden
olacak
çıkarılırken
kadar
dil -ucu
ile
d a m a k a r a s ı n d a k i a r a l ı k , s ı z m a o l m a y a c a k k a d a r a ç ı l ı r.
/i ,ü,e,ö/ ünl ül eri içi nse, bu aralık derece derece daha
geni ş ol ur(Demircan, 1996, s.:9 ).
Yu m u ş a k - d a m a k ( 6 ) ( k ü ç ü k d i l ) , i k i a y r ı g ö r e v y a p a r, y a
al çal arak geni z yol unu açar (m,n gibi ), veya yukarı
kal karak
g e ni z
yol unu
kapatır(a,p,s
gi bi).
Böylece
sesl er ağız sesl eri (a,p,s gi bi), geni z sesl eri(m,n gi bi)
di ye
iki ye
bi rlikte
a y r ı l ı r.
ya
ağız
İki nci
yol unu
görevi
i se,
kapatmak
dili n
(k,g
arkasıyl a
gibi )
ya
da
geni şletmektir (o,a gibi ) (Demi rcan, 1996, s.:8 ).
Dil
(7):
En
oynak
en
oynak
ses
organı
olan
dil,
s e s l e t i m d e d a m a k i l e b i r l i k t e g ö r e v y a p a r. Ç ı k a r ı l a n
sesl ere göre önden arkaya doğru ş u böl üml ere ayrılır;
uç,
orta,
art.
Dil
üç
türl ü
devi nir;ağız
yol unu
kapar(t,d,k,g...gibi ), ağız yol unu daraltır (i ,ü...gi bi), diş
seti ne çarpar (r gibi) (Demi rcan, 1996, s.:8 ).
Ağız boşluğu (8):
Ses yol unun en önemli böl ümü
a ğ ı z d ı r. S e s d e ğ i ş i m l e r i d i l i n , y u m u ş a k d a m a ğ ı n d u r u m u
v e ç e n e a ç ı k l ı ğ ı d e ğ i ş t i r i l e r e k s a ğ l a n ı r.
27
Yu ta k B o ş l u ğ u ( 9 ) : S e s t e l l e r i y l e y e m e k b o r u s u ü s t
ucundan
başl ayıp
ağız
ve
geni z
boşl uğunu n
b a ş l a n g ı c ı n a k a d a r s ü r e r. G ö r e v l i , d i l i n k ö k ü n ü g e r i y e
ç e k e r e k g ı r t l a ğ ı n y u k a r ı d o ğ r u o y n a t a r a k y u t a k y a nl a r ı n ı
k a s a r a k d e ğ i ş t i r i r. ( D e m i r c a n , 1 9 9 6 , s . : 1 0 )
Ş e k i l 2 . 5 . G ı r t l a ğ ı n y a n d a n k e s i t i ( Hollien, 1990, s.:52)
1 , g e ni z b o ş l u ğ u - 2 , d u d a k l a r - 3 , d i ş l e r - 4,damak önü5,sert damak-6,yumuşak damak ya da küçük dil- 7,dil-8, ağız
boşluğu- 9, yutak boşluğu- 10, gırtlak kapağı- 11, gırtlak12, yemek borusu-13, yutak ön duvarı- 14, boyun kemiği.
28
Ses
organl arının
kısaca
g ö r e v l e r i ni
a nl a t t ı k t a n
sonra bu organl arın bi r sesi sesleti mi ndeki ses yol unu n
a l d ı ğ ı ş e k i l i k ı s a c a i n c e l e y e l i m . " i " v e " a " s e s l e r i ni n
çıkartıl masında ses yol unun al dığı Şekil 2.6'de gösteril m i ş t i r.
Şekil 2.6. "i" ve "a" sesl eri ni n çıkartılmasında ses
y o l u n u n a l d ı ğ ı ş e k i l ( F r y, 1 9 7 9 . S . : 7 7 ) .
Burada "i " harfi i çi n dil orta tarafı damağa çok yakı n ve
s e s y o l u ç o k u z u n d u r, b u n a k a r ş ı n d i l u z u n l u ğ u ç o k
k ı s a d ı r ( F r y, 1 9 7 9 ) . Sp e k t r a l g ö s t e r i m d e b i r i n c i f o r m a n t
f r e k a n s ı F1 1 2 0 H z ' l i k s k a l a d a
360 Hz, iki nci formant
29
frekansı
F2 2 2 8 0
tamamen
f a r k l ı d ı r.
yakl aşmış
bi ri nci
H z ' d i r.
ses
Dil
yol u
formant
"a"
sesl eti mi nde
gırtlak
çeperi ne
k ı s a l m ı ş t ı r.
frekansı
yatay
Sp e k t r a l
F1 7 2 0
Hz,
ses
yol u
olarak
gösterimde
i ki nci
formant
f r e k a n s ı F2 1 2 0 0 H z ' d i r.
Formant frekansı, konuşma anında vokal alanı n
farklı
şekiller
al masından
dolayı
farklı
rezonansl ar
o l u ş u r v e f a r k l ı s e s l e r o l u ş u r, h e r b i r f a r k l ı r e z o n a n s a
formant
frekansı
rezanansta n
d e ni r.
dol ayı
Sürekli
konuşmada
konuşmanı n
her
farkl ı
anı nda
farkl ı
f o r m a n t f r e k a n s ı ü r e t i l e c e k t i r. K o n u ş m a n ı n o l u ş u m u n d a
formant
frekansl arı
sesl etil miş
herkes
olsaydı
hi ç
tarafından
ki mse
bir
aynı
biri ni
Hz'l erde
sesi nden
tanıyamayacaktı. Bu nedenle herkesi n kendi ne özgün
formant
frekansl arı
vardır
ve
bu
o
k i ş i ni n
ses
k a r a k t e r i s t i ğ i ni o l u ş t u r u r.
2.2.
Konuşma Dilinin Özellikleri
K o n u ş m a d i l i ni i n c e l e m e d e n ö n c e , k o n u ş m a d i l i - y a z ı d i l i
ayrımını
i ncel emekte
yarar
v a r d ı r.
İnsanın
ayrıcal ık
bel gesi ol arak görebileceği mi z dil, onun dış dünyayla ve
d i ğ e r b i r e y l e r l e i l i ş k i l e r i ni b e l i r l e y e n , y a n s ı t a n ; i n s a n v e
topl umdan
teknik
ayrı
gi bi
ol uşturan
k i ş i l i ğ i ni n
düşünül emeyecek
bütün
bir
a l a nl a r l a
k u r u m d u r.
ilgisi
K i ş i ni n
b e l i r g i nl e ş m e s i n d e
olan
bilim,
b ul u n a n
ruhsal
ve
ve
ve
sanat,
onl arı
topl umsal
düşünce ni n
ol uşmasında önemli işl evi ol an dil, başkal arını etkileme,
30
yönl endi rme,
aktarmanın
yanı
sıra,
belli
amaçl arla
g e r ç e k l i ğ e i l i ş k i n d e n e y i m l e r i a k ta r m a n ı n y a n ı s ı r a b e l l i
amaçl arl a gerçekliğe şu ya da bu görüntüy ü vermek i çi n
başvurul an yöntemleri n de başında gelir (Ergenç, 1995,
s.:28).
Her
dil
konuşul duğunda
topl um i çi nde
kendi ne
özgü bi r eki n ve uygarlık çevresi nde biçi mlenirken, dış
dünyayı topl umsal, ruhsal ve fizi ksel gerçekli ği özgün
b i r b i ç i m d e y o r u m l a r, k a v r a m l a ş t ı r ı r v e y a p ı l a ş t ı r ı r.
Bili ndi ği gibi dili n i ki yönü vardır; konuşma dili ve
yazı
dili.
sesl erden
Gerçekte
ol uşan
bir
dil
ol gusu
düzl eme
yazıdan
b a ğ l a n ı r.
bağımsız,
Bu
a çıdan
k o n u ş m a d i l i b i r u l u s u n , b i r d i l b i r l i ğ i n i n d i l i ni n y a z ı y l a
i l i ş k i l i o l m a y a n v e ç e ş i t l i s ö y l e y i ş ö z e l l i k l e r i ni t a ş ı y a n
y ö n ü d ü r. B u n e d e n l e y a z ı ç o k s o n r a b ul u n d u ğ u i ç i n
t e m e l o l m a ni t e l i ğ i t a ş ı r. Ya z ı d i l i i s e , s ö zl ü b i l d i r i ş i m
aracı, dili görsel ve tek boyutl u bi r düzen i çi nde sunan,
u z a k t a n b i l d i r i ş i m s a ğ l a m a k , b i l d i r i l e r i n y i t i p g i t m e s i ni
önl emek
gi bi
amaçlarla
kullanıl an
bi r
düzgü,
bir
a n l a t ı m , k ı s a c a s ı i k i n c i l b i r d i z g e d i r. S a u s s u r e ’ y e g ö r e
“Dil ve yazı birbi ri nden ayrı i ki göstergel er di zgesi dir.
Ya z ı n ı n b i r i c i k v a r l ı k n e d e n i , d i l i g ö s t e r m e k t i r. ”
İki ncil di zge, zamanla önem kazanarak kendi ne
özgü yeni bi r gerçeklik düzl emi yaratırken, genellikle
d i l i d u r a ğ a n l a ş t ı r ı r, g e l e n e ğ i k o r u r. H e r t ü r l ü b i l d i r i ni n ,
bu arada eki nsel ve yazınsal değerl eri n başlıca aktarım
a r a c ı d u r u m u n a g i r e r e k k u r u m l a ş ı r. Ta r i h s e l k o ş ul l a r ı n
31
etki siyl e konuşma diliyle yazı dili arasında büyük bi r
kopukl ukta
g ö r ül e b i l i r.
Ya z ı y l a
söyleyi ş
arasındaki
kopukl uğun en ö nemli nedeni, dili n evri m geçirmesi ne
karşın, yazının deği şmede n ol duğu gi bi kalması sonucu
i k i d i z g e a r a s ı n d a k i k o ş u t l u ğ u n o r t a d a n k a l k m a s ı d ı r.
Ya z ı d i l i n d e n f a r k l ı o l a r a k k o n u ş m a d i l i ni n k e n d i n e ö z g ü
ö z e l l i k l e r i v a r d ı r. A n l a m a y ı r ı c ı g ü ç t e o l a n b u ö z e l l i k l e r,
yazılı
m e t i nl e r d e k i
kull anıl an
‘sözcük’
durakl ardan,
aral arını
d i n l e y i c i ni n
belirlemede
d i k k a t i ni
çekmek
i ç i n k i m i s ö z ö b e k l e r i ni ö n e ç ı k a r m a k ü z e r e n e f e s i m i z i
yoğunl aştırmamıza kadar uzana n geni ş bi r yelpazede
y e r a l m a k ta d ı r.
B i l i n ç l i b i r a n a d i l i k o n u ş u c u s u n u n d ü ş ü n c e l e r i ni ,
duygul arını
karşısındaki ne
sunarke n;
onu
etkilemek,
d i k k a t i n i ç e k m e k a m a c ı y l a a n a d i l i ni n t ü m o l a n a k l a r ı n ı
kull anması
b e k l e ni r.
Bunun
i çi n
de
d i l i ni n
i şleyiş
ö z e l l i k l e r i n i b i l m e k v e o nl a r ı d o ğ r u b i ç i m d e u y g u l a m a k
z o r u n d a d ı r. Ö z e l l i k l e i ş i v e a m a c ı g e r e ğ i g e n i ş k i t l e l e r e
s e s l e n e n l e r i n e l l e r i n d e k i e n ö n e m l i g ü ç b u d u r. A n c a k ,
bu
b e k l e n t i ni n
her
zaman
i stenilen
düzeyde
g e r ç e k l e ş t i ğ i ni s ö y l e m e k z o r d u r. K u l l a n ı l a n m e t i n n e
denli iyi ol ursa olsun, sunuş kötüyse amaçlanan etki
y a r a t ı l a m a z . B u n u n t e r s i d e s ö z k o n u s u d u r. İ ç e r i ğ i p e k
dol gun
olmayan
bir
bildiri ,
etkili
bir
konuşmayl a
bekl enenden öte sonuçl ara ul aşabilir (Ergenç, 1990, s:
1 5 7 - 1 6 4 ) . H i ç b i r y a z ı d i z g e s i , k o n u ş m a d i l i nd e k i t o n
y ü k s e k l i ğ i ni v e v u r g u n u n a n l a m t a ş ı y a n d e ğ i ş i m l e r i ni
yansıtamaz.
Bi r
gerçekleşebil me -si
konuşmanın
eksi ksi z
biçi mde
içi n
koşullar
şunl ardır;
gereken
32
konuşma
ortamı,
konuşmayı
konuşmanı n
amacı,
di nl eyeni n
tepki si,
konuşmanı n
temel
o
ana
payl aşan
k i ş i l e r,
sunul an
bil gilere
kadar
konuşmada
düşünsel
k ul l a n ı l a n
destekleri
ve
araç,
iletişi mi n
bi çi mi.
Bi r
konuşmanın
ol uşum unda
ana
koşul
hi ç
k u ş k u s u z d i l s e l i ç e r i k t i r. B i r k o n u y u e t k i l e y i c i b i ç i m d e
k a r ş ı d a k i n e a k ta r m a ç a b a s ı , ç o k e s k i l e r e d a y a n ı r v e
bunun öğretisi ne eski çağl ardan beri sözbilim ( rhetori c)
d e n m i ş t i r. İ . Ö . 8 5 - 8 4 y ı l l a r ı n d a Ç i ç e r o , s ö z b i l i m i n g e n e l
ol arak üç amacı olduğunu söyl emi ş, bunl arı öğretmek
(docere),
i nandırmak(movere),
(debatere)
ol arak
ve
s ı r a l a m ı ş t ı r.
hoşnut
Çi çero’nun
etmek
sözbi lim
ü z e r i n d e k i b ul g u v e s a p ta m a l a r ı n ı y a z d ı ğ ı y ı l l a r d a h e r
çeşi t
söyl ev
ve
söylemi n
genel
ol arak
şu
5
ana
aşamadan ol uşması ge rekti ği öne sürül üyordu (Ergenç,
1995, s.:14):
Bul uş (i nventi o)
Düze n (di spositi o)
Seçi m (elecuti o)
Bell eğe alma (memori a)
Sunuş (acti o, pronunti atio)
Bi r
konuşmanın
gerçekleşti rilmesi
bul unması
g e r e k i r.
konuşmacıyl a
içi n
tam
çeşitli
Bunl arın
i l g i l i d i r.
ve
etkili
k o ş ul l a r ı n
bi r
böl ümü
Konuşmacı,
bi çimde
bir
arada
doğrudan
konuşmasının
amacını i yi belirlemeli, konusunun sınırl arını i yi çi zerek
33
ona
bağlı
kal mal ı
ol anakl arını
ve
konuş ma
t a n ı m a l ı d ı r.
konuşmanı n
başarısını
sıralanabili r;
konuya
amacı
Buna
etkileyen
bağlı
konuş ul an kişi , iletişi m
kalma,
olan
dilin
dayanarak
bir
koşull ar
şöyle
konuşma
amacı, İleti şim
o r ta m ı ,
aracı,
ortam
koşulları, konuşmanın düş ünsel desteği ne bağlı kalma
(Ergenç, 1995, s.:14 -15).
2.3.
Türkçe’nin Ses Özellikleri
Bi r dili başka dillerden ayıran en ö nemli özelliklerden
bi ri
ses
d ü z e n i d i r.
Biçi msel
sınırl andırmal arda
bağl antılı diller ( aggl uti nati ve language ) grubuna gi ren
Türkçe’ni n
ses
açısından
başlıca
ö z e l l i k l e r i ni
şöyle
sıralayabiliri z; Ünl üsü bol bir dil ol an Türkçe’ni n e n ti pik
özelliği , benzeşme (assimilati on) adı verilen ünl ü ve
ünsüz
uyuml arıdır
(vowel
and
consonant
harmony ).
Sözcüğün il k sesl emi ndeki (öncül deki) ünl ünün çıkış
yeri ve çıkış biçimi açısından taşıdığı özellikl eri sonraki
(ardıldaki)
sesl emde
b ul u n a n
ünl ü ye
ul aştırarak
k e n d i s i n e b e n z e t m e s i o l a r a k t a nı m l a y a b i l e c e ğ i m i z ü n l ü
uyum u
kurall arı,
s ö y l e y i ş l e r i ni
dilimi ze
de
gi ren
etkil eyerek
yabancı
en
sözcükl eri n
az
çabayl a
s e s l e t i m l e r i ni s a ğ l a m a k t a d ı r ( E r g e n ç , 1 9 9 5 , s . : 1 6 ) .
o-tu-ruş-l a-rı-nı
i-çi -le-me-di-ği n-den
ku-ru-tul -mak-ta-dır
baş-l a-dı-ğı-mız-da
34
sûret>surat
dîvâr> duvar
hâste> hasta
Türkçe
de
ünsüz
benzeşmesi,
kök
ya
da
gövdeleri n son sesi ndeki ünsüzün kendi si nden sonra
gel en eki n başındaki ünsüzl e ötüm ( sonori ty) açısından
b e n z e ş m e s i d i r.
ağaç+ta okul+dan
ev+de
si rk+ten
dal +gın er+dem
seç+ki n yön+tem
Türkçe’ni n ses açısından bir başka özelliği i se
sözcüğün ö n sesi nde birden çok üns üzün bi r arada
b u l u n m a s ı d ı r. A y n ı s e s l e m i ç i n d e ö n y a d a s o n s e s t e
bi rden
f a zl a
ünsüzün
bul unması
biçi mi nde
t a n ı m l a y a b i l e c e ğ i m i z ü n s ü z y ı ğ ı l m a s ı , b ul u n d u ğ u d i l i n
sesl em
düzeneği yl e
sesl em
yapısının
yığılmasına
i zi n
sıkı
sıkıya
kuralları
vermez.
b a ğ l a n t ı l ı d ı r.
gereği
Bağlantılı
Türkçe
önseste
bir
dil
ünl ü
olması
nedeni yl e, ancak sonsesi nde ünsüz yığıl ması olan bi r
bi çi mbi rime
yığılması
eklenmesi yle
dedi ğimi z
ol ayla
içseste
ol uşan
karşıl aşabiliri z
ünsü z
(Ergenç,
1995, s.:17).
abart-mak
çıkart-mak
si lk-mek
dol durt-mak
kork-mak
dürt-mek
35
Sonseste ünsüz yığıl masını i çeren sözc ükl eri n bi r
kısmı Türkçe’ni n sesl em sonunda kabul edilen ünsü z
yığılmal arına örnek verilecek ol ursak:
kıskanç
i nanç
iğrenç
eri nç
sevi nç
tunç gül ünç
çel enk
kepenk
özerk
erk
sarp
basınç
hınk
kürk
turp
ant
kent tont
ast
üst
hi şt
hoşt
Önseste ünsüz yığılmasının
bul unduğu yabanc ı
kökenli sözcükl eri n sesleti mi nde zorl ukl a karşılaşıldığı
içi n söyleyiş kol aylığı sağl amak amacıyl a ya sözcüğün
başına
ya
da
ünsüzl eri n
arasına
bir
ünl ü
koyarak
s e s l e m l e r e a y ı r m a y o l u n a g i d i l i r. Y ı l l a r ö n c e d i l i m i z e
gi rmiş,
önsesi nde
ünsü z
yığıl masının
yer
al dığı
s ö z c ü k l e r, b u y ö n t e m l e y e ni b i r b i ç i m e s o k u l m u ş v e b u
y e n i b i ç i m y a z ı m a d a y a n s ı t ı l m ı ş t ı r.
stati on>istasyon
scutari >Üsküdar
scal a>iskel e
stavroz>istavroz
Bugün dilimi zde
k ul l a n d ı ğ ı m ı z ö n v e i ç s e s i n d e
ünsüz yığıl ması olan s özcükl eri sesletirken genellikle
ünsüzl eri n arasına bi r ünl ü koymaktayız. Bu durum a
i ç s e s t ü r e t m e s i ( e p e n t h e s i s ) o l a r a k t a a d l a n d ı r ı l ı r.
36
tren~tiren,
fren~firen,
pl an~pilan,
gri p~gıri p,
pl aj~pilaj ,
kral~kıral ,
santral ~santıral,
el ektri k~elektiri k,
Sonsesi nde
ünsüz
sözcükl erde
de
yığıl ması
aynı
durum
ol an
yabancı
kökenli
yaşanmaktadır
(Ergenç,
1995, s.:18).
Türkçe’de Sesler
2.3.1.
K o n u ş m a o r g a nl a r ı m ı z ı n ( a k c i ğ e r, a ğ ı z , b u r u n , b o ğ a z
boşl uğuyl a sol uk) uyum i çi nde ve düzenl i çalışmasıyl a
anl amlı
sözc ükl er
ve
tümceler
ol uşturmak
i çi n
ağzımızdan çıkardığımız biri mlere düzenli sesler denir
ve ünl üler ( vowel) ve ünsüzl er (consonant) olmak üzere
iki ye ayrıl ır (Ergenç, 1995, s.:18).
Ü n l ü l e r ö z g ü r v e g ü r ü l t ü s ü z s e s l e r d i r. B i r d i ğ e r
tanımıyl a akci ğerden gel en sol uğun hi çbi r sürtünme ve
engellemeye
çıkardığı
s e s l e r d i r.
organlarının
daral ma
uğramadan
Bu
herhangi
ol madığı
dili n
sesl er
bir
i çi n
üstünden
geçerken
çıkartılırken
konuşma
yerinde
kapanma
g ü r ü l t ü s ü z d ü r l e r.
ya
da
Ü n l ül e r i n
ç ı k a r ı l ı ş ı n d a e n ö n e m l i g ö r e v i ü s t l e n e n o r g a nl a r d i l ,
çene
ve
d u d a k l a r d ı r.
ayrımlanması
Türkçe’ni n
bu
nedenl e
o r g a nl a r ı n
ünl ül eri ni
tanımlayabiliri z:
Bu
bu
ünl ül eri n
durum una
sınıflandırmaya
tanımsal
göre
göre
y a p ı l ı r.
şöyle
37
Çene açısının durumuna göre:
G e n i ş ü n l ül e r ( w i d e v o w e l ) a , e , o , ö
Dar ünl ül er (narrow vowel) ı,i,u,ü
Dudakların biçimine göre:
Düz ünl ül er (unrounded vowel ) ı,i,a,e
Yu v a r l a k ü n l ü l e r ( r o u n d e d v o w e l ) o , ö , u , ü
Dilin devinimine göre:
Arkadil ünl üleri (back vowel ) ı,a,o,u
Öndil ünl ül eri (front vowel ) i ,e,ö,ü
Öndil ünl ül eride kendi aral arında iki ye ayrıl ır:
Yu v a r l a k ö n d i l ü n l ü l e r i ö , ü
Düz ö ndil ünl ül eri e,i
Arkadil ünl üleri arasında yer al an /ı/ ünl üsü çıkış yeri
açısından
ortadil
(midi um
vowel )
ünl üsü
ol arak
da
g ö r ü l e b i l m e k t e d i r.
Her
dili n
sesl eri ni n
özelli ği
bi rbiri n den
farkl ı
ol duğunda n daha sağl ıkl ı bi r betiml eme yapabilmek içi n
ünl ü dörtgeni ( vowel quadrilateral ) (Şekil2.7) denilen ve
ünl ül eri n çıkarılışında dili n ağız boşl uğundaki durumun u
g ö s t e r e n b i r d ü z l e m d e n y a r a r l a n ı l m a k t a d ı r.
38
i
y
u
ı
Y
e
U
Ø
ε
o
ǽ
œ

Ï

a
Ş e k i l 2 . 7 . Ü nl ü d ö r t g e ni ( E r g e n ç , 1 9 9 5 , s . : 1 9 )
K o n u ş m a s e s l e r i ni n i k i n c i b ü y ü k k ü m e s i o l u ş t u r a n
ü n s ü z l e r,
engelli
s e s l e r d i r.
Çıkarıl ışları
sırasında
k o n u ş m a o r g a nl a r ı n ı n h e r h a n g i b i r y e r i n d e a l ı k o n u l u r l a r
v e b u n u n s o n u c u o l a r a k b i r s ür t ü n m e y a d a p a t l a m a
bi çi mi nde
o l u ş u r l a r.
Ünsüzl er
çıkış
biçi mleri ne,
yerl eri ne ve ses telleri ni n durumuna göre sınıfl andırıl ır
(Ergenç, 1995, s.:18).
Çıkış biçimlerine göre;
Patl amal ı üns üzl er (plosi ve)b,d,g,p,t,k
Geni z üns üzl eri (nasal) m,n
Çarpmalı ünsüzl er (rolled) r
Ya n d a r a l m a ü n s ü z l e r i ( l a t e r a l ) l
S ü r t ü n ü c ü ü n s ü z l e r ( f r i k a t i v e ) c , ç , f , h , j , s , ş , v, y, z
Çıkış yerlerine göre;
39
Çi ft dudak üns üzl eri (bil abi al) b,p,m
Dudak-di ş ünsüzl eri (labiodental ) f,v
Dil ucu dişardı ünsüzl eri (dental ) d,t
D i l u c u - d i ş e t i ü n s ü z l e r i ( p a l a t o - a l v e o l a r ) n , r, s , z
Dil -öndamak ünsüzl eri (alveo -palatal ) c,ç,j,ş,y
Dil ucu-öndamak ünsüzl eri (api cal/pal atal)l
Dil -artdamak ünsüzl eri (velar) k,g
Gırtlak ünsüzl eri (glottaş) h
Ses tellerinin titreşimine göre;
Ö t ü m l ü ü n s ü z l e r ( v o i c e d ) b , c , d , g , j , l , m , n , r, v, y, z
Ötümsüz ünsüzl er(voi celess) ç,f,h,k,p,s,ş,t
Öl çünl ü (standart) Türkçe’deki ünl ü ve üns üzl eri n
b i r b ö l ü m ü n ü n k o n u ş m a o r g a nl a r ı n d a k i o l u ş u m y e r l e r i n e
g ö r e d e ğ i ş k e l e r i ( v a r i a n t ) b u l u n m a k t a d ı r. A nl a m a y ı r t
edi ci
güçte
ol mayan
dağılıml arının
b i r b i r l e r i ni n
belli
yeri ne
bu
olmasına
değişkeleri n
dildeki
karşın
zaman
k ul l a n ı l a b i l m e k t e d i r.
kimi
Anlam
farkı
yaratmayan bu durum, öl çünl ü söyl eyişi n dışında bir
görünüm sergilemektedir (Ergenç, 1995, s.:20).
Türkçe’ni n
seslem
yapısı
gereği ,
aynı
sesl em
içi ndeki iki ünl ünün bi r arada bulunması yabancı kökenli
s ö z c ü k l e r d ı ş ı n d a s ö z k o n u s u d e ğ i l d i r. B u n e d e n l e y a z ı
dili nde
ünl ü
konuşma
kayması
dili nde
ki mi
(di phthong)
ünsüzl eri n
y o k t u r.
söyl eyi ş
Ancak,
s ırasında
sesl etil memeleri nedeniyl e, “tek sesmi ş gi bi çıkarılan ya
d a b a ş l a n g ı ç t a d u y u l a n s e s i n b i t i ş i n d e y e r i ni b i r b a ş k a
sese
bırakması”
olarak
ta n ı m l a y a b i l e c e ğ i m i z
ünl ü
40
kaymaların
Türkçe’ni n
konuşma
dili nde
var
olduğu
s e s y a z a r l a r l a y a p ı l a n ö l ç ü m l e r s o n u c u k a n ı t l a n m ı ş t ı r.
Öl çünl ü Türkçe de var ol an sesleri n genel görünüm ünü n
dışındaki özellikleri i çi n bu konuda yazıl mış yapıtlara
başvurul abilir (Ergenç, 1995, s.:22).
41
3. GERÇ VE YÖNTEM
Bu
böl ümde
Türkçe
veri
tabanı
ol uşturul masın da
uygul anacak en uygun veri tabanını n beli rlenmesi içi n
bi ri nci
böl ümde
P O LY P H O N E
i ncel enen
standartları
veri
tabanları
karşıl aştırılmış
ve
ile
veri
tabanının örnekl emi i çi n gerekli ol an sözl ü ve yazıl ı
m a t e r y a l l e r o l u ş t u r u l m u ş t u r.
Ayrıca,
ol uşturul acak
konuşma
ve
konuşmacı
T Ü R K Ç E - P O LY P H O N E
ses
tanıma
veri
içi n
tabanı
ö r n e k l e m i n e d e n P O LY P H O N E s t a n d a r t l a r ı s e ç i l d i ğ i v e
neden
tel efon
hattı
üzeri nden
al ınması
gerekti ği
a n l a t ı l m ı ş t ı r.
3.1.
Okutulacak
ve
S p o n ta n
Olarak
Söyletilecek
Ve r i n i n O l u ş t u r u l m a s ı
Bi ri nci
böl ümde
a nl a t ı l a n
çeşitli
ül k e l e r e
ai t
veri
t a b a n l a r ı , P O LY P H O N E p r o j e s i n d e n ö n c e t o p l a n d ı ğ ı i ç i n
o l u ş t u r u l a n s t a n d a r t l a r ı n d ı ş ı n d a k a l m ı ş t ı r. B u n e d e n l e
standart kapsamında veya buna yakın şekil de toplanan
d ö r t v e r i ta b a n ı i l e i l g i l i v e r i l e r k a r ş ı l a ş t ı r m a l ı o l a r a k
Ç i z e l g e 3 . 1 . ’ d e v e r i l m i ş t i r. B u n l a r A m e r i k a n İ n g i l i z c e s i
içi n yürütül en MACROPHONE (Bernstei n et al.,1995),
Japonca
içi n
yürütül en
“ Vo i c e
Across
Japan
( VA J )
( St a p l e s e t a l . , ( 1 9 9 4 ) , A B D ’ d e k i İ s p a n y o l c a k o n u ş u l a n
k i ş i l e r i ç i n y ü r ü t ü l e n “ Vo i c e A c r o s s H i s p a ni c ” ( VA H A )
42
(Muthusamy et al ., (1995) ve Flemenkçe i çi n yürütül en
“ D u t c h P O LY P H O N E ” ( B o v e s e t a l . , 1 9 9 3 ) p r o j e l e r i d i r.
O r t a y a ç ı k a n v e r i ta b a nl a r ı a y r ı n t ı l ı o l a r a k i n c e l e n m i ş t i r.
Ve r i t a b a n ı o l u ş t u r u l m a s ı i ç i n s e s ö r n e ğ i a l ı n a c a k
ki şilere okutul acak materyali n seçi mi, kağıttan okuna n
v e s p o n t a n s ö y l e t i l e n o l a r a k i k i y e a y r ı l m ı ş t ı r. H e r b i r
veri tabanında yer al an sözceleri n topl am sayısı ve
okuna n ve spontan söyl etil en sözcükl eri n sayısı çi zelge
3 . 1 ’ d e v e r i l m i ş t i r.
Çizelge
3.1
P O LY P H O N E
s ta n d a r d ı n a
göre
o l u ş t u r u l a n v e r i ta b a nl a r ı n ı n t o p l a m s ö z c e s a y ı s ı .
Macrophone
Okuna n
sözce
Sp o n t a n
sözce
To p l a m
sözce
P O LY P H O N E
VAJ
VAH A
Dutch
Polyphone
34
10
36
32
11
4
9
18
45
14
45
50
standardına
göre
kağıttan
okunan
ve
spontan olarak söyl etil en materyali n dükümü oriji nali ne
uygun ol arak sırasıyla çi zelge 3.2 ve çi zel ge 3.3’de
v e r i l m i ş t i r.
43
Sp o n t a n
ol arak
konuşmacılara
yanıtl anan
gönderilen
sorul arın
meti n
bir
böl ümü
kağıtl arında
yer
al makta, dol ayısıyl a konuşmacı ne söyl eyeceği ni daha
önceden
ise
p l a n l a y a b i l m e k t e d i r.
kayıt
işl emi
sırasında
Sorul arın
di ğer
doğrudan
böl ümü
konuşmacıya
s o r u l m a k t a d ı r.
Çi zelge 3.1’de fark edil diği gibi Japonca içi n yürütül en
VA J
projesi
P O LY P H O N E
k a r ş ı l a m a m a k t a d ı r.
s ta n d a r d ı n ı
P O LY P H O N E
tam
ol arak
s ta n d a r d ı n d a
k o n u ş m a c ı b a ş ı n a e n a 2 5 s ö z c e a l ı n m a s ı ö n g ö r ül ü r k e n
VA J v e r i t a b a n ı n d a 1 4 s ö z c e y e r a l m a k ta d ı r. VA J v e r i
t a b a n ı , b u n u n d ı ş ı n d a b a z ı n o k t a l a r d a d a P O LY P H O N E
standardını
nedeni
VA J
tam
ol arak
p r o j e s i ni n
k a r ş ı l a m a m a k t a d ı r.
P O LY P H O N E
Bunu n
s ta n d a r d ı
b e l i r l e n m e d e n ö n c e b a ş l a m ı ş o l m a s ı d ı r. B u n a r a ğ m e n
s ö z k o n u s u v e r i t a b a n ı d a P O LY P H O N E ç e r ç e v e s i i ç i n d e
d e ğ e r l e n d i r i l m e k t e d i r.
44
Ç i z e l g e 3 . 2 P O LY P H O N E v e r i ta b a n ı n d a k a ğ ı t t a n
okuna n materyali n dökümü.
Macrophone
Ko nu ş ma c ı nı n
Kodu(sayı)
Sayı dizileri xxxxxx-xxxx gibi
Banka veya kedi
kartı no’su
Te l e f o n n o ’ s u
VA J
Dutch
Po l yp ho ne
VA H A
1
-
1
1
2
6
1
-
-
-
2
1
-
-
4
1
-
1 ta ne 6
r ak a ml ık
di zi
1/6
( to pla m7 )
( 4 ta ne si $ )
-
¾
0 /2 (t opl a m2 ) ( to pla m7 )
( 1 tan esi $) ( 3 ta ne si
DFL)
Kesir
(1/4,7/10 gibi)
1
-
-
-
Alf an ü me rik di zi
-
-
1
(8 karakter)
-
Ta r i h
1
-
1
1
Saat
1
-
-
1
Ye r ( ş e h i r ) a d ı
2
-
-
2
6
-
12
4
2
-
1
3
3
-
-
-
3
-
-
-
-
-
-
4
7
4
8
5
34
10
36
32
Ard arda ayrık
rakam di zisi
Doğal sayılar
( biri msi z /biri mli)
Uy gul a ma
sözcüğü
(çek,bilet, vb.)
Harf,harf
söylenen sözcük
Şu işte çal ışan ş u
ki şi tipinde
sözcük
Şu adresteki şu
ki şi tipinde
sözcük
İ çin de u y gula ma
sözcüğü olan
t ü mc e
Fonetik açıdan
z e ngin t ü mc e
TOPLAM SÖZCE
S AY I S I
-
1
45
Çizelge
3.3
P O LY P H O N E
veri
t a b a nl a r ı n d a
spontan ol arak söyletile n Mataryali n dökümü.
Macrop
hone
VA J
VA H A
Dutch
Po l yp ho ne
Evet/Hayır türünde yanıtı
olan sorular
Bir(yaşadığınız) şehir adı
söyleyin
5
2
4
5
1
-
-
1
B u gün ün ta ri hi ne di r?
1
-
-
-
Şu an saat kaç
1
-
1
1
Doğum tarihiniz nedir?
1
-
-
1
Ka p ı nu ma r an ız n edir ?
1
-
-
1
Bildiği niz t elef on n u ma ral arı
-
2
1
1
Bir isi m söyleyi niz.
-
-
1
1
Sokağınızın adı nedir?
-
-
-
1
P o s ta ko du nu z ne di r?
-
-
-
1
Hangi şehirde büyüdünüz?
-
-
-
1
Cinsiyetini z nedir?
-
-
-
1
Ya ş ı n ı z k a ç ?
-
-
-
1
Eği ti m sevi yeniz nedir ?(1,2,3)
-
-
-
1
Adınızı harf harf söyl eyini z
-
-
-
1
Evde konuşul an dil nedir?
-
-
1
-
Hangi sıkl ıkta seyahat
edersi niz?
Bu kayıt hakkındaki
y or u mu n uz n edir ?
-
-
1
-
1
-
-
1
11
4
9
18
T O P L A M S Ö Z C E S AY I S I
46
Ol uşturul an
Türkçe
Ve r i
P O LY P H O N E
standardını
Ta b a n ı
karşılama
Ö r n e k l e m i ni n
durumu
aşağıda
mevcut
hatl arla
a ç ı k l a n m ı ş t ı r.
 Kayıtlar
Türki ye
y a p ı l m ı ş t ı r.
de
İstanbul
k ul l a n ı l a n
ve
Bursa'dan
al ınan
kayıtlar
I S D N h a t ü z e r i n d e n , Va n ' d a n a l ı n a n k a y ı t l a r ı n a n a l o g
h a t ü z e r i n d e n a n o l o g k a y ı t c i h a z l a r ı y l a y a p ı l m ı ş t ı r.
 Ve r i l e r
tabanını
X .W AV
formatında
k a y d e d i l m i ş t i r.
Ve r i
kull anacak ki şileri n bu sıkıştırma verileri
d o ğ r u s a l h a l e ç e v i r m e l e r i i ç i n t a b l o l a r v e r i l m e l i d i r.
 Ve r i t a b a n ı n d a 5 5 k o n u ş m a c ı d a n 5 3 9 0 s e s ö r n e ğ i y e r
a l m ı ş t ı r. Te s t g r u b u a y r ı l m a m ı ş t ı r.
 H e r b i r k o n u ş m a c ı d a n 4 9 s ö z c e a l ı n m ı ş t ı r.
 Sözceler arasında spontan konuşma böl ümü mevcut
ol up, konuşmacıl ardan kayıtl a ilgili yorum alınmamış t ı r.
 Her
bi r
içermeyen
sözce,
bi rer
başında
böl üml e
ve
sonunda
birlikte
ayrı
konuşma
bir
kütükte
s a k l a n m ı ş t ı r.
 Sözceler
arasında
t ü m c e l e r,
normal
harf
harf
s ö y l e n e n s ö z c ü k l e r, ç e ş i t l i b i ç i m l e r d e k i r a k a m d i zi l e r i
v e s a y ı l a r v e i ç i n d e s a y ı g e ç e n s ö z c e l e r y e r a l m ı ş t ı r.
47
 H e r b i r s ö z c e n i n o r t o g r a f i g ç e v i r i y a z ı m ı v e r i l m i ş t i r.
Sözceler ve konuşmacıl arın özellikl eri ses veril eriyle
b i r l i k t e v e r i t a b a n ı n a d a h i l e d i l m i ş t i r.
Dünyada
mi krofon/telefon
hattı
üzeri nden
kaydedilen veri tabanl arının bazıl arı biri nci
a ç ı k l a n m ı ş t ı r.
Bu
veri
t a b a nl a r ı n ı n
böl ümde
ol uşturul masında
kull anıl an yöntemler amacına göre birbirl eri ne yakın
ol masına rağmen
b u n l a r ı n a r a s ı n d a n P O LY P H O N E v e r i
t a b a n ı s e ç i l m i ş t i r. T ü r k ç e i ç i n o l u ş t u r u l a c a k v e r i t a b a n ı
ö r n e k l e m i ni n
mümkün
olduğu
kadar
P O LY P H O N E
s t a n d a r t l a r ı n ı k a r ş ı l a m a s ı a m a ç l a n m ı ş t ı r. P O LY P H O N E
standardında
bir
veri
t a b a nı
örnekl emi
seçimi n
gerekçesi daha öncede açıklandığı gi bi konuşma ve
konuşmacı tanıma, konuşmacıdan bağımsız olarak hem
ayrık sözcük, hem bağlantıl ı sözcük, hem de devaml ı
konuşma
tanıma
al goritmaların
a l a nl a r ı n d a
ol uşturul acak
denenmesi nde
a m a ç l a n m ı ş t ı r.
Ya n i ,
sözcük
s i s t e m l e r i ni n e ğ i t i m i
tanıma
ayrık
kullanılabilmesi
sözcükl er
koyarak
ayrık
s a ğ l a n a b i l i r, a r d
arda söylenen sayı di zileri koyarak bağlantıl ı sözcük
t a n ı m a s i s t e m l e r i n i n e ğ i t i m i s a ğ l a n a b i l i r, f o n e t i k a ç ı d a n
zengi n
tümceler
koyarak
devaml ı
konuşma
tanıma
s i s t e m l e r i ni n e ğ i t i l m e s i s a ğ l a n a b i l i r, h a r f h a r f s ö y l e n e n
sözcükl erle
yapıl abileceği
ünsüz- ünl ü
gibi
(CV)
spontan
ç i f t l e r i ni n
sözcel er
de
a n a l i zi
içermesi
sağl anarak okuma ve doğal konuşma arasındaki farklar
i r d e l e n e b i l i r.
48
Yu k a r ı d a s a y ı l a n s i s t e m l e r d ı ş ı n d a , k o n u ş m a c ı y a
okutul acak
sorul ara
uygun
verilen
m e t i nl e r l e
yanıtl arla
veya
s o r ul a c a k
uygun
sözcük
yakal ama
( word-
s p o t t i n g ) s i s t e m l e r i ni n e ğ i t i l m e s i m ü m k ü n o l a b i l e c e k t i r.
P O LY P H O N E
standartlarında
bi r
veri
tabanı
örneklemi nde konuşmacı sayısı, yaş grubu ve eği tim
düzeyi
açısından
yapıl abileceği nden
ayrıca
yaş
parametreni n
yeteri nce
çeşitli
büyük
l ehçe
ve
ci nsiyete
veri
tabanı
ve
bağl ı
bir
örnekleme
ağız
farkl arının,
ol arak
örneklemi nde
yer
bi r
çok
al masını
s a ğ l a m a k m ü m k ü n d ü r.
Adli
vakal arda,
(kişiye
hakaret,
sözl ü
ci nsel
taci z,
r ü ş v e t v e y a nl ı ş i h b a r g i b i ) s u ç l u l a r ı n s o n d ö n e m l e r d e
en
fazl a
kullandıkl arı
yöntem
tel efon
k u l l a n m a k t ı r.
Dol ayısıyla tel efon üzeri nden konuşma ve konuşmacı
tanıma
a n a l i zl e r i ,
suçl unun
ortaya
çıkarıl masında
f a z l a s ı y l a ö n e m k a z a n m ı ş t ı r. F a k a t b u t ü r a n a l i zl e r v e
s u ç l u n u n y a k a l a n m a s ı a k u s t i k i zo l a s y o n o d a d a y a d a
l a b o r a t u a r k o ş ul l a r ı n d a a l ı n a n s e s l e r ü z e r i n d e k o n u ş m a
ve konuşmacı tanıma işl emi ne göre çok daha zor ve
p r o b l e m l i d i r. Ç ü n k ü ,
tel efon hatl arından kaynakl anan
g ü r ü l t ü v e b o z u l m a g i b i e t m e n l e r, f a r k l ı m i k r o f o n v e h a t
k a r a k t e r i s t i k l e r i ni n
y a n s ı y a c a k t ı r.
ses
Şi mdi ye
ü z e r i ne
kadar
bu
kaçınıl maz
tür
ol arak
anali zl er
geli şti rilen al gori tmal arın, ol uşturul an bu veri
i çi n
ta b a n ı
örneklemi ile eğitilen si stemleri n, bu ti p çevre etkileri ne
k a r ş ı y e t e r i n c e d i r e n ç l i o l a c a k l a r ı d ü ş ü n ü l m ü ş t ü r.
49
3.2.
T ü r k ç e - P O LY P H O N E Ve r i Ta b a n ı Ö r n e k l e m i n i n
Oluşturulması
P O LY P H O N E
veri
tabanı
ö n e r m e k t e d i r,
yapıl an
5000
çal ışma
ki şiden
bi r
ol uşumun u
örneklem
ol ması
n e d e n i y l e 5 5 d e n e k k ul l a n ı l m ı ş t ı r. Yi n e P O LY P H O N E
standardında belirtildiği gi bi bunl arın yaş, ci nsiyet ve
lehçe
ol arak
düzgün
dağıl ımına
di kkat
e d i l m i ş t i r.
D e n e k l e r i n y a ş o r ta l a m a s ı 2 9 ’ d u r.
Deneklerden
alınan
ses
örnekleri ne
ait
kayıt
b i l g i l e r i ( t e l e f o n c i n s i g i b i ) Ç i z e l g e 4 . 1 . ’ d e v e r i l m i ş t i r.
Burada tel efon, s antral ve hat ci nsleri ses kaydının
karakteristi k
ö z e l l i k l e r i ni n
değişmesi nde
en
önemli
f a k t ö r o l d u ğ u i ç i n t ü m a y r ı n t ı l a r v e r i l m i ş t i r. To p l a m 2 9
sayısal, 22 Analog ve 4 sayısal santral a bağl ı i ç hat
t e l e f o n g ö r ü ş m e s i y a p ı l m ı ş t ı r. Ç i z e l g e d e k i A n k a r a ’ d a n
al ınan
ses
kayıtl arı,
doğrudan
eri şilen
tel efonlardır
(telefonsayısal şehir santralıtelefon),Şekil 4.1’de
g ö s t e r i l m i ş t i r.
Te l e f o n
Kabl ol u
Hat
Sayısal
Santral
Kabl ol u
Hat
Te l e f o n
Ş e k i l 3 . 1 . Ş e hi r i ç i k a y ı t s ı r a s ı n d a k u l l a n ı l a n h a t l a r ı n
durum unu gösteren di yagram.
50
İstanbul ,
Va n
ve
Bursa’dan
alınan
kayıtl ar
sayısal
santral aracıl ığıyl a alınmıştır ( telefonbina içi sayısal
santralsayısal
santralı bina
şehir
santraltelefon).
Santral
içi
aracılığıyl a
sayısal
ul a ş ı l a n
t e l e f o n l a r ı n h a t ö z e l l i ğ i ş e k i l 5 . 2 ’ d e g ö s t e r i l m i ş t i r.
Kablolu
Sayısal
Santral
Hat
Te l e f o n
Uydu
Sayısal/Analog
Ye r
Santral
İstasyonu
Kablolu Hat
Te l e f o n
Ş e k i l 3 . 2 . Ş e hi r l e r a r a s ı k a y ı t s ı r a s ı n d a
hatl arın durumunu gösteren di yagram.
Şekil de
gösteril en
k a b l o s u d u r.
kabl o
Üzeri nden
k ul l a n ı l a n
TD -PoP-0,5x2x200
aynı
anda
200
yer
altı
görüşme
y a p ı l a b i l m e k t e d i r.
K a y ı t l a r b i r e r h a f t a a r a y l a a l ı n m a y a ç a l ı ş ı l m ı ş t ı r.
Bazı
kayıtların
zamanda
alımı
y a p ı l m ı ş t ı r.
bi r
haftadan
Bunun
daha
nedeni
ise
sonraki
bir
denekl ere
z a m a n ı n d a u l a ş ı l a m a m a s ı d ı r. B i r i n c i k a y d ı y a p ı l a n 5
51
deneği n
iki nci
ses
kaydında
denekl ere
u l a ş ı l a m a d ı ğ ı n d a n k a y d e d i l m e m i ş t i r. H e r n e k a d a r b u
gerçekleşemediyse de bi ri nci kayıtl arının kull anıl abilir
o l m a s ı n d a n d o l a y ı ö r n e k l e m e e k l e n m i ş t i r.
Ç i z e l g e 3 . 4 Ve r i ö r n e k l e r i ni n t o p l a n d ı ğ ı y e r v e
k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e .
Kod Alındığı
1nci
No.
Ta r i h i
Ye r
Kayıt 2nci
Kayıt
Ta r i h i
Te l e f o n
Cihazının
Cinsi
B a ğ la n tı
K u r u la n
Sa ntra l
Cinsi
01
An ka ra
14.06.1999 21.06.1999
N E TA Ş
Sayısal
02
Ankara
13.06.1999 22.06.1999
PANAPHO NE
Sayısal
03
An ka ra
13.06.1999 23.06.1999
Omeg a 820
Sayısal
04
An ka ra
13.06.1999 25.06.1999
N E TA Ş
Sayısal
05
An ka ra
13.06.1999 25.06.1999
N E TA Ş
Sayısal
06
An ka ra
13.06.1999 20.06.1999
SONY
Sayısal
07
An ka ra
13.06.1999 20.06.1999
SONY
Sayısal
08
An ka ra
13.06.1999 20.06.1999
ELİT
Sayısal
09
An ka ra
14.06.1999 21.06.1999
T E L E TA Ş -
Sayısal+
Hitit
Dahili Abone
010
An ka ra
14.06.1999 21.06.1999
T E L E TA Ş -
Sayısal+
Hitit
Dahili Abone
0 11
An ka ra
14.06.1999 22.06.1999
SHERON
Sayısal
012
An ka ra
14.06.1999 21.06.1999
SHERON
Sayısal+
Dahili Abone
52
Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r
v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e .
Kod Alındığı
1nci
No.
Ta r i h i
Ye r
Kayıt 2nci
Kayıt
Ta r i h i
Te l e f o n
Cihazının
Cinsi
B a ğ la n tı
K u r u la n
Sa ntra l
Cinsi
013
An ka ra
14.06.1999 21.06.1999
Q G PA S S E T S a y ı s a l
014
An ka ra
14.06.1999 22.06.1999
T E L E TA Ş
015
Bursa
15.06.1999 22.06.1999
016
Bursa
15.06.1999 22.06.1999
017
Bursa
15.06.1999 30.06.1999
018
Bursa
15 .06.1999 Alına mad ı
019
Bursa
15 .06.1999 Alına mad ı
020
Bursa
15.06.1999 22.06.1999
021
Va n
15.06.1999 22.06.1999
022
Va n
15.06.1999 22.06.1999
023
Va n
15.06.1999 22.06.1999
024
Va n
15.06.1999 22.06.1999
025
Va n
15.06.1999 22.06.1999
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit-480
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Analog
Analog
Analog
Analog
Analog
53
Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r
v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e .
Kod Alındığı
1nci
No.
Ta r i h i
Ye r
Kayıt 2nci
Kayıt
Ta r i h i
026
Va n
15.06.1999 22.06.1999
027
Va n
15.06.1999 22.06.1999
028
Va n
15.06.1999 22.06.1999
029
Va n
15.06.1999 22.06.1999
030
Va n
15.06.1999 22.06.1999
031
Va n
15.06.1999 22.06.1999
032
Va n
15.06.1999 22.06.1999
033
Va n
15.06.1999 22.06.1999
Te l e f o n
Cihazının
Cinsi
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş -
B a ğ la n tı
K u r u la n
Sa ntra l
Cinsi
Analog
Analog
Analog
Analog
Analog
Analog
Analog
Analog
Hitit -480
034
Va n
15.06.1999 22.06.1999
035
Va n
15.06.1999 22.06.1999
036
Va n
15.06.1999 22.06.1999
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
Analog
Analog
Analog
54
Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r
v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e .
Kod Alındığı
1nci
No.
Ta r i h i
Ye r
Kayıt 2nci
Kayıt
Ta r i h i
037
Va n
15.06.1999 22.06.1999
038
Va n
15.06.1999 22.06.1999
039
Bursa
15.06.1999 22.06.1999
040
Bursa
15.06.1999 22.06.1999
041
Bursa
15.06.1999 22.06.1999
042
Bursa
15.06.1999 30.06.1999
043
Bursa
15.06.1999 22.06.1999
044
Bursa
16.06.1999 22.06.1999
045
Bursa
16.06.1999 30.06.1999
046
Bursa
16.06.1999 30.06.1999
047
Bursa
16 .06.1999 Alına mad ı
Te l e f o n
Cihazının
Cinsi
T E L E TA Ş Hitit -480
T E L E TA Ş Hitit -480
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
ERICSSON
TD-1
B a ğ la n tı
K u r u la n
Sa ntra l
Cinsi
Analog
Analog
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
Sayısal
55
Ç i z e l g e 3 . 4 ( D e v a m ı ) Ve r i ö r n e k l e r i n i n t o p l a n d ı ğ ı y e r
v e k a y ı t ş e k i l l e r i ni g ö s t e r i r i ç i z e l g e .
Kod Alındığı
1nci
No.
Ta r i h i
Ye r
Kayıt 2nci
Kayıt
Ta r i h i
Te l e f o n
Cihazının
Cinsi
ERICSSON
048
Bursa
16 .06.1999 Alına mad ı
049
An ka ra
16.06.1999 22.06.1999
050
An ka ra
16.06.1999 22.06.1999
051
Bursa
052
TD-1
B a ğ la n tı
K u r u la n
Sa ntra l
Cinsi
Sayısal
ERICSSON
Sayısal+Dah
TD-1
ili Abone
ERICSSON
Sayısal+Dah
TD-1
ili Abone
16.06.1999 22.06.1999
SIMENS
Analog
Bursa
16.06.1999 22.06.1999
SIMENS
Analog
053
Bursa
16.06.1999 22.06.1999
SIMENS
Analog
054
Bursa
16 .06.1999 Alına mad ı
SIMENS
Analog
055
İstanbul
20.06.1999 31.06.1999
PA N A S O N I C
Sayısal
Adli bilim (Forensi k) alanında i nsan sesi tanıması/
onayl amasına yönelik bi r al goritmanın geliştiril mesi ne
yardımcı ol acak bu ses veri tabanı örnekl emi kaydında
SONY
TCM-5000EV
markalı
profesyonel
ol mayan
herkesi n bul abileceği bir tel efo n hattına bağl anabilir
56
k a y ı t c i h a z ı k ul l a n ı l m ı ş t ı r. B u n u n n e d e n i , a d l i v a k a l a r d a
delil olarak sunul an ses kasetl erin profesyonel ol mayan
c i h a z l a r v e k i ş i l e r c e k a y d e d i l m e s i n d e n d o l a y ı d ı r. S e s
kayıtları TDK IECII/TYPE II SF100 markalı kasetl ere
k a y d e d i l m i ş t i r. K a y ı t s e v i y e s i s e s ş i d d e t i n e g ö r e m i n - 1 ,
m a x - 2 ‘ d e t u t u l m u ş t u r.
Ve r i
toplama
i şlemi
bitti kten
s o n r a ; s e s l e r b i l g i s a y a r o r t a m ı n a S O N Y Tc - D 5 M k a s e t
ç a l a r ı y l a b i l g i s a y a r o r t a m ı n a a t ı l m ı ş t ı r.
Sound Forge
4 . 0 . ( S o ni c F o u n d r y I n c . , 1 9 9 6 ) s e s i ş l e m e y a z ı l ı m ı y l a
“ w a v ” f o r m a t ı n d a k a y d e d i l m i ş t i r. K a y ı t 8 k H z , 8 b i t ’ d e
n i c e m l e n e r e k i ş l e n m i ş t i r.
Konuşmacıların Demografik Dağılımı
3.3.
Konuşmacıların sırasıyl a ci nsi yet, yaş, eğitim düzeyi ve
lehçe
deği şiklikl eri ne
p l a n l a n m ı ş t ı r.
göre
Konuşmacıl ara
dengeli
ait
dağılımı
demografig
bilgiler
Ç i z e l g e 4 . 2 . ’ d e v e r i l m i ş t i r.
Çi zelgeden
Ege’den
3,
İç
de
g ö r ül d ü ğ ü
Anadol u’dan
gi bi
29,
Marmara’dan
8,
K a r a d e ni z ’ d e n
5,
Akdeni z’den 5 ve Doğu Anadol u’dan 5 denekten topl am
5 5 s e s ö r n e ğ i a l ı n m ı ş t ı r b u n l a r ı n 11 ' i b a y a n , 4 4 ’ ü e r k e k
k o n u ş m a c ı d ı r. B u r a d a k o n u ş m a c ı l a r ı n d o ğ d u k l a r ı y e r l e r
d e ğ i l b ü y ü d ü k l e r i y e r l e r g ö z ö n ü n e a l ı n m ı ş t ı r. B u n u n
nedeni
ise
ül k e m i z
i nsanl arının
iş
b ul m a
n e d e ni y l e
meml eketl eri nden uzakl aşmal arı, çocukl arın yerl eşil en
yerde
büyümel eri
ve
oranın
ş i v e s i ni
k ul l a n m a l a r ı d ı r.
57
D e n e k l e r i n i k i s i i l k o k ul , 3 3 ' ü
lise ve 20'si yüksek okul
m e z u n u d u r.
Çizelge 3.5 Ses örneği alınan denekl eri n, ci nsi yet,
yaş eğiti m düzeyi ve büyüdükleri yerleri (l ehçe
kri teri içi n) gösterir çi zel ge.
K o n u şma cı
Kodu
Cinsiyeti
Ya ş ı
Eğitim
Büyüdüğü
Düzeyi
Şehir
01
Erkek
30
Üni versi te
Te k i r d a ğ
02
Erkek
30
Üni versi te
Kayseri
03
Bayan
21
Üni versi te
Ankara
04
Erkek
25
Li se
Çorum
05
Bayan
24
Li se
Karaman
06
Erkek
33
Li se
Bursa
07
Erkek
39
Üni versi te
To k a t
08
Erkek
31
Li se
Ankara
09
Bayan
27
Üni versi te
Mersi n
010
Bayan
26
Üni versi te
Ankara
0 11
Erkek
28
Üni versi te
İzmi t
012
Bayan
26
Üni versi te
İzmi r
013
Erkek
40
Üni versi te
Si vas
014
Erkek
30
Üni versi te
İzmi t
015
Erkek
30
Li se
Bal ıkesi r
016
Erkek
28
Li se
Ordu
017
Erkek
29
Li se
Ankara
018
Erkek
29
Li se
Si vas
019
Erkek
26
Üni versi te
Adana
020
Erkek
22
Li se
Amasya
021
Erkek
31
Li se
To k a t
58
Ç i z e l g e 3 . 5 ( D e v a m ı ) S e s ö r ne ğ i a l ı n a n d e n e k l e r i n ,
ci nsiyet, yaş eğiti m düzeyi ve büyüdükl eri yerl eri (lehçe
kri teri içi n) gösterir çi zel ge.
K o n u şma cı
Kodu
Cinsiyeti
Ya ş ı
Eğitim
Büyüdüğü
Düzeyi
Şehir
022
Erkek
30
Li se
Osmaniye
023
Bayan
26
Li se
Kırıkkal e
024
Erkek
27
Üni versi te
El azığ
025
Bayan
29
Üni versi te
Ankara
026
Bayan
29
Li se
Ankara
027
Erkek
28
Li se
Ordu
028
Erkek
20
İ l k o k ul
Ri ze
029
Bayan
30
Li se
Ankara
030
Bayan
27
Üni versi te
Ankara
031
Erkek
21
İ l k o k ul
Ankara
032
Erkek
36
Üni versi te
Afyon
033
Erkek
26
Li se
Aksaray
034
Erkek
25
Üni versi te
Ankara
035
Erkek
29
Li se
Afyon
036
Erkek
33
Li se
Kırıkkal e
037
Erkek
23
Li se
Mersi n
038
Erkek
37
Üni versi te
Mal atya
039
Erkek
34
Li se
Gazi antep
040
Erkek
21
Li se
E s k i ş e hi r
041
Erkek
32
Li se
Konya
042
Erkek
30
Li se
Ankara
043
Erkek
21
Li se
Ankara
59
Ç i z e l g e 3 . 5 ( D e v a m ı ) S e s ö r ne ğ i a l ı n a n d e n e k l e r i n ,
ci nsiyet, yaş eğiti m düzeyi ve büyüdükl eri yerl eri (lehçe
kri teri içi n) gösterir çi zel ge.
K o n u şma cı
Kodu
3.4.
Ya ş ı
Cinsiyeti
Eğitim
Büyüdüğü
Düzeyi
Şehir
044
Erkek
29
Üni versi te
Kırıkkal e
045
Erkek
34
Li se
Kayseri
046
Erkek
32
Li se
N e v ş e hi r
047
Erkek
32
Li se
Ankara
048
Erkek
28
Li se
E s k i ş e hi r
049
Erkek
28
Li se
Osmaniye
050
Erkek
31
Li se
Bol u
051
Bayan
25
Üni versi te
E s k i ş e hi r
052
Bayan
18
Li se
E s k i ş e hi r
053
Erkek
53
Li se
E s k i ş e hi r
054
Erkek
18
Li se
Bursa
055
Erkek
34
Üni versi te
İstanbul
Konuşmacılardan
Kaydedilecek
Materyalin
Seçimi
Konuşmacıdan
topl anacak
materyal
P O LY P H O N E
s t a n d a r d ı n d a b e l i r t i l d i ğ i g i b i h e m k a ğ ı t ta n o k u n a n h e m
d e s p o n t a n o l a r a k s ö y l e t i l e n s ö z c e l e r d e n s e ç i l m i ş t i r.
Böyl ece okuma ve doğal konuşma arasındaki farkl arın
i ncel enmesi ne ol anak tanınmış ol acağı gibi , konuşma
tanıma si steml eri farkl ı tipte söylenen sö zcel er üzeri nde
60
de
d e n e n e b i l e c e k t i r. T ü r k ç e - P O LY P H O N E
veri
tabanı
örneklemi nde 32’si kağıttan okunan, 17’i spontan ol arak
söyl etil en
topl am
49
sözce
bul unmasına
karar
v e r i l m i ş t i r.
K a ğ ı t ta n O k u n a c a k M a t e r y a l
3.5.
K a ğ ı t t a n o k u n a c a k m a t e r y a l ç i z e l g e 4 . 3 ’ d e v e r i l m i ş t i r.
Çizelge 3.6.
örneklemi nde
dökümü.
T ü r k ç e - P O LY P H O N E
kağıttan
okutul an
veri tabanı
sözcükl eri n
Adet Açıklama ve örnek
Konuşmacı kodu
1
S a y ı d i zi l e r i
3
Te l e f o n n u m a r a s ı
1
Ard arda ayrık rakam
di zi si
2
Reel sayılar
3
Ta r i h
1
Saat
1
Ye r ( ş e h i r ) a d ı
3
Uygul ama sözcüğü
4






01-50 arası bir sayı
312-231-763
68-99-20
7-5-1-2-1-3-4-8
0-212-456-38-79
Ye d i - d ö r t - a l t ı - ü ç - b e ş - i k i - b i r seki z
 Dokuz-dört-sıfır-yedi-i ki-altıüç
 Seki z-beş-bi r
 4 kilo, 2 metre, 9 santi m
Ya l n ı z c a b i r i ni o k u y u n u z .
 10 KASIM 1938
 13 EKİM 1974
 31 AĞUSTOS 1995
 Ya l n ı z c a b i r i ni o k u y u n u z .
 İki yi beş geçiyor
 Seki z on al tı
 Dokuza on var
A n k a r a , İ z m i r, İ s t a n b u l
Bil et,
Rezervasyon,
Hesap,
Kredi kart
61
Ç i z e l g e 3 . 6 . ( D e v a m ı ) T ü r k ç e - P O LY P H O N E v e r i
tabanı örnekl emi nde kağıttan okutul an
sözcükl eri n dökümü.
Adet Açıklama ve örnek
Harf harf söylenen
sözcük
2
Uygul ama sözcüğü
geçen tümce
2
Ayrık sözcük
2
Fonetik açıdan
zengi n tümce
5
Sözcük yakal ama
amaçl ı sözce
2
To p l a m
3.5.1.
A-N-K-A-R-A , B-E-G-Ü-M
 Mavi trene i ki bilet i stiyorum.
 Otel rezervasyonu yaptırmak
isti yorum
 Bankadan kredi kartı aldım.
 Ci mbomun maçına gelir
mi si n?
 A-B-F-8-C
 I-E-5-D-K
 Cumhurbaşkanı Sül eyman
D e m i r e l G a zi a n t e p e g i t t i .
 Çıkrıkçılar yokuşunda bi r
camcı dükkanında Pazar
günü tüp patl adı.
 Milli Eğiti m Bakanı Şubat
tatili nde öğrencilere fazla ev
ö d e v i v e r i l m e m e s i ni i s t e d i .
 Hemen İstanbul ’a gitmem
g e r e k i y o r.
 Ankara’dan İstanbul’a hep
trenle giderim.
32
Konuşmacı Kodu
Konuşmacı kodu, ses örneği topl anırken sesi alınan
d e n e k l e r i n g e r ç e k i s i m l e r i ni s ö y l e m e s i k o n u s u n d a b i r
62
t e d i r g i n l i k y a r a t m a m a s ı i ç i n i s i m l e r i s o r ul m a m ı ş b u n u n
yeri ne
iki
basamaklı
bi r
kod
numarası
okuması
i s t e n m i ş t i r. Ö r n e ğ i n s ı f ı r - o n i k i g i b i .
3.5.2.
Sayı Dizileri
S a y ı d i zi s i o l a r a k k r e d i k a r t n u m a r a l a r ı n ı a n d ı r a n ü ç e r l i ,
iki şerli
ve
bi rerli
sayıl ar
o k u t u l m u ş t u r.
Konuşmacı
b u n l a r ı ü ç e r l i , i k i ş e r l i v e b i r e r l i o k u m u ş t u r. B u d i z i l e r
seçilirken,
rakaml arın
dengeli
dağıl ımı na
dikkat
e d i l m i ş t i r.
3.5.3.
Te l e f o n N u m a r a s ı
Böl ünmüş
on
konuşmacıya
bir
basamaklı
okutulmuş.
bi r
telefon
Te l e f o n
numarası
numaralarının
okunması büyük bir çoğunl uk tarafından şehirl er arası
içi n
s ı f ı r,
al an
kodu(üç’l ü
bi r
numara)
ve
telefon
n u m a r a s ı n ı n ( ü ç - i k i - i k i g r u p l u ) s ö y l e n m e s i i l e i l e t i l i r. B u
nedenl e denekleri n hepsi nden telefon numaral arının bu
ş e k i l d e o k u n m a s ı i s t e n m i ş t i r.
3.5.4.
A r d Ar d a Ay r ı k R a k a m D i z i s i
Konuşmacıların kendil eri ne verilen kağıtta yer al an 8, 7
ve
3
rakamlı
bir
d i zi y i
tek
tek
rakamlar
hali nde
o k u m a l a r ı i s t e n m i ş t i r. ( ö r n e ğ i n 4 - 2 - 3 - 6 - 9 - 8 i ç i n d ö r t - i k i üç-altı-dokuz-seki z gi bi).
63
3.5.5.
Reel Sayılar
İki tanesi biri mli ol acak bi çimde seçilmi ş reel sayıl ar
k o n u ş m a c ı l a r a o k u t u l m u ş t u r. Ö r n e ğ i n 4 k i l o , 2 m e t r e
g i b i . S a y ı l a r ı n o l m a s ı t e r c i h e d i l m i ş t i r. B i r i m l e r l i r a ,
g r a m , k i l o , k i l o g r a m , t o n , l i t r e , s a ni y e , d a k i k a , g ü n ,
hafta, yıl , milim, milimetre, santim, santi metre, metre,
k i l o m e t r e , v e l i t r e o l a r a k s e ç i l m e l i d i r.
3.5.6.
Gün
Ta r i h
ve
ay
isiml eri
dengeli
dağılmış
olarak
o k u t u l m u ş t u r. Ö r n e ğ i n “ 1 0 K a s ı m 1 9 3 8 ” g i b i .
3.5.7.
Saat
Bi rçok
dil de
ol duğu
gi bi
Türkçe’de
de
saat
çeşitli
b i ç i m l e r d e s ö y l e n m e k t e d i r. B u n u n i ç i n k o n u ş m a c ı l a r a
dağıtıl an kağıtl arda saati n çeşitli bi çiml erde yazılışına
d i k k a t e d i l m i ş t i r. Ö r n e ğ i n , “ İ k i y i b e ş g e ç i y o r ” , “ S e k i z - o n
al tı”, “Dokuza on var”.
64
3.5.8.
Ye r ( ş e h i r ) Ad ı
Ş e h i r a d l a r ı b i r ç o k u y g u l a m a d a b ü y ü k ö n e m e s a hi p
ol duğunda n konuşmacılara Türkiye’deki yerleşim olarak
en
büyük
uygul ama
il
isi mleri
o k u t u l m u ş t u r.
sözcükl eri
içi nde
en
Bunun
çok
nedeni
k ul l a n ı l ı y o r
o l m a s ı n d a n d ı r.
3.5.9.
Uygulama Sözcüğü
Te l e f o n v a s ı t a s ı y l a o t o m a t i k o l a r a k y a p ı l a n k o n u ş m a
tanıma
t a b a nl ı
uygul amal ar
sözcükl er
ve
rezervasyon,
uygul amal arda
örneklem
de
banka
hesabı
geçebilecek
yer
a l m ı ş t ı r.
gibi
anahtar
U y g ul a m a
sözcükl eri “bilet”, “rezervasyon”, “hesap”, “kredi kartı”,
“ m a ç ” , “ t r e n ” g i b i d i r.
3.5.10. Har Harf Söylenen Sözcük
Ve r i l e n s ö z c ü k l e r i k o n u ş m a c ı l a r ı n h a r f , h a r f s ö y l e m e l e r i
i s t e n m i ş t i r.
Sözcükleri n
dengeli
olarak
dağıl masına
d i k k a t e d i l m i ş t i r.
3 . 5 . 11 . U y g u l a m a S ö z c ü ğ ü G e ç e n T ü m c e
Bu
tümceler
içl eri nde
yukarıda
ayrıntıları
açıkl anan
u y g u l a m a s ö z c ü k l e r i g e ç e c e k b i ç i m d e s e ç i l m i ş t i r. B i r
65
t ü m c e b i r d e n f a z l a u y g u l a m a t ü m c e s i i ç e r m i ş t i r. Ö r n e ğ i n
“Mavi trene bir bilet istiyorum” tümcesi hem bil et hem
d e t r e n u y g u l a m a s ö z c ü k l e r i ni i ç e r m e k t e d i r.
3 . 5 . 1 2 . Ay r ı k S ö z c ü k
Ayrık
sözcük
tanıma
si steml eri
içi n
konuşmacıdan
eli ndeki kağıtta yazıl ı ol an ayrık sözcükleri okunması
i s t e n m i ş t i r.
Ayrık
sözcükl er
Türkçe’ni n
ikili
ses
k o m b i n a s y o nl a r ı n ı m ü m k ü n o l d u ğ u n c a g e n i ş b i r b i ç i m d e
i ç e r m e s i n e d i k k a t e d i l m i ş i t i r.
3 . 5 . 1 3 . F o n e t i k Aç ı d a n Z e n g i n T ü m c e
B u b ö l ü m d e k o n u ş m a c ı l a r a T ü r k ç e ’ ni n b ü t ü n i k i l i s e s
k o m b i n a s y o nl a r ı
mümkün
olduğu
kadar
deği şik
bağl amlarda kapsayan ve mümkün ol duğu kadar zengi n
tümceler
o k u t u l m u ş t u r.
Bunl arın
yanında
tümce
seçi mi nde, tümcel eri n çok uzun ol mamasına (80 harfl e
s ı n ı r l ı o l m a s ı ) d i k k a t e d i l m i ş t i r.
3 . 5 . 1 4 . S ö z c ü k Ya k a l a m a A m a ç l ı S ö z c e
Kağıttan okutul an materyali n son böl ümünde, sözcük
yakal ama
si steml eri
sözcükl eri n
önceden
geçtiği
belirtildiği
içi n,
iki
tümce
gibi
şehir
i çi nde
yakalanacak
o k u t u l m u ş t u r.
isi mleri
Daha
yakalanacak
66
hedef sözcük ki tlesi olarak düşünül ürse, bu böl ümde,
içi nde
şehir
ismi
geçen
iki
tümce
o k u t u l m u ş t u r.
Bürünsel (prosodi c) açıdan zenginli k sağl amak amacıyl a
b u t ü m c e l e r d e ş e h i r i s i m l e r i ni n t ü m c e n i n b a ş , o r t a v e
son tarafında yakl aşık eşit oranda geçmesi ne dikkat
e d i l m i ş t i r.
3.6.
S p o n ta n S ö y l e t i l e c e k M a t e r y a l
Sp o n t a n o l a r a k y a n ı t l a n a n s o r u l a r ı n d ö k ü m ü Ç i z e l g e
4.4’de
v e r i l m i ş t i r.
sorul acak
bi rkaç
Burada
sorul ar
defa
denekl ere
verilmiş,
okuyarak
kayıt
daha
önceden
başlamadan
verecekleri
yanıtl ara
ol arak
yanıtl aması
önce
hazırl ıkl ı
o l m a l a r ı i s t e n m i ş t i r.
Denekleri n
sorul ar
doğru
şunl ardır:
beli rlenmesi
kayıt
içi n
“Bugünün
dağılımının
doğru
nedi r?”
denekl eri n
ve
eği tilmi ş
t a r i hi n i n
t a r i hi
yapıl abil mesi
i nsanl arın
eğiti m
tepki
ve
i çi n
doğru
olarak
nedi r?”,
“doğum
s e v i y e l e r i ni
organi ze
istenen
yaş
ta r i ni z
öl çmek
ve
yetenekl eri ni n
ö l ç ü m ü i ç i n “ e ğ i t i m s e v i y e ni z n e d i r ? ” s o r ul a r ı n a d o ğ r u
yanıt
verilmesi
al ınırken
de
i s t e n m i ş t i r.
doğru
alarak
Bu
yanıtla r
söyl enmesi
i ki nci
defa
i s t e n m i ş t i r.
Bunl arın dışında kal an di ğer sorul ar biri nci ve i ki nci
k a y ı t i ç i n k o n u ş m a c ı n ı n i s t e ğ i n e b ı r a k ı l m ı ş t ı r.
67
Ç i z e l g e 3 . 7 T ü r k ç e - P O LY P H O N E v e r i ta b a n ı
örneklemi nde spontan olarak söyletil ecek
sözceleri n dökümü.
Ad e t Aç ı kla ma v e Örn e k




E v e t / H a y ı r Ya n ı t l ı s o r u
5
Ya ş a d ı ğ ı n ı z Ş e h r i n i s m i ?
1
Bugünün tari hi nedir?
1
Şu anda saat kaç?
1
D o ğ u m t a r i hi n i z n e d i r ?
1
Ya ş ı n ı z k a ç ?
1
Kapı numaranız?
1
Ve y a b i r s a y ı s ö y l e y i n .
Te l e f o n n u m a r a n ı z
1
Ve y a h e r h a n g i b i r
tel efon numarası
o l a b i l i r.
nedi r?
B i r i s i m s ö y l e y i ni z
1
Hangi şehirde
büyüd ünüz?
C i n s i y e t i ni z n e d i r ?
1
E ğ i t i m s e v i y e ni z n e d i r ?
E n s e v d i ğ i ni z T V
programı nedi r?
To p l a m
E v l i m i s i ni z ?
Çocuğun var mı?
Babanız sağ mı?
Yu r t d ı ş ı n d a
bul undunuz mu?
 Ya b a n c ı d i l b i l i y o r
musunuz?
1
1
1
17
orta öğretim
=1
Li se
=2
Üni versi te
=3
68
Eği tim sevi yesi hakkındaki soruya beklenen yanıt 1,2 ve
3
olmak
üzere
k i ş i ni n
hangi
eğiti m
kategori si ne
g i r d i ğ i n e i l i ş k i n b i r s a y ı d ı r. K o n u ş m a c ı n ı n b u s o r u y a
hazırl ıklı
olması
içi n
bu
d a ğ ı t ı l a n m e t i n d e y a z ı l m ı ş t ı r.
soru
hakkında
açıkl ama
69
5 . B U L G U L AR
T ü r k ç e K o n u ş m a v e K o n u ş m a c ı Ta n ı m a y a Y ö n e l i k Ve r i
Ta b a n ı Ö r n e k l e m i b i r i n c i b ö l ü m d e i n c e l e n e n 1 6 a d e t
çeşi tli
dillere
Çi zelge
ait
veri
5.1.’de
tabanıyla
v e r i l m i ş t i r.
ol an k arşıl aştırması
Bu
16
veri
tabanı
P O LY P H O N E s t a n d a r t l a r ı n ı n b i r k ı s m ı n ı k a r ş ı l ı y o r o l s a
da yapılan örneklemi n standartl ara uygunl uğu açısından
bi r
fiki r
vermesi
içi n
karşıl aştırması
v e r i l m i ş t i r. Ç i z e l g e d e v e r i
çi zelgede
tabanını n kul lanım amacı,
ö r n e k l e n d i ğ i f r e k a n s , ni c e m l e m e s a y ı s ı v e d e n e k s a y ı s ı
v e r i l m i ş t i r.
Ya p ı l a n
al ınan
Türkçe
sesler
8
örnekl emde
Khz’de
tel efon
örnekl enmi ş,
üzeri nden
8
bi t’de
n i c e m l e n m i ş t i r. Ç i z e l g e ni n s o n u n d a o l u ş t u r u l a n T ü r k ç e
ö r n e k l e m i n d e ğ e r l e r i v e r i l m i ş t i r. B u r a d a n d a g ö r ü l e c e ğ i
gi bi veri tabanı bi r örneklem olmasına rağmen, birçok
veri
tabanındaki
denek
t a b a n l a r ı n d a n f a z l a d ı r.
ve
sözce
sayısı
di ğer
veri
70
Çizelge 5.1. Deği şik diller içi n topl anan ses
örnekleri il e yapıl an örnekl emi n karşılaş tırılması.
Kayıt
şekli
Khz
Bit
Kayıt cinsi
Den ek
Sayı sı
Cümle
sa yı sı
Hava dol aşımı
bil gi si stemleri
16
16
Ya k ı n
mi krofon
10
-
Konuşmacı
tanıma
10
16
Mi krofon
50
-
Hari talar
üzeri nde çeşitli
20
bil gileri n
tanımlanması
16
St e r o
Mi krofon
128
-
52
-
İn cel en en
Ve ri tab anı
Kull an ım alanı
AT I S Ve r i
Ta b a n ı
BRAMSHILL
Ve r i Ta b a n ı
HCRC Map
Ta s k Ve r i
Ta b a n ı
K I N G Ve r i
Ta b a n ı
Konuşmacı
tanıma
8
16
Te l e f o n
MACROPHO
N E Ve r i
Ta b a n ı
Konuşmacı
tanıma
8
8
Te l e f o n
OGI
SPELLED
ve SPOKEN
Ve r i Ta b a n ı
Konuşmacı
tanıma
8
8
Te l e f o n
125
-
PHONEBOO
K Ve r i
Ta b a n ı
Ayrık sözcük
tanıma
8
8
Te l e f o n
12
7979
Sözcük
D A R PA
RESOURCE
MANAGEME
NT (RM1)
Ve r i Ta b a n ı
Deni zcilikl e
ilgili
Konuşmacıdan
bağımlı,
konuşmacıdan
bağımsız
20
16
Mi krofon
160
-
90
5000 Sözcük
71
Çizelge 5.1. (Devamı) Değişi k diller içi n toplanan ses
örnekleri il e yapıl an örnekl emi n karşılaştırılması.
İn cel en en
Ve ri tab anı
ROAD
R A L LY Ve r i
Ta b a n ı
Kull an ım alanı
Kayıt
şekli
Khz
Bit
Doğal konuşma
içi nde sözcük 10
yakal ama
Kayıt cinsi
Den ek
Sayı sı
Cümle
sa yı sı
16
St e r o
Mi krofon
56
20
Sözcük
SW ITCHB O A R D Ve r i
Ta b a n ı
Konuşma ve
konuşmacı
tanıma
8
8
Te l e f o n
500
3000
Sözcük
SPIDRE
Ve r i Ta b a n ı
Konuşmacı
tanıma
8
8
Te l e f o n
45
-
SW ITCHBOARD
EXCERPTS
Ve r i Ta b a n ı
Sözcük
yakal ama
8
16
Mi krofon
-
35
diyalog
T I 4 6 Ve r i
Ta b a n ı
S ö z c ü k Ta n ı m a
8
16
Mi krofon
16
46
TIDIGITS
Ve r i Ta b a n ı
Konuşmacıdan
bağımsız
tanıma
20
12.5
Mi krofon
326
33
sözcük
TIMIT VE
N T I M I T Ve r i
Ta b a n ı
Konuşma
tanıma
8
8
Te l e f o n
630
6300
tümce
Y O H O Ve r i
Ta b a n ı
Konuşmacı
doğrulama
8
12
Mi krofon
138
136
sözcük
TÜRKÇE
VERİ
TA B A N I
ÖRNEKLEMİ
Konuşma ve
konuşmacı
tanıma
8
8
Te l e f o n
55
49
sözcük
72
T ü r k ç e K o n u ş m a v e K o n u ş m a c ı Ta n ı m a y a Y ö n e l i k
Ve r i
Ta b a n ı
hazırl anan
Örnekl emi
bazı
veri
P O LY P H O N E
t a b a nl a r ı
ile
standarda
karşıl aştırıl ması
Ç i z e l g e 5 . 2 . ’ d e v e r i l m i ş t i r. B u r a d a o k u n a n s ö z c e i l e
spontan
sözce
m i k ta r l a r ı
VA J
veri
tabanı
hariç
bir
bi rl eri ne yakın ol masına rağmen k ull anıl an denek sayısı
M a c r o p h o n e v e r i t a b a n ı n d a 5 0 0 0 , VA J v e r i t a b a n ı n d a
y a k l a ş ı k 2 5 0 0 , VA H A v e r i ta b a n ı 9 1 5 , D u t c h P o l y p h o n e
v e r i ta b a n ı n d a 5 0 5 0 d i r.
Çizelge 5.2.
P O LY P H O N E s ta n d a r d ı n a g ö r e
ol uşturul an veri tabanl arı il e Türkçe veri tabanı
ö r n e k l e m i ni n k a r ş ı l a ş t ı r ı l m a s ı .
Macrop
-hone
VAJ
VAH A
Dutch
Türkçe
Poly-
Ve r i
p h o n e Ta b a n ı
Örneklemi
Okuna n
sözce
Sp o n t a n
sözce
To p l a m
sözce
34
10
36
32
32
11
4
9
18
17
45
14
45
50
49
Ve r i t o p l a m a d a s o r u c e v a p b ö l üm ü n d e t o p l a m 1 3
s o r u s o r ul m u ş t u r, s o r u l a r a b a z ı d e n e k l e r i n v e r d i k l e r i
hatal ı cevaplar nedeni yle sesler bil gisayarda i şlenirken
bu
böl üml er
ç ı k a r t ı l m ı ş t ı r.
Bunun
nedeni ;
sorul ar
73
d e n e k l e r e s o r ul d u ğ u n d a v e r i l e n y a n l ı ş y a n ı t l a r ı n v e y a
okumaların tekrar edil mesi bu nedenl e ol uşan l üzums uz
k o n u ş m a l a r ı n v e r i t a b a n ı n ı k i r l e t m e s i d i r. S e s l e r i n C D ’ y e
kaydedilirken sesl eri n bi r işl enmiş hali birde işlenmemi ş
hali
k a y d e d i l m i ş t i r.
üzeri nde
çal ışacak
Bunun
nedeni ,
bu
içi n
ilgi nç
i nsanl ar
veri
tabanı
olabilecek
k a y ı t l a r ı n b ul u n a b i l e c e ğ i v e b i r u y g u l a m a d a i ş l e n m i ş
bi r
ses
ile
i şlenmemi ş
ses
arasındaki
bi r
ilişki
k u r u l a b i l e c e ğ i d ü ş ü n ü l m ü ş t ü r. S e s k a y ı t l a r ı n ı n t o p l a m ı
2 3 0 M b o l u p b i r C D - R O M ’ a y a z ı l m ı ş t ı r.
74
6. SONUÇ VE DEĞERLENDİRME
Bu tezi n konus u ol an Türkçe veri tabanı örnekl emiyl e ne
amaçl andığı
bi ri nci
böl ümde
bahsedilmi şti .
Bu
veri
tabanı bi ze farkl ı zamanl arda al ınan sesl eri n zaman
içi nde
ne
gi bi
değişi klikler
göstereceği
ve
aynı
k e l i m e l e r i k o n u ş m u ş o l s a d a hi k i ş i l e r a r a s ı n d a k i s e s
benzerli ği/farkl ılıklarını
ortaya
koymayı
s a ğ l a m ı ş t ı r.
A y r ı c a s e s a n a l i z i ni n h u k u k a l a n ı n d a k a b ul e d i l i r l i ğ i ni n
n e o l m a s ı g e r e k t i ğ i i n c e l e n m i ş t i r.
6.1. Hukuki İnceleme
Son yıll arda ilerleyen teknol ojiyle beraber i nsan sesi
yol uyl a i şlenen suçl arda da büyük bi r artış meydana
g e l m i ş t i r. S u ç ç e ş i t l i l i ğ i v e y o ğ u n l u ğ u i s e c i n s e l t a c i z ,
t e h d i t v e r ü ş v e t o l a y l a r ı n d a o r t a y a ç ı k m a k t a d ı r. B u t i p
suçl arl a yoğun ol arak karşılaşan mahkemel er bu tür
delilleri nasıl değerlendi recekl eri kanunda açık ol arak
yer almadığı içi n veya hangi şartl ar al tında el de edilen
s e s l e r i n d e l i l n i t e l i ğ i o l a c a ğ ı ta r t ı ş m a s ı n ı b a ş l a t m ı ş t ı r.
Bili ndi ği gi bi ceza mahkemesi nde, maddi gerçek
a r a ş t ı r ı l ı r. B u n e d e nl e h e r ş e y d e l i l d i r. H a k i m k a r a r ı n ı
d e l i l l e r l e d o ğ r u d a n d o ğ r u y a t e m a s a g e ç e r e k v e r i r, b u
durum vasıtasızlık ilkesi olarak anıl ır (CMUK Md.254,
1983).
75
Ceza yargılamaları mevzuatı konusunda yazıl an bir
çok
kitapta
bant
kayıtlarının
ispat
gücü
konusund a
y a z a r l a r ı n f a r k l ı d ü ş ü n c e l e r d e o l d u ğ u g ö r ü l m e k t e d i r. B i r
k ı s ı m y a z a r, b a n t k a y ı t l a r ı n ı n d e l i l o l a m a y a c a ğ ı a n c a k
b i r k e ş i f o l a b i l e c e ğ i ( Ye n e r, 1 9 9 8 ) y a z m a k ta d ı r. D i ğ e r
bi r görüş ise hukuka
uyg un şekil de elde edilen ve
topl umun y üksek çıkarlarının haklı kılınması hali nde, bu
gi bi
d e l i l l e r i n k u l l a n ı l a b i l e c e ğ i ni
ve
her
türl ü
delili n
( b a n t k a y ı t l a r ı d a hi l ) g e ç e r l i o l d u ğ u n u b e l i r t m e k t e d i r
( Yu r t c a n , 1 9 9 4 ) .
Buradan
konuda
savunan
da
ol dukça
görül düğü
gi bi
farklı
görüşl er
hukukç ul arın
geli şen
hu k u k i
v a r.
al anda
bu
Bi ri nci
görüşü
teknol ojiyl e
sesler
ü z e r i n d e h e r n e k a d a r o y n a n a b i l e c e ğ i ni s ö y l e s e l e r d a h i
bunl arın
tespi ti nde
b u l u n a b i l e c e ğ i ni
de
hesaba
gelişen
teknol ojiyl e
katmadıkl arı
birlikte
g ö r ü l m e k t e d i r.
İ k i n c i g ö r ü ş i s e t a m a m e n k a t ı l m a k g e r e k i y o r, ç ü n k ü b i r
ol ayın aydınl atıl ması içi n kanuni yol dan el de edilen her
t ü r l ü d e l i l d e ğ e r l e n d i r i l m e l i v e k a b u l e d i l m e l i d i r. Ya n i b i r
o l a y ı n n a s ı l m e y d a n a g e l d i ğ i ni , h a k a r e t , t e h d i t , ş a n t a j
ve buna benzer ol ayların kimler tarafından ve nasıl
yapıl dığı bant kayıtlardan el de edil ebiliyorsa neden bi r
d e l i l o l a r a k k a b u l e d i l m e k i s t e n m e d i ğ i ni a n l a m a k z o r.
H e r d e l i l i n a r k a s ı n d a b i r m a s um s a n ı ğ ı n o l a b i l e c e ğ i
u n u t u l m a m a l ı d ı r.
A d l i v a k a ni t e l i ğ i k a z a n m ı ş o l a y l a r d a d e l i l o l a r a k
i ncel enen ses kayıtl arı bi r çoğu sami mi ortaml arda kayıt
76
e d i l m i ş t i r.
Sanık
konumunda
ol an
şahsın
s e s i ni
d e ğ i ş t i r m e s i / p e r d e l e m e s i m ü m k ü n d e ğ i l d i r. B ö y l e o l m a s ı
d u r u m u n d a d a h i ç e ş i t l i b i l i m s e l m e t o t l a r k ul l a n ı l a r a k
k i ş i y e ö z g ü n s e s ö z e l l i k l e r i b u l u n a b i l i r.
İ n s a n s e s i ni n d e l i l o l a r a k d e ğ e r l e n d i r m e s i b i r ç o k
ül ke
tarafından
k u l l a n ı l m a k ta d ı r
(Ameri ka,
Almanya,
F r a n s a , İ ta l y a , İ n g i l t e r e . . . g i b i ) . D ü n y a d a k i b u g e l i ş m e l e r
Türkiye’ye de yansımış ve bir çok adli ol ayda s es delil
o l a r a k k ul l a n ı l m ı ş t ı r.
Bili m adamlarımız konuşmacı tanıma ve konuşma
onayl ama gi bi ses işl eme konusunda ki çal ışmalarını
hızl ı
bi r
şekilde
s ü r d ü r m e k t e d i r l e r.
Türki ye
de
bu
k o n u d a ç a l ı ş m a y a pa n t ü m ü n i v e r s i t e l e r “ S i n y a l İ ş l e m e
ve
U y g ul a m a l a r ı
(Sİ U)”
başlığı
al tında
kurul tayl ar
düze nl eyi p, bu alanda kendilerini n yaptığı çal ışmaları
ve
dünyadaki
yapmış
geli şmel eri
oldukl arı
a n l a t m a k t a d ı r l a r.
araştırmalar
kendi
Fakat
çevrel eri nden
a l d ı k l a r ı b i r k a ç s e s ü z e r i n d e o l m a k t a d ı r. Ya n i t i c a r i v e
adli
al anında
uygulama
denenebil eceği
bir
yabancı
hazırl anmış
dilde
Türkçe
geli ştirilen
veri
veri
tabanı
si steml eri n
olmadığı
t a b a nl a r ı
i çi n
üzeri nde
y a p m a k ta d ı r l a r, t a b i b u n u n s o n u c u n d a d a i s t e n e n v e r i m
a l ı n a m a m a k ta d ı r.
Bu tezi n sonucunda elde edilecek olan Türkçe ve ri
tabanı
örnekl emi
ile
yukarıda
bahsedilen
b i r a z d a o l s a g i d e r i l e b i l e c e ğ i d ü ş ü n ü l m ü ş t ü r.
sıkıntının
77
6 . 2 . Ve r i
Ta b a n ı
Örneklemini
Oluşturan
Seslerin
İncelenmesi
Bu çal ışma sonuc unda 43 erkek ve 12 bayan birer hafta
a r a y l a i k i d e f a s e s ö r n e k l e r i a l ı n m ı ş t ı r. K o n u ş m a c ı l a r ı n
bi r hafta sonra sesl eri nde meydana gel en değişi klikler
(perde,
formant
i n c e l e n m i ş t i r.
frekansı,
Bunl ara
ai t
spektrogram,...gibi )
i ncel emel er
aşağıda
v e r i l m i ş t i r.
Şekil 6.1.’de spektrografi k i ncelemede; üsteki ilk
al ınan ses, al ttaki i se bir hafta sonra aynı ortamda
al ınmış
sesi n
parametri k
eşleşmede
özellikl e biri nci
ol madığı
s p e k t r o g r a m ı d ı r.
çok
ses
arasındaki
farkl ılıklar
ol duğu,
formant frekansl arında bir değişi mi n
g ö zl e n m i ş t i r.
“Cumhurbaşkanı
az
İki
Burada
Sül eyma n
kull anıl an
Demi rel”di r
bu
tümce
tümceni n
u z u n l u ğ u 2 s a n i y e d i r.
Şekil 6.2.
konuşmacının
Parametrik
aynı
tümceyi
spektrografi k
eşl eşmel erde
kullanan
incel emesi
farklılıkl ar
farkl ı
iki
y a p ı l m ı ş t ı r.
olduğu,
özelli kle
bi ri nci ve iki nci formant frekanslarında değişimi n fazla
o l d u ğ u g ö z l e n m i ş t i r. B u r a d a k ul l a n ı l a n t ü m c e “ C u m h u r
Başkanı Sül eyman Demi rel ”dir bu tümce ni n uzunl uğu 2
s a n i y e d i r.
78
Şekil 6.1. Aynı ki şiye ait bir hafta arayla al ınmış
sesl eri n karşıl aştırıl ması
79
Şekil
6.2.
Aynı
tümceyi
kulla nan
k o n u ş m a c ı l a r ı n s e s l e r i ni n k a r ş ı l a ş t ı r ı l m a s ı
farklı
80
Ses
parametrel eri
doğal
süreç
i çersi nde
çeşitli
d e ğ i ş m e l e r e u ğ r a m a k t a d ı r. B u d e ğ i ş i k l i k m a t e m a t i k s e l
ortal amal arı
hesapl anarak
kişi ye
özgün
bir
o r ta l a m a
s o n u c u n b u l u n a b i l m e k t e d i r.
Konuşma
taklidi ,
perdel eme
gibi
konuşmacını n
s e s i ni d e ğ i ş t i r m e e ğ i l i m l e r i m üm k ü n o l m a s ı n a r a ğ m e n
kendi
sesi ne
özgün
karakterl eri n
tespi ti
mümkündür
(Şekil 6.3). Üsteki spektrogram konuşmacının normal
sesi ,
altta
ki
spektrogram
perdel enmi ş
(takli t)
sese
a i t t i r. B i r k o n u ş m a c ı n ı n n o r m a l y a p ı l a n k a y ı t t a n s o n r a
s e s i ni d e ğ i ş t i r m e s i i s t e n m i ş a y n ı s o r ul a r s o r u l m u ş v e
aynı
materyal
o k u t u l m u ş t u r.
Buradaki
amaç,
k o n u ş m a c ı l a r s e s l e r i ni n e k a d a r d e ğ i ş t i r m e e ğ i l i m i n d e
ol sa da i ki ses arasındaki benze rli k farkı , bu sesi taklit
etmeğe
çalışan
o l a c a k t ı r.
Burada
parametrel erdeki
di nl eyerek
konuşmacının
farkından
unutul maması
benzerli k
vardığı
sonuç)
gereken
daha
bi r
yanında
işi tsel
tanı’nın
da
az
konuda
(uzmanı n
çok
önemli
o l d u ğ u d u r. K e k e l e m e g i b i k o n u ş m a b o z u k l u k l a r ı h e r n e
kadar parametrik i ncel emede tespi t edilse de ses -rengi
gi bi
sübj ekti f
e d i l e b i l m e k t e d i r.
bil giler
ancak
işi tsel
yol
ile
tespit
81
Şekil
6.3.
Konuşmacının
(farklı bir sesi
sesini
perdel eyerek
t a k l i t e d e r e k ) k a y d e d i l m i ş s e s i ni n
özgün konuşmasıyl a karşıl aştırılması
82
Günüm üz
teknol oji siyl e
adli
amaçlı
(ticari
uygul amal ar hari ç) otomatik konuşmacı tanıma programı
h a l e n y o k t u r. B u n u n b a ş l ı c a n e d e n i i s e , ş u a n d a m e v c u t
ol an
veya
geliştirilen
al gori tmal ar
temi z
sesleri
t a n ı m a y a v e o n a y l a m a y a y ö n e l i k t i r. O y s a k i d e l i l o l a r a k
ortaya konul an
gürül tül eri n
sesler doğal ortaml arda alınmış arka
(kayıt
ci hazının
iç
gürül tüsü, telefon hatlarının doğal
gürül tüsü,
çevre
gürül tüsü, ...gibi )
y o ğ u n o l d u ğ u s e s l e r d i r. D o l a y ı s ı y l a d e v a m l ı d e ğ i ş e n
a r k a g ü r ü l t ül e r i s e s k a y d ı n ı e t k i l i y e c e k t i r. G ü r ü l t ü d e k i
bu
deği şiml er
düzg ün
periyotta
ol madığı
içi n
k o n u ş m a n ı n h e r s a n i y e s i n d e f a r k l ı e t k i l e r g ö s t e r e c e k t i r.
Bu nedenl e adli amaçlı konuşmacı tanıma ve onayl ama
işl eri
parametri k
ve
i şitsel
anali z
ol arak
bir
uzma n
t a r a f ı n d a n m a n u e l y a p ı l m a k t a d ı r.
Sonuç ol arak telefon üzeri nden el de edil en bu
v e r i l e r, k ı s a t ü m c e ü z e r i n d e t a n ı m a , k e l i m e y a k a l a m a ,
konuşmacı
tanıma
s i s t e m l e r i ni n
ve
uzun
tümce
al goritmalarının
üzeri nde
tanıma
denenmesi nde
büyük
yarar sağlayacağı ve bunun da ne kadar başarıl ı ol duğu
ancak
çeşi tli
ses
al gori tmaları
k u r u l u ş l a r ı n c a b e l i r l e n e b i l e c e k t i r.
gelişti ren
bilim
83
Ö ZET
Türkçe Konuşma ve Konuşmacı Tanımaya Yönelik Veri Tabanı Örnekleminin
Oluşturulması
Günümüzde teknolojinin gelişmesiyle birlikte Adli Bilimde, insan sesi yoluyla işlenen
suçların ortaya çıkartılabilmesi için bilimsel metotlar kullanılmaya başlanmıştır.
Dünyadaki bu gelişmeler Türkiye’ye de yansımış ve bir çok bilim adamı ses tanıma
ve ses onaylama gibi ses işleme konusunda araştırmalara başlamıştır. Bu
araştırmaların büyük çoğunluğu yabancı dilde hazırlanmış veri tabanları üzerinde
yapılmaktadır. Bu çalışma sonucunda hazırlanan Türkçe veri tabanı örneklemiyle bu
alanda ihtiyaç duyulan bir veri tabanı standardının belirlenmesine çalışılmıştır.
Veri tabanı örnekleminin hazırlanmasında bir çok veri tabanı incelenmiş ve
bunların arasından COCOSDA (Coordinating Committee for Speech Database
Assessment) adı verilen bir komite tarafından önerilen ve POLYPHONE adı verilen
veri tabanı hazırlama standartları kullanılmıştır.
Veri tabanı örneklemi, telefon hatları üzerinden birer hafta arayla 55
denekten alınmıştır. Ses kayıtları telefon hattına bağlanan bir teyp aracılığıyla
yapılmış ve bu kayıt daha sonra bilgisayar ortamında işlenerek 8 kHz'de
örneklenmiş, 8 bit'de nicemlenerek x.wav formatında CD-ROM'a yazılmıştır.
Sonuç olarak, değişik cinsiyet, lehçe ve yaş gruplarından toplanan bu veri
tabanı örneklemi Türkçe konuşma ve konuşmacı tanımaya yönelik hazırlanacak ses
algoritmalarının denenmesinde ve geliştirilmesinde kullanılabilecektir. Veri tabanı
örnekleminin ne kadar başarılı olduğunun, çeşitli ses tabanlı algoritmalar geliştiren
bilimsel kuruluşlarca belirlenebileceği sonucuna varılmıştır.
Anahtar Sözcükler : Konuşma ve konuşmacı tanıma, ses algoritması,
POLYPHONE standardı.
84
SUMM AR Y
Production of Data Base Sampling for Turkish Speech and Speaker
Recognition
Today, with the improvement in technology, scientific methods are put into use
for the purpose of enlightening crimes committed by using human voice. This
improvement around the globe found its reflections in Turkey too, and numerous
scientists began researches on voice processing topics like voice recognition, and
voice verification. Most of these researches are based on databases which are
prepared in a foreign language. With the help of the Turkish database prepared as a
result of this work, it is aimed that a database standard, which is a need in this area,
is set.
In preparing this database sampling, many database are examined, and
among those a database preparing standard which is named POLYPHONE, and
advised by COCOSDA (Coordinating Committee for Speech Database Assessment)
is used.
Database samples are recorded from 55 subjects with 1-week intervals, using
telephone lines. Recording is made via a tape recorder connected to the telephone
line. Then this recording, through the process in a computer, is sampled at 8 kHz,
and after quantified in 8 bits is written on a CD-ROM.
As a result, this database sampling gathered from various sex, dialect, and
age groups will be an asset to be used in testing and improving voice algorithms
which will be prepared for Turkish speech, and speaker recognition. It is concluded
that, how successful this database sampling is can be determined by the scientific
organizations that produce different voice-based algorithms.
Key words: Speech and speaker recognition, voice algorithm, POLYPHONE
standard.
85
KAYNAKL AR
1. ALİKAŞİFOĞLU,K., DOĞU, E. (1983). Ceza Mahkemeleri Usulü Kanunu. Ankara:
Seçkin Kitapevi,s.:237.
2. BERNSTEİN, J., TAUSSING, K., GODFREY, J.( 1995 ). MACROPHONE: An American
English Telephone Speech Corpus for The POLYPHONE Project, Proc., Detroit,
ICASSP’94, p.:I-81.
3. BOVES, L., BOGAART, L., BOS, L. (1993). Dessign and Recording of Large Data Bases
for Use in Speaker Verification and Identification. Proc.ESCA Workshop on Automatic
Speaker Recognition, Identification and Verification, , Martigny, Switzerland, p.:43-46.
4. BROWN K.L., GEORGE E.B. (1995). CTIMIT: A Speech Corpus For The Cellular
Environment with Applications to Automatic Speech Recognition. Proc.ICASSP’95.
Detroit. pp.105-108. Erişim:[http://www.ldc.upenn.edu/readme_ files/ctimit.readme.html].
Erişim Tarihi:11 Haziran 1999
5. COCOSDA . (1994) Institute of Information Sciences and Electronics University of
Tsukuba, Meeting in Yokohama. Erişim: [http://www.milab.is.tsukuba.ac.jp/ococosda/cosda94or.html].Erişim Tarihi:11 Haziran 1999
6. DEFENCE ADVANCED RESEARCH PROJECT AGENCY(DARPA). (1987). DARPA
Resource Management Continuous Speech Database RM1. NIST [Electronic Journal],
June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/rm1.readme.html] Erişim
Tarihi:11 Haziran 1999
7.
DEMİRCAN,Ö. (1996). Türkçe’nin Sesdizimi.İstanbul, s.:8-10.
8. DEMİREKLER,M. BİNGÖL,S. KAYHAN,S. (1995). Türkçe Konuşma ve Konuşmacı
Tanıma Amaçlarına Yönelik Veri Tabanları Hazırlanması için Bir Standart Önerisi.
TÜBİTAK-BİLTEN,1:1-6.
9. ERGENÇ,İ. (1990). Konuşma Dilinde Sözdizimiyle Bürün Olgularının İlişkisi
Üzerine:IV.Dilbilim Sempozyumu Bildirileri, 1:157-164.
10. ERGENÇ, İ. (1995). Konuşma Dili ve Türkçe’nin Söyleyiş Sözlüğü. Ankara, s.:11-28.
11. FRY, D.B. (1979). The Physics of Speech, Cambridge Uni.press, p.: 77.
12. HOLLIEN,H.(1990). The Acoustics of Crime. Plenum, New York, p.:43-45.
13. HUMAN COOMUNICATION RESEARCH CENTER (1992). The HCRC Map Task
Corpus Version 1.0. LDC at the University of Pennsylvania. [Electronic Journal], June
1999. Erişim: [http://www.ldc.upenn.edu/readme_files/hcrc.readme.html]. Erişim
Tarihi:11 Haziran 1999
14. ITT. (1987). King-92 Corpus for Speaker Verification. LDC at the University of
Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu
/readme_files/king.readme. html]. Erişim Tarihi:11 Haziran 1999
15. ITT. (1989). YOHO Speaker Verivacation. Linguistic Data Consortium. [Electronic
Journal]. Erişim:[http://www.ldc.upenn.edu/readme_files/yoho.readme.html].
Erişim Tarihi:11 Haziran 1999
86
16. LEONARD R,G., DODDIGTON R,G. (1993). A Speaker-Independent Connected-Digit
Database. TIICRL [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/
readme_ files/tidigits.readme.html]. Erişim Tarihi:11 Haziran 1999
17. MUTHUSAMY, Y., HOLLIMAN, E., WHEATLEY, B., PICONE, J., GODFREY, J. (1995).
Voice Across Hispanic America : A Telephone Speech Corpuse of American Spanish.
Proc.ICASSP’94, Detroit, p.:I-85-88.
18. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). The Road Rally
World-Spotting Corpora. RDRALLY1. Linguistic Data Consortium [Electronic Journal],
June 1999. Erişim: [http://www.ldc.upenn.edu/readme_files/road_rally.readme.html].
Erişim Tarihi:11 Haziran 1999
19. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). World Speech
Database Speaker-Depended Isolated World Corpus. NIST [Electronic Journal], June
1999. Erişim: [http://www.ldc.upenn.edu/readme_files/ti46.readme.html]. Erişim
Tarihi:11 Haziran 1999
20. NATIONAL INSTITUTE of STANDART AND TECHNOLOGY. (1991). Acoustic-Phonetic
Continuous Speech Corpus. Linguistic Data Consortium [Electronic Journal], June 1999.
Erişim: [http://morph.ldc.upenn.edu/readme_files/timit.readme.html]. Erişim Tarihi:11
Haziran 1999
21. NYNEX SCEINCE AND TECHNOLOGY. (1992). NTIMIT Speech Corpus CD-ROMs.
Linguistic Data Consortium [Electronic Journal], June 1999. Erişim: http://morph.ldc.
upenn.edu/readme_files/ntimit.readme.html]. Erişim Tarihi:11 Haziran 1999
22. OREGON GRADUAT INSTUTE. (1994). The Spelled and Spoken Word Telephone
Corpus. LDC at the University of Pennsylvania. [Electronic Journal], June 1999.
Erişim: [http://www.ldc. upenn.edu/readme_files/ogispell.readme.html]. Erişim Tarihi:11
Haziran 1999
23. OWENS, F.,J. (1993). Signal Processing of Speech. London, The Macmillan
Press.,p.:5,6.
24. PITERLLI, J.F., FONG, C., LEUNG H.C. (1995) Phonebook Final Report. LDC at the
University of Pennsylvania. [Electronic Journal], June 1999. Erişim:[http://www.ldc.
upenn.edu/readme_ files/phonebook.html]. Erişim Tarihi:11 Haziran 1999
25. POLICE STAFF COLLEGE. (1979). Bramshill Speech Collection. LDC at the University
of Pennsylvania. [Electronic Journal], June 1999. Erişim: http://www.ldc.upenn.edu/
readme_files/ bhill.readme.html]. Erişim Tarihi:11 Haziran 1999
26. ROSSING, T.D. (1990) The Science of Sound. USA. 2nd Ed., p.:312.
27. Sound Forge 4.0. 1996. S o n i c F o u n d r y I n c .
28. SRI INTERNATIONAL. (1995). Macrophone Corpus. LDC at the University of
Pennsylvania. [Electronic Journal], June 1999. Erişim: [http://www.ldc.upenn.edu/
readme_files/macrophone.readme.html ]. Erişim Tarihi:11 Haziran 1999
29. STAPLES, T., PICONE, J., ARAI, N., (1994). The Voice Across Japan Database- The
Japanese contribution to POLYPHONE. Proc.ICASSP’94, Adelaide, Australia,
p.:I-89-92.
87
30. TEXAS INSTRUMENTS. (1993). Switchboard Corpus of Recorded Telephone
Conversation. NIST [Electronic Journal], June 1999. Erişim:
[http://www.ldc.upenn.edu/ldc/news/newsletter/ v1.2/Switch.html]. Erişim Tarihi:11
Haziran 1999
31. TEXAS INSTRUMENTS. (1993). Switchboard Credit Card. NIST [Electronic Journal],
June 1999. Erişim: [http://morph.ldc.upenn.edu/Catalog/LDC93S8.html]. Erişim Tarihi:11
Haziran 1999
32. TEXAS INSTRUMENTS. (1994). Speaker Identification Research Corpus. NIST
[Electronic Journal], June 1999. Erişim: http://www.ldc.upenn.edu/readme_files/
spidre.readme.html]. Erişim Tarihi:11 Haziran 1999
33. TEXAS INSTRUMENTS. (1999). ATIS Speaker-Dependent Training Data. NIST
[Electronic Journal], June 1994. Erişim: http://www.ldc.upenn.edu/readme_files/atis/
sspcrd.readme.html]. Erişim Tarihi:11 Haziran 1999
34. YENER, O. (1998). Ceza Yargılaması Polis ve Jandarma Mevzuatı. Ankara :Adil
Yay.Evi,s.:113.
88
ÖZ GEÇMİŞ
30 Ocak 1963 yıl ında Bandırmada
orta
ö r e n i m i ni
Bandırmada,
t a m a m l a m ı ş t ı r. 1 9 8 0 - 1 9 8 4
Okul u
El ektronik
lise
yılları
Böl ümünde
d o ğ m u ş t u r. İ l k v e
ö ğ r e ni m i ni
arasında
öğrenim
Konyada
Kara
görmüş
Harp
ve
M u h a b e r e Te ğ m e n o l a r a k 1 9 8 4 y ı l ı n d a m e z u n o l m u ş t u r.
Mezuni yeti nden sonra çeşi tli yerlerde böl ük komutanl ığı
g ö r e v l e r i ni
yapmış
ve
1993
yıl ında
yeni
kurul an
Kri mi nal Daire Başkanlığına Ses anali z Şube Müdür ü
ol arak
a ta n m ı ş t ı r.
İtalya
Jandarma
Suç
Araştırma
L a b o r a t u v a r l a r ı n d a e ğ i t i m i ni ta m a m l a d ı k t a n s o n r a 1 9 9 5
y ı l ı n d a S e s a n a l i z l a b o r a t u v a r ı n ı k u r m u ş t u r.
L e v e n t G Ü N E R , e v l i v e b i r ç o c u k b a b a s ı d ı r.