ÿþM icrosoft W ord - evren _ kasap _ tez
Transkript
ÿþM icrosoft W ord - evren _ kasap _ tez
T.C. MARMARA ÜNİ VERSİ TESİ BANKACILIK VE Sİ GORTACILIK ENSTİ TÜSÜ Sİ GORTACILIK BÖLÜMÜ Sİ GORTACILIK SEKTÖRÜNDE MÜŞTERİ İ Lİ ŞKİ LERİYÖNETİ MİYAKLAŞIMIYLA VERİMADENCİ Lİ ĞİTEKNİ KLERİ VE Bİ R UYGULAMA YÜKSEK Lİ SANS TEZİ Evren KASAP Danı ş man Prof.Dr. Münevver ÇETİ N İ STANBUL 2007 1 ÖZET Sİ GORTACILIK SEKTÖRÜNDE MÜŞTERİİ Lİ ŞKİ LERİ YÖNETİ MİYAKLAŞIMIYLA VERİMADENCİ Lİ Ğİ TEKNİ KLERİ Sigortacı lı k sektöründe müş teri iliş kileri yönetimi (CRM) ve veri madenciliği çok yeni bir alan karş ı n bankacı lı k sektöründe ve büyük olması na uygulanmasıdaha önceki belirlemekte kullanı lan bu yı llara dayanmaktadı r.Bir ürünün iş letmelerde hedef kitlesini yöntemler iki ana bilim dalı nı n birleş tirilmesinden oluş maktadı r. Müş teri iliş kileri yönetimi (CRM) iş letmelerde müş terilerin memnuniyeti esas alı narak yapı lan bir grup stratejiden oluş maktadı r.Bu stratejilerin esas amacı maliyeti azaltarak daha fazla satı şyapabilmektir.Bu düş ünce üzerine kurulan müş teri iliş kileri , teknik analiz desteğini ise almı ş lardı r.Verilerin istatistik biliminden içerisinde istenen amaca uygun verilerin tespiti ve verilerin analizini istatistiksel analizler yardı mı yla yapmaktadı rlar.Bu teknik kı sma veri madenciliğ i adı verilmiş tir. Özellikle bankacı lı k sektöründe (CRM) ve veri baş arı yla uygulanan müş teri iliş kileri yönetimi madenciliği baş lanmı ş tı r.Sektörün sigortacı lı k sektöründe ihtiyaçları doğrultusunda müş terilerin tercih ve daha önce birçok de sigorta uygulamaya poliçesinin , satı n aldı klarıpoliçeler dikkate alı narak müş teri memnuniyetini artı racak,müş teri bağlı lı ğı nıgüçlendirecek uygun poliçeler önerilerek baş arısağlanmaya çalı ş ı lmaktadı r.Bu teknik analiz kı sı mları nı n elde edilebilmesi için yüksek teknolojiye ihtiyaç duymaktadı r. Bu çalı ş ma üç bölümden oluş maktadı r.İ lk bölümde müş teri iliş kileri yönetimi (CRM) hakkı nda gerekli bilgiler verilerek yapı lan teknik analizlerin amaçları vurgulanacaktı r.Ayrı ca müş teri mennuniyeti,müş teri sadakati vb. tanı mlarıdetaylı bir ş ekilde açı klanacaktı r. 2 ikinci bölümde ise kullanı lan analiz istatistiksel veri madenciliği hakkı nda gerekli bilgileri verirken ,burada yöntemleri hakkı nda kapsamlıbir bilgi verilecektir.Temelinde analizlerden oluş an veri madenciliği,verilerin gruplanmasıya da ayı klanmasıiçin kullanı lmaktadı r. Üçüncü ve son bölümde ise belirli bir veri setine , veri madenciliği teknikleri uygulanacaktı r.Uygulanan veri madenciliği teknikleri sonucunda , veri seti sı nı flandı rı lacak , kümelelere ayrı lacak , belirli iliş ki modelleri kurulacaktı r.Bu bölümde ayrı ca bir iş letmenin müş terileri hakkı nda detaylı bilgiyi elde edilerek , satı şkampanyalarıiçin hedef kitleler oluş turulacaktı r. 3 İ Çİ NDEKİ LER ÖZET……………………………………………………………………………………………………….. İ Çİ NDEKİ LER…………………………………………………………………………………………….. ŞEKİ L Lİ STESİ…..……………………………………………………………………………………….. TABLO Lİ STESİ ..…………………………………………………………………………………………. Gİ Rİ Ş.………………………………………………………………………………………………………. i iii v vii viii BÖLÜM 1 MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ(CRM )..……………………………………………. 1 1.1.Müş teri İ liş kileri Yönetiminin Tanı mı…………………………………………...………………… 1 1.2. Müş teri İ liş kileri Yönetiminin Temel Kavramları …………………………………………………... 4 1.2.1.Müş teri İ liş kileri Yönetimi Süreci…………………………………………………………... 1.2.2.Müş teri İ liş kileri Yönetiminin Bileş enleri…………………………………………………... 1.2.3.Müş teri İ liş kileri Yönetiminin Yapı taş ları ………………………………………………….. 1.2.4.Müş teri İ liş kileri Yönetiminin Mimarisi ..………………………………………………….. 1.2.5.Müş teri İ liş kileri Yönetiminin Teknolojileri ……………………………………………….. 4 7 7 9 10 1.3.Müş teri Yöntemi İ le İ lgili Diğer Kavramlar ………………………………………………………… 12 1.3.1.Müş teri Tanı mı……………………………………………………………………………….. 1.3.2.Müş teri Sadakati Kavramı …………………………………………………………………….. 1.3.3.Müş teri Tatmini Kavramı ……………………………………………………………………... 1.4. Müş teri İ liş kileri Yönetiminin Amaçlarıve Sağladı ğıAvantajlar………...……………………… 1.5. Müş teri İ liş kileri Yönetimi Projelerinin Baş arı lıve Baş arı sı z Olma Nedenleri……………………. 1.6. Müş teri İ liş kileri Yönetimininde Kampanya Yönetimi……………………………………………. 1.6.1.Kampanyanı n Planlanması ……………………………………………………………………. 1.6.2.Kampanyanı n Hayata Geçirilmesi ……………………………………………………………. 1.6.3.Kampanya Analizi ve Kontrolü ………………………………………………………………. 12 12 14 15 17 18 20 22 23 BÖLÜM 2 VERİMADENCİ Lİ Ğİ( DATA MINING )…………………………………………………. 24 2.1.Veri Madenciliği Tanı mı……………………………………………………………………………. 2.2.Veri Madencilğ i Sürecinde Ortaya Çı kabilecek Sorunlar ………………………………………….. 2.3.Veri AmbarıKavramı……………………………………………………………………………….. 2.4.Veri Madenciliği Teknikleri ………………………………………………………………………… 2.4.1.Tanı mlama ve ayrı mlama …………………………………………………………………….. 2.4.2.Birlikteli Kuralları……………………………………………………………………………. 24 27 29 35 36 39 4 2.4.3.Sı nı flama ve Öngörü …………………………………………………………………………. 2.4.3.1.Karar Ağaçları……………………………………………………………………………. 2.4.3.2.Yapay Sinir Ağları………………………………………………………………………... 2.4.3.3. K-Ortalamalar Yöntemi ………………………………………………………………….. 2.4.3.4.Genetik Algoritmalar……………………………………………………………………… 2.4.3.5.Regresyon Analizi ……………………………………………………………………….. 2.4.3.6.Zaman Serileri Analizi …………………………………………………………………… 2.4.4.Kümeleme Analizi …………………………………………………………………………… 2.4.4.1.Kümeleme Methodları ……………………………………………………………………. 2.4.5.Sı radı ş ı lı k Analizi…………………………………………………………………………….. 2.5.Veri Madenciliğinde Kullanı lan Diğer Analiz Teknikleri ………………………………………… 2.5.1.Faktör Analizi…………………………………………………………………………………. 2.5.2.Kanonik Kolerasyon Analizi …………………………………………………………………. 2.5.3. Lojistik Regresyon Analizi…………………………………………………………………... 2.5.4.Çok Boyutlu Ölçekleme………………………………………………………………………. 41 41 43 46 46 47 53 66 70 72 73 73 82 85 98 BÖLÜM 3 Sİ GORTACILIK SEKTÖRÜNDE MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ YAKLAŞIMIYLA Bİ R VERİMADENCİ Lİ ĞİUYGULAMASI …………………………………….. 101 3.1.Araş tı rmanı n Amacı ...………………………………………………………………………………. 101 3.2.Araş tı rmanı n Kapsamı……………………………………………………………………….……… 101 3.3.Araş tı rma İ le İ lgili Uygulama ...…………………………………………………………………….. 105 3.3.1. Birliktelik KurallarıAnalizi ………………………………………………………………… 105 3.3.2. Sı nı flandı rma Analizleri …..………………………………………………………………… 109 3.3.3.Kümeleme Analizleri ………………………………………………………………………… 114 SONUÇ……….……………………………………………………………………………………………... 122 KAYNAKÇA ……………………………………………………………………………………………… 125 5 ŞEKİ L Lİ STESİ Şekil 1.1. Müş teri iliş kileri yönetimi süreci………………………………………………………….. 5 Şekil 1.2. Müş teri iliş kileri yönetimi mimarisi……………………………………………………… 9 Şekil 1.3. CRM kampanya yönetim süreci……………………………………………………………. 19 Şekil 2.1.Veri tabanları nda bilgi keş fi aş amaları …………………………………………………… 25 Şekil 2.2 .Veri madenciliğinin tarihsel geliş imi…………………………………………………….. 29 Şekil 2.3.Veri ambarımimarisi……………………………………………………………………… 32 Şekil 2.4. veri ambarıbileş enleri……………………………………………………………………. 33 Şekil 2.5. Metadata ‘nı n veri madenciliğindeki yeri ………………………………………………... 34 Şekil 2.6.Karar ağacış ekli……………………………………………………………………………. 42 Şekil 2.7.Yapay ağsüreci…………………………………………………………………………… 44 Şekil 2.8.Yapay sinir ağları nı n katmanları …………………………………………………………… 45 Şekil 2.9.Doğrusal regresyon grafiği………………………………………………………………… 48 Şekil 2.10.Eğrisel iliş kiyi gösteren serpilme diyagramı……………………………………………. 51 Şekil 2.11.Doğrusal iliş kiyi gösteren serpilme diyagramı …………………………………………… 51 Şekil 2.12.Zaman serisi trendleri…………………………………………………………………….. 54 Şekil 2.13.Konjonktürel dalgalanma grafiği………………………………………………………… 55 Şekil 2.14.Mevsimsel dalgalanma……………………………………………………………………. 56 Şekil 2.15.Hareketli ortalama yöntemiyle oluş turulan trend………………………………………… 58 Şekil 2.16.Sı nı flandı rma ağacı ……………………………………………………………………….. 66 Şekil 2.17.Benzerlik matrisi…………………………………………………………………………... Şekil 2.18.Veri ölçeleri sı nı flandı rması ……………………………………………………………… Şekil 2.19.Kümeleme metodlarıhiyerarş isi …………………………………………………………. Şekil 2.20.Konanik kolerasyon grafiği……………………………………………………………….. 67 68 71 83 Şekil 2.21. S ve ters S fonksiyonu…………………………………………………………………….. 87 Şekil 3.1. C 4.5 analizi uygulama süreci …………………………………………………………….. 112 Şekil 3.2. C 4.5 analizi sonucu elde edilen karar ağ acıdiyagramı ………………………………... 112 6 Şekil 3.3. K-ortalamalar analizi uygulama süreci ………………………………………………….. 114 Şekil 3.4. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü………………... 115 Şekil 3.5. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü………………... 116 Şekil 3.6. Elde edilen vektörlerle arası ndaki iliş kiyi gösteren grafik……………………………….. 119 Şekil 3.7. Z1 vektörü ile satı n alma miktarıarası ndaki iliş kiyi gösteren grafik……………………... 120 Şekil 3.8. Z2 vektörü ile satı n alma miktarıarası ndaki iliş kiyi gösteren grafik……………………... 121 7 TABLO Lİ STESİ Tablo 2.1.Anova testi hesap tablosu…………………………………………………………………. 48 Tablo 2.2. Hareketli ortalamaları n hesaplanma yöntemi …………………………………………… 58 Tablo 2.3.Skorlama katsayı sımatrisi hesaplanması …………………………………………………. 78 Tablo 2.4. Değ iş kenlerin faktöre katkıoranlarıhesaplanması ……………………………………….. 78 Tablo 2.5.Değ iş ken etki puanları nı n hesaplanması …………...………………………………………. 79 Tablo 3.1. Veri seti tablosu…………………………………………………………………………… 101 Tablo 3.2.Cinsiyet değiş keninin özet bilgileri………………………………………………………... 102 Tablo 3.3.Sigorta bedeli değiş keninin özet bilgileri…………………………………………………... 102 Tablo 3.4.Primler değiş keninin özet bilgileri…………………………………………………………. 103 Tablo 3.5.Sigorta cinsi değiş keninin özet bilgileri…………………………………………………… 103 Tablo 3.6.Semt değ iş keninin özet bilgileri……………………………………………………………. 104 Tablo 3.7.Yangı n sigortasıiçindeki kadı n-erkek oranıtablosu……………………………………... 106 Tablo 3.8.Kaza sigortasıiçindeki kadı n-erkek oranıtablosu……………………………………….. 107 Tablo 3.9.Konut sigortasıiçindeki kadı n-erkek oranıtablosu……………………………………… 108 Tablo 3.10. C&RT analizi sonuç matrisi ve hata oranları ……………………………………………. 109 Tablo 3.11. C&RT analizinin yaprak analiz sonuçları ……………………………………………….. 110 Tablo 3.12. C&RT analizi sonucunda elde edilen karar ağacıdiyagramı …………………………. 110 Tablo 3.13. K-ortalamalar analizi sonucu elde edilen kümeler……………………………………... 114 Tablo3.14. K-ortalamalar analizi sonucu elde edilen kümelerin veri listesi………………………... 117 Tablo 3.15. Kanonikel diskriminant analizi sonuçları……………………………………………... 117 Tablo 3.16. Kanonikel diskriminant analizi sonuçcu elde edilen vektörler……………………….. 118 Tablo 3.17. Elde edilen vektörlerle değiş kenler arası ndaki iliş ki………………………………….. 118 8 Gİ Rİ Ş Veri madenciliği ve müş teri bağlı dı rlar.Veri olmaması iliş kileri yönetimi durumunda bu temel olarak tekniklerin veri setine geçerliliği ve uygulanabilirliği söz konusu değildir.Ancak günümüz ş artları nda çok yoğun bir veri akı ş ısöz konusudur. Veri çı kmaktadı r.Çünkü veri madenciliği kavramı da madenciliği , çok sayı da tam veriden olarak buradan amacı na uygun verilerinin elde edilme sürecidir.Günümüz ş artları nda ş irketlerin , doğru hedefe yönelmesinin baş arı yıgetireceği bilinmektedir. Bu çalı ş manı n amacıson yı llarda yönetimi ve veri yaygı n olarak kullanı lan müş teri iliş kileri madenciliği teknikleri hakkı nda bilgi vermeyi amaçlamaktadı r.Bu amaçla ilk iki bölümde teorik bilgi verildikten sonra üçüncü bölümde sigortacı lı k sektörü verileri kullanı larak bir örnek uygulma yapı lmı ş tı r. Teknolojik geliş melerin özellikle iş hayatı na yansı ması sonucunda satı şve pazarlama bölümlerindeki geliş melerin bir sonucu olarak ortaya çı kan müş teri iliş kileri ve veri madenciliği yöntemleri , çok sayı da müş teri verilerini analiz ederek satı ş larıartması na olanak sağlamı ş tı r. Yoğun rekabet ş artları altı nda daha baş arı lı olmanı n müş terilerini daha iyi tanı makdan geçtiğ i bir dönemde müş teri iliş kileri yönetiminde veri madenciliğ i buna olanak sağlamaktadı r. Ayrı ca veri madenciliği teknikleri sağlı k , bankacı lı k , astroloji gibi bir çok alanda da kullanı lmaktadı r. Ülkemizde veri madenciliği ve müş teri iliş kileri yönetimi hakkı nda yeterli kaynak bulunmamaktadı r. Bu nedenle yapı lan çalı ş ma özellikle sigortacı lı k sektörüne yapı cağıkatkıaçı sı ndan önem arz etmektedir. 9 BÖLÜM 1 MÜŞTERİİ Lİ Ş Kİ LERİYÖNETİ Mİ(CRM) 1.1.MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ(CRM)’İ N TANIMI Müş teri iliş kileri yönetimi (CRM)’in tek bir tanı mıolmaktan ziyade birden fazla tanı mıvardı r.Bunlar ş öyle ifade edilebilir . Müş teri iliş kileri yönetimi (CRM)’in satı ş , pazarlama ve hizmet süreçlerinin müş teri odaklıbir felsefe etrafı nda yeniden tanı mlanması nıgerektiren bir süreçtir.1 Müş teri iliş kileri yönetimi (CRM)’in , müş teri memnuniyetini kar maksimizasyonuna dönüş türmek amacıtaş ı yan, istediği müş teriye istediğ i deneyimi yaş atabilecek kabiliyette bir kurum felsefesi ve bu hedefe ulaş mak için ; gerekli insan, süreç , teknoloji yapı lanması dı r. 2 Müş teri iliş kileri yönetimi (CRM), tüketiciyi ve onları n ihtiyaçlarini doğru analiz ederek, eğilimleri ve ilgileri konusunda doğru sonuçlarıçı karabilmek ve tüm bunları ortaya koyduktan sonra onları n isteklerine uygun ürünlere ulaş tı rabilmektir. Müş teri iliş kileri yönetimi (CRM), müş terileri belli gruplara ayı rarak , onları n davranı şmodellerini oluş turan ve müş terilerin ihtiyaçları nı tesbit ederek bu ihtiyaçları n karş ı laması nıamaçlayan bir süreçtir. 3 Müş teri iliş kileri yönetimi (CRM), hem ön ofis (pazarlama, satı şve müş teri servisi) hem arka ofis (muhasebe, üretim ve lojistik) uygulamasıolmakla kalmayı p aynızamanda hem de diğer tüm bölümler, müş teriler ve işortaklarıile koordinasyonu ve iş birliğini sağlayan müş teri merkezli bir iliş ki yönetimi felsefesidir.4 1 Y.ODABAŞ, Satı ş ta ve Pazarlamada Müş teri İ liş ki Yönetimi , Sistem Yayı nları2005 s3. 2 http://www.biymed.com/pages/makaleler/makale49.htm 2004. http://www.apluspost.com/bilgi_teknoloji.php 2005. 3 10 Müş teri iliş kileri yönetimi (CRM) , yeni müş teri edinmek, var olan müş teriyi elde tutmak, müş teri sadakatini kazanmak ve karlı lı ğı nıartı rmak için anlamlı iletiş imler yoluyla iş letme çapı nda müş teri davranı ş ları nıanlama ve etkileme yaklaş ı mı dı r. 5 Müş teri iliş kileri yönetimi (CRM) , genel anlamda insanları n satı nalma alı ş kanlı klarıhakkı nda geçmiş ten elde edilen verilere dayanak ilerideki davranı ş ve ihtiyaçları nı yüksek teknolojida kullanarak tahmin etme ve bu ihtiyaçları karş ı lama sürecidir. Müş teri iliş kileri yönetimi (CRM) , ş irketlerin rekabet avantajı nıartı ran, müş teri odaklıbir işgeliş tirme stratejisi olarak algı lanmaktadı r.6 Müş teri iliş kileri yönetimi (CRM) , en değerli “işiliş kilerini” seçmeye ve yönetmeye yönelik işstratejisidir. Müş teri iliş kileri yaratmak için yönetimi (CRM), karş ı lı klı , uzun vadeli bir değer iliş kisi müş teriler ile gerçekleş tirilen iliş kilerin etkin biçimde yönetilmesidir. Müş teri iliş kileri yönetimi (CRM) ; satı ş , pazarlama ve hizmet süreçlerinin müş teri odaklı bir felsefe etrafı nda yeniden tanı mlanması nı gerektirir.7 Müş teri iliş kileri yönetimi (CRM)’nin tanı mı nı n ihtiyaç duyulan durumlara ve uygulamalara göre değiş tiği yukarı daki tanı mlamalardan da anlaş ı lmaktadı r. Müş teri iliş kileri yönetimi (CRM)’in tarihi geliş imine bakı ldı ğ ı nda , ş irketlerin müş terilerine ürettikleri hizmet ya da ürünlerin nası l bir bakı ş la üretildiği net bir ş ekilde ortaya koymaktadı r.1970’lerde üretelim satarı z anlayı ş ı nı n yaygı n olduğu ve müş terilerden ziyade karlımal üretiminin ön planda olduğu bir dönem yaş anmı ş tı r.Karlımal üretimi , 1970’lerde esas olarak seri ve hı zlı üretimle bağdaş tı rı lmaktaydı . 4 http://www.kobifinans.com.tr/bilgi_merkezi/020305/14318 2007. Ronald S. Swift ,Accelerating Customer Relationships ,Prentice Hall , 2001 s12. 6 www.tepum.com.tr/Etkinlikler/crm_nedir.pps 2003. 5 11 1980’lere gelindiğ inde , ürettiğimizi satarı z anlayı ş ı ndan ürünün nası l üretileceği , müş teriye uygun olup olmadı ğıtartı ş maları nı n ardı ndan yaş anan uzun bir süreçten sonra gerek rekabet , gerekse çeş it sayı sı nı n çok olması ndan dolayı müş teri odaklı bir bakı ş açı sı ş irketlere yerleş meye baş lamı ş tı r.Müş teri iliş kileri yönetimi’nin ortaya çı kı ş ı yla beraber , bazıyeni kavramlar ortaya çı kmı ş tı r.Bu kavramlar temel olarak sadı k müş teri, müş teri tatmini , cüzdan payı,müş teri karlı lı ğıgibi kavramlardı r. Bu kavramlara bakı ldı ğı nda stratejilerinin üretip satarı z , anlayı ş ı ndan pazarlama satı ş müş teri odaklı bir hale geldiğ i görülebilmektedir. Müş teri iliş kileri yönetimi (CRM) , kabul edilen temel alt kavramları n bir disiplin çerçevesinde ele alı nmasıdünyada son 10 yı lda , ülkemizde ise son 5 yı lda gerçekleş miş tir. 8 80’li yı llarda insanları n yaş am alı ş kanlı kları nda baş layan , değ iş im rüzgarıbilgi ve teknoloji sistemlerinin de hı zla geliş mesiyle, 90’lıyı llarda firmalarıürün ve hizmet konusunda , seçici, marka sadakati düş ük, talepkar müş teriler ile karş ıkarş ı ya bı rakmı ş tı r. Şirketler, yoğ un rekabet koş ulları nda, hem müş terisini elinde tutmak, onu memnun etmek, yeni müş teriler kazanmak için çabalarken, hem de kar ve zarar hesabı nıdoğru yapabilmek için yeniden yapı lanmaktaydı lar.Geliş en bilgi teknolojileri sayesinde, insan gücüne destek olacak yeni uygulamalar yaygı nlaş tı . Önceleri sadece veri bankasıolarak kullanı lan sistemlerin fonksiyonları nı , iş lem güçlerini arttı rması yla ş irketler tüm süreçlerde daha kontrollu, daha verimli çalı ş abilme yeteneğine kavuş tu. 9 Müş teri iliş kileri yönetimi (CRM) felsefesinin dünyada tanı nması nı n, benimsenmesinin ve hayata geçirilmesinin 1989 yı lı ndan bu zamana kadar uzun bir 7 O.C.Gel , CRM Yolculuğ u ,Sistem Yayı ncı lı k 2004 s28. http://blog.inspark.com/blog/2006/10/mteri_liklileri.html 2006. 9 A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth 8 Heinemann Publishers 2005 s 10. 12 süreç alması , bu kavramı n sadece bir veri tabanısistemi olmadı ğı nı n en güzel göstergesidir. Tüm süreçleri ve tüm fonksiyonlarıkapsayan bu felsefenin yönetilmesi için; tüm müş teri iliş kilerini her yönüyle görebilecek, ihtiyaçlarıve davranı ş larıölçebilecek, çift yönlü iletiş im sağ layabilecek akı llıbütünleş ik sistemlere ihtiyaç vardı r. Bilgi teknolojilerinin ihtiyaçlara paralel geliş mesiyle birlikte, analiz yapabilen, ihtiyaca uygun özelleş tirilebilen, esnek, türlü iletiş im araçları yla entegre olabilen uygulamalar da hayata geçirilmeye baş lamı ş tı r.Böylece bir felsefe ve bu felsefeyi desteklemek üzere hizmet eden teknoloji bütünü olarak Müş teri iliş kileri yönetimi ( CRM ) ‘ni oluş turmuş tur.10 Müş teri iliş kileri yönetimi (CRM), henüz geliş imini tam olarak tamamlamamı ş olmakla birlikte, uygulama alanları nı n yaygı nlaş masıve teknoloji ile bütünleş mişbir felsefe olduğ unun bilincine varı lması yla Müş teri iliş kileri yönetimi (CRM), yeni yüzyı lda firmaları n hayatları nısürdürebilmeleri için benimsenmesi ve uygulanması gereken bir anlayı şolarak ortaya çı kmı ş tı r.11 1.2. MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ(CRM)’İ N TEMEL KAVRAMLARI Müş teri iliş kileri yönetiminin temel kavramlarış öyle sı ralanabilir ; Müş teri İ liş kileri Yönetimi (CRM) ‘in Süreçleri , Müş teri İ liş kileri Yönetimi (CRM) ‘in Bileş enleri , Müş teri İ liş kileri Yönetimi (CRM) ‘in Yapıtaş ları, Müş teri İ liş kileri Yönetimi (CRM) ‘in Mimarisi , Müş teri İ liş kileri Yönetimi (CRM) ‘in Teknolojileridir. 1.2.1.Müş teri İ liş kileri Yönetimi (CRM) ‘nin Süreci Müş teri iliş kileri yönetiminde süreç , ilk olarak müş teriler hakkı nda olabildiğince bilgi toplamaya dayanı r. Bu anlamda daha önce belirtildiği gibi bu sistem (CRM), 10 11 O.C.Gel , CRM Yolculuğu ,Sistem Yayı ncı lı k 2004 s9. http://blog.inspark.com/blog/2006/10/mteri_liklileri.html 2006. 13 yaratı lan edilen felsefenin arkası nda yüksek bir teknolojiye ihtiyaç duymaktadı r.Elde verilerin ı ş ı ğı altı nda müş terilerin özelliklerinin çı karı lması ve son gruplandı rı lması, karakteristlik olarak doğru ürünün doğru müş teriye yönlendirilmesine olanak sağlar.12Bu süreç aş ağ ı daki ş ekilde açı klanmı ş tı r. Müş teri Seçimi CRM sürecinde bu aş aması nda özellikle müş terilerin sı nı flandı rı lması hedef , kampanya kitlelerin belirlenmesi , yapı ldı ğ ı planları nı n aş amadı r.Özellikle CRM kampanyası nı n , temel planı nı n oluş turulduğ u aş ama olmasıaçı sı ndan çok önemlidir.Müş terileri sı nı flandı rma süreçlerinde amaç en karlımüş teri grubunun tespiti ve bu gruba yönelik kampanyaları n planlandı ğıaş amadı r.Bu aş amada yapı lan iş lemler aş ağı da özetlenmiş tir. Sı nı flandı rma , Kampanya modelleme , Marka yönetimidir. Şekil 1.1. Müş teri iliş kileri yönetimi süreci Kaynak :http://www.manas.kg/pdf/sbdpdf9/Hamsioglu.pdf 2004. 12 ilk A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı ncı lı k ,s49 2007. 14 Müş teriyi elde tutma Müş terileri elde sonra net tutma aş aması nda bir ş ekilde özellikle müş terileri bu grupları n gruplara ayı rdı ktan ihtiyaçları nı n gerekmektedir.Doğ ru bir ihtiyaç analizinin yapı lmasıhem belirtilmesi müş teri sadakatini hem de firmanı n karı na doğrudan bir etkide bulunacağıgörülmektedir. Müş teri elde tutmanı n bir diğer boyutu ise müş teri memnuniyetini en üst noktada tutabilmektir.Özellikle ürün ve servis memnuniyeti müş terilerde güven yaratmakta ve firmada daha uzun bir süre müş teri olarak kalmaktadı r. Müş teri kazanma Yeni müş teri kazanma aş aması nda özellikle talep analizi ve ş ikayet yönetimi alanları nda baş arı lı yla uygulanmasıgerekmektedir.Her memnun müş teri ş irketin sözcüsü gibi davranarak , yeni müş teri kazanı mı nda firmaya yardı mcı olmaktadı r.13 Müş terinin ürünle ilgili yaş adı ğıbir sorunu , en kı sa bir ş ekilde sistemli olarak çözmek müş terilerin kazanı lması nda en önemli etkenlerden birisidir. Müş teriyi büyütme ve derinleş tirme Bu süreçte var olan müş terilere , ürün satı ş ı nı arttı rmak için çapraz satı ş kampanyalarıkullanı lı r.Bu kampanyalar , müş terilerin veri tabanı ndaki bilgileri kullanı larak müş teri ihtiyaçları nıtespit edip , ona uygun ürünü müş teriye sunma sürecidir. Bu çapraz satı şkampanyaları na en iyi örnek “amazon.com” dur.Bu firma , kitap ya da ürünü alan müş terisine ürünün en yakı n alternatiflerini sunarak müş terilerine , çapraz satı şyapmaktadı r. 13 Y.ODABAŞ, Satı ş ta ve Pazarlamada Müş teri İ liş ki Yönetimi , Sistem Yayı nları2005 s113. 15 1.2.2.Müş teri İ liş kileri Yönetimi (CRM) ‘in Bileş enleri Müş teri iliş kileri yönetimi (CRM) , üç temel bileş enden oluş maktadı r.Bunlar , insan, proses ve teknoloji yapı sı dı r. İ nsan (çalı ş anlar), müş terinin beklentilerini anlayı p, standart prosedürlerin ötesinde çözümler üretmektedirler.Proses, çalı ş anları n ilettiğ i müş teri taleplerini hı zlısüreç revizyonlarıile müş teri odaklıyapı lanmaya dönüş türmektedirler. Teknoloji ise müş teri bilgilerinin tüm temas noktaları ndan takip edilmesine ve farklımüş teri isteklerine hı zlıçözüm üretilmesine imkan tanı yacak ş irket içi otomasyonu sağlamaktadı rlar.Böylece bu koordinasyon Müş teri iliş kileri yönetimi (CRM) ‘i oluş turmaktadı r. 14 1.2.3.Müş teri İ liş kileri Yönetimi (CRM) ‘in Yapı taş ları Müş teri iliş kileri yönetimi (CRM) sekiz temel yapı taş ı ndan oluş maktadı r.Bu sekiz yapı taş ış unlardı r. CRM Vizyonu CRM'in kurumsal anlamda benimsenmesi için yapı lanlar, kurumsal CRM tarifi, pazar pozisyonu, müş terilere önerilmesi planlanan nihai değerler , iş hedeflerinden oluş maktadı r. Müş teri Stratejisi Müş teri hedefleri, pazar değerinin yönetimi, CRM'in kurumsal anlamda benimsenmesi için yapı lanlar, segmentasyon anlayı ş ları , segment hedeflerinin yönetimi, kurumsal değiş im planları , müş teri tabanlıpazarlama planı , CRM esas planları ndan oluş maktadı r. 14 http://www.biymed.com/pages/makaleler/makale49.htm 2004. 16 Müş teri Bakı ş ı Müş teri ile iletiş im, ş ikayet yönetim sistemi, eskalasyon sistemi, müş teri temas noktaları ndan oluş maktadı r. Müş teri Merkezliliği Değ iş im dinamikleri, müş teri merkezli süreç yapı lanması , bireysel yetkinlik ve uzmanlı kları n geliş tirilmesi, kariyer planları na müş teri baş arı ları nı n yansı ması ndan oluş ur.Bu kavram , çoğ u zaman müş teri odaklı lı kla karı ş tı rı lmaktadı r.Müş teri odaklı lı k toplam kalite yönetiminde kullanı lan bir kavramdı r.Müş teri odaklı lı k , üretilen malıkitlelere satı ş ı ön görürken , müş teri merkezli bir yaklaş ı m her müş teriye ihtiyaçlarıdoğrultusunda bir ürün ya da bir hizmet verilmektedir. 15 CRM Otomasyonu Müş teri yönetimine dönük uygulamalar, yazı lı m, network ve telefon entegrasyonları , sistem altyapı sıve sistem yönetimlerinden oluş maktadı r. Müş teri Bilgi Sistemi Tekil müş teri tanı mları , veri entegrasyonu, veri toplama yöntemleri, veri sözlüğü, müş teri verilerinin yönetiminden oluş maktadı r. CRM Taktik Modelleri Müş teri performans yönetimi, müş teri mülkiyeti çalı ş maları , sadakat programları , iliş ki modelleri, mikro pazarlama çalı ş maları , hedef odaklıkampanyaları ndan oluş maktadı r. 15 A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı ncı lı k , s51 , 2007. 17 CRM Ölçümleri Yönetim performans göstergeleri, müş teri stratejisi göstergeleri, operasyonel göstergeler, verimlilik göstergelerinden oluş maktadı r. 1.2.4.Müş teri İ liş kileri Yönetimi (CRM) ‘nin Mimarisi CRM çözümleri olarak nitelendirilen uygulamalar ile geçmiş teki uygulamalar arası nda birçok yapı sal benzerlik ve farklı lı klar vardı r.Farklı lı klar, Müş teri iliş kileri yönetimi (CRM) ’in geçirdiği evreleri de ortaya koymasıaçı sı ndan önemlidir.Bu anlamda Müş teri iliş kileri yönetimi (CRM) üç temel aş amadan oluş maktadı r.Bunlar Operasyonel CRM , Analitik CRM , İ ş birliğine yönelik CRM dir.CRM ‘in mimarisi aş ağı da belirtilmiş tir. Operasyonel CRM Arka Ofis ERP RP /ERM TTe daarikk Zinncciiri Yntm m. Sippar arişYnt m. Sip ipar arişP şPrrom om.. Analitik CRM Mir irass S isttem mller Kappaalı Dööng ngü İ ş le lemee Verri Deeposu Mü Müş te terri Et Etki kinlikk Verri Ön Ofis S Serrvvis Oto tomasy syonu P Pazzaarlam ma Ot omasy syonu Saatı ı ş Ot omaassyyoonu Mü Müş te terrii Ver eri am ambarrı ı Moobbil il Sat atı ı ş P Pazzaarlam ma Oto tomasy syon u Sa Sahhaa Ser ervis isi Kat ego gori Ynt nt m. Müş teri Etkileş imi aambaarı ı am mbarrı Diike y uyyggulama malar Seyyar Ofis Ü Ürrüünn V Ver erii K Koonf nf erran ans E- post a AğK Kon onf . Yan anı t Ynntm tm. Sess Weeb Kaamp mpaany nya Ynntm tm. Do Doğrudann Et kile leş im im İ şbirliksel CRM Şekil 1.2. Müş teri iliş kileri yönetimi mimarisi Kaynak : http://www.erpcrm.com/crm_anasf/crm_mimarisi.htm 2003. 18 Operasyonel CRM Müş teri iliş kileri yönetimi (CRM)’in bu biçimi aslı nda tipik işfonksiyonları nı n kapsandı ğıCRM çözümlerinden oluş ur. Bu fonksiyonlara örnek olarak müş teri hizmetleri, siparişyönetimi, faturalama, satı şve pazarlama otomasyonu gibi süreçleri verebilir. Bu çözümler daha çok kurumsal sistem içerisindeki finans, insan kaynakları gibi farklıişfonksiyonları nı n entegre bir yapı ya kavuş turulmasıiçin kullanı lmaktadı r. Analitik CRM Analitik CRM , kullanı cı lara ait verilerin elde edilmesi, depolanması , iş lenmesi, analiz ve tahminlere dönüş türülerek raporlanmasıiş lemlerini gerçekleş tirmektedir. Böylelikle CRM’in operasyonel ve entegrasyon özellikleri üzerine analiz ve raporlama özellikleri eklenmektedir. İ ş birliğine yönelik CRM İ ş birliğine yönelik CRM , aslı nda diğerlerinin en uygun birleş iminden oluş maktadı r. Müş teriler ile ş irketler arası nda tam anlamı yla bir etkileş im ve koordinasyon ağı nı n oluş ması na imkân veren , farklıiletiş im kanalları ndan (web, telefon, e-posta vb) gelen bilgilerin , değere dönüş türülmesini sağlayan bir süreçtir. İ ş birliğine yönelik CRM çözümleri müş teri ile etkileş ime imkân veren tüm fonksiyonlarıiçermektedir. 16 1.2.5.Müş teri İ liş kileri Yönetimi (CRM) ‘nin Teknolojileri Müş teri iliş kileri yönetiminde teknoloji olmazsa olmazı dı r.Müş teri verilerini analiz edecek gerek ve yeter bir teknoloji , tüm firmalar için ş arttı r. Müş teri iliş kileri yönetimi (CRM) için kullanı lan teknoloji , Müş teri iliş kileri yönetimi (CRM) ‘in aş amaları na göre sı nı flandı rı lmı ş tı r.Bunlar operasyonel (sales management..), analitik (data warehousing..) ve iş birlikçi (call center...) gibi ürünler kullanı lmaktadı r. Kullanı lan ürünler detaylıolarak aş ağı da belirtilmiş tir. 17 16 17 http://www.microsoft.com/turkiye/dynamics/crm/crm_nedir.mspx 2007. A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth- Heinemann Publishers 2005 s226- 236. 19 İ şzekası( Business Intelligence) , Bilgi yönetimi ( Knowledge Management ) , İ letş im yönetimi (Contact Management) , Müş teri etkileş im merkezi (Customer Interaction Center ) , Çağrımerkezi ( Call Center ) , Bilgi sistemleri ( Information Systems ) , Veritabanıraporlama sistemi ( Database Management Report Writing ) , Dijital belge yönetimi ( Digital Document Management ) , Elertronik ticaret ( Electronic Commerce ) , E-Pazarlama ( Emarketing ) , E-servis ( eService ) , İ nternet tabanlıçözümler ( Web-Based Solutions ), İ nternet analizi ( Web Analysis ) , Pazarlama otomasyonu ( Marketing Automation ), Tahmin etme ( Forecasting ) , Satı şotomasyonu ( Sales Automation ) , Kablosuz veya hareketli veri iş leme ( Mobile Computing/ Wireless ) , Bağlantıyönetimi servisleri ( Contact Management Services ) , Siparişyönetimi ( Order Management/ Distribution ) , Saha gücü otomasyonu ( Field Force Automation ) , Saha servisi ( Field Service ) , Ortaklı k iliş kisi yönetimi ( Partner Relationship Management ) , Kiş iselleş tirme ( Personalisation ), Telefonda pazarlama ve satı ş( Telemarketing/ Telesales ). Bu teknolojilere rağ men bir kurum , müş teri iliş kileri yönetimi (CRM) ‘i uygulayabilmek için ş u temel teknolojilere sahip olmak zorundadı r. 18 Veri tabanıteknolojisi , Call center teknolojisi , 18 A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı ncı lı k ,s95- 96 2007. 20 Ismarlama seri üretim teknolojisidir. Analitik 1.3.MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİİ LE İ LGİ LİDİ ĞER KAVRAMLAR 1.3.1.Müş teri Tanı mı Müş teri , belirli bir mağaza ya da kuruluş tan düzenli alı ş verişyapan kiş i ya da bakı ldı ğı nda , kurumdur.Müş teri iliş kileri yönetimine müş teri üç gruba ayrı lmaktadı r.Bunlar sı rası yla , Mevcut müş teri, Yeni müş teri ve de Şirketi terk etmişmüş teridir.Bu müş teri çeş itleri Müş teri iliş kileri yönetiminin bir anlamda amaçları nı da ortaya koymaktadı r. Müş teri iliş kileri yönetimi (CRM) , yeni müş teri kazanmaktansa , var olan müş terilere yapı lan satı ş ı arttı rarak , satı ş karlı lı ğı nı Analitik 19 artı rmayıamaçlamaktadı r. 1.3.2.Müş teri Sadakati Kavramı bir ş irkete Müş teri sadakati kavramı nı, müş terilerin tanı mlayabiliriz.Müş terilerin neden ş irket olan bağlı lıolarak değiş tirdiğiyle ilgili yapı lan araş tı rmalarda , müş terilerin % 68 ‘inin kayı tsı z bir tavı r hissettikleri için ş irket değiş tirdiğini ortaya koymaktadı r.Bu araş tı rmanı n sonuçları nda sadece müş terilerin % 14 ‘nün üründen memnun kalmadı ğıiçin ş irket değiş tirdiğini ,% 9 ‘unun rakip ş irketleri tercih ettiği , % 9‘unun ise diğer sebeplerden ş irket değiş tirdiğini ortaya koymuş tur. 20 Bu kavram doğrudan sadı k müş teri ile tanı mlanabilir. Düzenli olarak bir iş letmeden birden fazla ürün ya da hizmet iliş kilidir.Sadı k müş teri , ş öyle alı ş veriş yapan , aynış irketten alan , alı ş verişyaptı ğıyeri baş kaları na tavsiye eden ve rakip firmalara kaçmayan müş teri olarak tanı mlanabilir.21 Y.ZENGİ N, Değer Yaratan Müş teri İ liş kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv. , s 24 2006 20 65.110.73.19/UploadsNew/Gallery/Seminars/ICT3/III_CRM_Awareness-Handouts.pdf 2006. 21 Y.ODABAŞ, Satı ş ta ve Pazarlamada Müş teri İ liş ki Yönetimi , Sistem Yayı nları20005 s11-12. 19 21 Günümüzde yoğun rekabet ortamı ndan dolayı, iş letmler müş teri kavaramları nı yeniden tanı mlayarak , bir üründen alı nan kardan ziyade , müş terileri sadı k hala getirerek müş terilerden bir ömür boyu kar elde etmeyi amaçlamaktadı r.Bu anlamda müş teri tanı mlarış öyle sı ralanabilmektedir.22 İ lk kez alan müş teri Tekrar alan müş teri Sürekli müş teri Sözcü İ lk kez alan müş teri Müş teri sadakatinde yeni müş teriye verilen ilk izlenim müş terinin aldı ğıürün ya da hizmetten nekadar memnun olup olmadı ğı yla alakalı dı r.Genellikle alı nan üründen memnuniyetin yüksek olması, müş teri sadakatini arttı rmaktadı r. Tekrar alan müş teri Müş teri sadakatinin ası l amaçları ndan biri olan müş terinin tekrar satı n alması, iş letmelere yüksek kar sağlamaktadı rlar.Müş terilerin ürün anlamı nda , memnuniyetinin yüksek olması, tekrar satı n alan müş teriyi yaratmaktadı r. Sürekli müş teri Bu müş teri türü , genellikle ş irketin bir baş ka ş irkete sürekli olarak bir hizmeti vermesinin sonucudur. Sözcü Müş terinin sözcü olarak tanı mlanmasıtamamiyle ş irketle ürün ya da aldı ğ ı nda , meydana gelen hizmet yüksek memnuniyetin ürünüdür. Müş teriler , sözcü Y.ZENGİ N, Değer Yaratan Müş teri İ liş kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv.s32 , 2006 22 22 oldukları nda çevrelerine , arkadaş ları na ve ailesine düş üncelerini yayarak ş irket hakkı nda olumlu ş irketin reklamı nı yapmakta ve ş irketin güvenirliğini arttı rmaktadı r. Bu müş teri zinciri ve yaratı lmak istenen müş teri sadakati gereken uzun ve yönetilmesi zorlu bir iş tir.Müş terilerin aldı ğıbir ürün ya da hizmetin kusurlu çı kmasıveya aldı kları üründen memnun kalmamaları, müş teri sadakatini doğ rudan etkilemektedir.Bu gibi durumlarda , ş irketin çabuk ve kalı cıçözümleri müş terilerine ulaş tı rması, müş teride olumlu bir ifade bı rakacağıgibi aynı zaman da müş teri sadakatinede olumlu bir katkı sı olmaktadı r. 23 Müş teri sadakatini etkileyen faktörlere bakı ldı ğı nda güven , vazgeçilmezlik ve de önemsenmek gibi kavramlar ön plana çı kmaktadı r.Bunun gibi kavramları n müş teri sadakatine olumlu ya da olumsuz bir etkide bulunacağ ıkesindir. 24 1.3.3.Müş teri Tatmini Kavramı İ ş letmeler ayakta kalabilmek için müş terilerin beklenti ve isteklerini dikkate almak zorundadı rlar.Müş teri tatmini , iş letmelerin performans ve müş teri değerleri yaratmak açı sı ndan en önemli kriterlerden birisi olarak kabul edilmektedir.Müş teri tatmini , genel olarak , müş terilerin gerek üründen gerekse kurumdan beklentilerin karş ı lanması dı r. Müş teri tatminin yüksek tutulması, müş teri sadakatini doğrudan etkileyen en önemli faktörlerden birisidir.Müş teri tatminin sonucu olarak , müş teri sadakatinin artması, müş teriden ömür boyu faydalanı lması na olanak sağ lamaktadı r.Müş teri , satı n aldı ktan sonra aş ağı daki beşmemnuniyet düzeyinden biri yaş anacaktı r. 25 Çok hoş nut 23 A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth- Heinemann Publishers 2005 s102-110. 24 O.C.Gel , CRM Yolculuğu ,Sistem Yayı ncı lı k 2004 s50. Y.ZENGİ N, Değer Yaratan Müş teri İ liş kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv. s27 28,2006 25 23 Hoş nut Kayı tsı z Hoş nutsuz Çok hoş nutsuz Bu düzeylerden Hoş nut - Çok hoş nut olarak memnun ayrı lan müş terilerin doğal olarak müş teri tatmini ve sadakati yüksek olacaktı r.Bu kavramları n karlı lı k oranı na etkisinin olumlu olacağıgörülebilmektedir. Müş terilerin tatminsizliğinin sonucunda oluş abilen davranı ş lar ş unlardı r. Ürünü boykot etme ve ikame malara yönelme , Markayıboykot etme ve yeni markaya yönelme , Satı cı yıboykot etme , baş ka satı cı lara yönelme , Aile ve yakı n çevresine ş ikayetini iletme , Ürünü iade etme , Bası n yayı n yoluyla ürün hakkı ndaki fikirlerini beyan etme, olarak sı ralanabilmektedir. 1.4.MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ(CRM)’İ N AMAÇLARI VE SAĞLADIĞI AVANTAJLAR Müş terilerin tam istediği ürün ve hizmetleri sağlamak , Müş teriye daha iyi hizmet sunmak , Daha efektif çapraz satı ş, Satı şekibinin daha hı zlısatı şkapatması, Eski ve değ erli müş terileri tutmak ve yenilerini kazanmaktı r. 26 Müş teri iliş kileri yönetimi (CRM)’ in ş irketlere olan faydalarış öyle sı ralanabilir . 27 26 27 65.110.73.19/UploadsNew/Gallery/Presentations/CRM/CRM-distribution.pps 2004. http://www.sauemk.com/makale.html 1999. 24 Müş terileri sı nı flandı rmamı zısağlar , En uygun zamanda en uygun pazarlama programıile en uygun müş teriye yaklaş ma olası lı ğıhesaplar , Müş terinin firmaya daha çabuk ulaş ması nısağlar , Müş terinin daha çabuk karar vermesine olanak tanı r, Müş teri sadakatini artı rı r, Baş ka firmalarla iş birliği yaparak yeni gelir olanaklarıyaratı r, Müş teri tatmin değerinin yükselmesini sağlar , Birim müş teri gelirinin artması nısağlar , Müş teri sayı sı nıarttı rı r, Satı şgiderlerinin azalması nısağlar , Süreç verimliliklerini arttı rı r, Stok yatı rı mları nı n optimize edilmesini sağ lar , Rekabetten önce değiş imleri yakalayarak pazar payı nı n arttı rı lması nısağlar . Müş teri iliş kileri yönetimi (CRM)’ in ş irketlere sağladı ğıfaydalarırakamsal olarak ifade etmek gerekirse, CSO Insights ş irketinin dünya çapı nda bin iki yüz elli’nin üzerinde ş irketi kapsayan araş tı rması nda , yüz yirmi'nin üzerinde parametre kullanı larak satı şyapı ları nı n ne derece verimli çalı ş tı ğıdeğerlendirilmiş tir. Şirketlerin CRM uygulamaları yla elde ettikleri rakamsal sonuçlar ş unlardı r. 28 • Müş terilerle %61.9 oranı nda daha iyi iletiş im sağ landı ğ ı, • Müş terilerin ihtiyaçları nı%50.3 oranı nda daha iyi tahmin edildiği, • Yönetim yükünün %41.7 oranı nda azaldı ğı, • Gelirlerinin ise %30.1 arttı ğıgörülmüş tür. Bu veriler değerlendirildiğinde işyükünün azalmasıyani zaman kavramı nı n etkin kullanı mı, müş teri memnuniyeti ve sadakati üzerinde etkinliğinin görebilmekteyiz. 28 Ronald S. Swift ,Accelerating Customer Relationships ,Prentice Hall , 2001 s28. 25 artı ğı nı Müş teri iliş kileri yönetimi uygulamaları nı n rekabetçi bir ortamda ş irketlere sağladı ğıavantajlar düş ünüldüğünde müş teri iliş kileri yönetimi (CRM)’in neden bu kadar önemli ve vazgerçilemez olduğu daha iyi anlaş ı lmaktadı r. 1.5.MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ(CRM) PROJELERİ Nİ N BAŞARILI VE BAŞARISIZ OLMA NEDENLERİ Müş teri iliş kileri yönetimi (CRM) projelerinin baş arı sı z olması nı n bir çok nedeni bulunmaktadı r.Bunları n en önemlilerini ş öyle sı ralayabiliriz . 29 Projenin tek baş ı na IT personeline bı rakı lması , Vizyon oluş turmadan, hedefler belirlenmeden projeye baş lanması , Pahallıteknolojilerin tek baş ı na yeterli olduğunun düş ünülmesi , CRM’in sadece bir programdan ibaret olduğ unun düş ünülmesi, İ nsandan çok teknolojiye yatı rı m yapı lması , insana gereken önemin verilmemesi, CRM projesini çok kı sa zamanda tamamlanmaya çalı ş ı lması , Tecrübesi olmayan kiş ilerin, projeyi profesyonel destek almadan yürütmeye çalı ş ması , Üst yönetimin destek olmaması , Ayrı ş tı rma tekniklerinin uygulanmaması , Projenin baş ı na getirilen kiş inin bilgisiz ve tecrübesiz olması , Yeterince araş tı rma yapmadan projeye baş lanması , Müş teri odaklıdüş ünememe, Eksik müş teri bilgileri ile CRM çalı ş maları nıyürütmeye çalı ş ma, Veri ambarı nı n güncel olmaması ve eksik verilere dayanarak CRM çalı ş maları nıyürütmeye çalı ş ma, Projeyi ucuza mal etmeye çalı ş madı r.30 29 30 P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley Publishers 2004 s 33. http://www.herkesmusteri.com/scrm/crmbasarisiz.aspx 2007. 26 Müş teri iliş kileri yönetimi (CRM) projelerinin baş arı lıolma nedenleri ise ş unlardı r.31 Satı şsürecinin iyi tanı mlanması, Üst yönetimin, satı şyönetiminin ve satı ştemsilcilerinin CRM’e bağlı lı ğıve kararlı lı ğ ıolması, Etkinliklerin otomasyonuyla daha fazla satı ş yapı lmasıve engellerin kaldı rı lması, Doğru tedarikçilerin veya diğer hizmet sağlayı cı ları n doğru seçilmesi , Yönetimin değil, satı şelemanları nı n ve müş terilerin önemi vurgulanmalı , Tüm zaman dilimlerinin, kullanı cı ları n ve iş tarzları nı n ihtiyaçları nı n karş ı lanmasıiçin artı rı lmı şdestek sağlanmalı, Saha satı ş larıiçin uzaktan iletiş im kurulmalı, Satı şsenaryolarıüzerine kurulu bir eğ itim programıplanlanmalı, Sürdürülebilir ve geliş tirilebilir teknolojiye yatı rı m yapı lmalı dı r.32 1.6. MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ NDE (CRM) KAMPANYA YÖNETİ Mİ Bir CRM kampanyası nda esas amaç yeni müş teriyi elde elmek ve mevcut müş teriyi korumaktı r.Bu kampanya sürecide pazarlama kanalları nı n doğru bir ş ekilde kullanı lması nı n yanısı ra müş teriler hakkı nda detaylıbilgi edinmeyi amaçlamaktadı r. Uygulanan bir kampanyanı n baş arı lıolmasıiçin ş u dört özelliği taş ı malı dı r.33 Elde edilen veriler saklanmalı, Verilere uygun analizler uygulanarak parametreler arası nda bir bağ kurulmalı , Değ iş kenler tahmin edilebilir olması, Kampanya sonucunda elde edilen bilgilerin yapı lacak olan bir diğer kampanyada kullanı labilir olmasıgerekmektedir. 31 32 P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley Publishers 2004 s165 www.srdc.metu.edu.tr/webpage/documents/Kosgeb/CRM_KOSGEB.ppt 2005. 27 Ayrı ca yapı lan analiz ve değerlendirmelere dikkat edilerek , hazı rlanan kampanyanı n baş arıihtimali daha fazladı r.Bu kampanyanı n müş terilere bir ulaş ma yöntemleri olarak e-posta , telefon , doğrudan satı ş, broş ür gibi seçenekler uygulanmaktadı r.Kampanya yönetim süreci aş ağı daki ş ekilde belirtilmektedir. MÜŞTERİİ Lİ ŞKİ LERİYÖNETİ Mİ NDE (CRM) KAMPANYA YÖNETİ Mİ Kampanya Planlama ve Geliş tirme Kampanyanı n Hayata Geçirilmesi Hedeflerin ve Yürütme ve Koordinasyon Kampanya Sonuçları nı n Ölçümü izleme ve Düzeltme Tepki Analizleri Stratejilerin Analiz ve Kontrol Belirlenmesi Müş teri Grupları nı n Tespit Edilmesi Profil Analizleri İ letiş im Stratejilerinin Belirtilmesi Kampanya Bütçesi Tekliflerin Geliş tirlmesi Test Aş aması Şekil 1.3. CRM kampanya yönetim süreci Kaynak : http://www.teamworkcrm.com/Web/Istanbul/TeamWork.nsf/KeyMetin/CRM!OpenDocument&Click 2004. Yukardaki ş ekildede görüldüğü gibi baş arı lıbir kampanya yönetim sürecinin üç temel aş amasıvardı r.Bunlar planlama , uygulama ve analizdir. 33 http://www.bendevar.com/v3/makale_326.html 2004. 28 1.6.1.Kampanyanı n Planlanması bakı ldı ğı nda , kampanyanı n Kampanya planlaması na yönetilmesi için stratijk kararlar hedeflerine uygun alı rlar.Hedef tanı mıise , genellikle ulaş ı lmak istenen müş teri sayı sıolarak tanı mlanmaktadı r. Yapı lan analizler sonucunda hangi müş teriye hangi ürünün uygun olduğunun tespit edilerek , berlirlenen ürünler için kampanya yürütülür.Bu kampanyalar , bir grup müş teri hedeflerinden çok , birkaç grup müş teriyi kampanyaya dahil edebilmektedir.34 Kampanyaları n çok sayı da grubu içine alacak ş ekilde organize olunması nda teknolojinin sağladı ğıfayda yadsı namaz .Çok sayı da müş terilerin aynı anda analizi ya da veri kayı tları nı n yapı lması na olanak sağlayan teknoloji , kampanyanı n daha baş arı lıolması na yardı mcıolmaktadı r. Kampanyalara hedef belirlernirken ş u dört grup için hedefler belirlenmelidir.35 Pazara girmek , Pazarda büyümek , Ürün geliş tirmek , Çeş itlendirmek içindir. Kampanyanı n hedefleri tespitidir.Müş teri belirlendikten sonraki aş ama , müş teri grupları oluş turulması için , çok grupları nı n sayı da gruplama analizi verilere uygulanmak zorundadı r.Müş teri grupları nıtespit etmek için , iki veri kullanı lmaktadı r.Bunlar , satı nalma davranı ş ları ve müş teri bilgisinin tanı mlanması dı r. 34 N. WOODCOCK , The Customer Management Scorecard: Managing CRM for Profit, Kogan Page Publisherss 2003. 35 http://www.kobifinans.com.tr/yazici.php?Article=8652&Where=bilgi_merkezi&Category=020305 2005. 29 Satı nalma davranı ş ları, müş teri iliş ikileri yönetiminden elde edilen müş teri ihtiyaçları nıön plana alarak müş teri grupları nıoluş turmaktadı r.Müş teri bilgisinin tanı mlanması nıgruplama olarak kullanmak içinse , sadece müş terilerin geçmiş kampanyadaki verileri gözönüne alarak gruplarıoluş turmaktadı r. Kampanyanı n baş arı ya ulaş abilmesi için , en kritik aş ama müş teri grupları nı n oluş turulma sürecidir.Bu süreçte oluş an bir hatanı n , kampanyanı n baş arı sı nda direk etkisi olacağıgörülmektedir.Verilerine göre , farklımüş teriler kampanyaya dahil edilebilir.Müş teri çeş itleri , mevcut müş teri , potansiyel müş teri , kaybedilen müş terilerdir. Kampnaya kullanı larak yönetiminde gerek gruplama , gerekse grupları n oluş tuma sürecinin diğer gerekli analizlerin iyi sonuçlar vermesi , tamamiyle eldeki veri setinin kalitesine bağlı dı r. İ letiş im stratejilerinin geliş tirilemsine bakı ldı ğı nda ise esas konu , kamapanya için hedef kitle olarak belirnenen müş teri grupları na nası l ulaş ı lacağ ı dı r.Müş terlere ulaş mak için kullanı lan araçlar , dergi , gazete, televizyon , internet ve radyolardı r. İ letiş im planı nı n uygulamadaki amaç hedef kitleye çabuk ve etkili bir ş ekilde ulaş mayıgerçekleş tirmekdir. Kampanya teklifinin oluş turulmasıise , müş terilerin ilgisini daha fazla çekmek için yapı lan çalı ş madı r.Bu bir çalı ş manı n amacı var devamlı lı ğı nısağlmak , yeni müş terileri ürünü almaları na dayanı r.Tekliflere örnek olarak kullanı lan Fiyat , Taahhüdün uzunluğu , Ödeme koş ulları, Risk azaltma mekanizmaları dı r. 30 müş terinin ikna etmek esası na promosyonlar , kuponlar verilebilir.Teklif planı nıoluş turuken ş unlara dikkat edilmelidir. Ürün konumlandı rma , olan vb. Kampanya bütçesi , yapı lan harcamaları n ve aktivitelerin maliyetlerine bakı larak belirlenir.Kampanyaya etkilenmektedir.Bütçe ayrı lan kesin bir bütçe ş ekilde kampanya baş arı sı nı belirlenmekten doğrudan ziyade , yürütülen kampanya sürecinde belirlenmelidir.Bütçe değerlendirmesinden sonra , dikkate alı nmasıgereken aş ama test aş aması dı r. 1.6.2.Kampanyanı n Hayata Geçirilmesi Kampanyayıhayata geçirme süreci tamamiyle operasyonel bir süreçtir.Bu süreç değerlendirme ve izleme olarak ikiye ayrı lı r. Yürütme sürecinde kullanı lmak üzere , üç tane program hazı rlanı r.Bunlar , kampanya programı, kampanya cetveli ve aktivite cetvelidir. Kampanya programı, kampanyanı n hayata geçirilmesi sürecinde yapı lacak olan herş eyi özet bir ş ekilde içerir.Bu program , kampanyanı n yönetilmesinde bir faaliyeti olan her kiş iye verilir.Ayrı ca program özellikle yapı lacak iş lerin bitiş tarihlerinide içermektedir. Kampanya cetveli , kampanya bileş enlerinin ve de planlanan olayları n listelendiğ i bir cetveldir.Kaynak , zaman , müş teri hedefleri gibi konularda koordinasyonu sağlamak amacı yla kullanı lmaktadı r. Aktivite cetveli ise , tamamiyle kendi operasyonel aktivitelerini planlamak ve de koordinasyonunu sağlamak için kullanı lan bir listedir.Amaç herhangi bir faaliyetin zamanı nda ve etkin bir ş ekilde yapı lması nısağlamaktı r. Kampanyanı n izleme aş aması , kampanyanı n uygulanma sı rası nda ortaya çı kan sorunları nıçözmek ve ilk ön bilgiyi elde etmek amacı yla kullanı lmaktadı r.Bu aş amada ön bilgi almak için özet raporlar hazı rlanarak durum değerlendirilmesi yapı lmaktadı r.36 36 O.C.Gel , CRM Yolculuğu ,Sistem Yayı ncı lı k 2004 s184. 31 1.6.3.Kampanya Analizi ve Kontrolü Kampanya yönetiminin son aş amasıolan kampanya analizi , elde edilen müş teriler hakkı nda daha derin bilgi edinmenin kampanyaları geliş tirmek için yanı sı ra ilerideki yapı lacak kullanı lı r.Yapı lmı şiyi bir kampanya diger bir kampanya için örnek teş kil etmektedir. Kampanya analizlerinde kullanı lan teknikler ş uş ekilde sı ralanabilir.37 Performans ölçümleri Tepki analizleri Profil analizleridir. Performans ölçümleri , uygulanan kampanyanı n sonuçları nıdeğerlendirmek üzere kullanı lan parametrelerdir.Kamapanya sonuçlarıölçülebilir olması ndan dolayı yorumlanmasıve de kampanyada değiş ikliklere gidilmesine olanak sağlamaktadı r. Tepki analizleri , kampanya sürecinde ortaya çı kan sonuçlarıdeğ erlendirmek için kullanı lan yöntemlerdir.Tepki ,ş ikayet vb gibi kampanya sonrası elde edilen değerler kullanı larak kampanya ile ilgili tepkilerin tahmini değerleri heaplanmaya çalı ş ı lı r.Kullanı lan istatistik tekniği olarak özellikle Lojistik regresyon kullanı lmaktadı r. Profil analizi , kampanyaya katı lan müş terilerler iş letmenin mevcut müş terileri arası ndaki karakteristik farkları nıortaya koymak için kullanı lan bir analizdir. Bu analiz kampanyaya katı lan müş terilerin profilini belirleyerek kampanyanı n hedeflenen gruba nekadar baş arı yla ulaş tı ğı nı n tespitinde de kullanı lmaktadı r. 32 BÖLÜM 2 VERİMADENCİ Lİ Ğİ(DATA MINING) 2.1.VERİMADENCİ Lİ ĞİTANIMI Zaman içerisinde teknolojinin hı zla miktarlarda verilerin geliş mesine bağlı olarak çok büyük elde edilmesine ve de depolanması na olanak sağlamı ş tı r. Bu veri yoğunluğu içerisinden istenen ya da gizli kalmı ş yararlıverilerin elde edilme sürecine veri madenciliği olarak tanı mlanmaktadı r. Veri madenciliği, veri ambarları nda tutulan verilerden otomatikleş mişmodeller sayesinde anlamlıbilgileri, iliş kileri ve davranı ş larıortaya çı karma süreci olarak da tanı mlanmaktadı r. Bu süreçte, veri içinde önceden pek fazla bilinmeyen veya görülemeyen desenler (pattern) öncelikle ortaya çı karı lmaktadı r.Bu desenler genellikle bilgiler arası ndaki iliş kilerin, sı ralamanı n, birlikteliğinin ve tahminlemenin sonucunda elde edilmektedir. Veri madenciliği sı nı flandı rmanı n, veri 38 uygulama alanları düş ünüldüğünde , en çok kullanı lan sektörler ş unlardı r. 39 Pazarlama , Bankacı lı k ve sigortacı lı k, Biyoloji,tı p ve genetik , Kimya , Yüzey analiz ve coğrafi bilgiler , Görüntü tanı ma ve robot görüşsistemleri , Uzay bilimleri ve teknolojileri , Meteoroloji ve atmosfer bilgileri , Sosyal bilimler ve davranı şbilimleri , 37 http://www.init.com.tr/news_articles_tr.asp?haber_id=12 2006. S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John Wiley & Sons Publisher 2003 39 T.T.Bİ LGİ N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans Tezi, Marmara Ünv. ,2003 38 33 Metin madenciliği , Web madenciliğidir. Veri madenciliğinin kullanı m alanları ndan yönetiminin teknik alt yapı sı nda uygulanması dı r.Bu süreç gerek pazarlama gerekse bankacı lı k ve sigortacı lı k sektörlerini en önemlisi Müş eri iliş kileri kapsamaktadı r. Müş teri iliş kileri yönetimi için müş terileri sı nı flandı rma , grup oluş turma , en değ erli müş teri grubunu oluş turma süreçlerinde Veri madenciliğinden yararlanı lmaktadı r.40 Veri madenciliğinde bilgi elde etme süreçleri aş ağı daki ş ekilde belirtilmiş tir. Aş ağı daki ş ekilde belirtilen süreçlerin baş langı ç noktası veri tabanı ndaki elde bulunan veriden , veri ambarı na , oradan veri madenciliğine , son aş ama olaraksa gerekli bilginin elde edilmesi aş aması na gelmektedir. Veri Madenciliği Veri Ambarı Sunum Keş fedilen Bilgi Veri Tabanı Şekil 2.1 Veri tabanları nda bilgi keş fi aş amaları Kaynak : http://www.isletme.istanbul.edu.tr/surekli_yayinlar/dergiler/nisan2000/1.htm Veri madenciliğinin geliş imine bakı ldı ğı nda veri madenciliğinin geliş mesindeki en önemli nedenin , veri tabanları ndaki büyük teknolojik geliş me olduğu görülebilmektedir. Veri tabanları nı n çok büyük miktarlarda veriyi özelliğinin artması yla , veri kümelerinden 34 saklı yabilme özet ve yararlıverileri ortaya çı karma gereksinimine bir cevap olarak Veri madenciliği ortaya çı kmı ş tı r.41 Veri madenciliği sürecinde en önemli konu , her aş amanı n dikkatli ve eksiksiz bir ş ekilde uygulanmasıgereğidir.Çünkü bir aş ama , diğer bir aş amanı n girdisi olduğ undan dolayı, bir aş amanı n eksik yapı lmasıtüm veri madenciliği sürecini etkiler .Veri madenciliği süreci ş u aş amalardan oluş maktadı r.42 Problemin tanı mlanması, Verinin hazı rlanması, Model kurulumu , Modelin kullanı lması dı r. Bu aş amalar veri madenciliği sürecini oluş turmaktadı r. Problemin tanı mlanması Veri madenciğilinin en önemli aş amaları ndan biridir.Problemin ne olduğunu , gerek iş letme gerekse müş teri tarafı ndan problemin tanı mlandı ğı; elde edilmek istenen verinin ne için kullanı lacağ ı nıtanı mlayan bir aş amadı r. Veri madenciliği süreçlerinde amaçlar özellikle iş letmeler için , müş teri değerini arttı rma , müş teri sadakati yaratma , karıarttı rmak , pazar payı nı artı rmak vb. olabilmektedir. Verinin hazı rlanması Verinin hazı rlanmasıaş amasıdört temel aş amadan oluş maktadı r.Bu aş amalar ; Verinin toplanması, Verinin birleş tirilmesi , Verinin temizlenmesi , 40 T.T.Bİ LGİ N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans Tezi, Marmara Ünv. ,2003 41 M. DEMİ RALAY ,Hiyerarş ik Kümeleme Metotlarıİ le Veri Madencili ğ i , Yüksek Lisans Tezi, Marmara Ünv. s 4,2005 42 M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s7. 35 Verinin dönüş türülmesidir. Veri hazı rlanmasısürecinde , veri toplanması en önemli adı mlardan birisidir.Bu aş amada verilerin belirlenen amaçlara uygun elde edilmesi , gerek veri hazı rlama aş aması nıgerekse tüm veri madenciliği sürecini doğ rudan etkilemektedir. Veri birleş tirme sürecinde , farklıkaynaklardan toplanan verilerin aynıformatta çevrilmesi gerekmektedir.Böylece farklı kaynaklardan alı nan verilerin hepsine aynıanalizler uygulanabilmektedir. Veri temizleme sürecinde , verilere uygulanan yöntem esas olarak analizi yanlı ş yönlere sürükleyebilecek olan eksik ya da aykı rıverilerin veri topluluğ undan çı karı lması yla veri madenciliği sürecine etkisi ortadan kaldı rı lmaktadı r. Veri dönüş türme sürecinde ise , verilerin farklıformları nıanalize uygun olacak ş ekilde dönüş türülmesi sürecidir. Model kurulumu Veri madenciliği sürecinde modele dahil edilecek verilerin amaçlara uygun ve de doğru bir ş ekilde seçilmesi , modelin doğru kurulma olası lı ğı nıarttı rmaktadı r. Doğru kurulan bir model , bilmek istenilen özet bilgiyide doğru yansı tacağ ı kesindir. Modelin kullanı lması Veri madenciliğinin son aş amasıolan bu süreç , ortaya çı karı lan modelin benzer amaçlara iş letmeler için bir gösterge olacağıkesindir. 2.2.VERİ MADENCİ Lİ Ğİ SÜRECİ NDE ORTAYA ÇIKABİ LECEK SORUNLAR Veri madenciliğinde ortaya yatmaktadı r.Bunlar ilk olarak çı kan sorunları n temelinde iki unsur iş letmenin hangi amaçla veri madenciliğ i yaptı ğı, 36 diğeri ise elde bulunan verilerden kaynaklanmaktadı r.Karş ı laş ı lan bazıproblemler ş unlardı r.43 Veri tabanı nı n boyutları, Dinamik veri yapı sı, Eksik veri , Gürültü , Eksik değerlerdir. Veri tabanı nı n boyutları Veri tabanı n boyutları nı n veriler için yeterli olmamasıdurumunda , yaptı ğı mı z analizlerin örnekleme uygulanabilirliği tekniklerinin ve yoktur.Bu örnek problemin çözümünde miktarı nı n azaltı lması yla ise , yapı lan bu problem aş ı labilmektedir. Dinamik veri yapı sı Veri tabanları nı n verileri güncellemesi , ya da yeni müş teri verilerini veri tabanı na eklenmesi , veri madenciliğ i sürecinde olumsuz etkilere yol açabilmektedir. Eksik veri Veri madenciliğ inde en çok rastlanan problemlerden biri olan eksik veri , analizi ya da yaratı lamak istenen modeli yanlı şyönlere çekebilmektedir. Gürültü Nitelik değerlerindeki ya da sı nı f bilgilerindeki hatalar , gürültü tanı mlanı r.Ayrı ca yanlı şgirilen veriler de bu tanı ma girmektedirler. 43 http://www.isletme.istanbul.edu.tr/surekli_yayinlar/dergiler/nisan2000/1.htm 2000. 37 olarak Eksik değerler Yapı lan her analiz için büyük bir sorun olan veri değerlerinin hatalı olması, tüm analizi iş levsiz kı labilecek büyük bir sorundur.Genellikle veri toplama ya da girilme aş aması nda oluş an bu hata analizi doğrudan etkilemektedir. Geçmiş ten günümüze gelen süreçte , veri madenciliğinin geliş imi ş u ş ekilde oluş muş tur. Veri Toplama (1970) Veri Giriş i (1980) Veri Ambarı Geliş imi (1990) Veri Madenciliği (2000) Şekil 2.2 Veri madenciliğinin tarihsel geliş imi Kaynak : S.SMITH ,Building Data Mining Applications for CRM ,McGraw Hill Publisher 1999,s16 19 2.3.VERİAMBARI KAVRAMI Veri ambarı, operasyonel, kalı cı , entegre ve tarihsel derinliği olan verilerin, karar destek sisteminin iş levlerini desteklemek, verilerden anlamlıiliş kiler kurarak sonuçlar çı karmak üzere modellenmişsüreçlerin toplamı dı r. Amaç , verileri organizasyondaki karar vericilerin faydalanmalarıiçin saklanarak, veriye hı zlıve tek kaynaktan ulaş malarıimkanı nısağlamaktadı r.44 44 S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John Wiley & Sons Publisher 2003 s24. 38 Veri ambarıayrı ca diğer analiz programları nıkullanarak , var olan veriyi sorgulama , analiz etme ve yorumlama imkanı da tanı maktadı r. Veri ambarı nı n en önemli amacı na dönüş türülmesi ve toplanması ndan bakı ldı ğı nda , bunlar bilginin saklanması olarak ön plana toplanması, çı kmaktadı r.Verilerin sonra , veriler hataları nı n giderilmesine çalı ş ı lı r.Böylece daha doğ ru verilerle daha doğru analizler yapma imkanısağlanmı şolunur. Firmaları n yoğun rekabet ortamıiçinde müş terilerini ve de pazar payları nı ellerinde tutmak ya da geniş letmek için veri ambarı nı n sağladı ğıanaliz imkanı ve de raporlama oluş turulacak veri iş lemlerinden yararlanmalarıgerekmektedir.Firmalar ambarları nı n miktarı, kapasitesi firma ihtiyaçları na için göre farklı lı k göstermektedirler. Veri ambarı nı n firmaları n operasyon kı smı na sağladı ğı faydalar ş öyle sı ralanabilir.45 Kolay bir ş ekilde veriye ulaş ma imkanısağlar, Geçmiş ten ders alı nması nısağlar, Operasyon kı smı nda verimliliği arttı rı r, Zaman ve de paradan tasarruf sağlar. Veri toplamanı n öneminin arttı ğıgünümüzde , kurumsal ş irketler büyük bir veri ambarı oluş turmak büyük meblağlar ayı rmaktadı r.Müş terilerini daha iyi tanı maları na olanak sağlayan veri ambarı, gerek ürün yapı lması nda için bütçelerinden ya da hangi müş teriye hangi ürünün sunulması gerektiği konusundaki uygulamaları n yapı lması na olanak sağlamaktadı r. Veri ambarı nı n taş ı masıgereken özellikler ş öyle sı ralanabilir. 46 45 46 http://www.breuer.com/benefits.asp 2007. http://www.breuer.com/features.asp 2007. 39 Zamana bağlıolması, Kalı cıolması, Konuya yönelik olması, Birleş trilmişolmasıgerekmektedir. Zamana bağlıolması Veri ambarı ndaki veriler , tarihlere bağlı olarak kaydedilmektedir.Verilerin zamana bağlıolarak kaydedilmesi bazıistatistiksel analizlerin uygulanması nı kolaylaş tı rmaktadı r.Verilerin veri ambarı içerisinde zamana bağlı olmayan verilerin kullanı lmaya çalı ş ı lması o verilerin güvenirliliğini ve geçerliliğini kaybetmesine sebep olacaktı r. Kalı cıolması Veri ambarı ndaki verilerin güncellenmesi tabanları aracı lı ğ ı yla mümkündür.Esasen değiş tirilemez.Güncelleme , düzeltme aş aması, sadece operasyonel veri veri veri , sabit ya da ambarı ndaki veri silme iş lemleri ve ancak operasyonel veri tabanları nda mümkündür.Veri ambarı na verileri aktarmak ya da herhangi bir iş lemi yapabilmek için , operasyonel veri tabanları na ihtiyacı mı z vardı r. Konuya yönelik olması Veri ambarları nı n kullanı m amaçları uzun ya da orta vadeli kararlar alabilmek için , yararlanı lan bir araçtı r.Bu amaca uygun bir ş ekilde gerek analizlerin gerekse kayı tları n yapı lmasıgerekmektedir. Birleş trilmişolması Veri ambarları na kaydedilen veriler , belirli bir kaydedilirler.Bu dönüş üm verilerin formata dönüş türülerek birleş tirilmesi ve farklıverilerin aynıanalizin uygulanması na olanak sağlar. 40 Veri ambarı, bir karar destek sistemi olup veri tabanı ndan farklıolarak sadece verilerin günlük olarak değerlendirilmesine olanak sağlayan biir teknolojidir. Veri ambarı nı n karar destek sistemi olarak OLAP ( Online analytical Processing ) , Müş teri iliş kileri yönetimi (CRM) , istatistiksel analizler ve raporlama süreçlerinde kullanı lmaktadı r.47 Veri ambarımimarisi aş ağı daki ş ekilde görülmektedir. Kaynaklar METADATA Kaynakları Birleş tirme VERİAMBARI Sorgulama Ve İ nceleme İ stemciler Şekil 2.3. Veri ambarımimarisi Kaynak : http://web.cs.hacettepe.edu.tr/~fatih/RESEARCH/doc/tez.pdf 2003. Veri ambarı, mimarisine bakı ldı ğı nda alt – orta – üst katman olarak üç esas katmandan oluş maktadı r.Alt katman , operasyonel verinin iş lendiği ve verinin temizlenmesine olanak sağlayan iliş kisel bir veri tabanı dı r.Alt katmanı n en öne çı kan özellik olarak , veri tabanı na bağlanı p verilere uluş mayısağlamasıolduğu söylenebilir.Alt katman , kaynaklarıbirleş tirme aş aması ndan oluş maktadı r. 47 T.T.Bİ LGİ N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans Tezi, Marmara Ünv. ,2003 41 Orta katmana katmanı n esas bakı ldı ğı nda ise , veri ambarı bu katmanı oluş turmaktadı r.Bu görevi , veri madenciliği için verileri anlaş ı lı r bir hale getirmektir.Özellikle raporlama , analiz gibi iş lemler bu katmanda yapı lmaktadı r. Son katman olarak üst katman ise , karar oluş maktadı r.Analizlerin sonuç kı sı mları nı n ve özet destek sisteminden verinin değerlendirildiği bir katmandı r.Bu katman sorgulama ve inceleme aş aması ndan oluş maktadı r.48 Veri ambarı nı n bileş enleri aş ağı daki ş ekilde gösterilmektedir. Şekil 2.4. veri ambarıbileş enleri Kaynak : http://web.cs.hacettepe.edu.tr/~fatih/RESEARCH/doc/tez.pdf 2003. Veri ambarı nı n oluş turulma amacıiki tanedir.Bunlar ;49 Veri depolamak ve analiz yapmak , Karar destek sistemini Operasyonel oluş turmak ve hı zlıbir ş ekilde bilgiye ulaş maktı r. veri tabanları , veri tabanı na günlük verileri iş lenen verilerdir.Operasyonel veriler , çoğu kez kı sa vadeli olarak saklanan verilerdir. Metadata ise , hem operasyonel veri hem de veri ambarı ndaki verilerin yapı ları nı gösteren bir veridir.Gösterdiğ i veriden ziyade , veri setinin karakteristik bilgilerini taş ı yan bir veridir.Metadata , veri biçimi , veri kullanı mı, veri kaynakları nı, 48 C .TODMAN , Designing a Data Warehouse: Supporting Customer Relationship Management , Prentice Hall PTR Publisherss 2000 s220. 49 http://en.wikipedia.org/wiki/Data_warehouse 2007. 42 verilerin nerede bulunduğu gibi bilgileri saklayan bir yapı ya sahiptir.Metadata’nı n veri ambarı yla olan iliş kisi ş u ş ekilde açı klanabilir. Dı şkaynak Veri seti Veri ambarı Metadata Şekil 2.5. Metadata ‘nı n veri madenciliğindeki yeri Kaynak : S.SMITH ,Building Data Mining Applications for CRM ,McGraw Hill Publisher 1999,s30 Veri ambarı, stratejik kararları n alı nması anlamı nda kullanı lmaktadı r.Bu nedenden dolayı, çok miktarda verileri saklamaktadı r.Veri ambarı, alı ş ı lmı şveri tabanları nı n amaç ve çalı ş ma biçimi bakı mı ndan farklı lı k göstermektedir.Veri ambarları, veri tabanları ndan daha fazla veri saklama kapasitesine sahiptir.OLTP ( online transaction process) uygulamaları na olanak sağlamı ş tı r. OLTP uygulamalarıveri tabanı ndan veri silme , değiş tirme ya da gibi iş lemleri içermektedir.Bu iş lemler SQL veri ekleme (structured query language) sorgulama dili ile gerçekleş mektedir. OLTP bakı ldı ğı nda , operasyonel verinin veri tabanı na aktarı lması na yardı mcı olan bir iş lem sürecidir.Bu süreç verilerin kayı t edilmesinden güncellenmesine kadar uzanan gerçekleş en bir süreçtir.Veri iş lemler , genel ambarı ndan olarak veri kullanı lmaktadı r.OLTP ‘nin amacısadece veri tabanı na aktarı lması nıamaçlamaktadı r. 43 ziyade veri tabanı üzerinde yüklenmesi aş aması nda setinin en az hata ile veri Veri ambarları daha çok karar destek sistemlerine yönelik veri saklama araçları dı r.Veri madenciliği, OLAP (online analytical process) gibi uygulamalara olanak sağ lamaktadı rlar. OLAP ise verilere analiz yapı lması na , raporlanması na olanak sağlayan bir iş lemler sürecidir.Bu süreç gerçekleş ir.Bütün analizler tamamiyle veri tabanı ndan veri ambarıüzerinde bağı msı z olarak yapı larak on-line iş lem sürecini oluş turur.Bu süreç sadece karar vericiye daha sağlı klıkarar vermesine olanak sağ layan tüm analizleri veri setine uygulama imkanıvermektedir.50 2.4. VERİMADENCİ Lİ ĞİTEKNİ KLERİ Veri madenciliği teknikleri , verilerin kullanı lma amaçlarıve de veri yapı sı na göre farklı laş maktadı r.Temel olarak iki ana grupta bu teknikleri toplayabiliriz.Bunlar ; Öngörüsel Tanı mlayı cı Tanı mlayı cı veri madenciliği teknikleri , daha çok verinin karakteristik özelliklerini ön plana çı karmak için kullanı lı rken , öngörüsel teknikler daha çok ileriki yı llarda bir parametreyi tahmin etmek için kullanı lmaktadı r.Kategorik olarak gruplanan veri madenciliği teknikleri ile , farklıgruplamalar da yapmak mümkündür.Bu gruplamaları n en bilineni J.Han kategorileri olarak bilinir. 51 Tanı mlama ve ayrı mlama , Birliktelik Kuralları, Sı nı flandı rma ve öngörü , Kümeleme analizi , Sı radı ş ı lı k analizidir. 50 http://www.olapreport.com/fasmi.htm 2005. T.T.Bİ LGİ N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans Tezi, Marmara Ünv. ,2003 . 51 44 2.4.1.Tanı mlama Ve Ayrı mlama Veri setini tanı mlama sürecinde amaç , veri hakkı nda özet bir bilgi elde etmektedir.Ayrı mlama ise , veri setindeki farklı lı klarıortaya koymak için yapı lan bir iş lemden ibarettir. Ayrı mlama iş leminde kullanı lan en önemli yöntemlerden birisi Diskiriminant analizidir.Bu analiz , veri kümesini belirli gruplara atı yarak verileri ayrı ş tı rı r.Bu yöntemde kullanı lan model , esas olarak veri ayrı ş tı rma iş leminde kullanı lmaktadı r.Veri Ayrı ş tı rma modeli ş u ş ekildedir. Zi b0 b1 x1i b2 x 2i ... bn x ni Zi : i’ninci bireyin ayı rma değeri b i : i’ninci değiş kenin katsayı sı X1i : i ‘ninci bireyin i’ninci değ iş ken üzerindeki etkisidir. Diskriminant analizi ; örneğin bir iş letmede marka alan ile marka almayan müş teri arası nda kullanı labilmektedir. anlamlı bir fark olup olmadı ğı nı belirlemek için 52 Diskriminant analizi, hatalısı nı flandı rma olası lı ğı nıen aza indirgeyerek birimleri ait olduklarıgruplara ayı rmak amacı na yönelik olan, istatistiksel bir karar verme yöntemidir . Diskriminant analizi, X veri setindeki değiş kenlerin iki veya daha fazla gerçek gruplara ayrı lması nıbelirlemek amacı yla yararlanı lan bir yöntemdir. Diskriminant analizi, genel anlamda ayı rma olup, bireylere ait p tane özellikten yararlanarak ait olduklarıgrupları(yı ğı n) belirlemede veya mevcut grupları birbirinden ayı racak en iyi fonksiyonu bulmada kullanı lan , çok değiş kenli istatistik tekniklerinden birisidir. Bu analiz , gruplar arası nda çeş itli değiş kenlere bağlıolarak farklı lı kları nıortaya koyması na olanak sağlamakktadı r. 52 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. s 258-264 1996. 45 Diskriminant analizinde , birimler en az hata ile ait olduklarıbirimlere ayrı lmaktadı r. Bu analizin temelinde incelenen bireyin kitlesinin belirlenmesini sağlayacak bir fonksiyon bulunmaktadı r. Disriminant analizi iki veya daha fazla gruptaki birimlerin etkileş im seviyelerinin hangi düzeyde olduğu, diğer değiş kenler arası nda ne gibi farklı lı klar bulduğunu ortaya koymaktadı r. Diskriminant analizi, farklı lı ğ ı n en fazla hangi değiş kenlerde yoğunlaş tı ğı nı n belirlenmesi ve böylece grupları n farklı laş ması na etkin olan faktörlerin saptanması nı da sağlar. Analiz sonucunda yapı lan sı nı flama ile orijinal grup üyeliklerinin karş ı laş tı rı lması, belirlenen fonksiyonun yeterli olup olmadı ğı nıtest etmeye olanak sağlar . Diskriminant analizi, birbirleriyle yakı ndan iliş kili birkaç istatistiksel yaklaş ı mı kapsayan genişbir kavramdı r . Bu yaklaş ı mlar iki ana kategoride ele alı nabilir. Birinci kategoriyi oluş turan yaklaş ı mlardan , gruplar arası farklı lı klarıyorumlamada faydalanı lı rken, ikinci kategori yaklaş ı mlar birimleri gruplara ayı rmak amacı yla kullanı lmaktadı r. Diskriminant analizi eğer bir ayı rma fonksiyonu belirlemeye yönelik olarak uygulanmı şise , tanı mlayı cıdiskriminant analizi, eğer sı nı flama amacı yla uygulanmı şise , tahmin edici diskriminant analizi olarak adlandı rı lı r. Tahmin edici diskriminant analizi, davranı şdeğerleri içinde bulunan temel bilgilerin gruplar için , verilerin nası l belirleneceği sorusuna iş aret eder. Bir girdi eğ er tahmini grubun üyesi değilse , yanlı şsı nı flandı rı lmı şolarak nitelendirilir. Genellikle yanlı ş sı nı flandı rma olası lı ğı nıve bedelini düş ürmek oldukça önemlidir Bazı yazarlar diskriminant analizinde ayı rma fonksiyonu katsayı ları nı n hesaplanması nda baş vurulan yöntemlere göre diskriminant analizini, kanonik diskriminant analizi, en çok olabilirlik diskriminant analizi ve bayes diskriminant analizi ş eklinde adlandı rı rlar. Genel olarak birimlerin gruplaması nda bazımatematiksel eş itliklerden faydalanı lı r. Diskriminant fonksiyonu olarak adlandı rı lan bu eş itlikler birbirine en çok benzeyen gruplarıbelirlemeye olanak sağlayacak ş ekilde grupları n ortak özelliklerini belirlemek amacı yla kullanı lmaktadı r. Gruplarıayı rmak amacı yla kullanı lan karakteristikler ise diskriminant değiş kenleri olarak adlandı rı lmaktadı r. Kı saca diskriminant analizi, iki 46 veya daha fazla sayı daki grubun farklı lı kları nı n diskriminant değiş kenleri vası tası yla ortaya konmasıiş lemidir . Araş tı rı cı nı n, p tane özelliği bilinen gözlemleri belli özelliklerine göre bazıgruplara ayı rmak istemesi, elde edilecek somut ve özetleyici bilgiler açı sı ndan istatistiksel değerlendirmede önemli bir konudur. Araş tı rı cı , hatalısı nı flandı rma olası lı ğı nıen aza indirgeyerek gözlemleri ait oldukları gruplara ayı rmak veya bu gözlemlerin çekilmiş olduklarıyı ğı nlarıbelirlemek isteyecektir. Diskriminant analizinin amaçları nıdört grupta toplanabilir.53 Analiz öncesi tanı mlanmı şiki ya da daha fazla grubun (örneğin, mali açı dan baş arı lıve baş arı sı z iş letmeler) ortalama özellikleri arası nda önemli farklar olup olmadı ğı nı n, bağı msı z değiş kenlere (açı klayı cıdeğiş ken) bağlıolarak istatistiksel olarak test edilmesi, Her bir değiş kenin, gruplar arası ndaki farka katkı sı nı n saptanması , Grup içi değiş ime oranla, gruplar arası ndaki ayı rı mımaksimize eden tahmin değiş kenleri kombinasyonunun belirlenmesi ve bu sayede baş langı çtaki açı klayı cı değiş ken sayı sı ndan daha az sayı da değiş ken ile gruplar arası ndaki önemli farklı lı kları n açı klanması , Analiz öncesi tanı mlanmı şgrupları n atanmasıile ilgili yöntemlerin geliş tirilmesi, yeni bireylerin hangi gruba ait oldukları nı n saptanması dı r. Tüm istatistiksel ve matematiksel modellerde olduğu gibi, diskriminant analizi de bazı varsayı mlara dayanmaktadı r. Analizin ayı rı m gücü, dayandı ğı varsayı mları n sağlanması na ya da bu varsayı mlar karş ı sı nda sağlam olması na bağlı dı r. Özellikle modelin baş arı sı nı n, beklenenden düş ük çı ktı ğıdurumlarda, doğru yorumda 53 http://people.revoledu.com/kardi/tutorial/LDA/LDA.html 2006. 47 bulunabilmek için , bu varsayı mları n test edilmesi gerekmektedir. Diskriminant analizinin varsayı mlarış unlardı r. 54 Anakütle belli özelliklere göre gruplanabilir.Birbirinden farklıiki veya daha fazla grup söz konusu olmalı dı r. Veriler anakütleden rassal olarak seçilmiş tir. Bağı msı z değiş kenler çok boyutlu normal dağı lı ma sahiptirler. Gruplara ait ortalamalar ve kovaryans matrisi önceden bilinir. Grupları n kovaryans (sapma) matrisleri eş ittir.Bu varsayı mı n sağlanamadı ğıdurumlarda, diskriminant analizinin karesel formu kullanı labilir. Grupları n eş it sayı da birimden oluş madı ğ ı durumlarda, üyelerin önsel olası lı kları nı n bilindiği varsayı lı r. Herhangi bir birimin yanlı ş sı nı flandı rmanı n maliyeti önceden bellidir.Bu varsayı mlardan bir ya da daha fazlası nı n sağlanamadı ğıdurumda, diskriminant analizi optimum bir sı nı flama ortaya koyamayacaktı r. Yazı nda, diskriminant analizinin bu varsayı mlar karş ı sı nda sağlamlı ğ ıtartı ş malıbir konudur. Üçüncü varsayı mda , bağı msı z değiş kenler normal dağı lı ma sahip olduğu belirtilmiş tir. Ancak yapı lan araş tı rmalar , mali oranlar kullanı larak yapı lan çalı ş malarda mali oranları n normal dağı lı ma uygunluk göstermemesi sebebiyle dağ ı lı mları n normalden ziyade sağa çarpı k olduğu göstermektedir. Bu durumda mali oranlar kullanı larak yapı lan çalı ş malar , değiş kenlerin dağı lı mı nınormal dağı lı ma yaklaş tı rmayıhedeflemektedirler. 2.4.2.Birliktelik Kuralları Veri kümesinde birliktelik analizi eş zamanlıoluş um , olay vb durumları n tesbiti için kullanı lan bir analizdir. Veri madenciliğ i sürecinde en olasımodeli 54 http://www.statsoft.com/textbook/stdiscan.html#assumptions 2003. 48 ortaya çı karmasıaçı sı ndan önemli analizlerden birisidir.Bu analizler genel olarak çı kardı kları kurallardan dolayı, müş teri davranı ş ları nı tanı mlama sağlamaktadı r.Birliktelik kuralları n örnek uygulamalarış öyledir. imkanı 55 Sepet analizi , Direk satı ş ta baş ka bir ürün önermek , Kredi kartısahtekarlı kları nıortaya çı karmak , Sağ lı k sigortaları ndaki sahtekarlı ğıortaya çı karmak , Standları n dükkanda nası l dizilmesi gerektiğini ortaya koymaktadı r. 56 Bu uygulamalardan en yaygı n olarak kullanı lan analiz yöntemi , sepet analizidir.Bir ürünü alan müş terinin onun yanı nda baş ka ne aldı ğı nı n tespiti için kullanı lan bir analizdir.Sepet analizinde Bunlar; iki önemli kriter kullanı lmaktadı r. 57 Destek kriteri , Güven kriteridir. Bu kriterler ş ekilde hesaplanmaktadı rlar.Burada X ve Y malları nı n arası ndaki iliş ki incelenmektedir. P(X Y) X ve Y malları nıalmı şmüş teri sayı sı/ toplam müş teri sayı sı P(X Y) , destek kriteri adı verilmektedir.Destek kriteri X malı nı alan bir müş terinin Y malı nıalma olası lı ğı nıyani X malı nıalı p sonra Y malı nıalma olası lı ğı nıgösteren bir değerdir.Bu değer bire yaklaş tı kça güçlenmektedir. P(X Y) P(X / Y) P(Y) 55 M.KANTARDZIC,Data Mining : Concept,Models,Methods , and Algorithms,John Wiley & Sons Publisher s 82 ,2003 56 S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John Wiley & Sons Publisher s 268 ,2003 49 P(X / Y) , güven kriteri olarak tanı mlanmaktadı r.Bu kriyer Y malı nıalan bir müş terinin X malı nıalma olası lı ğı nı göstermektedir.Aynıdestek kriteri gibi , güven kriteri de bire yaklaş tı kça güçlenmektedir. 58 Birliktelik kurallanı rı na örnek vermek gerekirse , tatil için uçak bileti alan bir kimsenin , belli bir olası lı kla araba kiralamasıverilebilir. 2.4.3. Sı nı flandı rma Ve Öngörü Veri madenciliğinde sı nı flandı rma , belirli bir özelliğe göre veri kümesini sı nı flara ayı rmaya ve yeni elde edilen verilerin hangi sı nı fa ait olduğunu gösteren bir analiz tekniğidir. Öngörü ise , bir parametrenin geçmiş teki değerlerine alabileceği değerleri tespit etme çabası dı r.Gerek sı nı flandı rma bakı larak gelecekte gerekse öngörü iş lemleri için kullanı lan analizler ş unlardı r. 59 Karar Ağ açları( Decision Tree) , Yapay Sinir Ağları( Neural Networks) , K-Ortalamalar Yöntemi ( K-Means) , Genetik Algoritmalar , Regresyon Analizi , Zaman Serileri Analizidir. 2.4.3.1. Karar ağaçları Karar ağacı, karar vericinin en iyi karara ulaş ı labilmesi için yapı lan gerek olası lı k gerekse maksimum fayda esas alı narak düzenlenen bir tekniktir.Karar ağacıanalizi , genellikle seçenekler üzerinde yapı lan bir analiz türüdür.Bu analizin veri madenciliğinde kullanı lma sebepleri ş unlardı r.60 57 M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s289. S.MITRA , Data Mining Multimedia , Soft Computing and Bioinformatics , Wiley Publishers 2003 s71. 59 J. BIGUS , Data Mining With Neural Networks ,McGraw Hill Publishers , 1996 s12. 60 W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss 2005 s25 , s100. 58 50 Maliyeti azdı r. Anlaş ı lmasıve yorumlanmasıkolaydı r. Veri tabanı na kolay entegre edilebilmektedir. Güvenirliliği yüksektir. Bu analizin uygulaması nda veri seti iki kı sma ayrı lrı r.İ lk veri seti karar ağacı nı oluş turmak , ikinci kı sı m ise karar ağacı nı kontrol etmek amaçlı kullanı lmaktadı r.Karar ağacış u ş ekildedir. Karar 1 evet hayı r Karar 2 Karar 3 evet evet hayı r hayı r Karar 4 evet Karar 5 hayı r evet hayı r Şekil 2.6.Karar ağacış ekli Kaynak : M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 . Karar ağacıanalizinde kullanı lan algoritmalar ş unlardı r.61 C&RT , CHAID , C4.5 , Quest . 61 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s142. 51 C&RT , ikili ağ aç analizi olarakta bilinmektedir.Bu analiz doğru homojen yapı ya ulaş ı lı ncaya kadar , veriyi ikili alt kümelere ayı rmaktadı r.1984 yı lı nda bulunan bu yöntem kullanı ş lı lı k açı sı ndan , büyük verilerde çok uzun zaman aldı ğı ndan dolayıpek tercih edilmemektedir. CHAID , bu karar ağacıtekniği gruplarıoluş turmak için Ki-Kare analizinden yararlanmaktadı r.Bu algoritma esasen benzer verileri birleş tirerek farklıolanlarla analize devam eder.Böylece ulaş ı lmak istenen değerler kesin ve kolay bir ş ekilde elde edilir. Karar ağ acı nı n ilk dalları nı oluş turmak için en iyi tahmin edici değiş kenler seçilir.Bu algoritmada değiş kenler sürekli ise F-Testi değerleri , nominal ya da ordinal bir değiş kense Ki-Kare Test değerleri kullanı lı r. CHAID algoritmasıikili bir algoritma değildir.Kullanı m açı sı ndan yaygı n ve popüler bir uygulamadı r. C4.5 algoritması en iyi karar ağacıalgoritması dı r. Karar ağacı nı oluş tururken kayı p verileri hesaba katmaz .Özellikle hasas ve anlamlıveriler elde etmek için kullanı lmaktadı r. 62 Quest algoritması, ikili bir algoritmadı r.En önemli özelliği gerek değiş ken gerekse ayı rı m noktaları nı n belirtilebilmesidir.1997 yı lı nda bulunan bu yöntem yaygı n bir karar ağacıalgoritması dı r.63 2.4.3.2.Yapay sinir ağları Yapay sinir ağları, öğrenme yolu ile yeni bilgi elde edebilmeyi sağlayan bir tekniktir.Tarihi geliş imine bakı ldı ğı nda , 1950 ‘lilerden geliş meler olduğ u görülebilmektedir. Yapay sinir günümüze uzanan hı zlı ağ ları nı n yapı sı na bakı ldı ğı nda; Wi : kendi ağarlı k değeri , I i : n adet girdi değeri , 62 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s154. 63 N.YE , The Handbook Of Data Mining , Lawrence Erlbaum Associates Publisherss 2003 s3. 52 n I Wi : Toplama fonksiyonu , i1 i F( i1 Ii Wi ) : Aksiyon fonksiyonu bu ş eklinde hesaplanı r.64 n Yapay sinir ağları n süreci ş u ş ekildedir. Girdi Toplama fonksiyonu Aksiyon fonksiyonu Çı ktı Şekil 2.7. Yapay ağsüreci Kaynak : http://tr.wikipedia.org/wiki/Yapay_sinir_a%C4%9Flar%C4%B1 2007. Bir yapay sinirin öğrenme yeteneği , kullanı lan ağı rlı k oranı yla doğrudan alakalı dı r.Süreçte kullanı lan girdiler , dı ş arı dan elde edilen bilgilerdir.Toplama fonksiyonu bir hücreye gelen net girdi miktarıolarak tanı mlanabilir.Aktivasyon fonksiyonu , bu fonksiyon öğrenilme sonucu oluş an değerlerin ortaya çı karı lması için kullanı lan bir fonksiyondur.Son olarak çı ktıise , aktivason fonksiyonundan elde edilen değer olarak tanı mlanabilir. 65Yapay sinir ağaçları nı n katman olarak iş leyiş i aş ağı daki ş ekilde gösterilmektedir. 64 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s222. 65 W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss 2005 s23. 53 Şekil 2.8.Yapay sinir ağları nı n katmanları Kaynak : http://tr.wikipedia.org/wiki/Yapay_sinir_a%C4%9Flar%C4%B1 2007. Yapay sinir ağ ları , ağı n yapı sı na göre sı nı flandı rı ldı ğı nda iki gruba ayrı lmaktadı r.Bunlar ; 66 İ leri beslemeli ağlar , Geri beslemeli ağlardı r. Yapay sinir ağ larıöğrenme türüne göre sı nı flandı rı ldı ğı nda ise , denetimli ve denetimsiz öğ renme olarak iki gruptan oluş maktadı r. Yapay sinir ağ ları nı n kullanı ldı ğıyerlere bakı ldı ğı nda ilk olarak akla genel veri madenciliği olması na karş ı n , birçok alanda yapay sinir ağları kullanı lmaktadı r.Bunlar ; 67 Kredi kartısahtekarlı ğ ı nı n tespiti , Kalite kontrol , Üretim planlama ve çizergeleme , Ürünlerin performans tahmini gibi konularda kullanı lmaktadı r. 66 N.YE , The Handbook Of Data Mining , Lawrence Erlbaum Associates Publisherss 2003 s71. 67 http://www.backpropagation.netfirms.com/ysauygulama.htm 2005. 54 2.4.3.3. K-ortalamalar yöntemi ( K-Means) K-en yakı n komş u yöntemi 1967 yı lı nda Mac QUEEN tarafı ndan bulunmuş tur.Kümeleme algoritması olan k-ortalamaları, k sayı da veriden küme oluş turmaktadı r.Verilen ağ ı rlı klı ortalamalara bakı larak en yakı n değerleri birbirine atayarak kümeler oluş turmaktadı r. Bu yöntem ilk olarak veri setini k tane küme olucak ş ekilde ayı rı r.K değeri analizi yapan kiş i tarafı ndan belirtilmektedir.Daha sonra noktalara en yakı n olduğu kümeye dahil edilerek her veri , merkez kümeleme iş lemi yapı lı r.Oluş turulan kümelerin tekrar ağı rlı klıortalaması hesaplanarak merkez değerleri yeniden oluş turulur.Böylece elde edilen kümeler homojen bir ş ekilde oluş turulmuşolurlar.68 2.4.3.4.Genetik algoritmalar Genetik alagoritmalar , çok değiş kenli fonsiyonlarıoptimize etmeyi amaçlayan sayı sal bir araçtı r.Bu algoritma parametre yerine onları n kodlanmı şbiçimlerini kullanarak en iyiye ulaş maya çalı ş ı r.Yapay zekanı n bir uygulamasıolan genetik algoritma , kı sa sürede çözümleri ortaya çı karması bakı mı ndan önemli bir tekniktir.69 Genetik algoritmaları nı n uygulama alanları na bakı ldı ğı nda ise , kromozon ve gen hesaplamaları, havuz problemi çözümü , uygunluk fonksiyonunun hesaplanması gibi genel problemlerde uygulanabildiğini görmekteyiz.70 Bu uygulama alanları nı sı nı flandı rmamı z gerekirse ; Deneysel çalı ş maları n optimizasyonu , 68 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s134. 69 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s222. 70 M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s421. 55 Pratik endüstriyel uygulamalar , Sı nı flandı rma çalı ş maları dı r. Genetik algoritmaları n veri madenciliğinde uygulamaları na bakı ldı ğı nda ise ; Kümeleme , Model tahmini , İ liş ki kurallarıoluş turma , Müş teri gruplarıoluş turma , Sı nı flandı rma çalı ş maları nda kullanı lmaktadı r. 2.4.3.5.Regreyon analizi Tahmin yöntemlerinden biri olan regresyon analizi bir birden fazla bağı msı z değiş kenle olan iliş kisini bağı mlıdeğiş kenin gösteren basit bir fonksiyondur.Bu analizde amaç geçmiş te iliş kisi olduğu varsayı lan bağı mlıve bağı msı z değiş kenler arası nda bir iliş ki fonksiyonu oluş turarak gelecekte alabilicekleri değerleri tahmin etme esası na dayanmaktadı r.Regresyon fonksiyonu ş uş ekildedir.71 Örneklem içinse formül ş u ş ekli almaktadı r. Doğrusal regresyon modeli grafikle ş u ş ekilde gösterilir. 71 N.ORHUNBİ LGE , UygulamalıRegresyon ve Kolerasyon Analiz , İ Ü. Yayı nları1996 s14. 56 Şekil 2.9.Doğrusal regresyon grafiği Kaynak : Ö.SERPER,Uygulamalıİ statistik 2 , Ezgi Yayı nevi 2000 s220 Y a bx e olan örneklem için doğrusal modelde a sabit katsayı, b bağı msı z değiş kenin modeldeki ağı rlı, e hata terimleri olarak tanı mlanmaktadı r.Bu modelin katsayı larış u ş ekilde tahmin edilmektedir. 72 Tahmin edilen Y a bx e modelinin gövenirliliği F-testi olan ANOVA ile araş tı rı lı r.Araş tı rı lan hipotez aş ağı daki gibidir.73 H0 : X ve Y değ iş keni doğrusal arası nda iliş ki yoktur. H1 : X ve Y değiş keni doğrusal arası nda iliş ki vardı r. Bu hipotez ş u formülle test edilir. Tablo 2.1.Anova testi hesap tablosu Kaynak : K.ÖZDAMAR , Paket Programlar ile İ statiksel Veri Analizi , Kaan Kitabevi 1999 s274 72 73 M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995 s143. K.ÖZDAMAR , SPSS ile Bioistatistik , Kaan Kitabevi 2001 s313. 57 Hesaplanan F değeri F-test değeriden büyük ise H0 hipotezi red edilir H1 hipotezi kabul edilir.Yani değiş kenler arası nda doğrusal bir iliş kinin var olduğu söylenebilmektedir. Eğer bağı msı z değ iş kenlerin sayı sıbirden fazla olduğu durumlarda regresyon modeli ş u ş ekli almaktadı r.74 Yukarı daki modelin değiş kenlerinin tanı mış uş ekildedir. Y Bağı mlıdeğ iş ken , X 1 Birinci bağı msı z değiş ken , X2 İ kinci bağı msı z değiş ken , 0 Modelin sabit katsayı sı, 1 X 1 ‘in modediki ağı rlı ğı nıgösteren katsayı, 2 X 2 ‘nin modediki ağ ı rlı ğ ı nıgösteren katsayı, Hata terimlerini göstermektedir. Çoklu regresyon modelinin uygulanabilmesi için bazıvarsayı mlar değiş kenlerin uymasıgerekmektedir.Aksi takdirde değiş kenler ile modeldeki regresyon modeli kurulamamaktadı r.Bunlar ; 75 ~ (0, ) , hata terimleri normal dağı lı ma uygun olmalı , Cov ( X i , X j ) 0 , bağı msı z değiş kenler arası nda hiçbir iliş ki olmaması gerekmektedir. Örnekten hesaplanan regresyon denkleminin verilere uyum düzeyini, dolaysı yla denklemin baş arı sı nıölçmede belirleme katsayı sı R 2 istatistiği kullanı lmaktadı r. Belirleme katsayı sı , regresyon denkleminin basarı sı nıölçme yanı nda, denklemin tahmin gücünü de yansı tan bir parametre olmasıbakı mı ndan modelin , anlamlı lı k 74 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998 s390. 58 testinden sonra gelen en önemli paremetredir. R 2 istatistiği ş u ş ekilde hesaplanmaktadı r. rx y rx 2 y 2rx1y rx 2 y rx1x 2 R2 1 2 1 rx2 y 2 2 2 Çoklu regresyon modelinin testide , aynı doğrusal regresyon modelindeki gibidir.Hipotezlerin kullanı mıaynı dı r. H0 : Bağı msı z değiş kenlerle bağı mlıdeğiş ken arası nda iliş ki yoktur. H1 : Bağı msı z değiş kenlerle bağı mlıdeğiş ken arası nda iliş ki vardı r. Bu hipotez aş ağı da belirtilen F değeri ile test edilmektedir. k değ iş ken sayı sı, n istatistiği ile gözlem sayı sı olarak karş ı laş tı rı lan F değeri durumunda H 0 hiporezi red edilirken , test tanı mlanmı ş tı r . Fk 1,n k 1 istatistiğinden büyük F-test olması H1 hipotezi kabul edilerek modelin anlamlı ğ ı na karar verilmektedir. Regresyon analizinin bir diğer önemli konusu ise , regresyon modelinin belirlenmesi sürecidir.Bu süreç verilerin bir x-y eksenli bir grafikte dağı lı mı nı n ne olduğuna bakı larak hangi regresyon modelinin uygulanacağı na karar verilen bir süreçtir.Bu süreçte kullanı lan grafiğe , serpilme diyagramı denmektedir.Doğrusal model ve eğrisel model için serpilme diyagramı ş u ş ekildedir. 75 D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s34 . 59 Şekil 2.10.Eğ risel iliş kiyi gösteren serpilme diyagramı Kaynak : D.GUJARATI , Temel Ekonometri , Literatür Yayı nevi 1999 s17-18 Şekil 2.11.Doğrusal iliş kiyi gösteren serpilme diyagramı Kaynak : D.GUJARATI , Temel Ekonometri , Literatür Yayı nevi 1999 s17-18 Serpilme diyagramı nda noktaları n durumu ve genel seyri, iki değiş ken arası nda iliş ki olup olmadı ğı nı ; varsa iliş kinin ne tür bir fonksiyon tipine uyduğunun belirlenmesinde yardı mcıolur. Serpilme diyagramı, yalnı z iliş kinin olup olmadı ğı nıve fonksiyonel ş eklini göstermekle kalmaz, iliş kinin derecesi hakkı nda da bilgi verir. Bunun için, noktaları n 60 en dı ş ta kalanlarıbirleş tirilerek, bir ş ekil elde edilir. Söz konusu ş eklin durumuna göre iliş kinin derecesi hakkı nda tahminde bulunulur. Eğer ş ekil, oldukça dar bir elipse benziyorsa, iliş ki kuvvetlidir. Elips geniş ledikçe iliş ki zayı flamaktadı r. Regresyon analizinde tahmin edilen parametrelerin güven aralı kları nıheasaplamak için ilk aş ağı daki formüllerden olarak parametrelerin standart hataları nı n hesaplanmasıgerekmektedir.76 (Y Yˆ) 2 i Sb1 i n k ( X Sb1 , erinin standart hatası dı r. 1 ‘in tahmini değ X ) 2 i (Y Yˆ) 2 H Sb0 H * i i n k X2 1 n t örnekleme ( X i X ) dağı lı mı na 2 , S b0 ise 0 ’ı n standart hatası dı r. göre 0 , 1 ’in güven aralı kları ş u ş ekilde hesaplanmaktadı r.77 0 Sb0 * tn 2 1 Sb1 * tn 2 76 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s381. 77 M.AYTAÇ , Matematiksel İ statistik , Ezgi Kitabevi 1999 s345 . 61 0 , 1 ’in güven aralı kları0.95 güvenle hesaplanmaktadı r. 2.4.3.6.Zaman serileri analizi Zaman serileri paremetrelerin analizi , zamana gelecekteki bağlı olarak değerlerini tahmin verileri etmeye analiz yarayan bir ederek analiz tekniğ idir.Bu analizin regresyon analizinden temel farkı, zaman esası na göre verilerin değerlendirmesidir. Bu zaman serileri , yı llara göre milli gelirin, istihdamı n veya ihracatı n kaydettiğ i geliş me gibi iktisadi zaman serileri olabileceği gibi, bir mağazanı n aylı k satı ş ları nı , mevsimlere göre sı caklı k değ erlerini veya tı p veya meteoroloji konularıile ilgili serilerde olabilmektedirler. İ ş letme ve iktisat alanları nda zaman serilerinin büyük önem taş ı maları nı n sebebi, önceki dönemlere ait gözlemlerin incelenmesi ve ileriye dönük tahmin yapabilmenin mümkün olması dı r. 78 Zaman serileri, bir yı ldan fazla genelde 5, 10 , 15, ve 20 yı la dayanan uzun dönem planlama ve tahminleme için kullanı lmaktadı r. Zaman seriler analizi uygulayabilmek için , seriyi oluş turan bileş enlerin ayrı ş tı rı lması gerekmektedir. Bir seriyi bileş enlerine ayı rmak için , kapsadı ğıdört bileş en arası nda belli bir iliş ki bulunduğu varsayı lmalı dı r. Bunun için kullanı lan yöntem , zaman serisinin birkaç bileş enini toplamıya da çarpı mı ndan meydana geldiği varsayı mı dı r. Zaman serisi ş u dört etkiye maruz kalmaktadı r.79 Uzun dönemli genel trend (T) , Konjonktür dalgalanmaları(C ) , Mevsimsel dalgalanmalar (S) , Varyasyon ve düzensiz rastgele hareketlerdir. (I) 78 R.S.TSAY ,Analysis Of Financial Time Series ,Wiley publishers 2005 s24. 79 M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995 s225. 62 Bu etki bileş enleri kullanı larak elde edilen denklem ş u ş ekildedir. Y = T*C*S*I Zaman serilerinin amacı, bu dört elemanı n her birinin aldı ğ ıdeğerlerin model üzerinde ne ölçüde etkili olduğunu araş tı rmaktı r. Uzun dönemli genel trend (T) Uzun dönemli genel trend , olayı n bağlıolduğu temel ve taş ı dı ğıözellikler bakı mı ndan uzun dönemde çok fazla değiş mediği için , bu trendlere uzun dönem genel trendleri denmektedir. Trend , belirli bir zaman aralı ğı nda serinin uzun dönemde belirli bir yöne doğru gösterdiği geliş me veya ilerlemedir. Trend analizi bir uzun dönem analizi olduğundan verilerin aylı k veya mevsimlik olarak verilmiş olması tahlilin sonucunu etkilemeyecektir.Trendin yön ve ş iddeti her zaman sabit kalmaz. Trend doğrusal ya da eğrisel olabilir.Bu tendler ş uş ekildedir.80 Artan Doğrusal Trend Azalan Doğrusal Trend Azalan Oranda Eğrisel Artı ş Artan Oranda Eğrisel Azalı ş Azalan Oranda Eğrisel Azalı ş Artan Oranda E ğrisel Artı ş Şekil 2.12.Zaman serisi trendleri Kaynak : http://img92.imageshack.us/img92/2669/zamanserileri1fv0.png 2005. 63 Konjonktür dalgalanmaları(C) Konjonktür dalgalanmalar , genel sapmalara konjonktürel trend doğrusundan verilerin yapmı ş olduğu dalgalanmalar denmektedir.Bu hareketler mevsim dalgalanmaları na benzer ş ekilde periyodik olarak tekrar etmekte iseler de periyotları n uzunluğu ve sürelerin belirsizliği ile dikkati çekmektedir.Konjonktürel dalgalanmalar aş ağı daki grafikte gösterilmektedir. 81 Durgunluk Gelişme Tekrar Yükselme Uzun Dönem Trendi Kriz Şekil 2.13.Konjonktürel dalgalanma grafiği Kaynak : Ö.SERPER,Uygulamalıİ statistik 2 , Ezgi Yayı nevi 2000 s329 Mevsimsel dalgalanmalar (S) Mevsimsel dalgalanmalar ise , ekonomiksel olayları n zaman içinde izlendiğ i doğal ve sosyal nedenlerden dolayı , mevsime göre oluş an değ iş meler mevsimsel dalgalanmalar olarak adlandı rı lı r. Mevsimsel dalgalanmaları n dalga uzunluğu 12 ay olmaktadı r.Mevsimsel dalgalanmaya örnek verilmesi gerekirse , ekonominin okulları n açı ldı ğı zamanki hareketliliği gösterilebilir.Mevsimsel dalgalanma ş ekildedir. 80 81 82 82 M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995 s474- 483. Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s331. D.GUJARATI , Temel Ekonometri , Literatür Yayı nevi 1999 s709 . 64 ş u Dalga Uzunluğu Dalga Şiddeti Şekil 2.14.Mevsimsel dalgalanma Kaynak : Ö.SERPER,Uygulamalıİ statistik 2 , Ezgi Yayı nevi 2000 s333 Trendin hesaplanması nda kullanı lan yöntemler ş unlardı r.83 Basit grafik yöntemi , Hareketli ortalamalar yöntemi , En küçük kareler yöntemidir. Basit grafik yöntemi Bu metoda göre , inceleme konusu olan zaman serisi gözlem sayı sıitibariyle iki eş it kı sma bölünür ve her kı sı mdaki gözlemler için birer aritmetik ortalama hesaplanı r. Bu ortalama değerleri grafiğe iş aretlendikten sonar aralarıbir doğru ile birleş tirilerek bir trend doğrusu elde edilir. Tek ve çift sayı daki örneklemler için , ayrı m ş uş ekilde olmaktadı r. Seri çift sayı lıise , seri eş it olarak tam ortadan iki parçaya ayrı lı r. Seri tek sayı lıise , tam ortadaki eleman dikkate alı nmadan seri iki eş it parçaya ayrı lı r. 83 M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995 s232- 247. 65 Bu yöntemin uygulanabildiği veriler , doğrusal bir trende sahip olmalarıve her iki kı sı mı nda da konjonktürel etkilerinin aynıolmasıgerekmektedir. Hareketli ortalamalar yöntemi Hareketli ortalamalar yöntemi , konjonktürel ve mevsimsel dalgalanmalarıyok etmek amacı yla kullanı lmaktadı r. Hareketli ortalamalar bir zaman serisine ait her değerin yerine, o değ er ve daha önce ve sonra gelen birkaç değerin ortalaması nı n bu değer yerine yazı lmasısuretiyle elde edilen bir zaman serisidir. Örneğin yı llı k verilerde üçer yı llı k hareketli ortalamalar hesaplamak istiyorsak, her yı lı n değeri bir önceki ve bir sonraki değerlerle toplanarak üçe bölünür ve bulunan değer fiili değerin yerine konulur. Benzer ş ekilde daha çok yı lıveya aylarıiçine alan hareketli ortalamalar hesaplanabilmektedir. Hareketli ortalamalar trend hesabı nı n sağlı klıolabilmesi için gerekli koş ullar ş unlardı r. Olayı n trendi doğrusal olması, Serideki dalgaları n uzunluğu aynıolması, Serideki dalgaları nş iddeti aynıolmalı, Hareketli ortalamalar yönteminin aş amalarış unlardı r. İ lk olarak , hareketli ortalama yönteminin uygulama sürecinde dalga uzunlukları bulunur.Dalga uzunluklarıminimumdan minimuma ya da maksimumdan maksimuma olan uzaklı k olarak hesaplanı r.Daha sonra kaçarlı hareketli ortalama hesaplanacağıbulunur.Bunun için kullanı lan formül aş ağı da verilmiş tir. KHO = ( Dalga UzunluklarıToplamı ) / (Dalga Sayı sı ) Hareketli ortalama sayı sıtek sayıbulunursa yapı lan hesaba (n-1) / 2 eleman az alı nı r. Örneğ in üçerli hareketli ortalama hesaplandı ğı nda (3 – 1) / 2 =1 bulunur . Bunun anlamı , baş tan ve sondan birer trend değerinin hesaplanmayacağı dı r. 66 Hareketli ortalama sayı sıçift sayıbulunursa yapı lan hesaba (n) / 2 eleman az alı nı r. Dörderli hareketli ortalama bulunduğunu varsayarsak 4/2 = 2 elde edilir. Bu sayı , baş tan ve sondan ikiş er trendin hesaplanmayacağ ı nıgösterir.Üçerli hareketli ortalamalar ile trend değerleri ş u ş ekilde hesaplanı r. Tablo 2.2. Hareketli ortalamaları n hesaplanma yöntemi Yı llar Değerler 1990 Üçerli hareketli ortalamalarla trend değerleri Y1 Y2 = (Y1+ Y2+Y 3) / 3 1991 Y2 Y3 = (Y2+ Y3+Y 4) / 3 1992 Y3 ... .... 1995 Y6 1996 Y7 . Y7 = (Y 6+ Y7+Y 8) / 3 . Hareketli ortalamalar … yöntemiyle hesaplayarak trend aş ağ ı daki gösterilmektedir. 25 20 TREND 15 10 5 0 84 86 88 90 92 94 Şekil 2.15.Hareketli ortalama yöntemiyle oluş turulan trend Kaynak : M.SPIEGEL , İ statistik , Bilim Teknik Yayı nevi 1995 , s473 67 96 98 ş ekilde Hareketli ortalamalar için gerekli ş artlar sağlanamazsa, doğru sonuçlar elde edilmez.Hareketli ortalamalar tekniği ile elde edilen sonuçlar serideki uzun ve ş iddetli dalgaları n etkisi altı ndadı r. Serinin baş ı ndaki ve sonundaki bazıelemanları n hareketli ortalamasıbulunamaz. En küçük kareler yöntemi Bu yöntem , zaman ile sonuçlar arası ndaki fonksiyonel iliş kiyi ortaya çı karmaktadı r.84 Trendi en iyi tanı mlayacak fonksiyon tipinin seçilmesi için veriler X ekseni zaman olmak üzere bir diyagrama fonksiyonu aktarı lı r.Oluş turulan diyagrama bakı larak trendin çalı ş ı lı r.Trend fonksiyonları ş u ş ekillerde belirlenmeye 85 olabilmektedir. Doğrusal Denklem ( Y = a + bX ), bu eş itlik genelde artma ve azalmalarısabitlik gösteren seriler için kullanı lı r. Parabol Denklemi (Y = a + bX + cX2) , bu eş itlik, yükselmeyi alçalmanı n takip ettiği yön değ iş tirmeyi veren veriler için kullanı lı r. Üstel Denklem (Y = a.bX) , bu denklem, artma yada azalma oranısabit olan serileri hesaplamayısağlar. Hiperbol Denklemi ( 1 / Y = a + bX) Kübik Denklem (Y = a + bX + cX2 + dX3) , serinin grafiğinde alçalma ve yükselmeleri içeren iki bükülme varsa kullanı lı r. Geometrik Denklem( Y = a . Xb) Yukarı daki denklemlerde kullanı lan parametreler ş unlardı r. 84 Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s340. 68 Y : Değ erler , X : Yı llar , a, b, c : Modelin katsayı ları nıtemsil etmektedir. Doğrusal denklem yöntemi kullanı larak trend ş u ş ekilde hesaplanı r. Y na bX XY a X bX 2 Seri tek sayı da ise , zaman bloğunda, tam ortadaki değer orijin olarak alı narak, sı fı r değeri konur. Bundan öncekilere -1,-2,-3, vb; sonrakilere ise +1, +2, +3 değeri verilir. Seri çift sayı da ise , zaman sütununda tam ortadaki iki değerden büyük olana +1, küçük olana – 1 değeri verilerek +3, +5 , ... ve -3, -5, ... konularak iş leme devam edilir.Doğrusal denklem yöntemi kullanı larak standart hataş u ş ekilde hesaplanı r.86 n ≥30 ise n < 30 ise Formül; Y Y 2 S yx Y Y ' 2 S yx n 2 n Formül ; S yx 85 Y 2 a Y bXY S yx n 2 Y 2 a Y b XY n B,KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002 s1-4. 69 Syx : Tahminin standart hatası nı, Y : Bağı mlıdeğ iş kenin gözlenen değerini , Y’ : Bağı mlıdeğ iş kenin modelden hesaplanan değerini , n : Gözlem sayı sı nı, a ve b : model katsayı larıolarak ifade etmektedir. Parabol denklem için (Y = a + bX + cX2 ) a, b, c katsayı larış u yöntemle hesaplanı r. Y na b X c X XY aX b X c X X Y aX b X c X 2 2 2 2 3 3 4 n : Trend periyodundaki zaman öğesinin sayı sı nı , Y : Zamana göre serinin değerini , X : Zamanıtemsil eder. Parabol denklem yöntemi kullanı larak standart hatanı n hesabı n ≥30 ise n < 30 ise Formül ; Y Y 2 S yx Y Y ' 2 S yx n 3 n Formül ; S yx Y 2 aY bXY S yx n 3 Y Syx : Tahminin standart hatası nı, 86 Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s348-349. 70 2 aY bXY n Y : Bağı mlıdeğ iş kenin gözlenen değerini , Y’ : Bağı mlıdeğ iş kenin regresyondan hesaplanan değerini , n : Gözlem sayı sı nı, a ve b : Regresyon katsayı ları nı ifade etmektedir. Üstel denklem için (Y = a.bX ) , bağı mlıdeğiş kene iliş kin veriler, logaritmik duruma getirilirse doğrusal iliş ki ş u ş ekilde olur. 87 log Y’ = log a + X log b log Y’ : Bağı msı z değiş ken için trend değerinin logaritması nı , log a : X = 0 durumunda log Y’ nin değerini, log b : Trend doğrusu eğrisinin logaritması nı, X : Bağı msı z değiş keni ifade eder. a ve b katsayı larış u formüllerden hesaplanı r. logY nloga XlogY X .log log Y n log a X log b XlogY X log a X 2 2 log b log a logY / n log b X log Y / X 2 Mevsim dalgalanmalara bakı ldı ğı nda , mevsimsellik ş u ş ekilde ölçülmektedir.Bir seride iklim ve sosyal sebeplerden dolayı , her yı l düzenli olarak tekrar eden periyodik değiş meler “mevsim dalgalanmaları ” olarak adlandı rı lmaktadı r.Mevsimselliğ i hesaplamak için ilk önce ş u düzeltme yapı lmalı dı r.Aylı k verilerin gün sayı sı na göre ayarlanmasıgerekmektedir. Düzeltme Faktörü = (Ort.Bir Aydaki Gün Say.)/ (O Aydaki Gerçek Gün S.) Ortalama bir aydaki gün sayı sı; 87 B,KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002 s62. 71 Normal Yı llarda : (365)/12=30,41667 Artı k Yı llarda : (366)/12=30,5 Normal Bir yı l için Düzeltme Faktörü Hesaplanması Şubat Ayıiçin: D.F. = (30,41667)/28=1,08631 30 günlük Ay için: D.F. = (30,41667)/30=1,013889 31 günlük aylar için: D.F. = (30,41667)/31=1,981183 Mevsim dalgalanmaları nı n ölçülmesinde kullanı lan yöntemler aş ağı da belirtilmiş tir.88 Genel ortalamayıoranlama yöntemi , Trende oranlama yöntemi , Hareketli ortalamalar yöntemidir. Genel ortalamayıoranlama yöntemi Bu yöntemde her ayı n aritmetik ortalamasıbulunur. Daha sonra bu aritmetik ortalamalardan genel aritmetik ortalama hesaplanı r. Bu yöntem ş öyle formüllenmektedir. GOOY = ( Ŷaylık/Ŷgenel).100 (GOOY ) Genel ortalamayıoranlama yöntemi , Ŷgenel :ΣŶaylı k/12 dir. Bu yöntemde trendin durgun olduğu varsayı lmaktadı r. Halbuki ekonomik zaman serilerinin çoğunlukla bir hareketli bir trendi vardı r.Bu yöntemle elde edilen sonuçlar, hem mevsimin hem de trendin ortak ölçüsünü vermektedir. 88 Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s363-372. 72 Trende oranlama yöntemi Trende oranlama yöntemiyle mevsimin indeksi bulunarak seride ilk olarak trendin etkisi giderilir.En küçük kareler yöntemiyle elde edilen trend denklemiyle trend değerleri Ŷaylık hesaplanı r. Trendin etkisi ş uş ekilde ortadan kaldı rı lı r. [ (Ŷaylı k)/ (Ŷ’aylı k )] . 100 n yı lı nı n ayları na iliş kin oranları n aritmetik ortalamasıhesaplanı r.Mevsim indeksi değerini veren S’ lerin toplamı n 1200 olmasıistenir. 1200 olmadı ğı nda düzeltme faktörü kullanı lı r.Trende oranlama yöntemi dezavantajlarıise , mevsim ineksinin belirlendiği aylı k değerlerde, ekonomiksel zaman serilerine etki eden dört faktöründe etkisi mevcuttur. Trende oranlama yönteminde, gerçek değerleri trende oranlamakla, trendin etkisi giderilir. (Yaylı k/Yaylı k) – ( T )( C )( S )( I ) / ( T ) = ( C ) ( S ) ( I ) Hareketli ortalamalar yöntemi Mevsim indeksinin hesaplanması nda en iyi yöntem hareketli ortalamalar yöntemidir. Mevsimsel dalgalanmaları n dalga boyu 12 olmasınedeniyle 12 ş erli hareketli ortalamalarla trend değerleri bulunulur.89 [ (Ŷaylı erlerin mevsimin etkisiyle hangi k)/ (Ŷ’aylı k )] . 100 formülü ile gerçek değ oranda değiş tiği hesaplanabilmektedir. Değ iş ik yı llara ait aynıay oranları nı n aritmetik ortalamasıhesaplanı r. ΣS’ ≠1200 ise düzletme faktörüyle S’lerin ayarlanmasıgereklidir. 89 D.GUJARATI , Temel Ekonometri , Literatür Yayı nevi 1999 s737. 73 12 D.F 1200 / S i 1 S S D.F . Konjonktürel dalgalanmaları n ölçülmesinde ise iki hesaplama yöntemi kullanı lı r. Yı llı k serilerde konjonktürün ölçülmesi , Aylı k serilerde konjonktürün ölçülmesidir. Yı llı k serilerde konjonktürün ölçülmesi Yı llı k seriler üzerinde mevsimin etkisi söz konusu değildir. Bundan dolayıüç faktörün sonucu olan gerçek değerler trend değerlerine bölündüğünde, trendin etkisi giderilecektir. Kalan kı sı m, konjonktürel ve düzensiz hareketler faktörlerinin etkisini verir. ( Y / Y’ ) = [( T )( C )( I ) / ( T ) ] = ( K ) ( I ) ( K ) ( I ) = [ ( Y ) / ( Y’ ) ] . 100 Bu eş itlikte konjonktürün önceki periyotlardaki etkisi hesaplanabilir. Ancak konjonktürün gelecekteki etkisini tahminlemek mümkün değildir. Aylı k serilerde konjonktürün ölçülmesi Aylı k serilerde konjonktürün ölçülmesi iki aş amada gerçekleş tirilir. İ lk aş amada , aylı k serilerde konjonktür dalgalanmaları nı n etkisini belirleyebilmek için , ilk olarak aylı k trend değerleri ilgili ayları n mevsim indeksleri ile çarpı larak her ay için konjonktürün etkisini içermeyen normal değerleri hesaplanı r.90 (Y’aylı k)(S) 90 Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s373. 74 İ kinci aş amada ise , gerçek değerler, normal değerlere bölünerek oran ş eklinde ifade edilir. K. I = [ ( Y aylık ) / ( Y’aylık ) ( S ) ] . 100 Böylelikle her ay gerçek değerlerin konjonktürel etki nedeniyle normalden ne kadar saptı ğıbelirlenmişolur. 2.4.4. Kümeleme Analizi Kümeleme analizinde , sı nı flandı rma iş lemini önceden belirten sı nı flar ya da kriterler yoktur.Analiz sonucunda ortaya çı kan kümeler benzerliklerine göre oluş turulmuş tur.Veri kümesinin sı nı flandı rma iş lemleri ş unlardı r. Sı nı flandı rma Özel Olmayan Özel Gözetimli Gözetimsiz Hiyerarş ik Kümeleme Bölümleyici Kümeleme Şekil 2.16.Sı nı flandı rma ağ acı Kaynakça : H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. s 330-38, 1996 Sı nı flandı rma yapı sı ndaki ilk ayrı m , özel (Exclusive) - özel olmayan (Nonexclusive) olarak ayrı lmaktadı r.Özel sı nı flandı rmada , her veri yalnı zca bir gruba aittir.Özel olmayan sı nı flandı rmada ise , bir veri birden fazla gruba ait olabilmektedir.İ kinci sı nı flandı rmada ise , gözetimli (Supervised) – gözetimsiz 75 (Unsupervised) olarak yapı lmaktadı r.Gözetimli sı nı flandı rmada veriler önceden tanı mlı ve etiketlenmişolarak yapı lı rken ; gözetimsiz sı nı flandı rmada herhangi bir etiket olmaksı zı n verilerin yakı nlı k matrisine göre sı nı flandı rmaktadı r.Kümeleme analizi bu sı nı flandı rma ağacı na göre , Özel – Gözetimsiz bir sı nı flandı rma analizidir.91 Kümeleme analizinde , kümleri gruplamamı za yardı mcıolan en önemli araç Benzerlik matrisidir (Proximity Matrix). Benzerlik matrisi, matris ekseni sı fı r değerinden oluş an d ij değerleri kümlerin birbiriyle olan iliş kilerini gösteren bir matristir. dij değerleri , sı fı ra benzerlikleride yakı n pozitif değer aldı ğı nda bir o kadar artmaktadı r. Benzerlik kümelerin matrisi aş ağı daki ş ekilde gösterilmektedir.92 Şekil 2.17.Benzerlik matrisi Benzerlik matrisinin elde edilme sürecine bakı ldı ğı nda , veri ölçeklerine göre farklı lı k gösterdiği görülmektedir.Veri ölçeklerine bakı ldı ğı nda ise iki ana baş lı kta toplanmaktadı rlar.Veri Ölçekleri ş ekil 2.18 ‘de gösterilmektedir. 91 M. DEMİ RALAY ,Hiyerarş ik Kümeleme Metotlarıİ le Veri Madencili ğ i , Yüksek Lisans Tezi, Marmara Ünv. ,2005 76 Veri Ölçekleri Nicel Niteleyici Ölçekler Ölçekler Nominal Ölçekler Ordinal Ölçekler Aralı k Oran Ölçekler Ölçekler Şekil 2.18.Veri ölçeleri sı nı flandı rması Kaynak : M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995 s14 Veri ölçekleri ş öyle sı ralanabilir.93 Nominal Ölçekler En az kı sı tlıancak en güçsüz ölçeklerdir.Bu ölçeklerde matematiksel iş lemler yapı lamazlar.Ölçek yalnı zca bir kategori göstergesi kullanı lmaktadı r.Ayrı ca nominal ölçeklere uygulanan istatistiksel olarak analizlerde oldukça kı sı tlı dı r. Ordinal (Sı ralı ) Ölçekler Nominal ölçeklerden daha güçlü ölçeklerdir.Bu ölçeklerin esas niteliği sı ralayı cı bir ölçek olması dı r.Ordinal ölçeklerin en çok kullanı ldı kları durumlar insan davranı ş ları, eğilimleri , tercihleri gibi subjektif konulardı r.Ayrı ca bu ölçekteki verilere kı sı tlıbir istatistiksel analiz uygulanabilmektedir. 92 93 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998 s495. H.ARICI , İ statiksel Yöntemler ve Uygulamaları, Hacettepe ünv. Yayı nları1998 s14-19. 77 Aralı k Ölçekler En önemli ölçekler arası ndadı r.Bu ölçekler rağmen , ölçü biriminin baş langı ç noktasıkeyfi seçilmesine sabit olmasıen önemli özelliğidir.Ayrı ca ölçeklenen verilerin aralı kları nı n bir birinin katıolmasıdiğ er önemli bir özelliğidir. Oransal Ölçekler En güçlü ölçeklerdir.En önemli özellikleri baş langı ç noktası nı n ve ölçü biriminin değiş memesidir.Bu ölçekle ölçeklenen veriler birbirlerinin katıolabilmektedir.94 Benzerlik matrisini elde etme yöntemini seçerken , veri kümesinin hangi ölçekle ölçeklendirildiğinin önemli olduğu bilinmektedir.Bu anlamda nicel ölçekler ve nitel ölçekler için benzerik matrisi ş uş ekilde hesaplanmaktadı r.95 Nicel Ölçek için Minkowski Uzaklı ğıolarak bilinen bir yöntem kullanı lmaktadı r. 1/ d (x i x j ) ; 1 k1|x ik x jk | p formülünden elde edilmektedir. 1 için bu formül Manhattan City –Block Uzaklı ğ ıolarak bilinen formule dönüş mektedir.Bu formul ş uş ekildedir. p d1 (x i x j ) k 1|x ik x jk | ; 1 Nitel Ölçekli veriler için dij ‘leri hesaplamakta Bhattacharyya uzaklı ğıformulü kullanı lmaktadı r.Bu formül ; 1 p d (x i x j ) w |x x jk | p k 1 k ik 94 95 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı, s 338-346 ,1998 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996. 78 1 wk m m k’nı ncıdeğiş kenin dağı lı m aralı ğ ı dı r. Bu yöntemin kullanı lmasıiçin bazıkoş ulları n sağlanmasıgerekmektedir.Bunlar ; d (x i x j ) d (x j x i ) simetri özelliği , d (x i x j ) 0 negatif olmama özelliği , d (x i x j ) 0 ise i j tanı m özelliği, d (x i x j ) d (x i x l ) d (x l x j ) üçgen eş itsizliği özelliği bulunmalı dı r.96 Kümeleme bakı ldı ğı nda ise , ş u analizinin metadolojisine aş amalarda 97 gerçekleş mektedir. Örgütsel sunum özellik seçme , Örgütsel yakı nlı k ölçüsü tanı mlama , Kümeleme , Veri soyutlama , Sonuçlarıdeğelendirme süreçleridir. 2.4.4.1.Kümeleme Metodları Kümeleme analizinde kullanı lan kümeleme metotlarıiki ana baş lı k altı nda toplanmaktadı r.Bunlar ; Hiyerarş ik metodlar , Bölümeyici metodlardı r. 96 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. s 330-342, 1996. 79 Kümeleme Metodları Hiyerarş ik Metodları Tek Bağlantı lı Hataları n Karesi Bölümleyici Metodları Tam bağlantı lı Karı ş ı m Çözücü Grafik Teorik K-Means Yön Arayı cı Beklenti Arttı rı mı Şekil 2.19.Kümeleme metodlarıhiyerarş isi Kaynak : H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. s 336-339 ,1996 Hiyerarş ik Metodlar Bu metotta , baş langı çta herbir veri bir kümeyken analizin sonunda tüm veriler bir küme oluş tururlar.Hiyerarş ik metodları n süreçleri ş u ş ekilde açı klanabilir. 98 n tane birey n tane küme ile iş e baş lanı r. En yakı n iki küme ( d ij değeri en küçük olanlar ) birleş tirilir. Küme sayı sıbir indirgenerek yinelenmişuzaklı klar matrisi bulunur. İ lk iki adı n n-1 kez tekrarlanı r. 97 98 W.Hardle , Multivariate Statistics:Exercises And Solutions , Springer Publishers 2007 s210. N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s523-530. 80 Bölümleyici Metodlar Bu metodlar hiyerarş ik metodlardan daha güçlü tekniklerdir.Bu tekniker n tane veriden oluş an veri kümesini k tane kümelere ayı ran metodlardı r.Benzerlik matrisindeki değerlere göre benzerliklerine göre gruplarlanı rlar. Kümeleme analizinin son aş aması olarak , küme sayı sı nı n belirlenmesi gerekmektedir.Bunun için kullanı lan formul pek güvenilir olmamakla beraber pratikte çok sı k kullanı lmaktadı r.Küme sayı sı nı n hesaplanacağ ı formül ş u ş ekildedir. k (n / 2) 1/ 2 k : küme sayı sı, n : veri kümesindeki veri sayı sı dı r. 2.4.5. Sı radı ş ı lı k Analizi Sı radı ş ı lı k analizi , veri kümesinde oluş an aykı rı gözlemi tespit etmek için kullanı lan konularda bir en analiz baş ta türüdür.Özellikle kullanı lan analiz sahtekarlı k ve yöntemidir.Bu dolandı rı cı lı k gibi analiz iki teknikten oluş maktadı r.99 İ statistiksel tabanlıyöntem , Yoğunluk tabanlıyöntemdir. İ statistiksel yöntem , temel istatistik parametrelerindeki aykı rı lı ğıgözönüne alarak aykı rıgözlemi tespit etmeye çalı ş ı rken , yoğ unluk tabanlıyöntemde ise ekseni üzerinde dağı lan bir grafik ş eklinde analiz yapı lmaktadı r. 99 http://www.togaware.com/datamining/survivor/Outlier_Analysis.html 2007. 81 x-y 2.5.VERİMADENCİ Lİ Ğİ NDE KULLANILAN Dİ ĞER ANALİ Z TEKNİ KLERİ Veri madenciliği sürecinde uygulanan bir çok teknik olması na karş ı n veri madenciliğinde kullanı lan istatistiksel teknikler ş unlardı r.100 Faktör analizi , Kanonik korelasyon analizi , Lojistik regresyon analizi , Çok boyutlu ölçekleme olarak tanı mlayabiliriz. 2.5.1. Faktör Analizi Çok değiş kenli bir istatistik analizi olan faktör analizi , verileri özetleyen ve daha anlamlı bir halde yorumlamamı za olanak tanı yan analizdir.Değiş kenlerin arası ndaki iliş kileri araş tı rarak özet bilgiye bir ulaş ma imkanıvermektedir. Değ iş kenlerin ya da verilerin birbirleriyle olan bağlı lı kları nıortadan kaldı rmak için kullanı lan en yaygı n analizlerden biridir.Değiş ken bağı mlı lı kları nı ortadan kaldı rarak daha sağlı klıbir veri seti oluş turulması na imkan vermektedir.101 Faktör analizi kullanı m amaçları na bakı ldı ğı nda , iki temel amaç ön plana çı kmaktadı r.Bunlar ; Değ iş ken sayı sı nıazaltmak , Değ iş kenler arası ndaki iliş kiden yararlanarak bazıözel yapı lar ortaya çı karmaktı r. 100 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s82. 101 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s167. 82 Kullanı ldı ğıyerlere bakı ldı ğı nda ise esas olarak , tüketici eğilimleri, davranı ş ları , tüketici karakteristiklerinin ortaya çı karı lmasıiçin kullanı ldı ğıbilinmektedir. Faktör analizinde faktörlerin belirlenmesi için birçok yöntem kullanı lmaktadı r. Bunlar kullanı m sı klı kları na göre ş uş ekilde sı ralanabilir;102 Temel Bileş enler Yöntemi , En Çok Olabilirlik Yöntemi , Ağı rlı ksı z En Küçük Karaler Yöntemi , Genelleş tirilmişEn Küçük Kareler Yöntemi , Ana Eksen Faktörizasyonu Yöntemi , Alfa Faktörizasyon Yöntemi , İ mge Faktörizasyonu Yöntemidir. Bu yöntemler içinde en yaygı n kullanı lan yöntemler ise , temel bileş enler analizi ve en çok olabilirlik yöntemidir. Faktör analizi kullanı lma koş ulları na bakı ldı ğı nda ise , gerek maliyet gerekse iş lem zorluklarınedeniyle profesyonel uygulamalara ihtiyaç duymaktadı r. Yöntemin ana amacı , fazla sayı daki değ iş kenlerin gruplanarak faktör değiş kenler olarak ifade edilip edilemeyeceğinin belirlenmesi ve bu mümkün ise hangi değiş kenlerin hangi faktör içinde yer alacağı nı n bulunması dı r. Bu sayede araş tı rmacıfaktörler içine dahil edilen değiş kenleri inceleyerek ilgili faktörün ne anlam ifade ettiğini yorumlayabilecektir. Faktör analizinin algoritması kı saca aş ağı daki ş ekliyle ifade edilebilir.103 102 103 N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s496. W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers 2007 s185-188. 83 Denklem 1’de verilen çoklu doğrusal regresyon denkleminde x1x 2 x3 ...xn ile ifade edilen değiş ken sayı sı nı n fazla olması , bağı ntı nı n karmaş ı klı ğı nıarttı rmakta ve kullanı mı nıçoklu doğrusallı k nedeniyle güçleş tirmektedir. Faktör analizi sonucunda belirlenen k sayı da faktör, F1F2 F3 ...Fk kullanı larak ifade edilen çoklu doğ rusal regresyon iliş kisi denklem 2’de verilmektedir. Burada her faktör denklem 1’de verilen x1 x2 x3 ... xn değiş kenlerinin bir fonksiyonu olarak faktör katsayı ları( Wk 1Wk 2Wk 3...Wkn ) yardı mı yla denklem 3’de verildiği ş ekliyle ifade edilmektedir. Faktör analizinin etkin olabilmesi için ‘k’ faktör sayı sı nı n mümkün olduğunca ‘n’ parametre sayı sı ndan küçük olmasıgerekmektedir (k<n). Aksi takdirde faktör analizi değiş ken sayı sı nıazaltamayacağ ıiçin faktör analizi uygulanamaz.Faktör analizi iki aş amada uygulanmaktadı r.104 Değ iş kenlerin faktör grupları nıoluş turmaya uygun olup olmadı kları nı n tayini, Faktörlerin belirlenmesi ve faktör skor katsayı ları nı n ( Wk 1Wk 2Wk 3...Wkn ) hesabı dı r. Değ iş kenler faktör gruplarıiçine dahil edilemiyorsa, faktör analizinin kullanı mıda mümkün değ ildir. Bu durum, ilk aş amada faktör analizi için uygunluk kriterleri ile araş tı rı lmaktadı r. Faktör analizinin ikinci aş aması nda değiş kenlerin ait olduğu faktör grupları na karar verilmektedir. Faktör sayı sıAsal Bileş en Analizi ile belirlenmektedir. Bu yöntemde bağı msı z değiş kenlerin varyanslarıayrıayrıbelirlendikten sonra, toplam varyansı büyük oranda (>%70) temsil eden değiş ken sayı sıkadar faktör seçilmektedir. Asal Bileş en Analizi faktör analizinden bağı msı z bir teknik olup, ana kullanı lı ş amacı , regresyona dahil edilecek ve çoklu doğrusallı ğa yol açabilecek bağı msı z değiş kenlerin teş his edilmesidir. Bu teknik , özellikle iş lem verimliliği açı sı ndan diğ er benzer tekniklere göre üstünlük arz ettiğinden bilgisayar uygulamaları nda hesap süresini azaltmaktadı r. 104 L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And Methods, LEA Publishers 2005 s222-223. 84 Ayrı ca k faktör sayı sı nıbelirlemek için varyans analizine dayalış u yöntemler kullanı lmaktadı r.105 Temel Eksen faktörü , En Çok Olabilirlik Tekniği , Ağı rlı ksı z En Küçük Kareler , Genelleş tirilmişEn Küçük Kareler , image faktörü, alpha faktörüdür. Her bağı msı z değ iş kenin seçilen faktörler cinsinden aş ağı daki denklemde verilen doğ rusal regresyon denklemleri kurulmaktadı r. Seçilen faktörlere karş ı lı k gelen bağı msı z değiş kenler ise , faktör ağı rlı kları nıifade etmektedir. Denklem 4’te her faktörün katsayı sı , aynızamanda faktör ile xi değiş keni arası ndaki korelasyon katsayı sı nıvermektedir. Korelasyon katsayı sıya da faktör ağı rlı kları nı n karelerinin toplamı xi değiş keninin kullanı lan faktörlerle edilebilen toplam varyans yüzdesini ya da katkıdeğ erini ifade etmektedir. 105 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s171. 85 temsil Aş ağı daki formül katkıdeğeri hesaplamak için kullanı lı r. Katkıdeğ erleri , 0 ile 1 arası nda bir değer almaktadı r. Katkıdeğeri düş ük olan değiş kenlerin, belirlenen faktörlerle bir iliş kilerinin olmadı ğıkabul edilerek, faktör analizinde kullanı lmamalarıve regresyon denklemine bağı msı z değiş kenler olarak dahil edilmeleri gerekmektedir. Her bir bağı msı z değiş kenin x1x 2 x3 ...xn hangi faktör altı nda yer aldı ğıkorelasyon katsayı ları na ya da faktör ağı rlı kları na bakı larak karar verilmektedir.İ deal olarak her değiş kenin en fazla bir faktör ile yüksek bir korelasyon katsayı sıvermesi istenir. Ancak korelasyon matrisine bakı ldı ğ ı nda , kimi değiş ken birden fazla faktöre dahilmişgibi algı lanabilmektedir. Bu gibi durumlarda ortogonal döndürme tekniği kullanı larak döndürülmüş korelasyon matrisi elde edilir. Döndürülmüşkorelasyon matrisi sayesinde , her değiş kenin kesin olarak hangi faktör altı nda yer aldı ğıkolayca döndürme algı lanabilmektedir. Döndürme teknikleri ortogonal ve eğimli açıile döndürme olmak üzere iki farklıteknik ile ele alı nabilmektedir. Bu çalı ş mada ortogonal döndürme tekniği , birbirinden tamamen bağı msı z faktör gruplarıoluş turmasınedeniyle tercih edilmiş , ileride lineer regresyon analizine giren bu faktörler arası nda çoklu doğ rusallı k olmasıengellenmiş tir. Bu durumda, eğimli açıile döndürme tekniğinin parametreler arası nda kı smi bir iliş ki olduğunun varsayı labildigi durumlarda kullanı lmasıdaha uygundur. 106 Faktör analizinde son aş ama, denklem 3’te verilen Wk1Wk 2 Wk 3 ...Wkn faktör skor katsayı ları nı n hesaplanmasıve böylece faktör değerlerinin belirli hale getirilmesi gerekmektedir.Faktör analizinden elde edilen faktörler ve bu bulunmayan bağı msı z değiş kenler tahminleme faktörlerle iliş kisi modelinin kurulması nda kullanı lmaktadı r.Kurulan tahminleme modeli , Ytah min 1 F1 2 F2 ... k 1 Fk 1 ... k n Fk n U dir. 106 W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers 2007 s186-188. 86 Burada F1 , F2 , F3 ,..., Fk faktör analizinden hesaplanan faktör değerlerini, xk 1 , xk 2 , xk 3 ,..., xk n ise faktör analizinde iliş kisi bulunamamı ş bağı msı z değiş kenleri ifade etmektedir. Faktörlerin etki değerleri, 1 , 2 , 3 ,..., k 1 katsayı ları ile, bağı msı z parametrelerin etki değerleri ise k 1 , k 2 , k 3 ,..., k n katsayı larıile temsil edilmektedir. Faktörler içinde yer alan değ iş kenlerin etkinlik düzeyleri aş ağı daki adı mlar dahilinde belirlenebilmektedir. İ lk olarak , faktör skor matrisi kullanı larak her bir değ iş kenin faktör skor katsayı ları toplanmaktadı r.Aş ağı daki ş ekil skorlamanı n nası l yapı ldı ğıgöstemektedir. Tablo 2.3.Skorlama katsayı sımatrisi hesaplanması Kaynak : H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s199 İ kinci olarak , incelenen değiş kenin her faktöre katkı sı , Wij/.Wnj oranı ndan hesaplanmaktadı r. Tablo 2.4. Değiş kenlerin faktöre katkıoranlarıhesaplanması Kaynak : H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s199 87 Son aş ama olarak denklem 6’dan elde edilen her faktör için beta katsayı ları , ‘ß1, ß2, ß3,......, ßk’, ile Wij/.Wnj oranları nı n çarpı mları nı n toplamı değiş kenin etki puanı olarak hesaplanmaktadı r. Tablo 2.5.Değiş ken etki puanları nı n hesaplanması Kaynak : H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s199 Değ iş ken etki puanlarıx1etki , x 2etki , x 3etki , ..., x netki ‘çok etkili’, ‘etkili’, ‘az etkili’ ve etkisiz’ olmak üzere dört ayrıkategoride değerlendirilmektedir. Bu sı nı flamada ‘etkili’-‘az etkili’ sı nı rıt-dağı lı m testinden belirlenmektedir. ‘çok etkili’-‘etkili’ ve ‘az etkili’-‘etkisiz’ sı nı rlarıise t testinden elde edilen sı nı r değerinin altı nda ve üzerinde kalan değerlerin ortanca değerleri hesaplanarak elde edilmektedir. Kullanı lan parametrelerin tanı mlarıaş ağı da belirtilmiş tir. 88 Faktör analizi, birbirleriyle iliş kili veri yapı ları nıbirbirinden bağı msı z daha az sayı da yeni veri yapı ları na dönüş türmek, bir oluş umun nedenini açı kladı klarıvarsayı lan değiş kenleri gruplamak ve ortak faktörleri ortaya koymak, majör ve minör faktörleri tanı mlamak amacı yla baş vurulan bir çok değiş kenli istatistiksel analiz türüdür . Yani faktör analizi, veriler arası ndaki iliş kilere dayanarak verilerin daha anlamlıve özel bir biçimde sunulması nısağlayan bir yöntemdir. Faktör analizinin temel amacı boyut indirgeme ve bağı mlı lı k yapı sı nı yok etmektir. Faktör analizinin diğer amaçları nış u ş ekilde sı ralamak mümkündür. Değiş kenler arası ndaki karş ı lı klı bağı mlı lı ğı n kökenini araş tı rmaktı r. Faktör, gözlenen değ iş kenlerin doğrusal bir bileş imidir.107 Faktör analizinde , kovaryans veya korelasyon matrisinden hareket ederek bilgi kaybı olmadan daha az sayı da faktör adı nıverdiğimiz yeni değiş kenlere ulaş ı lmaya çalı ş ı lı r.Karş ı lı klıolarak araları nda iliş ki olan değiş kenleri bir araya toplamak ve böylece veri grubunu daha az sayı da değiş ken ile temsil edilebilecek duruma dönüş türebilmektir . 107 http://www.statistics.com/resources/glossary/f/factoran.php 2007. 89 Faktör analizi, gruplandı rdı ğıdeğiş kenler arası ndaki ortaklaş a iliş kileri inceleyerek birbirleriyle yüksek iliş ki kuran değiş kenleri bir grupta; daha az iliş ki içinde bulunan değiş kenleri diğ er bir grupta toplayabilir. Faktör analizinin baş lı ca varsayı mları , veri matrisinin analiz öncesi kriter ve tahmin değiş kenleri alt matrislerine bölüş türülmemesi ve değiş kenler arası ndaki ilginin doğ rusal olduğudur . Bu açı klamaları n ı ş ı ğı nda faktör analizinin, değiş kenler arası ndaki tüm iliş kilerin gücünün ve bu arada bu iliş kiyi temsil edecek değiş kenlerin saptanması nıamaçlayan, esas olarak değ iş kenlerle ilgilenen, veri matrisinin kriter ve tahmin değiş enlerinin alt matrislerine bölüş türülmediği ; değiş kenler arası ndaki iliş kinin doğrusal olduğunun varsayı ldı ğıve genel kural olarak aralı klıölçekle ölçülmüşverilere gereksinme gösteren bir çok değiş kenli istatistiksel analiz olduğu söylenebilir. Örneklem büyüklüğü faktör analizi için önemlidir. Gözlem sayı sıdeğiş ken sayı sı ndan fazla olmalı dı r. Baş arı lıbir faktöranalizi uygulaması nda, elde edilen faktör sayı sı değiş ken sayı sı na göre çok daha az olmalı dı r. Ayrı ca faktörlerin yorumlanabilir olmasıaranı lan diğ er bir özelliktir.108 Faktör analizinde faktörlerin ortaya çı karı lmasıiçin yapı lan faktörleş me iş leminde farklıyöntemler kullanmaktadı r. Bu yöntemlerden bazı ları ; temel bileş enler, en büyük benzerlik, ağı rlı ksı z en küçük kareler, genelleş tirilmişen küçük kareler, ana eksen faktörizasyonu, alfa faktörizasyon, imge faktörizasyonu, çoklu gruplandı rma ve maksimum olabilirlik yöntemleridir. Temel Bileş enler Yöntemi, bütün değ iş kenlerdeki maksimum varyansıaçı klayacak faktörü hesaplar. Kalan maksimum miktardaki varyansıaçı klamak için, ikinci faktör hesaplanı r. Ancak, birinci faktörün ikinci faktör ile iliş ki göstermemesi için sı nı rlama vardı r. Söz konusu süreç, değiş kenlerdeki bütün varyansı n açı klanması na kadar devam eder. Normal olarak bu noktaya faktör sayı sıdeğ iş ken sayı sı na eş it olunca ulaş ı lı r. Ancak değ iş ken sayı sıkadar faktör olmasıhiçbir ş eyi basitleş tirmeyeceğ i 108 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998 s482. 90 için; özdeğ er istatistiği kullanı larak analize kaç faktörün dahil edileceğine karar verilir. 2.5.2. Kanonik Korelasyon Analizi Kanonik kolerasyon analizi , birden çok bağı mlı ve bağı msı z değiş ken arası ndaki iliş kiyi ortaya koymak için kullanı lan bir analizdir.Çok değiş kenli istatistiksel analiz tekniği olan kanonik kolerasyon analizi , ş u amaçlar için kullanı lmaktadı r.109 İ ki değiş kenin birbirinden bağı msı z olup olmadı ğı nı n tespit edilmesi, Kümeler arası nda en büyük iliş kilere sahip kümelerin ortaya çı karı lması, Kolerasyonu maksimum yapacak modelin belirtilmesi için kullanı lmaktadı r. Kanonik kolerasyon analizine örnek vermek gerekirse , bir firmanı n ürününü alan müş terinin cinsiyeti , medeni hali, yaş ıve de satı n aldı klarıürünler arası ndaki iliş kiyi ortaya koyan bir analizdir. İ ki değisken arası ndaki iliş ki hakkı nda genel bir bilgi edinmek için kullanı lan grafiklere saçı lı m grafiği denir.Ancak, iliş kinin miktarıkonusunda yorum yapabilmek için korelasyon katsayı sı nı n hesaplanmasıgerekmektedir.110 Korelasyon katsayı sı(r), iki değiş ken arası ndaki iliş kinin ölçüsüdür ve -1 ve +1 arası nda değiş im gösterir.Aş ağı daki ş ekilde değiş kenler arası ndaki grafiklerle gösterilmektedir. 109 110 N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s477. H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s216. 91 kolerasyon Şekil 2.20.Konanik kolerasyon grafiği Kaynak : H.TATLIDİ L , UygulamalıÇok Değ iş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s216 r = -1 olan grafikte değiş kenlerden birisinin artı ş ı na bağlıolarak diğerinde azalması yönünde bir iliş ki olduğ unu göstermektedir. r = 0 olan grafikte iki değiş ken arası nda iliş ki olmadı ğı nıgöstermektedir. r = 1 degiskenlerden birisindeki artı ş a bağlıolarak diğerinde de artı şolacağı nı göstermektedir. Korelasyonun katsayı sı nı n gücü ile ilgili olarak aş ağı daki tanı mlamalar yapı lmı ş tı r. 0 - 0.25 Çok zayı f iliş ki , 0.26 - 0.49 Zayı f iliş ki , 0.50 - 0.69 Orta iliş ki , 0.70 - 0.89 Yüksek iliş ki , 0.90 - 1.0 Çok yüksek iliş kidir. Korelasyon katsayı sı , örneklem büyüklüğünden etkilenmektedir. Küçük hacimli örneklerde, elde edilen korelasyon katsayı sıbüyük bile olsa istatistiksel olarak önemli bir değer olmayabilir.Dolayı sı yla, elde edilen değerin hipotez testinin yapı lması gerekmektedir.111 111 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998 s453. 92 Değ iş kenlerin türlerine göre korelasyon katsayı ları sı nı flanabilir.İ ki nitel değiş ken arası ndaki iliş kinin belirlenmesi için kullanı lan korelasyon katsayı ları ; Phi katsayı sı,Cramer V katsayı sı,Olaganlı k katsayı sı,Lambda katsayı sı dı r. Kesikli/sürekli nicel değiş kenler arası ndaki iliş kinin belirlenmesinde kullanı lan korelasyon katsayı larıise Pearson korelasyon katsayı sı , Spearman korelasyon katsayı sı dı r. Kı smi korelasyon katsayı ları, iki değiş ken arası ndaki iliş kiyi gösterirken diğer değiskenlerin etkilerini dikkate alı nmadan ya da diğer değ iş kenlerin arı ndı rı ldı ktan sonra iki değiş kenin biribiri ile olan iliş kilerini ortaya koyan kolerasyon katsayı sı dı r. 93 etkisi bir 2.5.3.Lojistik Regresyon Analizi Lojistik regresyon analizi , geleceğe dönük tahmin yapmak için kullanı lan ve son yı llarda popüler olan bir analizdir.Bu analiz değiş kenlerin kesikli değerler alması na ve de esnek modeller kurulması na olanak sağladı ğıiçin günümüzde tercih edilmektedir.Kesikli değ iş kenlere örnek olarak medeni hal , cinsiyet vb. örnek olarak verilerbilir.112 Lojistik regresyon modellerinin yaygı n bir ş ekilde kullanı lı r hale gelmesi, katsayı tahmin yöntemlerinin geliş tirilmesi ve lojistik regresyon modellerinin daha ayrı ntı lı incelenmesine sebep olmuş tur. Cornfield (1962), lojistik regresyondaki katsayıtahmin iş lemlerinde diskriminant fonksiyonu yaklaş ı mı nıilk kez kullanarak popüler hale getirmiş tir. Lee (1984) basit dönüş ümlü deneme planlarıiçin linear lojistik modeller üzerinde durmuş tur. Bonney (1987) lojistik regresyon modelinin kullanı mıve geliş tirilmesi üzerinde çalı ş mı ş tı r. Robert ve ark. (1987) lojistik regresyonda standart ki-kare, olabilirlik oran, en çok olabilirlik tahminleri, uyum mükemmelligi ve hipotez testleri üzerine çalı ş malar yapmı ş lardı r. Duffy (1990) lojistik regresyonda hata terimlerinin dağı lı ş ıve parametre değerlerinin gerçek değerlere yaklaş ı mı nıincelemiş tir. Hsu ve Leonard (1995) lojistik regresyon fonksiyonları nda Bayes tahminlerinin elde edilmesi iş lemleri üzerine çalı ş mı ş lar ve lojistik regresyonda Monte Carlo dönüş ümünün kullanı labilecegini göstermiş lerdir. Akkaya ve Pazarlı oğlu (1998) lojistik regresyon modellerinin ekonomi alı nı nda kullanı mı nıörneklerle incelemiş lerdir. Çeş itli varsayı m bozulmalarıolduğunda Lojistik regresyon analizi, diskriminant analizi ve çapraz tablo uygulamaları na alternatif olarak uygulanmaktadı r. Kullanı m nedeni olarak en temel yaklaş ı m doğrusal regresyon analizinde yapı labilir; bağ ı mlı değiş ken 0 ve 1 gibi ikili (binary) ya da ikiden çok kategori içeren kesikli değiş ken 112 L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And Methods, LEA Publishers 2005 s152. 94 olduğunda normallik varsayı mı bozulmakta ve doğrusal regresyon analizi uygulanamamaktadı r.113 Lojistik regresyonu doğrusal regresyondan ayı ran en belirgin özellik ise lojistik regresyonda sonuç değ iş kenin ikili veya çoklu olması dı r. Lojistik regresyon ve doğ rusal regresyon arası ndaki bu fark hem parametrik model seçimine, hem de varsayı mlara yansı maktadı r. Lojistik regresyonda da, doğrusal regresyon analizinde oldugu gibi bazıdeğiş ken değerlerine dayanarak tahmin yapı lmaya çalı ş ı lı r. Ancak bu iki yöntem arası nda önemli fark bulunmaktadı r. Doğrusal regresyon analizinde tahmin edilecek olan bağı mlıdeğiş ken sürekli iken, lojistik regresyon analizinde bağı mlıdeğiş ken kesikli bir değer almaktadı r. Doğrusal regresyon analizinde bağı mlıdeğiş kenin değeri, lojistik regresyon analizinde ise bağı mlıdeğiş kenin alabileceği değerlerden birinin gerçekleş me olası lı ğıtahmin edilir. Doğrusal regresyon analizinde bağı msı z değiş kenin çoklu normal dağ ı lı m göstermesi ş artıaranı rken, lojistik regresyon analizinde böyle bir ş art yoktur. Lojistik regresyon modelleri zayı f ölçekle ölçülmüşdeğ iş kenler arası ndaki iliş kinin ş eklini ortaya koyan modellerdir. Yapı lan bir çok çalı ş mada bağ ı mlıdeğiş ken sadece iki sonuca sahiptir. Genellikle üzerinde durulan olayı n gerçekleş mesi 1 gerçekleş memesi ise 0 ile gösterilir.Hem teorik hem de deneysel incelemeler bağ ı mlı değiş ken iki sonuçlu iken cevap fonksiyonunun ş eklinin S veya ters S ş eklinde olacağı nıbilinmektedir.Bağı mlıdeğiş ken, aş ağ ı daki ş ekilde de görüldüğü gibi bitiş noktalarıdı ş ı nda yaklaş ı k olarak doğrusaldı r. 113 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s289. 95 Bu cevap fonksiyonları0 ile 1 değerlerinde X ve Y eksenlerine asimptottur. Şekil 2.21. S ve ters S fonksiyonu X X Kaynak : M.AYTAÇ , Matematiksel İ statistik ,Ezgi Yayı nevi 1999 s309 Yukarı daki ş ekilde gösterilen cevap fonksiyonları , lojistik cevap fonksiyonlarıolarak bilinmektedir.Lojistik fonksiyonun 0 ile 1 arası nda bir değiş im aralı ğı na sahip olması lojistik fonksiyonun tercih edilmesindeki ilk önemli nedenidir. Lojistik model, ortaya çı kacak riski 0 ile 1 arası nda herhangi bir değer olarak tahmin etmeye yarar. Baş ka bir deyiş le 1’in üstünde veya 0’ı n altı nda bir risk olmaz. Bu durum her model için her zaman doğru olmamaktadı r. 114 Araş tı rmacıbazen bağı msı z değiş kenler üzerinde denetime sahiptir. Böyle bir imkan söz konusu oldugunda Xi değerlerine karş ı lı k gelen hücrelerdeki birim sayı sı nı n asgari 30 olmasıregresyonun verilere uygunlugunu önemli ölçüde yükseltir. Lojistik regresyon fonksiyonu, 114 K.ÖZDAMAR , Paket Programlar ile İ statiksel Veri Analizi , Kaan Kitabevi 1999 s475. 96 ş eklindedir. Bu ifadenin bir diğer ş ekli ise, olarak yazı labilir. π(x) = E(Y/x) değeri ş artlı ortalama olarak bilinir.Şartlı ortalamanı n, modelde yer alan parametrelerle (βo+β1) doğrusal hale dönüş türülmesi için, transformasyona olduğu gibi tutulmasıgerekir.Bu transformasyona Logit transformasyon adıverilir.Bu formül aş ağı da gösterilmektedir. Transformasyon değiş keni g(x), modeldeki parametrelerle doğrusaldı r, süreklidir ve , aralığında değişen değerler alı r. π(x) arttı kça g(x)’te artar ve eğer π(x)<0.5 ise g(x) negatif, π(x)>0.5 ise g(x) pozitif değerler alı r. Modelin sonuç değiş keninin sı nı rları nı geniş letmek için uygulanan Logit transformasyonunun bazıözellikleri ş öyle sı ralanabilir.115 p arttı kça logit(p) de artmaktadı r. p, 0 ile 1 arası nda iken logit(p) reel sayı lar doğrusu üzerinde değerler almaktadı r. p < 0.5 olduğ unda logit(p) < 0 ve p > 0.5 olduğunda logit(p) > 0 olur. Doğrusal regresyon modelinde bağı mlıdeğiş kene ait bir gözlem y = E(Y/x) + ε 115 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s293. 97 ş eklinde gösterilebilir. εhata terimi olarak isimlendirilir ve gözlemin koş ullu olası lı ktan ne kadar saptı ğı nıgösterir. ε ’nin ortalaması nı n sı fı r ve varyansı nı n ise bağı msı z değiş kenin her düzeyinde sabit olacak ş ekilde normal dağı lı m göstereceğ i genel bir varsayı mdı r. Bu varsayı m bağı mlıdeğiş ken iki düzey içerdiği zaman geçerli değildir. Bu tür durumlarda x verildiğinde sonuç değiş keninin değeri y = π(x) + εile gösterilir. Ve ε ’nin mümkün olan iki değerden baş ka değer alamayacağıvarsayı lı r. Eğer y = 1 ise, π(x) olası lı kla ε= 1 - π(x) değerini alı r ve eğer y = 0 ise, 1 - π(x) olası lı kla ε= π(x) değerini almaktadı r. Böylece ε , sı fı r ortalamalıve π(x)[1 - π(x)]’a eş it varyanslı binomiyal bir dağı lı m göstermişolur. Lojistik modelde parametrelerin tahminine bakı ldı ğı nda , parametre tahmin etmek için çeş itli yöntemler ortaya atı lmı ş tı r.Bu çalı ş mada parametrelerin tahmin edilmesinde en çok olabilirlik (maximum likelihood) tahmin yöntemi kullanı lacaktı r. Genel olarak en çok olabilirlik yöntemi, gözlenen veri kümesini elde etmenin olası lı ğı nımaksimum yapan bilinmeyen parametrelerin değerlerini verir. Bu metodu uygulamak için öncelikle, gerekmektedir.Bu fonksiyon en çok olabilirlik gözlenen verilerin fonksiyonunun oluş turulması olası lı kları nı , bilinmeyen parametrelerin bir fonksiyonu olarak açı klar. Bu parametrelerin en çok olabilirlik tahmin edicileri, fonksiyonu maksimum yapan değerleri bulacak ş ekilde seçilir. Böylece sonuçta elde edilen tahminleyiciler, gözlenen verilerle çok yakı n değerlere sahiptir. Eğer y, 0 ve 1 olarak kodlandı ysa, bu durumda 1 numaralıeş itlikte verilen π(x) ifadesi, verilen x değeri için y’nin 1’e eş it olma koş ullu olası lı ğı nıvermektedir. Bu olası lı k π(x) = P(y = 1/x) sembolüyle gösterilir. Buradan hareketle, [1-π(x)] ifadesi de, y’nin 0 degerini alma koş ullu olası lı gı nıgöstermektedir. 116 Bu olası lı k da [1-π(x)] = P(y = 0/x) ş eklinde gösterilir. ( x , y ) çifti için y = 1 i i i 116 D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s155 . 98 olduğunda olabilirlik (likelihood) fonksiyonuna katkı sıπ( x ) iken y = 0 olduğ unda i i olabilirlik fonksiyonuna katkı sı1- π( x ) kadar olmaktadı r. ( x , y ) çiftinin olabilirlik i i i foksiyonuna katkı sı nıhesaplama formülü aş ağı da verilmiş tir. Gözlemlerin birbirinden bağ ı msı z olduklarıvarsayı ldı ğıiçin, olabilirlik fonksiyonu yukarı da buulunan formül terimlerin çarpı lması yla elde edilir. En çok olabilirliğin temel ilkesinde βkestiriminin yukarı daki ifadeyi maksimum yaptı ğ ıvurgulanmaktadı r. Matematiksel olarak bu formülün logaritması yla çalı ş mak daha kolay olacağı ndan log-olabilirlik fonksiyonu aş ağı daki gibi elde edilir. L(β)’yi maksimum yapan βdeğerlerini bulmak için, L(β)’nin ve ’e göre türevi o 1 alı narak sı fı ra eş itlenir. Elde edilecek eş itlikler aş ağı da belirtilmiş tir. ş eklindedir. Bu eş itlikler olabilirlik eş itlikleri (likelihood equations) olarak adlandı rı lı r. 99 Lineer regresyon analizinde β’ya göre türevinden elde edilen olabilirlik eş itlikleri, bilinmeyen parametreleri içeren doğrusal ifadelerdir, bu nedenle kolayca çözümlenebilmektedir. Lojistik regresyon için yukarı da elde edilen eş itlikler ve ’de lineer o 1 değildirler.Bundan dolayıbu eş itliklerin çözümlenmesi için özel yöntemlere ihtiyaç vardı r.Bu denklemlerin çözümleri genelleş tirilmişağı rlı klıen küçük kareler yöntemi ile elde edildiği gösterilmiş tir. Lojistik regresyonda gözlenen ve beklenen değerlerin karş ı laş tı rı lmasılog olabilirlik fonksiyonu ile yapı lmaktadı r.Bu test Önem testi olarak adlandı rı lı r.117 Yukarı daki formülde parantez içerisinde verilen ifade olabilirlik oranı“likelihood ratio”olarak adlandı rı lı r. (–2ln) katı nı n alı nması , matematiksel olduğu kadar dagı lı mı bilinen bir değer elde etmektir. Bu değer hipotez testi amacı yla kullanı lmaktadı r. Böyle bir teste olabilirlik oran testi adıverilmektedir. Formüller yerine konulduğunda eş itlik aş ağı daki ş eklini almaktadı r. Bağı msı z bir değiş kenin önemine karar vermek için , denklemde bağı msı z değiş kenin olduğu ve olmadı ğ ıdurumlardaki D değerleri karş ı laş tı rı lı r. Bağı msı z değiş keni kapsaması ndan dolayıortaya çı kan D’deki değ iş im aş ağı daki gibidir. 117 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s299. 100 Hesaplanan bu istatistikde, doğrusal regresyonda kullanı lan F testindeki pay kı smıile aynırolü üstlenir. G’yi hesaplamak için farkıalı nacak D değerlerinin her ikisi için de doymuşmodelin olabilirlikleri ortak olduğundan G istatistiği aş ağı daki ş ekli almaktadı r.118 Tek bağı msı z değiş kenli özel durumlarda, değ iş kenin modelde olmadı ğızamanda ki βo’ı n en çok olabilirlik tahmini ln( n / n )’dı r. ( n = Σy ve n = Σ(1- y )). Tahmin 1 o 1 o i i değeri n / n sabittir.G istatistiğ iş u ş ekilde hesaplanı r. 1 o ya da dı r. β1 = 0 hipotezi altı nda, G istatistiği 1 serbestlik derecesiyle χ2 dağı lı mı göstermektedir. Tüm değiş kenleri içeren model ile kestirilen modele iliş kin olabilirlik oran değerlerinin farkı na dayanan ölçütlerin ki-kare dağı lacağ ıdüş üncesinden hareketle kurulan modelin geçerliliği sı nanmaktadı r. 118 D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s160. 101 Çoklu lojistik regresyon analizine bakı ldı ğ ı nda , bağı msı z değiş kenler değiş ik ölçüm biçimlerinde olabilmektedir.Kesikli ve nominal ölçekli bağı msı z değiş kenleri modele dahil etmek için dizayn değiş kenleri kullanı lmasıgerekir. Öncelikle modeldeki tüm bağı msı z değiş kenlerin her birinin en az aralı k ölçekli olduğu varsayı lmaktadı r. X ' ( x1x2 x3 ...x p ) vektörü ile gösterilsin. Sonuç değ iş keninin mevcut olduğu (Y=1) zaman ki koş ullu olası lı k, P(Y = 1/x) = π(x)’e eş it olacaktı r. Çoklu lojistik regresyon modelinin logiti aş ağı daki denklem ile gösterilir. 119 Buradanda , Formülü elde edilir. Bağı msı z değiş kenler kesikli, nominal ölçekli ise, o zaman bu değiş kenler yerine dizayn (kukla) değiş kenlerinin bu değiş kenleri temsil etmesi için kullanı lmasıgerekir. Genel olarak nominal değiş ken k kategoriye sahipse, o zaman k-1 dizayn değiş kenine ihtiyaç vardı r. J. Bağı msı z değiş ken (xj), kj kateğoriye sahip olsun. Kj –1 dizayn değiş keni Dju olarak ve katsayı larıda βju, u = 1,2,.....,kj – 1 olarak belirtilirse, j. değiş ken kesikli olan p değiş kenli model için logit aş ağı daki gibi olur.120 Birbirinden bağı msı z n tane (xi, y i), i=1,2,....,n gözlem çiftinin olduğu olduğunu düş ündüğümüzde tek değiş kenli modelde olduğu gibi modelin kurulmasıiçin tahmin vektörünün ' ( elde edilmesi gerekir. Çok değiş kenli durumda, 1, 2, 3 ,..., p) 119 M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 s106. 120 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s304. 102 tek değiş kenli durumda olduğu gibi tahmin metodu en çok olabilirlik metodu olacaktı r. ̂ en çok olabilirlik tahmin teorisi, log olabilirlik fonksiyonunun ikinci dereceden türevlerinden oluş an matristen tahmin değerlerinin elde edilmektedir.Logaritmik olabilirlilik fonksiyonunun β0, β1, ...., βp-1 parametrelerine göre ikinci dereceden kı smi türevlerinin matrisini G ile gösterilir.G matrisi, ş eklinde gösterilir. değerleri elde edilir. Bu matris, Hessiyan matrisi olarak adlandı rı lı r. Hessiyan matrisdeki ikinci derece kı smi türevleri, b = ίolarak; yani, en çok olabilirlilik tahmincileri olarak görmek gerekir. En yüksek ihtimal tahmini için kullanı ldı ğı nda Lojistik regresyondan tahmin edilen regresyon katsayı ları nı n tahmini yaklaş ı k varyans kovaryans matrisi ş u eş itlikten elde edilir. Örnek hacmi yeterince büyük olduğunda , basit veya çoklu lojistik regresyon modellerindeki regresyon katsayı ları nı n anlamlıolup olmadı ğı nıtest ederken aş ağı daki değere bağlıolarak karar verilir. Yukarı daki formüldeki Z değeri standart normal değerdir. S{b k} değeri ise bk’nı n tahmini standart sapması dı r. Çoğu kez çoklu lojistik regresyon modelindeki X değiş kenlerinin alt gruplarıile iliş kili regresyon katsayı ları nı n önemli olup olmadı ğ ı araş tı rı lı r. Kullanı lacak test prosedürü en çok olabilirlilik tahmininin genelleş tirilmiş 103 bir ş eklidir. Büyük örnekler durumunda uygulanabilen bu test olabilirlilik oranıtesti olarak adlandı rı lı r. Genel model olarak aş ağı daki model kullanı lı r. Bu modelde , olurlar. Model için bulunacak en çok olabilirlilik tahminlerini bF ile gösterilir. Olabilirlilik fonksiyonunu L( β) ile gösterdiğimizde β= bF olmaktadı r. Genel modelde olabilirlilik fonksiyonunun bu değerini L(F) ile gösterilir.Test edilecek hipotezler ş unlardı r. En son p-q katsayı ları nıtest etmek için model düzeltilir. Kı saltı lmı şmodel, ş eklindedir. Bu modelde olarak yazı lı r.Şimdi kı saltı lmı şmodel için maksimum olabilirlilik tahminlerinin elde ediliş i ş u ş ekildedir.Maksimum olabilirlilik tahminleri b R ile gösterilir. βR = b R olduğunda q adet parametre ihtiva eden kı saltı lmı şmodel için olabilirlilik tahmini tarif edebiliriz. Olabilirlilik fonksiyonunun bu değeri L® ile gösterilir. L® değ eri L(F) değerini hiçbir zaman geçemez. Bu sebeple L® değeri L(F) değerine yaklaş tı ğı nda ilave parametreler olabilirliligi fazlaca artı rmayacaklarıiçin H0 hipotezinin doğru 104 olduğuna karar verilir. L® değeri L(F) degerinden yeterince küçük olursa H 1 hipotezinin doğru olduğuna karar verilir. Test istatistiği X 2 gösterildiğinde,121 olur. Örnek hacmi yeterince büyük olduğ unda H0 hipotezi doğru ise yaklaş ı k olarak 2 (1; p q ) X 2 istatistiği ş eklinde dağı lı m gösterir. Serbestlik derecesi, v = (n – q)–(n–p) ş eklindedir. Böylece X 2 X 2 (1; p q ) olduğunda H0 kabul edilirken X 2 X 2 (1; p q ) olduğunda H1 kabul edilir. Regresyon katsayı ları nı n önemli olup olmadı ğı nıtest etmede kullanı labilecek ikinci test Wald testidir. Wald testine ait test istatistiginin dağı lı mıstandart normal dağı lı ma yaklaş ı r. Her değiş ken için listedeki standart hatalar kullanı larak Z testi yapı lı r. Wald testi, örnek hacminin büyük olmasıdurumunda anlam kazanmaktadı r. Eğim parametresinin en yüksek ihtimal tahmincisi standart hatası nı n tahmini değeri ile mukayese edilir. 1 = ίiken test istatistiğinin dağ ı lı mıstandart normal dağı lı ma uygundur. Bu teste ait test istatistik formulü ş u ş ekildedir. Kurulan modelin uyum iyiliği testi Hosmer-Lemeshow’un hem onlu risk gruplarıhem de sabit kesim noktasıyöntemine göre hesaplanmaktadı r.Uyum iyiliğine karar vermek için onlu risk gruplarıyöntemine göre hesaplanmak ş uş ekildedir. 121 D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s172-173. 105 Hosmer-Lemeshow * Cˆ istatistiği, g t-2 serbestlik dereceli ki-kare dağı lı mı göstermektedir. Kestirilen modelin uyum iyiliği testi sabit kesim noktasıyöntemiyle hesaplanmak istendiğ inde ise, Hosmer-Lemeshow istatistigi kullanı lmaktadı r. Hosmer-Lemeshow Hˆ*g istatistiği, t-2 serbestlik dereceli ki-kare dağı lı mı göstermektedir. Lojistik regresyonda paremetreler ş unlardı r. n:İ ncelenen birey sayı sı , Y (Y1 , Y2 , Y3 ,..., Yn ) ' : açı klayı cıdeğiş ken vektörü, (1 , 2 , 3 ,..., p )' : parametre vektörü, ' (1 , 2 , 3 ,..., n ) : hata terimleri vektörü, p : değiş ken sayı sı , X :açı klayı cıdeğiş ken matrisidir. Açı klayı cıdeğiş kenler matrisi X ş uş ekilde tanı mlanı r. 106 Lojistik regresyon analizinin uygulamadaki adı mları na bakı ldı ğı nda ş u aş amalardan geçmektedir.122 Önsel grup üyelikleri belirlenir. Modele girecek değ iş kenler belirlenir. Bu amaçla önsel bilgiden ya da istatistiksel tekniklerden yararlanı labilir. Modelin parametreleri Newton-Raphson yöntemi ile tahmin edilir. Ardı ndan modelin tümünün anlamlı lı ğıolabilirlik oranıile test edilir. Model anlamlıdeğilse analize son verilir. Eğer model anlamlıbulunursa diğer aş amaya geçilir. Tahmin edilen model parametrelerinin tek tek anlamlı lı ğıincelenir. Bu amaçla olabilirlik oranıya da Wald istatistiği kullanı labilir. Her katsayı nı n anlamlı lı ğı incelendikten sonra, teklik oranlarıincelenerek, açı klayı cıdeğiş kenlerin bağı mlı değiş ken üzerindeki etkileri yorumlanabilir. Tahmin edilen model parametreleri kullanı larak, her bir gözlemin hangi gruptan geldiğ i tahmin edilir. Modelin uyum iyiliğini incelemek amacı yla doğru sı nı flandı rma yüzdesi ve yapay R 2 ölçütleri kullanı lı r. Modelin uyum iyiliği kabul edilebilir düzeyde ise 5. aş amadaki grup tahminleri kullanı labilir. Aksi halde 2. aş amaya geçilerek modele girecek değiş kenler yeniden gözden geçirilir ve iş lemler tekrar edilir. 122 K.ÖZDAMAR , Paket Programlar ile İ statiksel Veri Analizi , Kaan Kitabevi 1999 s475-479. 107 2.5.4.Çok Boyutlu Ölçekleme Çok boyutlu ölçekleme , veri tekniktir.Faktör analizinin boyutunu indirgeme amaçlı kullanı lan bir alternatifi ölçülemeyen ölçekleme yöntemleri olduğu olarak söylenebilir.Ölçülebilen ve iki ayrı lmaktadı r.Veri değerlerinin birbirine olan uzaklı kları na bakı larak indirgeme yapı lan yöntem psikoloji ve sosyal bilimlerde yaygı n olarak kullanı lmaktadı r. Çok boyutlu ölçekleme analizi, n tane nesne ya da birim arası ndaki p değiş kene göre belirlenen uzaklı klara dayalıolarak nesnelerin k boyutlu (k < p) bir uzayda gösterimini elde etmeyi amaçlayan, böylece nesneler arası ndaki iliş kileri belirlemeye yarayan bir yöntemdir.123 Çok boyutlu ölçekleme analizi, hem görsel bir haritalama imkanıvermekte hem de gözlemler ile değiş kenler arası ndaki iliş kileri görsel olarak ortaya çı karmaktadı r. Çok boyutlu ölçekleme, n tane nesne arası ndaki uzaklı k değerlerini kullanarak bu nesnelerin çok boyutlu uzaydaki konumları nı , iliş ki yapı sı nıveren resmini ortaya koymayıamaçlamaktadı r. Bu analizde X veri matrisi yerine n tane bireyin uzaklı klardan elde edilen nxn boyutlu D uzaklı klar matrisi kullanı lmaktadı r. Uzaklı klar matrisinin simetrikliği nedeniyle, iş lemler n ( n 1 ) 2 tane uzaklı k değeri kullanı larak sürdürülmektedir . Çok boyutlu ölçekleme, nesneler arası ndaki iliş kilerin bilinmediğ i, fakat araları ndaki uzaklı kları n hesaplanabildiği durumlarda uzaklı klardan yararlanarak nesneler arası ndaki iliş kileri ortaya koymaya yardı mcıolan bir istatistiksel tekniktir. Uzaklı klar veya farklı lı klar yardı mı yla nesnelerin geometrik konumları nı n belirlenmesi, ş ekillendirilmeleri önemli bir konudur. Bu amaçla yapı lan çalı ş malarda genellikle elde edilen ş ekillerin çok boyut içermesi sebebiyle bu ölçeklemelere çok boyutlu ölçekleme adıverilmiş tir. 123 K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998 s436-445. 108 Genellikle metrik ve metrik olmayan olarak iki çeş it çok boyutlu ölçekleme vardı r. Metrik ölçmede veri en az mesafeli seviyede olmalı dı r. Metrik olmayan modelde veriler en azı ndan sı ralama biçiminde olmalı dı r.124 Çok boyutlu ölçekleme analizi boyut indirgeme amacı yla da kullanı lmaktadı r. Aynı zamanda n tane nesne ya da birim arası ndaki faklı lı klarısubjektif bir sı ralamaya sokmak amacı yla da kullanı labilir. Çok boyutlu ölçekleme yöntemi uzaklı klar matrisinden faydalanarak çözüm yapar. Bu nedenle analizde kullanı lacak veri türüne uygun olarak uzaklı k matrisi hesaplamak gereklidir. Çok boyutlu ölçekleme yönteminde hesaplanan uzaklı k matrisine farklı lı k matrisi denir. Çok boyutlu ölçekleme analizi belli bir dağı lı m varsayı mıgerektirmeyen bir yöntemdir. Fakat buna karş ı n bu yöntemin sağlamasıgereken bazıvarsayı mlar vardı r. Bunlar; 125 Çok boyutlu ölçekleme, n tane nesne yada birim arası ndaki uzaklı klarıkullanı r. Bu uzaklı klar simetrik ve yansı malı dı r. Veriler sı nı flama veya sı ralama düzeyinde ölçülerek nesneler arasıuzaklı klar hesaplanmı şise , değerlerin sı raya dizilmesi ve monotonik regresyona göre konfigürasyon uzaklı kları nı n belirlenmesi gerekir. Çok boyutlu ölçekleme içinde yer alan yöntemlerin uygulanabilmesi için yöntemin gerektirdiği veri tipini doğru olarak belirlemek gerekir. Örneğin; sı nı flamalı , sı ralı , eş it aralı klıveya orantı lı dı r 124 H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996 s353. 125 N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s541-544. 109 Çok boyutlu ölçekleme ile analiz edilecek veriler farklı lı klar belirtiyor ise, farklı lı klar matrisi nicel değerler içermeli ve tüm farklı lı k ölçüleri aynıölçümleme ile hesaplanmı şolmalı dı r. 110 BÖLÜM 3 Sİ GORTACILIK SEKTÖRÜNDE MÜŞTERİ İ Lİ ŞKİ LERİYÖNETİ MİYAKLAŞIMIYLA Bİ R VERİ MADENCİ Lİ ĞİUYGULAMASI 3.1.ARAŞTIRMANIN AMACI Bu uygulamada x sigorta ş irketinin veri tabanı ndan alı nan , yangı n sigortası, konut sigortası ve de kaza sigortası verileri kullanı lmaktadı r.Sigorta satı n alan müş terilerin veri madenciliği analizi için davranı ş kalı pları nı ortaya çı kartarak müş terileri gruplamak ve bu müş terilere uygun bir satı ş kampanyası hazı rlanmasıiçin bu veri seti kullanı lmaktadı r. 3.2.ARAŞTIRMANIN KAPSAMI Bu araş tı rmada kullanı lan veri seti 111 adet veriden oluş urken değiş enleri ise müş teri numarası, müş teri cinsiyeti , sigorta bedeli , primler , sigorta cinsi ve de semt değiş kenidir. Uygulamada kullanı lan veri seti ş uş ekildedir. Tablo 3.1.Veri seti tablosu Veri setindeki değiş kenlerin tanı mlarış öyledir. 111 Müş teri numarasıdeğiş keni Bu değiş ken sürekli bir değ iş ken olup müş teri sı ralaması nıbelirtmetedir. Müş teri cinsiyeti değiş keni Bu değiş ken sigorta satı n alan müş terilerin cinsiyetlerini göstermektedir.Kesikli verilerden oluş an bu değiş ken kadı n-erkek değerlerini alabilmektedir.Bu değiş kenin özet bilgileri ş u ş ekildedir. Tablo 3.2.Cinsiyet değiş keninin özet bilgileri Yukarı daki tabloya göre sigorta satı n alan müş terilerin % 65,77 ‘si erkek müş teri iken % 34,23 ’ü kadı n müş terdir. Sigorta bedeli (YTL) değiş keni Bu değ iş ken sigortalanacak olan malı n belirlenmiş olan bedel değerlerini içermektedir.Bu değiş kenin dağ ı lı mış u ş ekildedir. Tablo 3.3.Sigorta bedeli değiş keninin özet bilgileri Yukarı daki tabloya göre bu değiş ken en az 624 YTL en fazla 400000 YTL değer alabilmektedir.Ortalama değeri 40689,90 YTL iken dür. 112 standart sapması50355,64 ‘ Primler (YTL) değiş keni Bu değiş ken sigorta satı n alan müş terilerin tomlam ödeyecek olduklarıprim değerlerini göstermektedir.Bu değiş kenin özet bilgileri ş öyledir. Tablo 3.4.Primler değiş keninin özet bilgileri Yukarı daki tabloya göre bu değiş ken en az 25 YTL en fazla 4751 YTL değer alabilmektedir.Ortalama değeri 790 ,81 YTL iken standart sapması801,08 ‘ dir. Sigorta cinsi değiş keni Bu değ iş ken sigorta satı n alan müş terilerin hangi sigortayıtercih ettiklerini göstermektedir.Kesikli verilerden oluş an bu değiş ken yangı n-kaza-konut değerlerini alabilmektedir.Bu değiş kenin özet bilgileri ş u ş ekildedir. Tablo 3.5.Sigorta cinsi değiş keninin özet bilgileri semt değiş kenidir. Yukarı daki tabloya göre bu değiş kenin % 36,04 ‘ü kaza sigortaları ndan , % 36,94 ’ü konut sigortaları ndan % 27,03 ‘ü ise yangı n sigortaları ndan oluş maktadı r. Semt değiş keni 113 Bu değ iş ken sigortalayıalan müş terinin hangi semtte oturduğunu gösteren bir değiş kendir. Kesikli verilerden oluş an bu değiş ken Şiş li-Beş iktaş -Levent değerlerini alabilmektedir.Bu değiş kenin özet bilgileri ş u ş ekildedir. Bu değiş kenin özet bilgileri ş uş ekildedir. Tablo 3.6.Semt değiş keninin özet bilgileri Yukarı daki tabloya göre müş terilerin % 33,33 ‘ü Şiş li , % 39,64 ’ü Beş iktaş %27,03 ‘ü ise Levent semtlerinde oturmaktadı rlar. Bu veri setine uygulanacak olan analizler ş unlardı r. Birliktelik kurallarıanalizi Sepet analizi , Sı nı flandı rma analizleri C&RT analizi , C4.5 analizi , Kümeleme analizleri K-ortalamalar(k-means) analizi , Kanonikel diskriminant analizi , Yapı lacak olan analizlerin ilki satı n aldı ktan sonra koymaktadı r.Bu analiz olan sepet analizi , bir müş terinin bir baş ka sigortayı satı n alma bir sigortayı olası lı ğı nı ortaya belirli müş teri grupları na belli bir poliçenin yanı nda 114 baş ka bir poliçeninde tektif edilmesine olanak sağlayarak karlı lı ğıarttı rmaya yardı mcıolmaktadı r. İ kinci olarak uygulanacak olan analizler C&RT analizi ve C4.5 analizidir.Bu analizler müş terileri belirli kriterlere göre ayrı ş tı rarak müş teri gruplarıoluş turmak için kullanı lmaktadı r. Üçüncü olarak uygulanacak olan analizler K-ortalamalar(k-means) analizi ve Kanonikel diskriminant analizidir.Bu analizler , benzerliklerine göre müş terileri gruplayarak müş teri kümeler oluş turmaktadı r.Bu kümeleme grupları na ortak bir pazarlama yöntemleri kullanı larak kampanyası yürütülmesine olanak Birliktelik kurallarıanalizinden en yaygı n olarak kullanı lan analiz yöntemi sağlamaktadı r. 3.3.ARAŞTIRMA İ LE İ LGİ LİUYGULAMA 3.3.1.Birliktelik KurallarıAnalizi Sepet analizidir.Bu analizin temeli koş ullu olası lı k varsayı mları na formüller P(X Y) destek dayanmaktadı r.Bu analizde kullanı lan kriteri P(X / Y) güven kriteridir.Güven kriterini hesaplamak için ş u formül kullanı lı r. P(X Y) P(X / Y) P(Y) Kullanı lacak olan değiş kenler aş ağı da açı klanmı ş tı r. E : Sigorta satı n alan erkek müş teri sayı sı, K : Sigorta satı n alan kadı n müş teri sayı sı, Y : Yangı n sigortasısatı n alan müş teri sayı sı, Ka : Kaza sigortasısatı n alan müş teri sayı sı, Ko : Konut sigortası satı n alan müş teri sayı sı, S : Şiş li semtindeki müş teri sayı sı, 115 ve L : Levent semtindeki müş teri sayı sı, B : Beş iktaşsemtindeki müş teri sayı sı dı r. Bu analizde ilk olarak kadı n ve erkek müş terilerin yangı n sigortasısatı n alma olası lı ğı nıhesaplamak için kullanı lacaktı r.Bunun için kullanı lacak olan tablo aş ağı da verilmiş tir. Tablo 3.7.Yangı n sigortasıiçindeki kadı n-erkek oranıtablosu Yukarı daki tablo kullanı larak elde edilen formül ş uş ekildedir. P(Y E) P(Y / E) P(E) Bu formül sigorta satı n alan bir erkek müş terinin olası lı ğı nıgösterir. P(Y E) %73,3*30 21,99 P(E) %65,8*111 73, 038 21,99 P(Y / E) 0,3010 73, 038 116 yangı n sigortası alma Sigorta satı n alan bir erkek müş terinin yangı n sigortasıalmasıolası lı ğı % 30,10 ‘dur.Aynıanalizi sigorta satı n alan bir kadı n müş teri için yaparsak ş u sonuç elde edilir. P(Y K) %26, 7 *30 8, 01 P(K) %34, 2*111 37, 962 8, 01 P(Y / K) 0, 211 37,962 Sigorta satı n alan bir kadı n müş terinin yangı n sigortasıalmasıolası lı ğı% 21,1‘dir. Bu analizde ikinci olarak kadı n ve erkek müş terilerin kaza sigortasısatı n alma olası lı ğıhesaplanacaktı r.Bunun için kullanı lacak olan tablo aş ağı da verilmiş tir. Tablo 3.8.Kaza sigortasıiçindeki kadı n-erkek oranıtablosu Sigorta satı n alan bir erkek müş terinin kaza sigortası alma olası lı ğı nış uş ekilde hesaplanı r. P(Ka E) %75* 40 30 P(E) %65,8*111 73, 038 30 P(Ka / E) 0, 4107 73, 038 117 Sigorta satı n alan bir erkek müş terinin kaza sigortasıalmasıolası lı ğı % 41,07 ‘dir.Aynıanalizi sigorta satı n alan bir kadı n müş teri için yaparsak ş u sonuç elde edilir. P(Ka K) %25* 40 10 P(K) %34, 2*111 37, 962 10 P(Ka / K) 0, 2634 37,962 Sigorta satı n alan bir kadı n müş terinin kaza sigortasıalmasıolası lı ğı% 26,34‘dür. Bu analizde üçüncü olarak kadı n ve erkek müş terilerin konut sigortasısatı n alma olası lı ğıhesaplanacaktı r.Bunun için kullanı lacak olan tablo aş ağı da verilmiş tir. Tablo 3.9.Konut sigortasıiçindeki kadı n-erkek oranıtablosu Sigorta satı n alan bir erkek müş terinin konut sigortasıalma olası lı ğı nış uş ekilde hesaplanı r. P(Ko E) %48,8* 41 20 P(E) %65,8*111 73, 038 20 P(Ko / E) 0, 2739 73,038 118 Sigorta satı n alan bir erkek müş terinin kaza sigortasıalmasıolası lı ğı % 27,39 ‘dir.Aynıanalizi sigorta satı n alan bir kadı n müş teri için yaparsak ş u sonuç elde edilir. P(Ko K) %51, 2* 41 20, 992 P(K) %34, 2*111 37, 962 20,992 P(Ko / K) 0,5530 37,962 Sigorta satı n alan bir kadı n müş terinin konut sigortasıalmasıolası lı ğı% 55,30‘dur. 3.3.2. Sı nı flandı rma Analizleri Sı nı flandı rma analizi veri setini belirli kriterlere göre ayrı ş tı rarak veri setini doğ ru yorumlamamaza yarı dı mcıolmaktadı r.Burada uygulanacak olan analizler C&RT analizi ve C4.5 analizidir.Bu analizlerin sonuç değerleri karar ağacı ş eklinde belirtilmektedir.Bu analizler aş ağı da veri setine uygulanmaktadı r. C&RT Analizi Veri setine , müş terilerin yerleş im yerleri esas alı narak yapı lan C&RT analizi ş u ş ekildedir. Tablo 3.10. C&RT analizi sonuç matrisi ve hata oranları Yukarı daki tablo C&RT analizinin oluş turduğu matris değerleridir.Bu analizin yaprak sayı sı nıbelirlemek için kullanı lan tablo aş ağı da verilmiş tir. 119 Tablo 3.11. C&RT analizinin yaprak analiz sonuçları Burada oluş an hata değerlerinden , C&RT analizi için kullanı lacak olan yaprak sayı sıbelirlenmektedir.Bunun için genel hata oranıile üretilen veri setinin (growing set ) hata değeri karş ı laş tı rı lı r. Analiz sonucunda elde edilen karar ağacış u ş ekildedir. Tablo 3.12. C&RT analizi sonucunda elde edilen karar ağacıdiyagramı Yapı lan analize göre veri seti iki ana gruba ayrı lmı ş tı r.ilk grup sigorta bedeli 1410 YTL ‘den küçük müş teriler , ikinci grup ise sigorta bedeli 1410 YTL’den büyük olanlar olarak ayrı lmı ş tı r.Buna göre ; Sigorta bedeli 1410 YTL ‘den küçük olan bir müş terinin tamamı Levent semtinde oturmaktadı r. Sigorta bedeli 1410 YTL ve de büyük olan bir müş terinin için ; 120 Sigorta bedeli 1410 YTL ile 2525 YTL arası nda ve sigorta primleri 1373 YTL ‘den küçük olan müş terilerin % 100 Beş iktaş semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 101 YTL ‘den küçük olan müş terilerin % 100 Şiş ili semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ile 10270 YTL arası nda ve sigorta primleri 101 YTL ile 963 YTL arası nda olan müş terilerin % 66,67 ’si Şiş li semtinde oturmaktadı r. Sigorta bedeli 10270 YTL ve daha büyük değerler için ve sigorta primleri 101 YTL ile 963 YTL arası nda olan müş terilerin % 47,62 ’si Beş iktaş semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 963 YTL ile 1111 YTL arası nda olan müş terilerin % 57,14 Şiş ili semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1111 YTL ile 1190 YTL arası nda olan müş terilerin % 100 Beş iktaş semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1190 YTL ile 1373 YTL arası nda olan müş terilerin % 100 Şiş ili semtinde oturmaktadı r. Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1373 YTL ve daha büyük olan müş terilerin oturmaktadı r. 121 % 83,33 Beş iktaş semtinde C4.5 Analizi Bu analiz , en iyi karar ağacı analizidir.Özellikle oluş turmak için kullanı lı r.Veri setine uygulanan veri setinde belirli kurallar analiz süreci aş ağı da belirtilmiş tir. Şekil 3.1. C 4.5 analizi uygulama süreci Uygulanan C4.5 analiz sonucu elde edilen karar ağacı elde aş ağı daki ş ekilde gösterilmektedir. Şekil 3.2. C 4.5 analizi sonucu elde edilen karar ağacıdiyagramı 122 Elde edilen karar ağacı nı n belirlenmesinde sigorta cinsi değiş keni esas alı nmı ş tı r.Buna göre ; Prim değ erleri 341 YTL ‘den az olan müş terilerin % 30,6’sıkonut sigortaları nı tercih etmiş tir. Prim değerleri 341 YTL ve daha fazla olan müş terilerin %51,9 ‘u kaza sigortaları nı, %39,0 ‘ıyangı n sigortaları nıve % 9,1’i konut sigortaları nıtercih etmiş tir. Prim değerleri 341 YTL ve daha fazlasıve sigorta bedeli 82650 YTL ‘den daha fazla olan müş terilerin % 83,3 ‘ü konut sigortaları nı, %16,7’ si kaza sigortaları nıtercih etmiş tir. Prim değerleri 341 YTL ve daha fazlasıve sigorta bedeli 82650 YTL ‘den daha az olan müş terilerin % 2,8 ‘i konut sigortaları nı, %54,9’u kaza sigortaları nıve % 42,3 ‘ü ise yangı n sigortaları nıtercih etmiş tir. Prim değerleri 341 YTL ile 728 YTL arası ndaki değerler ve sigorta bedeli 82650 YTL ‘den daha az olan müş terilerin % 8 ‘i konut sigortaları nı, % 32 ‘si kaza sigortaları nı ve % 60 ‘ıise yangı n sigortaları nıtercih etmiş tir. Prim değ erleri 728 YTL ‘den daha büyük değerler için ve sigorta bedeli 82650 YTL ‘den daha az olan müş terilerin % 67,4 ‘ü kaza sigortaları nıve % 32,6 ‘sıise yangı n sigortaları nıtercih etmiş tir. Müş terilerin tanı mlarıçerçevesinde hangi ürünü daha çok aldı kları nıgösteren C4.5 analizi , özellikle satı ş kampanyaları nı n belirlenmesinde oynamaktadı r. 123 önemli bir rol 3.3.2. Kümeleme Analizleri Kümeleme analizleri , veri setindeki belirli gruplara tekniğ idir.Burada atamamı za olanak kullanı lacak olan benzerliklerini dikkate alarak sağlayan önemli bir veri verileri madenciliğ i kümeleme analizleri , K-Ortalamalar ( K- MEANS) analizi ve Kanonikel diskriminant analizidir. K-Ortalamalar ( K-MEANS) Analizi Veri setinin bu yöntemler kümelere ayrı lmasısüreci ş u ş ekildedir. Şekil 3.3. K-ortalamalar analizi uygulama süreci Bu analiz sürecinin sonucunda , oluş an kümelerin yapı larıaş ağı daki tabloda belirtilmiş tir. Tablo 3.13. K-ortalamalar analizi sonucu elde edilen kümeler 124 Oluş turulan kümelerin uygunluk derecesine bakı ldı ğı nda uygunluğu en iyi olan küme 0.686 ile 3.kümedir.İ kinci en iyi uygunluğa sahip olan küme ise 0.579 ile 1.kümedir. Oluş turulan kümelerin grafiksel olarak görüntüsü ş u ş ekildedir. Şekil 3.4. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü 125 Yukarı da belirtilen grafikler , değiş kenlere göre kümelerin oluş turdukları dağı lı mlarıgöstermektedir. Şekil 3.5. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü Yukarı da belirtilen grafikler , değiş kenlere dağı lı mları nıgöstermektedir. 126 göre oluş turulan kümelerin Kümeleri oluş turulan verilerin liste biçimi ş u ş ekildedir. Tablo3.14. K-ortalamalar analizi sonucu elde edilen kümelerin veri listesi Görüldüğü gibi K-ortalamalar analizi veri setinde belirli gruplar oluş turulan gruplara aynı oluş turarak satı ş kampanyası nıuygulamamı za olanak sağlamaktadı r. Kanonikel Diskriminant Analizi Veri setine bu analiz sigorta cinsi esas alı rak uygulanmı ş tı r.Buradan elde edilen vektörlerin tablosu ş u ş ekildedir. Tablo 3.15. Kanonikel diskriminant analizi sonuçları 127 Buradan elde edilen vektörler ş unlardı r. Z1 4,8 0.09 M 0 S 0, 0003 P Z2 0,915 0, 0114 M 0 S 0, 0017 P Bu vektörlerin güvenirlilik tablosu aş ağı daki belirtilmiş tir. Tablo 3.16. Kanonikel diskriminant analizi sonuçcu elde edilen vektörler P test istatistiğine bakı ldı ğı nda Z1 ve Z 2 vektörlerinin anlamlıbir vektör olduğu söylenebilmektedir. Tablo 3.17. Elde edilen vektörlerle değiş kenler arası ndaki iliş ki Z1 vektörü , müş teri numarasıdeğiş keni ile pozitif yönde 0.996 oranı nda , sigorta bedeli değiş keni ile pozitif yönde 0,006 oranı nda ve primler değiş keni ile ters yönde 0,269 oranı nda bir iliş ki vardı r. 128 Z2 vektörü , müş teri numarasıdeğiş keni ile ters yönde 0.043 oranı nda , sigorta bedeli değiş keni ile pozitif yönde 0,542 oranı nda ve primler değiş keni ile ters yönde 0,553 oranı nda bir iliş ki vardı r. Burdan elde edilen vektörlerin grafiksel görüntüsü ş u ş ekildedir. Şekil 3.6. Elde edilen vektörlerle arası ndaki iliş kiyi gösteren grafik Bu grafikteki X ekseni , veri setinin gruplanması na yardı mcı olmaktadı r.X- ekseninde , -1 ile –3 değerleri arası ndaki veriler iyi , -1 ile 1 değerler arası ndaki veriler normal ve 1 ve 3 değerleri arası ndaki veriler kötü olarak tanı mlanmaktadı r.Buna göre kaza sigortasıdeğerleri normal gruba girerken yangı n sigortasıiyi ve de konut sigortasıkötü gruba girmektedirler. Yukarı daki grafikteki y ekseninde sigorta bedeli değiş keni ve x eksenine de Z1 vektörü yerleş tirildiğ inde grafik aş ağı daki ş eklini almaktadı r. 129 Bu grafikte görüldüğü gibi , drama ve aksiyon filmleri satı n alan müş terilerin Şekil 3.7. Z1 vektörü ile satı n alma miktarıarası ndaki iliş kiyi gösteren grafik Z1 vektörü üzerindeki dağı lı mı na bakı ldı ğı nda kaza sigortaları nı n iyi , konut sigortaları nı n normal ve de yangı n sigortalarıkötü gruba girmektedir. Yukarı daki grafikteki y ekseninde sigorta bedeli değiş keni ve x eksenine de Z2 vektörü yerleş tirildiğ inde grafik aş ağı daki ş eklini almaktadı r. 130 Şekil 3.8. Z 2 vektörü ile satı n alma miktarıarası ndaki iliş kiyi gösteren grafik Z2 vektörü üzerindeki dağı lı mı na bakı ldı ğı nda kaza ve yangı n sigortalarınormale yaklaş mı şiken konut sigortaları nda ise bir değiş iklik olmamı ş tı r. 111 adet x sigorta ş irketinin verilerine yapı lan sepet analizinin kadı n müş terilerin çoğunluğunun konut sigortaları nı tercih ederken erkek müş teriler ise kaza sigortaları nıağı rlı klıolarak tercih ettikleri görülmektedir.Türkiye genelinde erkek ve kadı n statülerinin yukarı da yapı lan analiz sonuçları nı etkilediği yani cinsiyetin tercih edilen sigorta poliçesinin üzerinde yüksek bir etkiye sahip olduğu söylenebilmektedir.Yapı lan karar ağacı analiz sonuçları na bakı ldı ğı nda 341 YTL primden daha az prim ödeyen müş terilerin konut sigortası nıtercih ettikleri ortaya çı kmı ş tı r.K-ortalamalar analizinin 131 sonucunda oluş turulan veri kümelerinin tamamı na yakı nı % 40 anlamlı lı k düzeyini aş mı ş tı r.Kanonikel diskiriminant analizi sonucunda ise özellikle konut sigortasıverilerini azaltarak veriyi daha anlamlıbir hale getirebileceği ortaya çı kmı ş tı r. SONUÇ Bu çalı ş mada , son yı llarda yaygı nlaş an veri madenciliği ve müş teri iliş kileri yönetimi detaylıbir ş ekilde incelenmiş tir.Müş teri iliş kileri yönetimi aslı nda bir iş letme felsefesi olup daha çok satı ş kampanyaları nı n baş arı lı olması için kullanı lan bir tekniktir.Veri madenciliğ i ise satı ş kampanyaları nda kullanı lacak olan hedef ya da hedef grupları nı n tespit edilmesinde kullanı lmaktadı r. Sigorta ş irketlerinin gerek müş teri portföylerini arttı rmak ve de varolan müş teri portföyünü korumak için müş teri iliş kileri yönetimine ihtiyaç duymaktadı r.Yoğun rekabet ortamı nda poliçe satı n alan müş terilerin devamlı lı ğı nısağlamak , kar marjı nıarttı rmak için , özetle ş irketlerin hayatta kalabilmesi için uygulanması gerek ve ş art bir sistemdir.Özellikle verilen poliçelerin müş teriye özel bir hale dönüş türülmesinin faydaları ve de sağladı ğı kar marjı nı n yüksek olacağ ı görülebilmektedir.Mal , eş ya satan bir firmadan hizmet satan sigorta ş irketleri müş teri iliş kileri yönetiminin uygulamaları na çok daha müsaittir. Veri madenciliğ i özellikle mevcut müş teri bilgilerini özetleyerek veya verileri arı ndı rarak verileri daha kullanı ş lıhale getirilmesine olanak sağ lamaktadı r. İ ş letmelerin bilgi bombardı manı ndan kurtularak verileri amaçları na uygun kullanma imkanıvermektedir. Sigortacı lı k sektörüne bakı ldı ğı nda ise gerek veri madenciliği gerekse müş teri iliş kileri yönetimi yeni yeni yaygı nlaş maya baş lamı ş tı r.Özellikle banka bağlantı lı olan sigorta ş irketleri , müş teri iliş kileri yönetimi için pazarlama departmanı na bağlıbölümler oluş turmaktadı rlar.Bu oluş turulan bölümlerin amacısatı şve satı ş sonrası destekte müş teri iliş kileri yönetimini ve de veri kullanmaktı r. 132 madenciliğini Gerek müş teri iliş kileri yönetimi (CRM ) gerekse veri madenciliği uygulanabilmesi için belirli bir düzeyde teknoloji desteğine ihtiyaç duymaktadı rlar.Veri değerleri ne kadar fazla olursa teknolojiye olan ihtiyaç da o kadar artmaktadı r. Veri madenciliğinden elde edilen sonuçları n ş irketlerin müş terilerini daha iyi tanı maları na olanak sağladı ğıiçin müş teri ihtiyaçlarıdaha kesin bir ş ekilde tespit edilebilmektedir. Bu çalı ş manı n incelenen müş teri iliş kileri yönetimi (CRM) sonucunda müş teri iliş kileri yönetiminin bir felsefe olduğu , veri tabanıve veri analizine bağlıolarak belirli bir uygulama süreci sonucunda elde edildiği , elde edilen değerler kullanarak müş terilere özel ürün oluş turma süreci olduğu ortaya çı kmı ş tı r. Bu çalı ş manı n ayrı ca veri madenciliği incelenmiş tir.Veri madenciliğinin çok teknik bir konu olduğu , uygulamanı n yapı labilmesi için teknoloji desteğe ihtiyaç duyulduğu ortaya çı kmı ş tı r.Veri madenciliği , genel olarak istatistik analiz yönetemlerinin çok sayı da veri kümesine uygulanmasısonucunda müş teri iliş kileri yönetimi için hedef gruplar oluş turmayıamaçladı ğıgörülebilmektdir. Bu çalı ş manı n uygulaması nda ise x sigortaş irketinin müş teri verileri kullanı larak sigorta sektöründe veri madenciliğ i kullanı mı nı n sonuçlarıdeğ erlendirilmiş tir.Veri setine uygulanan analizlerin ana baş lı kları na bakı ldı ğı nda bunlar ; birliktelik kurallarıanalizi , sı nı flandı rma analizleri ve de kümeleme analizleridir. Birliktelik kuralları analizi sonucunda erkek müş terilerin çoğunluğun kaza sigortaları nı tercih ederken kadı n müş teriler ise konut sigortası nıtercih ettikleri görülmüş tür. Yapı lan sı nı flandı rma analizi sonucunda ise , 341 YTL değerinden küçük prim ödeyenlerin kaza sigortaları nı tercih ettikleri , 341 YTL prim değerinden fazla ödeme yapan ve sigorta bedelleri 82 650 YTL’den büyük olan bir malı sigortalayan müş terilerin çoğunlu konut sigortası nıtercih etmiş tir.Ayrı ca 341 ila 133 728 YTL arası nda prim ödeyip sigorta bedeli 82 650 YTL’den az olan bir malı sigortalayan müş teri ise yangı n sigortası nıtercih etmektedir. Kümeleme analizi sonucunda 5 adet küme oluş turulmuş tur.En çok veriye sahip olan küme % 51 anlamlı lı k derecesiyle 46 veriye sahiptir.En anlamlıküme ise % 69 ile 18 veriye sahiptir. Bu çalı ş mada görüldüğü üzere veri madenciliği teknikleri müş terileri sı nı flandı rmak , kümelemek ve de davranı şolası lı kları nı tahmin etmekte oldukça güçlü analizleri içermektedir.Yapı lan çalı ş mada özellikle bankacı lı k sektöründe yaygı n olarak kullanı lan müş teri iliş kileri yönetimi ve veri madenciliği teknikleri sigortacı lı k sektöründe de uygulanmaya çalı ş ı lmı ş tı r.Ürün-müş teri , ş irket-müş teri arası ndaki iliş kileri ortaya konularak müş terilerin tercihlerine göre poliçe satı ş ı nda artı şsağlanmaya çalı ş ı lmı ş tı r. 134 KAYNAKÇA 1. http://www.microsoft.com/turkiye/dynamics/crm/crm_nedir.mspx 2. http://www.biymed.com/pages/makaleler/makale49.htm 3. http://www.apluspost.com/bilgi_teknoloji.php 4. http://www.kobifinans.com.tr/bilgi_merkezi/020305/14318 5. www.tepum.com.tr/Etkinlikler/crm_nedir.pps 6. 65.110.73.19/UploadsNew/Gallery/Presentations/CRM/CRM-distribution.pps 7. http://www.ixirteknoloji.com.tr/crm_nedir.html 8. 65.110.73.19/UploadsNew/Gallery/Seminars/ICT3/III_CRM_AwarenessHandouts.pdf 9. www.srdc.metu.edu.tr/webpage/documents/Kosgeb/CRM_KOSGEB.ppt 10. http://www.sauemk.com/makale.html 11. http://www.erpcrm.com/crm_anasf/crm_nedir.htm 12. http://blog.inspark.com/blog/2006/10/mteri_liklileri.html 13. http://www.herkesmusteri.com/scrm/crmbasarisiz.aspx 14. A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth-Heinemann Publishers 2005. 15. P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley Publishers 2004. 16. O.C.Gel , CRM Yolculuğu ,Sistem Yayı ncı lı k 2004. 17. A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı ncı lı k , 2007. 18. Y.ZENGİ N, Değer Yaratan Müş teri İ liş kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv. ,2006 19. R.S. SWIFT ,Accelerating Customer Relationships ,Prentice Hall , 2001. 20. T.T.Bİ LGİ N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans Tezi, Marmara Ünv. ,2003 . 135 21. M. DEMİ RALAY ,Hiyerarş ik Kümeleme Metotları İ le Veri Madenciliği , Yüksek Lisans Tezi, Marmara Ünv. ,2005. 22. H.TATLIDİ L , UygulamalıÇok Değiş kenli İ statistiksel Analiz , Hacettepe ünv. 1996. 23. K.KURTULUŞ,Pazarlama Alı ş tı rmaları,Avcı ol Yayı nı,1998. 24. H.ARICI , İ statiksel Yöntemler ve Uygulamaları, Hacettepe ünv. Yayı nları1998. 25. Ö.SERPER ,Uygulamalıistatistik 1 , Filiz Kitapbevi 1996. 26. K.ÖZDAMAR , SPSS ile Bioistatistik , Kaan Kitabevi 2001. 27. D.GUJARATI , Temel Ekonometri , Literatür Yayı nevi 1999. 28. K.ÖZDAMAR , Paket Programlar ile İ statiksel Veri Analizi , Kaan Kitabevi 1999. 29. N.ORHUNBİ LGE , UygulamalıRegresyon ve Kolerasyon Analiz , İ Ü. Yayı nları 1996. 30. N.ÇÖMLEKÇİ, Deney Tasarı mı ve Çözümlemesi , Anadolu ünv. Yayı nları 1988. 31. M.AYTAÇ , Matematiksel İ statistik , Ezgi Kitabevi 1999. 32. M.SPIEGEL, İ statistik , Bilim Tekik Yayı nevi 1995. 33. Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000. 34. F.NEWELL , CRM Neden Baş arı lıOlmuyor, Sistem Yayı nları2004. 35. E.TAŞKIN , Müş teri İ liş kileri Eğitimi ,Papatya Yayı nları2005. 36. Y.ODABAŞ, Satı ş ta ve Pazarlamada Müş teri İ liş ki Yönetimi , Sistem Yayı nları2005. 37. O.GEL , Büyük Müş teri Yönetimi , Sistem Yayı nları2004. 38. W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss 2005. 39. D.RUAN , Intelligent Data Mining Techniques and Applications ,Springer Publisherss 2005. 40. K.ANDERSON , Customer Relationship Management , McGRaw-Hill Publisherss 2002. 41. F. TOURNIAIRE , Just Enough CRM , Prentice Hall PTR Publisherss 2003. 42. C .TODMAN , Designing a Data Warehouse: Supporting Customer Relationship Management , Prentice Hall PTR Publisherss 2000. 43. N. WOODCOCK , The Customer Management Scorecard: Managing CRM for Profit, Kogan Page Publisherss 2003. 136 44. M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers 2003 . 45. O.RUD , Data Mining Cookbook , Wiley Computer Publishers 2001. 46. S.MITRA , Data Mining Multimedia , Soft Computing and Bioinformatics , Wiley Publishers 2003 . 47. N.YE , The Handbook Of Data Mining , Lawrence Erlbaum Associates Publisherss 2003 . 48. D . HAND , Principles Of Data Mining , The MIT Press 2001. 49. J.WANG , Data Mining Opportunities and Challenges , IDEA GROUP Publishers 2003 . 50. M .BERRY , Data Mining Techniques , Wiley Publishers 2004 . 51. T. JOHNSON , Exploratory Data Mining And Data Cleaning ,Wiley Publishers 2003 52. J. BIGUS , Data Mining With Neural Networks ,McGraw Hill Publishers , 1996 . 53. D.PYLE , Business Modeling And Data Mining , Morgan Kaufmann Publisherss 2003. 54. F.GUILLET , Quality Measures in Data Mining , Springer Publisherss 2007. 55. D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 . 56. L.LOFTIS, Building The Customer-Centric Enterprise , Wiley Publishers 2001. 57. A.Berson , Building Data Mining Application For CRM ,McGraw Hill Publishers 1999. 58. http://www.bendevar.com/v3/makale_326.html 59. http://www.kobifinans.com.tr/yazici.php?Article=8652&Where=bilgi_merkezi&Ca tegory=020305 60. http://www.init.com.tr/news_articles_tr.asp?haber_id=12 61. R.S.TSAY ,Analysis Of Financial Time Series ,Wiley publishers 2005. 62. B.KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002. 63. W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers 2007. 64. N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002. 65. L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And Methods, LEA Publishers 2005 . 137