Slayt 1 - anadolu üniversitesi eczacılık fakültesi
Transkript
Slayt 1 - anadolu üniversitesi eczacılık fakültesi
Varyans Analizi (ANOVA) Kruskal-Wallis H Testi Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Konu Başlıkları • Tek Yönlü Varyans Analizi • SPSS’de Tek Yönlü Varyans Analizi • Kruskal-Wallis H Testi • SPSS’de Kruskal-Wallis H Testi Varyans Analizi Varyans analizi (ANALYSIS OF VARIANCE), normal dağılım gösteren bağımlı ya da bağımsız toplumların ortalamalarına ilişkin hipotezlerin test edilmesinde yararlanılan bir analiz yöntemidir. Varyans Analizi Varyans analizi (ANOVA), k gruptan (k>2) elde edilen veri setinde incelenen değişkene ait olan genel varyansı (genel değişimin), bu değişime katkıda bulunan öğelerine ayırarak analiz etmeyi sağlayan bir yöntemdir. Varyans Analizi Varyans analizi veri yapısına bağlı olarak çok değişik işlevler yerine getiren bir yöntemdir. Veri yapısına ve çalışma dizaynına göre değişik modeller içerir. Bu derste tek yönlü varyans analizi incelenecektir. Tek Yönlü Varyans Analizi Bağımsız k>2 gruplu bir çalışma dizaynında, incelenen bir değişkene ait elde edilen verilerin analizinde yararlanılan bir yöntemdir. K bağımsız örneklem varyans analizi olarak tanımlanabilmektedir. Bağımsız örneklerde t testinin ikiden fazla grup için genellenmiş bir şekli diyebiliriz. Tek Yönlü Varyans Analizi Tek yönlü varyans analizine ait varsayımlar; • İncelenen değişken (Y) her bir toplumda normal dağılım göstermelidir. • Toplum etkileri toplanabilir olmalı ve etkilerin toplamı sıfır olmalıdır. • Grup ortalamaları ve standart arasında bir doğrusallık olmamalıdır. sapmaları Tek Yönlü Varyans Analizi Birbirinden bağımsız 𝜇1 , 𝜇2 , … , 𝜇𝑘 ortalamalı ve 𝜎 2 varyanslı normal dağılım gösteren k tane toplumdan ni hacimli (i=1,2,…,k) rastgele örnek alınarak elde edilen veri setini analiz etmek için tek yönlü varyans analizi kullanılır. Tek Yönlü Varyans Analizi Tek yönlü varyans analizinde test edilen hipotezler aşağıdaki gibidir. 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 𝐻1 : en az bir grup ortalaması diğerlerinden farklıdır. Burada toplumlardan alınan örnekler birbirlerinden bağımsızdır ve örnek birim sayılarının benzer olması gerekmez. Tek Yönlü Varyans Analizi İncelene değişken genel olarak 𝑌𝑖𝑗 olarak gösterilir. Burada; i=1,2,…,k ve j=1,2,…, ni olmak üzere k: grup sayısını j: birim sayısını ni: i. grupa ait örnek büyüklüğünü göstermektedir. Tek Yönlü Varyans Analizi Buradan yola çıkarak incelenen değişkene ait genel ortalama, 𝑌= 𝑛𝑖 𝑗=1 𝑌𝑖𝑗 𝑘 𝑖=1 𝑁 , 𝑁= 𝑘 𝑖=1 Burada genel kareler toplamı, 𝐺𝐾𝑇 = 𝑘 𝑛𝑖 𝑖=1 𝑗=1 𝑛𝑖 (𝑌𝑖𝑗 −𝑌)2 Tek Yönlü Varyans Analizi Genel kareler toplamı gruplar arası kareler toplamı ve grup içi kareler toplamı olarak parçalanabilir. GKT=GAKT+GİKT Grup içi kareler toplamına hata kareler toplamında denilmektedir. Tek Yönlü Varyans Analizi Bu durumda genel kareler toplamı, 𝐺𝐾𝑇 = = Burada 𝑘 𝑖=1 𝑘 𝑛𝑖 𝑖=1 𝑗=1 𝑘 𝑛𝑖 𝑖=1 𝑗=1 𝑛𝑖 𝑗=1 𝑌𝑖𝑗 2 denir DT ile gösterilir. (𝑌𝑖𝑗 )2 − (𝑌𝑖𝑗 −𝑌)2 𝑘 𝑖=1 𝑛𝑖 𝑗=1 𝑌𝑖𝑗 2 𝑁 𝑁 ifadesine düzeltme terimi Tek Yönlü Varyans Analizi Gruplar arası kareler toplamı, 𝑘 𝑖=1 𝐺𝐴𝐾𝑇 = 2 𝑛𝑖 𝑌 𝑗=1 𝑖𝑗 𝑛𝑖 − 𝐷𝑇 Grup içi kareler toplamı, 𝐺İ𝐾𝑇 = 𝑘 𝑛𝑖 𝑖=1 𝑗=1 (𝑌𝑖𝑗 )2 − 𝑘 𝑖=1 2 𝑛𝑖 𝑗=1 𝑌𝑖𝑗 𝑛𝑖 Tek Yönlü Varyans Analizi Genel serbestlik derecesi (gsd)=N-1 Gruplar arası serbetlik derecesi(gasd)=k-1 Grup içi serbestlik derecesi (hsd)=N-k N-1=(k-1)+(N-k) Tek Yönlü Varyans Analizi Kare toplamları ve bir kare toplamına ait serbestlik dereceleri kullanılarak varyans tahminleri olan Kare Ortalamaları hesaplanır. Gruplar arası kareler ortalaması=GAKT/gasd Grup içi kareler ortalaması=GİKT/hsd Grup içi kareler ortalaması aynı zamanda hata kareler ortalaması tahmincisidir. olarak bilinir ve toplum varyansının Tek Yönlü Varyans Analizi Gruplar arasınsaki değişimin önemliliğini test etmek için F test istatistiği kullanılır. 𝐹= 𝐺𝐴𝐾𝑂 𝐻𝐾𝑂 F test istatistiği iki serbestlik derecesine sahip F dağılımı gösterir. Bu dağılımın birinci serbestlik derecesi pay serbestlik derecedir sd1=gasd’dir. İkinci serbestlik derecesi payda serbestlik derecesidir ve sd2=hsd’dir. Tek Yönlü Varyans Analizi Bu durumda hesaplanan F test istatistiği F dağılımından elde edilen F kritik değerine göre karşılaştırılır ve Ftest < F0.05,sd1,sd2 ise p>0.05 olarak hesaplanır. Bu durumda H0 hipotezi kabul edilir. Eğer Ftest > F0.05,sd1,sd2 ise p<0.05 olarak hesaplanır. Bu durumda da H1 hipotezi kabul edilir. Tek Yönlü Varyans Analizi Tek yönlü varyans analizi sonuçları aşağıdaki gibi özet bir tablo halinde sunulur. Değişim Kaynağı Serbestlik Derecesi Kareler Toplamı Kareler Ortalaması F istatistiği P değeri Gruplar Arası k-1 GAKT GAKO GAKO/GİKO P Grup İçi (Hata) N-k GİKT GİKO Toplam (Genel) N-1 GKT - Tek Yönlü Varyans Analizi Tek yönlü varyans analizi sonucuna göre F’in olasılığı önemli olarak nitelendiriliyor ise yani p değeri 0.05’den küçük ise grup ortalamalarından en az bir tanesi diğerlerinden farklıdır hipotezi kabul edilir. Bu durumda hangi grup ya da grupların diğerlerinden farklı olduğu nasıl belirlenir? Tek Yönlü Varyans Analizi Farklı olan grupların belirlenmesinde çoklu karşılaştırma testlerinden yararlanılır. Çok sayıda çoklu karşılaştırma testi vardır. Eşit varyans varsayımının ya da farklı varyans varsayımının dikkate alınmasına göre ikiye ayrılır. Tek Yönlü Varyans Analizi Bu sınıflardaki testler, ortalamaların farklarının önemliliğini birbirleri işe eşanlı karşılaştırma, gruplardan birini kontrol grubu alarak diğerleri ile karşılaştırma, ağırlıklı karşılaştırma, ortalamaları dizerek karşılaştırma katsayılar gibi yaklaşımları içeren testlerdir. kullanarak büyüklük farklı sırasına karşılaştırma Tek Yönlü Varyans Analizi Bu derste ortalamalar arasındaki farkları eşanlı olarak karşılaştırmayı sağlayan Bonferroni (Dunn), Tukey HSD, Tamhane T2 ve kontrol grubuna göre diğer ortalamaları ikili karşılaştırmayı sağlayan Dunnett çoklu karşılaştırma testleri açıklanacaktır. Tek Yönlü Varyans Analizi Bonferroni (Dunn) testi k grup varyanslarının türdeş olduğu durumlarda k ortalamanın ikili karşılaştırmalarını ya da ortalamaları gruplayarak ağırlıklı olarak birbirleri ile karşılaştırmayı sağlayan bir testtir. Tek Yönlü Varyans Analizi Bonferroni testte ikili çiftler için arasındaki karşılaştırmalar için kullanılan test istatistiği, 𝑡= 𝑌𝑖 − 𝑌𝑙 2𝐻𝐾𝑂 𝑛 şeklindedir. Burada i ve l karşılaştırılacak iki grubu göstermektedir. 𝑡 istatistiğinin önemliliği Dunn olasılıklar tablosuna göre belirlenir. Tek Yönlü Varyans Analizi Tukey HSD testinde grup ortalamaları büyüklük sırasına dizilir ve grup ortalamaları arasındaki farklar (Dil) bulunur. HKO ve ortak birim sayısı n0 belirlenir. Qα, k, hsd tablo değeri Q kritik değerler tablosundan belirlenir. Ortalamalar arasında bulunabilecek müsaade edilebilir fark (Dmax) hesaplanır. Tek Yönlü Varyans Analizi 1 𝑛0 = 𝑁− 𝑘−1 𝑆𝐻 = 𝑘 𝑖=1 𝑛𝑖 𝑁 𝐻𝐾𝑂 ; 𝐷𝑚𝑎𝑥 = 𝑄𝛼,𝑘,ℎ𝑠𝑑 × 𝑆𝐻 𝑛0 Eğer iki grup ortalaması arasındaki fark Dmax değerinden büyükse bu gruplar birbirlerinden farklıdır. Tek Yönlü Varyans Analizi Dunnett testi, k gruptan biri kontrol grubu alınarak diğer deneme sonuçlarının kontrole göre farklılığının analizde kullanılır. İ normal bir grubu k’da kontrol grubunu göstermek üzere 𝐷0.05 𝑌𝑘 − 𝑌𝑖 = 𝑄0.05 2𝐻𝐾𝑂 𝑛 Tek Yönlü Varyans Analizi Kontrol grubuna göre grup ortalamalarının önemliliği aşağıdaki gibi belirlenir. 𝑌𝑘 − 𝑌𝑖 < 𝐷0.05 ise p>0.05 olur önemli fark yoktur. 𝑌𝑘 − 𝑌𝑖 > 𝐷0.05 ise p<0.05 olur önemli fark vardır. Tek Yönlü Varyans Analizi Tamhane T2 testi ise grupların varyansları heterojen olduğunda kullanılan çoklu karşılaştırma testidir. Grupların varyansları Levene testi ile değerlendirildiğinde, varyanslar heterojen çıkarsa yararlanılır. Burada verilmeyecektir. hesaplama formülleri SPSS’de Tek Yönlü Varyans Analizi 40 yaş grubu sağlıklı kadınlarda dört farklı boy grubunda FEV1 (litre) değerleri aşağıdaki tabloda verilmiştir. Boy grupları arasında FEV1 (litre) değerleri bakımından farklılık olup olmadığını tek yönlü varyans analizi ile karşılaştıralım. SPSS’de Tek Yönlü Varyans Analizi Örneğe ait hipotezler aşağıdaki gibi kurulur. H0: µ1=µ2=µ3=µ4 H1:Ortalamalardan en az biri diğerlerinden farklıdır. SPSS’de Tek Yönlü Varyans Analizi 155 cm 2.57 2.49 2.56 2.55 2.35 2.42 2.57 2.48 2.49 2.72 165 cm 2.82 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 175 cm 3.09 3.02 3.06 3.17 3.08 3.16 3.11 3.09 3.07 3.04 185 cm 3.30 3.45 3.20 3.37 3.36 3.33 3.38 3.33 3.30 3.27 SPSS’de Tek Yönlü Varyans Analizi Veriler yanda görüldüğü iki sütun halinde SPSS veri sayfasına girilir. FEV1 değişkeni 4 grup alt alta gelecek şekilde girilir. Grup sütununa ise FEV1 ölçümlerinin hangi boy grubuna ait olduğunu gösteren grup kodları girilir. SPSS’de Tek Yönlü Varyans Analizi Örnekte yer alan verilerin tek yönlü varyans analizi ile analiz edilebilmesi için öncelikle normal dağılım göstermesi gerekmektedir. Bunun için verilerin normal dağılıma uygun olup olmadıkları test edilir. SPSS’de Tek Yönlü Varyans Analizi Analyze -> Descriptive Statisticsc -> Explore menüsü kullanılır. SPSS’de Tek Yönlü Varyans Analizi Açılan Explore penceresinde FEV1 Dependent List alanına taşınır. Factor List alanına ise Grup değişkeni atanır. Çünkü her dört grupta da verilerin normal dağılıma uygun olup olmadığı test edilmelidir. SPSS’de Tek Yönlü Varyans Analizi Plots düğmesi tıklanır ve açılan pencerede Normality plots with test seçeneği seçilir. Continue ve OK tıklanır. SPSS’de Tek Yönlü Varyans Analizi Kolmogorov-Smirnov ve Shapiro-Wilk test sonuçlarına göre dört farklı boy grubunda FEV1 değerleri normal dağılım göstermektedir. Çünkü test sonuçlarında yer alan anlamlılık düzeyleri her grup içinde 0.05 değerinden büyüktür. SPSS’de Tek Yönlü Varyans Analizi Tek yönlü varyans analizi uygulamak için Analyze -> Compare Means -> One-Way ANOVA seçeneği tıklanır. SPSS’de Tek Yönlü Varyans Analizi Açılan pencerede Dependent List alanına FEV1 ve Foctor alanına ise boy değişkeni alınır. Options… düğmesi tıklanır. SPSS’de Tek Yönlü Varyans Analizi Açılan pencerede Descriptive seçeneği verilere işaretlenerek ait tanımlayıcı istatistikler istenir. Homogenity of variance test işaretlenerek de varyansların homojen olup olmadığı test edilir. SPSS’de Tek Yönlü Varyans Analizi Çoklu karşılaştırma için PostHoc… düğmesi tıklanır. SPSS’de Tek Yönlü Varyans Analizi Açılan pencerede varyansların eşit olduğu varsayımı altında çoklu karşılaştırmalardan Tukey testi, varyansların eşit olmadığı durumda kullanılacak olan Tamhane T2 testi seçilir. SPSS’de Tek Yönlü Varyans Analizi Yukarıda gruplara göre FEV1 ölçümlerinin tanımlayıcı istatistikleri ve Levene testi sonuçları verilmiştir. Levene testi sonuçlarına göre varyanslar homojendir. SPSS’de Tek Yönlü Varyans Analizi Varyans analizi sonuçları aşağıdaki gibi elde edilir. SPSS’de Tek Yönlü Varyans Analizi Sonuçlar incelendiğinde FEV1 değerlerinin dört farklı boy grubunda farklılık gösterdiği saptanmıştır (F=232.679, p<0.001). Bu durumda H1 hipotezi kabul edilir. Peki hangi gruplar birbirlerinden farklıdır? SPSS’de Tek Yönlü Varyans Analizi Bu sorunun cevabını bulmak için çoklu karşılaştırma sonuçları incelenmelidir. SPSS’de Tek Yönlü Varyans Analizi Çoklu karşılaştırma sonuçları incelendiğinde tüm grupların FEV1 değişkeni bakımından farklı olduğu saptanmıştır. Kruskal-Wallis H testi Kruskal-Wallis H testi (KWH) parametrik olmayan tek yönlü varyans analizi yöntemidir. K bağımsız örneğin benzer ortanca değerli toplumların rastgele örnekleri olup olmadığını test eder. KWH testi uygulanacak verilerin aralıklı ya da oransal ölçekli olması gerekir. Kruskal-Wallis H testi KWH testinde aşağıdaki hipotezler test edilir. H0: k örnek benzer medyanlı toplumlardan alınmış örneklerdir. H1: k örnekten an az birinin medyanı diğerlerinden farklıdır. Kruskal-Wallis H testi KWH testinde gözlem değerleri yerine bu değerlere ait sıralama puanları kullanılır. Her grubun sıralama puanları toplamı ele alınarak H test istatistiği aşağıdaki gibi hesaplanır. 𝐻= 12 𝑘 𝑖=1 𝑛𝑖 (𝑅𝑖 − 𝑅)2 𝑁(𝑁 + 1) Burada 𝑅𝑖 i. gruba ait sıralama puanlarının ortalamasını, 𝑅 ise sıralama puanlarının genel ortalamasını göstermektedir. Kruskal-Wallis H testi H test istatistiği (k-1) serbestlik dereceli ki-kare dağılımı gösterir ve 𝐻 < 𝜒0.05,(𝑘−1) ise p>0.05 olarak elde edilir ve grupların medyan değerleri farklı değildir sonucuna varılarak H0 hipotezi kabul edilir. 𝐻 > 𝜒0.05,(𝑘−1) ise p<0.05 olarak elde edilir ve grupların medyan değerleri farklıdır sonucuna varılarak H1 hipotezi kabul edilir. Kruskal-Wallis H testi KWH testinde anlamlı sonuç bulunduktan sonra hangi grupların birbirlerinden farklı olduğunu belirlemek için parametrik olmayan çoklu karşılaştırma testleri kullanılır. Burada parametrik olmayan çoklu karşılaştırma testlerine ait hesaplamalar gösterilmeyecek SPSS uygulamasında anlatılacaktır. SPSS’de Kruskal-Wallis H testi Önceki örnekteki veriler aşağıdaki gibi elde edilmiş olsun. Aynı şekilde dört farklı boy grubuna göre FEV1 değerleri bakımından fark olup olmadığını araştıralım. SPSS’de Kruskal-Wallis H testi 155 cm 3.90 2.49 2.56 2.55 3.85 2.42 2.10 2.48 2.49 2.72 165 cm 3.80 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 175 cm 3.09 3.02 3.06 3.17 3.08 3.16 3.11 3.09 3.07 3.04 185 cm 3.30 3.45 3.20 3.37 3.36 3.33 3.38 3.33 3.30 3.27 SPSS’de Kruskal-Wallis H testi Veriler yanda görüldüğü iki sütun halinde SPSS veri sayfasına girilir. FEV1 değişkeni 4 grup alt alta gelecek şekilde girilir. Grup sütununa ise FEV1 ölçümlerinin hangi boy grubuna ait olduğunu gösteren grup kodları girilir. SPSS’de Kruskal-Wallis H testi Örnekte yer alan verilerin tek yönlü varyans analizi ile analiz edilebilmesi için öncelikle normal dağılım göstermesi gerekmektedir. Bunun için verilerin normal dağılıma uygun olup olmadıkları test edilir. SPSS’de Kruskal-Wallis H testi Analyze -> Descriptive Statisticsc -> Explore menüsü kullanılır. SPSS’de Kruskal-Wallis H testi Açılan Explore penceresinde FEV1 Dependent List alanına taşınır. Factor List alanına ise Grup değişkeni atanır. Çünkü her dört grupta da verilerin normal dağılıma uygun olup olmadığı test edilmelidir. SPSS’de Kruskal-Wallis H testi Plots düğmesi tıklanır ve açılan pencerede Normality plots with test seçeneği seçilir. Continue ve OK tıklanır. SPSS’de Kruskal-Wallis H testi Kolmogorov-Smirnov ve Shapiro-Wilk test sonuçlarına göre 155cm ve 165cm boy grubunda grubunda FEV1 değerlerinin normal dağılım göstermemektedir. Bu durumda tek yönlü varyans analizi kullanılamaz. SPSS’de Kruskal-Wallis H testi Bu şartlar altında tek yönlü varyans analizinin parametrik olmayan alternatifi olan Kruskal-Wallis H testi kullanılır. SPSS’de Kruskal-Wallis H testi Analyze -> Nonparametric Tests -> Independent samples… seçeneği tıklanır. SPSS’de Kruskal-Wallis H testi Açılan pencerede Fields sekmesinde Test Fields alanına FEV1 ve Groups alanına ise boy değişkeni alınır. Sonra Settings sekmesi tıklanır. SPSS’de Kruskal-Wallis H testi Açılan pencerede Customize tests işaretlenir. Sonra Kruskal-Wallis 1-way ANOVA (k samples) işaretlenir ve Multiple comparions’dan All pairwise seçilir. Run düğmesi tıklanır. SPSS’de Kruskal-Wallis H testi Analiz sonucunda sonuçlar elde edilir. aşağıdaki tabloda gösterilen SPSS’de Kruskal-Wallis H testi Sonuçlar incelendiğinde FEV1 değerlerinin dört farklı boy grubunda farklılık gösterdiği saptanmıştır (p<0.001). Bu durumda H1 hipotezi kabul edilir. Peki hangi gruplar birbirlerinden farklıdır? SPSS’de Kruskal-Wallis H testi Farklı grupları belirlemek için öncelikle elde edilen analiz sonuçlarını gösteren tablonun üzerine çift tıklanır. Model Viewer penceresi açılır. SPSS’de Kruskal-Wallis H testi Model Viewer penceresi SPSS’de Kruskal-Wallis H testi Model Viewer penceresinde View alanında Pairwise Comparisons seçilerek çoklu karşılaştırmalar elde edilir. SPSS’de Kruskal-Wallis H testi Sonuçlar incelendiğinde 155cm ile 185cm ve 165cm ile 185cm boy gruplarında farklılık olduğu gözlenmektedir.