İstatistik Kavramları
Transkript
İstatistik Kavramları
İSTATİSTİK Zehra DAĞLI NEDIR? NEREDE KULLANıLıR? CANLILARIN ÖZELLİKLERİ VE BUNLARI ETKİLEYEN ÖGELER ARASINDAKİ NEDENSELLİK BAĞLARINI, YÖNTEMBİLİMSEL DEĞERLENDİRME KURGULARI VE OLASILIK KURAMI ÇERÇEVESİNDE AÇIKLAMAYA ÇALIŞAN BİLİM DALIDIR.... NORMALLIK SıNıRı VE P DEĞERI Toplum normlarına göre, denetlenen farkın normal ya da anormal (anlamlı farklı) olduğu, başlangıçta kabul edilen güven düzeyi (%95) temelinde yargılanır. Bahsedilen güven düzeyinin dışında kalan olasılık yanılgı payı ( =%5) olarak değerlendirilir ve uygulanan tüm istatistiksel testlerin sonucu bu p olasılığına kadar indirgenerek yorumlanır. BILIMSEL ARAŞTıRMA BASAMAKLARı Gözlem-Sezgi Hipotez Gerçekleme Genelleme HİPOTEZİN KURGULANMASI Hipotez, araştırmacının kendi bilgi birikiminden veya daha önce yapılmış gözlemlerden faydalanarak önerilir. Örneğin, tedavi grupları arasında fark vardır. H1 (alternatif hipotez); araştırmacının geçerliliğini denetleyeceği başlangıçta doğru olarak kabul ettiği hipotez. (FARK VAR) H0 (sıfır hipotezi); H1 Hipotezinin doğru olmadığını öne süren doğal hipotez. (FARK YOK) HİPOTEZ H1 Para ile mutluluk arasında ilişki vardır Para arttıkça mutluluk artar Para arttıkça mutluluk azalır H0 Para ile mutluluk arasında ilişki yoktur H1 Kadınlarla erkekler arasında dedikodu yapma oranları farklıdır Kadınlar erkeklerden daha çok dedikodu yapar Erkekler kadınlardan daha çok dedikodu yapar H0 Kadınlar ve erkekler arasında dedikodu yapma oranları bakımından fark yoktur HİPOTEZ H1 Para ile mutluluk arasında ilişki vardır (r ≠ 0) Para arttıkça mutluluk artar (r > 0) + Para arttıkça mutluluk azalır (r < 0) H0 Para ile mutluluk arasında ilişki yoktur (r = 0) H1 Kadınlarla erkekler arasında dedikodu yapma oranları farklıdır (m1 ≠ m2) Kadınlar erkeklerden daha çok dedikodu yapar (m1 < m2) Erkekler kadınlardan daha çok dedikodu yapar (m1 > m2) H0 Kadınlar ve erkekler arasında dedikodu yapma oranları İSTATISTIKSEL DEĞERLENDIRME Hangi hipotez doğru? p<0.05 => H1 DOĞRU KABUL EDİLİR Yani hipotez (çok düşük bir yanılma payı ile) genel geçerliliği olan yeni bir sonuç olarak kabul edilir. p>0.05 => H0 KABUL EDİLİR Hipotez kabul edilemeyecek kadar çok yanılmaktadır %95 RED %2,5 KABUL RED %2,5 p değeri: bir fark olduğunu söylerken onun gerçekte olmama olasılığıdır Karar Hataları EVRENSEL GERÇEK Ho DOĞRU ARAŞTIRMA SONUCU KARAR Ho DOĞRU Ho Kabul H1 DOĞRU Ho Red DOĞRU KARAR H1 DOĞRU 2.Tip HATA () 1.Tip HATA () DOĞRU KARAR (1- =Power) 1.TİP HATA() Gerçekte FARKSIZLARA yanlış olarak FARKLI denmesi. 2.TİP HATA() Gerçekte FARKLILARA yanlış olarak FARKSIZ denmesi. GERÇEKLEME 1. Uygun kurgunun tasarlanması 2. Değişkenlerin Saptanması -Değişken sayısının belirlenmesi 3. Verilerin doğru ve güvenilir toplanması (Veri girişi) 4. Verilerin uygun analizi 5. Verilerin doğru sunumu İSTATİSTİK ANALİZE HAZIRLIK Veri tabanı oluşturun Verileri kodlayın ve bilgisayara ortamına aktarın. Verilerde hata kontrolünü yapın. Eksik verilere ne yapılacağına karar verin. Aşırı değerlere ne yapacağınıza karar verin Yeniden kodlamaları yapın Değişkenlerin dağılımını belirleyin (çok önemli) VERILERIN DAĞıLıM ÖZELLIĞI NIÇIN ÖNEMLIDIR? İstatistikte dağılımın normal olup olmadığının belirlenmesi çok önemlidir. Farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin tümünün uygulanabilmesi için verilerin dağılımının normal olması gerekir. Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile araştırılır. NORMAL DAĞıLıM Doğadaki ve toplumdaki çok şeyin dağılımı çan eğrisine benzer Skewness Denekler ortalamadan daha büyük değerlerde toplanıyorlarsa, negatif basık ya da soldan basık (negatively skewed, skewed to the left), küçük değerlerde toplanıyorlarsa, pozitif basık ya da sağdan basık (positively skewed, skewed to the right) dağılımdan söz edilir . Mean, median ve mode farklıdır. Unimodal’da mean kuyruğa doğru çekilir. Median mean ile mode arasına düşer. KURTOSıS Dağılımın şeklinin ölçüsüdür. Pozitif değerler dağılımın dik, negatif değerler ise yassı olduğunu gösterir. BAŞARI 4 yaşında başarı ....donuna işememektir. 12 yaşında başarı..........arkadaş bulabilmektir. 16 yaşında başarı.................araba sürebilmektir. 20 yaşında başarı........................seks yapabilmektir. 35 yaşında başarı .......................para kazanabilmektir. 50 yaşında başarı .......................çok para kazanabilmektir. 60 yaşında başarı ........................seks yapabilmektir. 70 yaşında başarı ................araba sürebilmektir. 75 yaşında başarı .........arkadaş bulabilmektir. 80 yaşında başarı ....donuna işememektir. Buna ÇAN EĞRİSİ denir!.. Prof. Albert Follanberg NORMAL DAĞıLıM NASıL ANLAŞıLıR? 1. 2. 3. 4. Grafikler ile Merkezi ölçütler ve Dağılım ölçütleri ile Skewness ve kurtosis değerleri ile Hipotez testleri ile 1. GRAFIKLER ILE 1. 2. Değerlerin histogramını çizerek Ya da "normal olasılık grafiği" (normal probability plot) adı verilen grafiğini çizerek araştırılabilir. 2. Merkezi ve yayılım Ölçütleri ile 1. Ortalama, median ve mod birbirine yakın olmalı 2. Standart Sapma Ortalamanın yaklaşık ¼ ü 3. Skewness ve Kurtosis sıfıra yakın olmalı 3. Basıklık ve çarpıklık değerleri ile 1. Skewness ve Kurtosis sıfıra yakın olmalı 4. Testlerle 1. Shapiro-Wilks’ ve Kolmogorov Smirnov testleri bu amaç için sıklıkla kullanılan testlerdir. p değeri < 0.05 ise, dağılım normal değil. Özellikle denek sayısı fazlaysa, genellikle tüm normal dağılım testleri ile "p < 0.05" bulunabilir. Bu nedenle bu durumlarda grafik değerlendirmeler yapılmalı DAĞıLıM ŞEKLI ÖLÇÜTLERI VERILERIN DAĞıLıM ÖZELLIĞI NIÇIN ÖNEMLIDIR? İstatistikte dağılımın normal olup olmadığının belirlenmesi çok önemlidir. Farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. 1. Veriyi tablolarda hangi ölçütler ile özetleyeceğiniz 2. Hangi grafiği seçeceğiniz 3. Hangi hipotez testini seçeceğiniz Dağılıma bağlıdır NORMALLER TEHLIKELIDIR VERILERIN ANALIZI Tanımlayıcı İstatistikler Değişkenin örnek ya da toplum özelliklerini yansıtan değerlere tanımlayıcı istatistikler adı verilir. İki ana gruba ayrılır. Tanımlayıcı İstatistikler Merkezi Eğilim Ölçütleri Mean (Aritmetik ortalama) Median Mod (Ortanca) (Tepe noktası) Yayılım Ölçütleri Değer aralığı (range) Standart Değişim sapma ve varyans, standart hata (varyasyon) katsayısı Persentil Çeyrekler arası aralık Güvenirlik aralıkları Aritmetik Ortalama Değerlerin toplamının denek sayısına bölünmesiyle elde edilen aritmetik ortalama en sık kullanılan merkezi eğilim ölçütüdür. Sayısal değişkenler için merkezi eğilim ölçütü olarak ortalama kullanılır. Medyan-Ortanca Küçükten büyüğe (ya da büyükten küçüğe) doğru sıralandığında tam ortadaki deneğin değeridir. Ordinal veriler için en iyi merkezi dağılım ölçütüdür Ortanca aşırı değerlerden etkilenmez. Bu nedenle aşırı uç değerler varsa, sayısal veriler için de ortanca tercih edilmelidir. Mod En sık tekrarlayan değer Not: Dağılım normal ise ortalamayı, normal değil ise medyanı verin YAYILIM ÖLÇÜTLERİ STANDART SAPMA VE VARYANS: SD, sd ya da s ile gösterilen standart sapma, değişken değerlerinin ortalamanın etrafındaki yayılmasını temsil eden bir yayılma ölçütüdür. Değerler arasında farklar arttıkça standart sapma ve varyans büyür. Standart sapmanın karesine varyans adı verilir. Standart sapma ve varyans, birçok istatistik analiz yönteminin temelini oluşturur. YAYILIM ÖLÇÜTLERİ DEĞER ARALIĞI (Range): Değişken değerlerinin dağılımını belirten yararlı bir ölçüttür. En büyük ve en küçük değer arasındaki fark değer aralığıdır (range). Değer aralığı da, ortalama gibi uç değerlerden çok etkilenir. Üstelik en uçtaki iki değer arasında kalan değerler hakkında bilgi vermez. YAYILIM ÖLÇÜTLERİ PERCENTİLLER: Çeyreklikler Laboratuar değerlerinin alt ve üst normal sınırlarının belirlenmesinde kullanılır. Genellikle kabul edilen alt normal sınır 2.5 persentil ve üst normal sınır 97.5 persentildir. ÇEYREKLER ARASI ARALIK: 25. ve 75. persentil değerleri arasındaki farka çeyreklerarası aralık (interquartile range) adı verilir. Yani değerlerin ortada yer alan %50’si, çeyrekler arası aralıktır. GÜVEN ARALIKLARI Güven Aralığı: Verilerin evren içinde bulunabileceği aralığın, bu aralıkta bulunma olasılığı ile birlikte verilmesidir. (%95, %99 güven aralığı, gibi) Ortalama için güven aralıkları: Evren ortalamasının içine düşmesinin beklendiği bir (a,b) aralığıdır. Oranlar için güven aralıkları: Evren oranının içine düşmesinin beklendiği bir (p1, p2) aralığıdır. NE ZAMAN HANGISINI KULLANALıM? 1. Dağılım normal ise mean 2. Dağılım normal değil ise median 1. Merkezi eğilim ölçütü olarak ortalama kullanıldığı zaman, yayılma ölçütü olarak da standart sapma kullanılır. Ortalama ± SS 2. Ortanca kullanılacaksa minimum maksimum değerleri verilir. Medyan (min-max) VERİNİN ÖLÇÜM BİÇİMİ Bazı veriler ölçülür: boy uzunluğu, ağırlık, hemoglobin değeri, kolesterol miktarı, hastanede yatılan gün sayısı, günlük diyetle alınan yağ miktarı. Bazıları ise isimlendirilir: cinsiyet, meslek, hastalık cinsi,, yapılan ameliyatın türü, alınan ilaç. BAĞIMLI VE BAĞIMSIZ GRUPLAR İki ya da daha çok grup karşılaştırılması yapılıyorsa, grupların bağımlı ya da bağımsız olduğunu bilmek çok önemlidir. Bağımlı grup: 1 birey (birim) den birden fazla ölçüm alınması ile oluştuğu durumdur. Bağımsız grup: Ölçümlerin birbirinden farklı birey ya da gruplarda yapıldığı durumdur. Bağımsız grup A ilacının 5.dakikadaki kalp atım hızı ile B ilacının 5.dakikadaki kalp atım hızı Bağımlı grup A ilacının 5.dakikadaki kalp atım hızı ile A ilacının 10.dakikadaki kalp atım hızı GRUP SAYISI 1. 2. 3. Tek grup 2 grup 3 ve daha fazla grup GRUP SAYıSı VE ÖLÇÜM SAYıSı 1. 2. 3. 4. 5. 6. Tek grup 2 grup Tek grupta 2 zamanlı ölçüm 2 ve daha fazla grup Tek grup 2 den fazla ölçüm 2 den fazla grup 2 den fazla ölçüm GRUP SAYıSı VE ÖLÇÜM SAYıSı Tek grup-Panik hastalarda ank. skoru 2 grup- Panik ve OKB ank. skoru Tek grupta 2 zamanlı ölçüm-Panik hastalarda A ilacı öncesi ve 3 ay sonrası ank. skoru 3 ve daha fazla grup- Panik, OKB ve sağlıklı kontrollerde ank skoru Tek grup 2 den fazla ölçüm-Panik hastalarda başlangıç, 1 ay 3 ay 6 ay sonrasında ank skoru 3 den fazla grup 3 den fazla ölçüm- Panik hastalara A ilacı; 1, 3, 6 ay ank skoru; panik hastalara kognitif terapi; 1,3, 6 ay ank. skoru GRUPLARDAKİ KİŞİ SAYISI (N) Önemlilik testlerinde ‘30’ sayısı; istatistiksel teori içinde anlam taşıdığından önemlidir. 30 ve daha büyük örnekli gruplara test gücü daha fazla olan parametrik testler uygulanır.-merkezi limit teoremine dayanır Asıl dayanak dağılımın normal olmasıdır. n sayısı 500 de olsa değişken normal dağılmıyorsa parametrik test seçilemez NNT Tedavi için gerekli sayı Number needed to treat (NNT) İstenen olumlu sonuca ulaşılacak her bir hasta için, tedavi edilmesi gereken hasta sayısı 1/ ARR = 1/ EER-CER TIPTA KARAR VERME •Tıpta tanı yöntemleri ile ilgili araştırmaların büyük bir bölümü, tanı yöntemlerinin doğruluğunun kestirilmesi ve karşılaştırılmasına ayrılmıştır. •Tanı doğruluğunu gösterecek değişik ölçüler geliştirilmiş, bu amaç için klinik çalışma düzenleri tanımlanmıştır. •Son yıllarda giderek artan öneminin nedenlerinden biri de hasta bakım maliyetleri üzerine olan etkisidir. Tanı testinin kullanılabilir olması için I- Hastanın durumu hakkında güvenilir bilgi sağlaması II- Hastanın tedavisi ile ilgili hekimin planları üzerinde etkili olabilmesi III- Hastalar üzerinde test tekrarlandığında hastalık mekanizmalarını yada hastalığın doğal seyrini anlatabilmesi TANı TESTı PERFORMANSLARı NASıL DEĞERLENDıRıLıR A - Özgün oranlar B - Kestirim gücü C- ROC eğrisi Kappa katsayısı, Mc-Nemar testi; DUYARLILIK Testin toplumdaki hastaları saptayabilme gücü Payda (toplumdaki) gerçek hastalar SEÇİCİLİK Testin toplumdaki sağlamları saptayabilme gücü Payda (toplumdaki) gerçek sağlamlar Duyarlılık (Sensitivity): Gerçekte hasta olanlar arasında testin pozitif sonuç verme oranı Seçicilik (Specificity): Gerçekte hastalığa sahip olmayanlar arasında testin negatif sonuç verme oranı Yanlış pozitif oran: Gerçekte hastalığa sahip olmayanlar arasında testin yanlışlıkla pozitif sonuç verme oranı=1-Seçicilik Yanlış negatif oran: Gerçekte hasta olanlar arasında testin yanlışlıkla negatif sonuç verme oranı=1-Duyarlılık TANı VE TARAMA TESTLERI Altın Test + - a/a+c = Duyarlılık b d/b+d = Seçicilik d a/a+b = + PD Test + - a c Doğru pozitif oran Doğru negatif oran 1-Seçicilik d/c+d = - PD 1-Duyarlılık DP ve DN oranlar hastalık prevelansından etkilenmezler. YN Tedavinin gecikmesi YP Riskli, gereksiz, ileri tetkikler, Yanlış tedavi, Yanlış tanımlama DP-DN Hastalık şiddeti, anatomik özellikler, hasta özellikleri LIKELIHOOD RATIO OLABILIRLIK ORANı •OLABİLİRLİK ORANI Bir tanı testinin duyarlılığını ve seçiciliğini birleştirerek kullanan performans ölçüsüdür Pozitif Olabilirlik Oranı; Bir testin hasta kişide pozitif çıkma olasılığının, sağlam kişide pozitif çıkma olasılığına oranı LR (+) = duyarlılık / (1-seçicilik) LIKELIHOOD RATIO Pozitif Olabilirlik Oranı • POO=Duyarlılık/(1-Seçicilik)=DP/YP • Bir tanı testinin, her doğru pozitif sonuca karşılık kaç tane yanlış pozitif sonuç verdiğini gösterir. DP=0,80 ve DN=0,90 olan bir test için; • POO=0.80/0.10 = 8 • Bu test, her 8 doğru pozitif sonuca karşılık 1 yanlış pozitif sonuç verir. • Dokuz pozitif sonucun 8’i doğru, biri yanlıştır. LIKELIHOOD RATIO NEGATIF OLABILIRLIK ORANı Bir testin hasta kişide negatif çıkma olasılığının, sağlam kişide negatif çıkma olasılığına oranı LR (-) = (1- duyarlılık)/seçicilik Negatif Olabilirlik Oranı • NOO=(1-Duyarlılık)/Seçicilik=YN/DN • Bir tanı testinin, her yanlış negatif sonuca karşılık kaç tane doğru negatif sonuç verdiğini gösterir. DP=0,80 ve DN=0,90 olan bir test için; • NOO=0.2/0.9=2/9 • Bu test, her 2 yanlış negatif sonuca karşılık 9 doğru negatif sonuç verir. • Onbir negatif sonucun 9’u doğru, ikisi yanlıştır. • POO’nın olabildiğince büyük, NOO’nın olabildiğince küçük olması istenir. Olabilirlik Oranı • +LR>10 veya • -LR<0.1 ise önemliliğe götürür • +LR 5-10 • -LR 0.1-0.2 ise orta • +LR 2-5 veya • -LR 0.5-0.2 küçük ama bazen önemli • +LR 1-2 • -LR 0.5-1 ise küçük ve çok az önemli B - KESTİRİM GÜCÜ Gerçekte araştırmacıların yanıt aradığı en önemli soru; “Tanı testi sonucu pozitif olanın, gerçek bir hasta olma olasılığı nedir? (veya Tanı testi sonucu negatif olanın gerçekten sağlam olma olasılığı nedir ?)” sorusudur. Bu kavram “KESTİRİM DEĞERİ” adını alır ve Bayes kuramı çerçevesinde çözümlenir. B - KESTİRİM GÜCÜ 1) POZİTİF SONUCUN KESTİRİM DEĞERİ (PKD): Tanı testi hasta yargısı verdiğinde, gerçekten hasta olma olasılığıdır. 2) NEGATİF SONUCUN KESTİRİM DEĞERİ (NKD): Tanı Testi sağlam dediğinde gerçekten sağlam olma olasılığıdır. Bu oran ne kadar küçük olursa tanı testi, sağlamları o derecede iyi ayırmaktadır. Klinisyenler için önemli olan soru, bir test sonucunun ne anlama geldiği sorusudur. Pozitif sonuca sahip bir kişinin hasta olması ya da negatif sonuca sahip bir kişinin hastalıksız olması olasılıklarının ne olduğu önemlidir. • Bu amaca hizmet eden olasılıklar TEST SONRASI OLASILIKLAR olarak adlandırılır ve iki farklı test sonrası olasılık vardır. Bunlar: • POZİTİF TAHMİNİ DEĞER (POSITIVE PREDICTIVE VALUE) ya da POZİTİF TEST SONUCUNUN TAHMİNİ DEĞERİ ve • NEGATİF TAHMİNİ DEĞER (NEGATIVE PREDICTIVE VALUE) ya da NEGATİF TEST SONUCUNUN TAHMİNİ DEĞERİ dir. Pozitif Tahmini Değer (PTD), tanı testi sonucu pozitif olan bir kişinin hasta olması olasılığını gösterir. Test istenmeden önceki hastalık olasılığına ve testin performans ölçütlerine bağlıdır. Pozitif Tahmini Değer (PTD), tanı testi sonucu pozitif olan bir kişinin hasta olması olasılığını gösterir. Test istenmeden önceki hastalık olasılığına ve testin performans ölçütlerine bağlıdır. Se x Pr PTD Se x Pr (1 S p ) x (1 Pr) Burada Se: Testin Duyarlılığı Sp: Testin Seçiciliği Pr: Test Öncesi Hastalık Olasılığı Negatif Tahmini Değer (NTD), tanı testi sonucu negatif olan bir kişinin hasta olmaması olasılığını gösterir. Test istenmeden önceki hastalık olasılığına ve testin performans ölçütlerine bağlıdır. NTD S p x (1 Pr) S p x (1 Pr) (1 Se ) x Pr Burada Se: Testin Duyarlılığı Sp: Testin Seçiciliği Pr: Test Öncesi Hastalık Olasılığı ROC EĞRıSı YÖNTEMı; Testin ayırt etme gücünün belirlenmesine, Çeşitli testlerin etkinliklerinin kıyaslanmasına, Uygun pozitiflik eşiğinin belirlenmesine, Laboratuar sonuçlarının kalitesinin izlenmesine, Uygulayıcının gelişiminin izlenmesine ve Farklı uygulayıcıların etkinliklerinin kıyaslanmasına olanak sağlar. Receiver Operating Characteristic Curve ROC EĞRİSİ Bir çift duyarlılık ve seçicilik değeri kullanmanın getirdiği dezavantajları ortadan kaldıracak bir yöntem olarak geliştirilmiştir. Testin kendi doğruluğunu (prevelanstan bağımsız olarak) tanımlaması ve testler arasında en doğru karşılaştırma yapmaya olanak sağlaması açısından sıklıkla kullanılmaktadır. ROC Curve 1,00 ,75 ROC eğrisi, değişik kesim Sensitivity ,50 ,25 0,00 noktalarında testin duyarlılığının (yekseni), testin YP oranına (x-ekseni) karşı noktalanması ile elde edilir. Her kesim noktasındaki DP ve YP’e karşılık gelen noktalar birleştirilerek ROC eğrisi çizilir. 0,00 ,25 ,50 ,75 1 - Specificity Diagonal segments are produced by ties. 1,00 ROC Eğrisi Altında Kalan Alan: Testin doğruluğunu tek bir sayısal değerle özetlemek için kullanılır. En büyük “1” değerini alabilir. Pratik olarak alabileceği en küçük değer “0.50” dir. Hastalarla sağlamlar tamamen şansa bağlı olarak (örneğin para atışı ile) ayırt edilirse bu durum ortaya çıkar ROC Eğrisi Altında Kalan Alan: ROC eğrisi altında kalan alan herzaman çok bilgilendirici olmayabilir. Kimi zaman, testin yüksek seçici (yüksek duyarlı) olması istendiğinde düşük seçicilik değerleri (düşük duyarlılık değerleri) ile değil, ROC eğrisinde yüksek seçiciliğe (yüksek duyarlılığa) karşılık gelen bölge ile ilgilenebiliriz. İki test aynı ROC eğrisi altında kalan alan değerine sahip olabilir, ancak işleyişleri farklıdır. ROC Eğrisi Altında Kalan Alan: Düşük yanlış pozitif oran (yüksek seçicilik) gerekli ise, B test A testine tercih edilebilir. Bu nedenle ROC eğrisinin ilgilenilen bölümünü kullanmak, böyle bir bölgeyi kullanan ölçülerle ilgilenmek daha akılcı olabilir. Teşekkürler