İstatistik Kavramları

Transkript

İSTATİSTİK
Zehra DAĞLI
NEDIR? NEREDE KULLANıLıR?

CANLILARIN ÖZELLİKLERİ VE BUNLARI
ETKİLEYEN ÖGELER ARASINDAKİ NEDENSELLİK
BAĞLARINI, YÖNTEMBİLİMSEL DEĞERLENDİRME
KURGULARI VE OLASILIK KURAMI ÇERÇEVESİNDE
AÇIKLAMAYA ÇALIŞAN BİLİM DALIDIR....
NORMALLIK SıNıRı VE P DEĞERI

Toplum normlarına göre, denetlenen farkın
normal ya da anormal (anlamlı farklı) olduğu,
başlangıçta kabul edilen güven düzeyi (%95)
temelinde yargılanır.

Bahsedilen güven düzeyinin dışında kalan
olasılık yanılgı payı ( =%5) olarak
değerlendirilir ve uygulanan tüm istatistiksel
testlerin sonucu bu p olasılığına kadar
indirgenerek yorumlanır.
BILIMSEL ARAŞTıRMA BASAMAKLARı
 Gözlem-Sezgi
 Hipotez
 Gerçekleme
 Genelleme
HİPOTEZİN KURGULANMASI

Hipotez, araştırmacının kendi bilgi birikiminden
veya daha önce yapılmış gözlemlerden faydalanarak
önerilir. Örneğin, tedavi grupları arasında fark
vardır.

H1 (alternatif hipotez); araştırmacının geçerliliğini
denetleyeceği başlangıçta doğru olarak kabul ettiği
hipotez. (FARK VAR)

H0 (sıfır hipotezi); H1 Hipotezinin doğru olmadığını
öne süren doğal hipotez. (FARK YOK)
HİPOTEZ
H1
 Para ile mutluluk arasında ilişki vardır
 Para arttıkça mutluluk artar
 Para arttıkça mutluluk azalır
H0
 Para ile mutluluk arasında ilişki yoktur
H1
 Kadınlarla erkekler arasında dedikodu yapma
oranları farklıdır
 Kadınlar erkeklerden daha çok dedikodu yapar
 Erkekler kadınlardan daha çok dedikodu yapar
H0
 Kadınlar ve erkekler arasında dedikodu yapma
oranları bakımından fark yoktur
HİPOTEZ
H1
 Para ile mutluluk arasında ilişki vardır (r ≠ 0)
 Para arttıkça mutluluk artar
(r > 0) +
 Para arttıkça mutluluk azalır
(r < 0) H0
 Para ile mutluluk arasında ilişki yoktur (r = 0)
H1
 Kadınlarla erkekler arasında dedikodu yapma oranları
farklıdır
(m1 ≠ m2)
 Kadınlar erkeklerden daha çok dedikodu yapar (m1 < m2)
 Erkekler kadınlardan daha çok dedikodu yapar
(m1 >
m2)
H0
 Kadınlar ve erkekler arasında dedikodu yapma oranları
İSTATISTIKSEL DEĞERLENDIRME
Hangi hipotez doğru?
p<0.05 => H1 DOĞRU KABUL EDİLİR
 Yani hipotez (çok düşük bir yanılma payı ile) genel
geçerliliği olan yeni bir sonuç olarak kabul edilir.

p>0.05 => H0 KABUL EDİLİR
 Hipotez kabul edilemeyecek kadar çok yanılmaktadır

%95
RED
%2,5
KABUL
RED
%2,5
p
değeri:
bir fark olduğunu söylerken onun gerçekte
olmama olasılığıdır
Karar Hataları
EVRENSEL GERÇEK
Ho DOĞRU
ARAŞTIRMA
SONUCU
KARAR
Ho DOĞRU
Ho Kabul
H1 DOĞRU
Ho Red
DOĞRU
KARAR
H1 DOĞRU
2.Tip
HATA
()
1.Tip
HATA
()
DOĞRU
KARAR
(1- =Power)
1.TİP HATA() Gerçekte FARKSIZLARA yanlış olarak FARKLI denmesi.
2.TİP HATA() Gerçekte FARKLILARA yanlış olarak FARKSIZ denmesi.
GERÇEKLEME
1.
Uygun kurgunun tasarlanması
2.
Değişkenlerin Saptanması -Değişken
sayısının belirlenmesi
3.
Verilerin doğru ve güvenilir
toplanması (Veri girişi)
4.
Verilerin uygun analizi
5.
Verilerin doğru sunumu
İSTATİSTİK ANALİZE HAZIRLIK

Veri tabanı oluşturun

Verileri kodlayın ve bilgisayara ortamına aktarın.

Verilerde hata kontrolünü yapın.

Eksik verilere ne yapılacağına karar verin.

Aşırı değerlere ne yapacağınıza karar verin

Yeniden kodlamaları yapın

Değişkenlerin dağılımını belirleyin (çok önemli)
VERILERIN DAĞıLıM ÖZELLIĞI NIÇIN
ÖNEMLIDIR?
 İstatistikte
dağılımın normal olup
olmadığının belirlenmesi çok önemlidir.
 Farklı dağılım gösteren verilere
uygulanacak tanımlayıcı ve analitik
istatistik yöntemleri de farklıdır.
 Parametrik testlerin tümünün
uygulanabilmesi için verilerin
dağılımının normal olması gerekir.
 Dağılımın normal olup olmadığı grafik
ve istatistik analiz yöntemleri ile
araştırılır.
NORMAL DAĞıLıM
 Doğadaki
ve toplumdaki çok şeyin dağılımı
çan eğrisine benzer
Skewness
Denekler ortalamadan daha büyük değerlerde
toplanıyorlarsa, negatif basık ya da soldan basık
(negatively skewed, skewed to the left), küçük
değerlerde toplanıyorlarsa, pozitif basık ya da
sağdan basık (positively skewed, skewed to the right)
dağılımdan söz edilir .


Mean, median ve mode farklıdır. Unimodal’da mean
kuyruğa doğru çekilir. Median mean ile mode arasına
düşer.
KURTOSıS
Dağılımın şeklinin ölçüsüdür. Pozitif
değerler dağılımın dik, negatif değerler
ise yassı olduğunu gösterir.
BAŞARI
4 yaşında başarı ....donuna işememektir.
12 yaşında başarı..........arkadaş bulabilmektir.
16 yaşında başarı.................araba sürebilmektir.
20 yaşında başarı........................seks yapabilmektir.
35 yaşında başarı .......................para kazanabilmektir.
50 yaşında başarı .......................çok para kazanabilmektir.
60 yaşında başarı ........................seks yapabilmektir.
70 yaşında başarı ................araba sürebilmektir.
75 yaşında başarı .........arkadaş bulabilmektir.
80 yaşında başarı ....donuna işememektir.
Buna ÇAN EĞRİSİ denir!..
Prof. Albert Follanberg
NORMAL DAĞıLıM NASıL ANLAŞıLıR?
1.
2.
3.
4.
Grafikler ile
Merkezi ölçütler ve Dağılım
ölçütleri ile
Skewness ve kurtosis değerleri ile
Hipotez testleri ile
1. GRAFIKLER ILE
1.
2.
Değerlerin histogramını
çizerek
Ya da "normal olasılık
grafiği" (normal probability
plot) adı verilen grafiğini
çizerek araştırılabilir.
2. Merkezi ve yayılım Ölçütleri ile
1.
Ortalama, median ve mod birbirine yakın
olmalı
2.
Standart Sapma Ortalamanın yaklaşık ¼ ü
3.
Skewness ve Kurtosis sıfıra yakın olmalı
3. Basıklık ve çarpıklık değerleri ile
1.
Skewness ve Kurtosis sıfıra yakın
olmalı
4. Testlerle
1.
Shapiro-Wilks’ ve Kolmogorov Smirnov
testleri bu amaç için sıklıkla kullanılan
testlerdir.

p değeri < 0.05 ise, dağılım normal değil.

Özellikle denek sayısı fazlaysa, genellikle
tüm normal dağılım testleri ile "p < 0.05"
bulunabilir. Bu nedenle bu durumlarda
grafik değerlendirmeler yapılmalı
DAĞıLıM ŞEKLI ÖLÇÜTLERI VERILERIN
DAĞıLıM ÖZELLIĞI NIÇIN ÖNEMLIDIR?

İstatistikte dağılımın normal olup olmadığının
belirlenmesi çok önemlidir. Farklı dağılım
gösteren verilere uygulanacak tanımlayıcı ve
analitik istatistik yöntemleri de farklıdır.
1. Veriyi tablolarda hangi ölçütler ile özetleyeceğiniz
2. Hangi grafiği seçeceğiniz
3. Hangi hipotez testini seçeceğiniz
Dağılıma bağlıdır
NORMALLER
TEHLIKELIDIR
VERILERIN ANALIZI
Tanımlayıcı İstatistikler
Değişkenin
örnek ya da
toplum özelliklerini yansıtan
değerlere tanımlayıcı
istatistikler adı verilir.
İki
ana gruba ayrılır.
Tanımlayıcı İstatistikler

Merkezi Eğilim Ölçütleri
 Mean
(Aritmetik ortalama)
 Median
 Mod

(Ortanca)
(Tepe noktası)
Yayılım Ölçütleri
 Değer
aralığı (range)
 Standart
 Değişim
sapma ve varyans, standart hata
(varyasyon) katsayısı
 Persentil
 Çeyrekler
arası aralık
 Güvenirlik
aralıkları
Aritmetik Ortalama
 Değerlerin toplamının denek sayısına bölünmesiyle
elde edilen aritmetik ortalama en sık kullanılan
merkezi eğilim ölçütüdür.
 Sayısal değişkenler için merkezi eğilim ölçütü
olarak ortalama kullanılır.
Medyan-Ortanca
 Küçükten büyüğe (ya da büyükten küçüğe) doğru
sıralandığında tam ortadaki deneğin değeridir.
 Ordinal veriler için en iyi merkezi dağılım
ölçütüdür
 Ortanca aşırı değerlerden etkilenmez. Bu nedenle
aşırı uç değerler varsa, sayısal veriler için de
ortanca tercih edilmelidir.
Mod
 En sık tekrarlayan değer
Not: Dağılım normal ise ortalamayı,
normal değil ise medyanı verin
YAYILIM ÖLÇÜTLERİ

STANDART SAPMA VE VARYANS:
SD, sd ya da s ile gösterilen standart sapma, değişken
değerlerinin ortalamanın etrafındaki yayılmasını temsil
eden bir yayılma ölçütüdür. Değerler arasında farklar
arttıkça standart sapma ve varyans büyür.

Standart sapmanın karesine varyans adı verilir. Standart
sapma ve varyans, birçok istatistik analiz yönteminin
temelini oluşturur.
 DEĞER
ARALIĞI (Range): Değişken
değerlerinin dağılımını belirten yararlı bir
ölçüttür. En büyük ve en küçük değer
arasındaki fark değer aralığıdır (range).
Değer aralığı da, ortalama gibi uç değerlerden
çok etkilenir. Üstelik en uçtaki iki değer
arasında kalan değerler hakkında bilgi
vermez.

PERCENTİLLER: Çeyreklikler

Laboratuar değerlerinin alt ve üst normal sınırlarının
belirlenmesinde kullanılır. Genellikle kabul edilen alt
normal sınır 2.5 persentil ve üst normal sınır 97.5
persentildir.

ÇEYREKLER ARASI ARALIK: 25. ve 75. persentil
değerleri arasındaki farka çeyreklerarası aralık
(interquartile range) adı verilir. Yani değerlerin ortada yer
alan %50’si, çeyrekler arası aralıktır.
GÜVEN ARALIKLARI

Güven Aralığı: Verilerin evren içinde bulunabileceği
aralığın, bu aralıkta bulunma olasılığı ile birlikte
verilmesidir. (%95, %99 güven aralığı, gibi)

Ortalama için güven aralıkları: Evren ortalamasının
içine düşmesinin beklendiği bir (a,b) aralığıdır.

Oranlar için güven aralıkları: Evren oranının içine
düşmesinin beklendiği bir (p1, p2) aralığıdır.
NE ZAMAN HANGISINI KULLANALıM?
1.
Dağılım normal ise mean
2.
Dağılım normal değil ise median
1.
Merkezi eğilim ölçütü olarak ortalama kullanıldığı
zaman, yayılma ölçütü olarak da standart sapma
kullanılır. Ortalama ± SS
2.
Ortanca kullanılacaksa minimum maksimum değerleri
verilir. Medyan (min-max)
VERİNİN ÖLÇÜM BİÇİMİ
Bazı
veriler ölçülür: boy uzunluğu,
ağırlık, hemoglobin değeri,
kolesterol miktarı, hastanede
yatılan gün sayısı, günlük diyetle
alınan yağ miktarı.
Bazıları ise isimlendirilir: cinsiyet,
meslek, hastalık cinsi,, yapılan
ameliyatın türü, alınan ilaç.
BAĞIMLI VE BAĞIMSIZ
GRUPLAR
İki
ya da daha çok grup
karşılaştırılması yapılıyorsa,
grupların bağımlı ya da bağımsız
olduğunu bilmek çok önemlidir.
Bağımlı grup: 1 birey (birim) den
birden fazla ölçüm alınması ile
oluştuğu durumdur.
Bağımsız grup: Ölçümlerin
birbirinden farklı birey ya da
gruplarda yapıldığı durumdur.
Bağımsız grup
A
ilacının
5.dakikadaki
kalp atım hızı ile
B ilacının
5.dakikadaki
kalp atım hızı
Bağımlı grup
A ilacının
5.dakikadaki
kalp atım hızı ile
A ilacının
10.dakikadaki
kalp atım hızı
GRUP SAYISI
1.
2.
3.
Tek grup
2 grup
3 ve daha fazla grup
GRUP SAYıSı VE ÖLÇÜM SAYıSı
1.
2.
3.
4.
5.
6.
Tek grup
2 grup
Tek grupta 2 zamanlı ölçüm
2 ve daha fazla grup
Tek grup 2 den fazla ölçüm
2 den fazla grup 2 den fazla
ölçüm
GRUP SAYıSı VE ÖLÇÜM SAYıSı






Tek grup-Panik hastalarda ank. skoru
2 grup- Panik ve OKB ank. skoru
Tek grupta 2 zamanlı ölçüm-Panik hastalarda
A ilacı öncesi ve 3 ay sonrası ank. skoru
3 ve daha fazla grup- Panik, OKB ve sağlıklı
kontrollerde ank skoru
Tek grup 2 den fazla ölçüm-Panik hastalarda
başlangıç, 1 ay 3 ay 6 ay sonrasında ank skoru
3 den fazla grup 3 den fazla ölçüm- Panik
hastalara A ilacı; 1, 3, 6 ay ank skoru; panik
hastalara kognitif terapi; 1,3, 6 ay ank. skoru
GRUPLARDAKİ KİŞİ SAYISI (N)

Önemlilik testlerinde ‘30’ sayısı; istatistiksel teori
içinde anlam taşıdığından önemlidir.

30 ve daha büyük örnekli gruplara test gücü daha
fazla olan parametrik testler uygulanır.-merkezi limit
teoremine dayanır

Asıl dayanak dağılımın normal olmasıdır. n
sayısı 500 de olsa değişken normal dağılmıyorsa
parametrik test seçilemez
NNT
 Tedavi
için gerekli sayı
 Number
needed to treat (NNT)
 İstenen
olumlu sonuca ulaşılacak her bir
hasta için, tedavi edilmesi gereken hasta
sayısı
1/ ARR = 1/ EER-CER
TIPTA KARAR VERME
•Tıpta tanı yöntemleri ile ilgili araştırmaların
büyük bir bölümü, tanı yöntemlerinin
doğruluğunun kestirilmesi ve
karşılaştırılmasına ayrılmıştır.
•Tanı doğruluğunu gösterecek değişik ölçüler
geliştirilmiş, bu amaç için klinik çalışma
düzenleri tanımlanmıştır.
•Son yıllarda giderek artan öneminin
nedenlerinden biri de hasta bakım maliyetleri
üzerine olan etkisidir.
Tanı testinin kullanılabilir olması için
I- Hastanın durumu hakkında güvenilir bilgi
sağlaması
II- Hastanın tedavisi ile ilgili hekimin planları
üzerinde etkili olabilmesi
III- Hastalar üzerinde test tekrarlandığında
hastalık mekanizmalarını yada hastalığın doğal
seyrini anlatabilmesi
TANı TESTı PERFORMANSLARı NASıL
DEĞERLENDıRıLıR
A - Özgün oranlar
B - Kestirim gücü
C- ROC eğrisi
Kappa katsayısı,
 Mc-Nemar testi;

DUYARLILIK
Testin toplumdaki hastaları saptayabilme gücü
Payda (toplumdaki) gerçek hastalar
SEÇİCİLİK
Testin toplumdaki sağlamları saptayabilme gücü
Payda (toplumdaki) gerçek sağlamlar
Duyarlılık (Sensitivity): Gerçekte hasta olanlar
arasında testin pozitif sonuç verme oranı
Seçicilik (Specificity): Gerçekte hastalığa sahip
olmayanlar arasında testin negatif sonuç verme
oranı
Yanlış pozitif oran: Gerçekte hastalığa sahip
olmayanlar arasında testin yanlışlıkla pozitif
sonuç verme oranı=1-Seçicilik
Yanlış negatif oran: Gerçekte hasta olanlar
arasında testin yanlışlıkla negatif sonuç verme
oranı=1-Duyarlılık
TANı VE TARAMA TESTLERI
Altın Test
+
-
a/a+c = Duyarlılık
b
d/b+d = Seçicilik
d
a/a+b = + PD
Test
+
-
a
c
Doğru pozitif oran
Doğru negatif oran
1-Seçicilik
d/c+d = - PD
1-Duyarlılık
DP ve DN oranlar
hastalık prevelansından etkilenmezler.
YN
Tedavinin gecikmesi
YP
Riskli, gereksiz, ileri tetkikler,
Yanlış tedavi, Yanlış tanımlama
DP-DN
Hastalık şiddeti, anatomik
özellikler, hasta özellikleri
LIKELIHOOD RATIO
OLABILIRLIK ORANı
•OLABİLİRLİK ORANI Bir tanı testinin
duyarlılığını ve seçiciliğini birleştirerek kullanan
performans ölçüsüdür
Pozitif Olabilirlik Oranı; Bir testin hasta
kişide pozitif çıkma olasılığının, sağlam
kişide pozitif çıkma olasılığına oranı
LR (+) = duyarlılık / (1-seçicilik)
LIKELIHOOD RATIO
Pozitif Olabilirlik Oranı
• POO=Duyarlılık/(1-Seçicilik)=DP/YP
• Bir tanı testinin, her doğru pozitif sonuca
karşılık kaç tane yanlış pozitif sonuç verdiğini
gösterir. DP=0,80 ve DN=0,90 olan bir test
için;
• POO=0.80/0.10 = 8
• Bu test, her 8 doğru pozitif sonuca karşılık 1
yanlış pozitif sonuç verir.
• Dokuz pozitif sonucun 8’i doğru, biri yanlıştır.
LIKELIHOOD RATIO
NEGATIF OLABILIRLIK ORANı
Bir testin hasta kişide negatif
çıkma olasılığının, sağlam
kişide negatif çıkma olasılığına
oranı
LR (-) = (1- duyarlılık)/seçicilik
Negatif Olabilirlik Oranı
• NOO=(1-Duyarlılık)/Seçicilik=YN/DN
• Bir tanı testinin, her yanlış negatif sonuca
karşılık kaç tane doğru negatif sonuç verdiğini
gösterir. DP=0,80 ve DN=0,90 olan bir test için;
• NOO=0.2/0.9=2/9
• Bu test, her 2 yanlış negatif sonuca karşılık 9
doğru negatif sonuç verir.
• Onbir negatif sonucun 9’u doğru, ikisi yanlıştır.
• POO’nın olabildiğince büyük,
NOO’nın olabildiğince küçük olması
istenir.
Olabilirlik Oranı
• +LR>10 veya
• -LR<0.1 ise önemliliğe götürür
• +LR 5-10
• -LR 0.1-0.2 ise orta
• +LR 2-5 veya
• -LR 0.5-0.2 küçük ama bazen önemli
• +LR 1-2
• -LR 0.5-1 ise küçük ve çok az önemli
B - KESTİRİM GÜCÜ
 Gerçekte
araştırmacıların yanıt aradığı en
önemli soru; “Tanı testi sonucu pozitif olanın,
gerçek bir hasta olma olasılığı nedir? (veya
Tanı testi sonucu negatif olanın gerçekten
sağlam olma olasılığı nedir ?)” sorusudur. Bu
kavram “KESTİRİM DEĞERİ” adını alır ve
Bayes kuramı çerçevesinde çözümlenir.
B - KESTİRİM GÜCÜ
1)
POZİTİF SONUCUN KESTİRİM DEĞERİ
(PKD): Tanı testi hasta yargısı verdiğinde,
gerçekten hasta olma olasılığıdır.
2) NEGATİF SONUCUN KESTİRİM DEĞERİ
(NKD): Tanı Testi sağlam dediğinde
gerçekten sağlam olma olasılığıdır. Bu
oran ne kadar küçük olursa tanı testi,
sağlamları o derecede iyi ayırmaktadır.
Klinisyenler için önemli olan
soru, bir test sonucunun ne
anlama geldiği sorusudur. Pozitif
sonuca sahip bir kişinin hasta
olması ya da negatif sonuca sahip
bir kişinin hastalıksız olması
olasılıklarının
ne
olduğu
önemlidir.
• Bu amaca hizmet eden olasılıklar TEST SONRASI
OLASILIKLAR olarak adlandırılır ve iki farklı test
sonrası olasılık vardır. Bunlar:
• POZİTİF
TAHMİNİ
DEĞER
(POSITIVE
PREDICTIVE VALUE) ya da POZİTİF TEST
SONUCUNUN TAHMİNİ DEĞERİ
ve
• NEGATİF
TAHMİNİ DEĞER (NEGATIVE
PREDICTIVE VALUE) ya da NEGATİF TEST
SONUCUNUN TAHMİNİ DEĞERİ dir.
Pozitif Tahmini Değer (PTD), tanı testi
sonucu pozitif olan bir kişinin hasta
olması
olasılığını
gösterir.
Test
istenmeden önceki hastalık olasılığına ve
testin performans ölçütlerine bağlıdır.
Pozitif Tahmini Değer (PTD), tanı testi
sonucu pozitif olan bir kişinin hasta olması
olasılığını gösterir. Test istenmeden önceki
hastalık olasılığına ve testin performans
ölçütlerine bağlıdır.
Se x Pr
PTD 
Se x Pr  (1  S p ) x (1  Pr)
Burada Se: Testin Duyarlılığı
Sp: Testin Seçiciliği
Pr: Test Öncesi Hastalık Olasılığı
Negatif Tahmini Değer (NTD), tanı testi
sonucu negatif olan bir kişinin hasta
olmaması olasılığını gösterir. Test istenmeden
önceki
hastalık
olasılığına
ve
testin
performans ölçütlerine bağlıdır.
NTD 
S p x (1  Pr)
S p x (1  Pr)  (1  Se ) x Pr
Burada Se: Testin Duyarlılığı
Sp: Testin Seçiciliği
Pr: Test Öncesi Hastalık Olasılığı
ROC EĞRıSı YÖNTEMı;
 Testin
ayırt etme gücünün belirlenmesine,
 Çeşitli testlerin etkinliklerinin kıyaslanmasına,
 Uygun pozitiflik eşiğinin belirlenmesine,
 Laboratuar sonuçlarının kalitesinin
izlenmesine,
 Uygulayıcının gelişiminin izlenmesine ve
 Farklı uygulayıcıların etkinliklerinin
kıyaslanmasına olanak sağlar.
Receiver Operating Characteristic Curve
ROC EĞRİSİ
Bir çift duyarlılık ve seçicilik değeri
kullanmanın getirdiği dezavantajları ortadan
kaldıracak bir yöntem olarak geliştirilmiştir.
Testin kendi doğruluğunu (prevelanstan
bağımsız olarak) tanımlaması ve testler
arasında en doğru karşılaştırma yapmaya
olanak
sağlaması
açısından
sıklıkla
kullanılmaktadır.
ROC Curve
1,00
,75
ROC eğrisi, değişik kesim
Sensitivity
,50
,25
0,00
noktalarında testin duyarlılığının (yekseni), testin YP oranına (x-ekseni)
karşı noktalanması ile elde edilir. Her
kesim noktasındaki DP ve YP’e
karşılık gelen noktalar birleştirilerek
ROC eğrisi çizilir.
0,00
,25
,50
,75
1 - Specificity
Diagonal segments are produced by ties.
1,00
ROC Eğrisi Altında Kalan Alan:
Testin doğruluğunu tek bir sayısal değerle
özetlemek için kullanılır. En büyük “1” değerini
alabilir. Pratik olarak alabileceği en küçük
değer
“0.50”
dir.
Hastalarla
sağlamlar
tamamen şansa bağlı olarak (örneğin para atışı
ile) ayırt edilirse bu durum ortaya çıkar
ROC eğrisi altında kalan alan herzaman çok
bilgilendirici olmayabilir. Kimi zaman, testin
yüksek seçici (yüksek duyarlı) olması istendiğinde
düşük seçicilik değerleri (düşük duyarlılık
değerleri) ile değil, ROC eğrisinde yüksek
seçiciliğe (yüksek duyarlılığa) karşılık gelen bölge
ile ilgilenebiliriz.
İki test aynı ROC eğrisi altında kalan alan
değerine sahip olabilir, ancak işleyişleri farklıdır.
Düşük yanlış pozitif oran
(yüksek seçicilik) gerekli
ise, B test A testine tercih
edilebilir.
Bu nedenle ROC eğrisinin ilgilenilen bölümünü
kullanmak, böyle bir bölgeyi kullanan ölçülerle
ilgilenmek daha akılcı olabilir.
Teşekkürler

İstatistik Kavramları

Transkript

Benzer belgeler

Dönem Ödevi - Dr. Aybars UĞUR

sahibinden satılık fren test cihazı