tam metin / full text
Transkript
tam metin / full text
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana DOĞRUSAL OLMAYAN MODELLERİN UYUMUNDA FARKLI İSTATİSTİK PAKET PROGRAMLARININ KARŞILAŞTIRILMASI Arş. Gör. Çiğdem YAKUPOĞLU 1 1 2 Doç. Dr. Yavuz AKBAŞ 2 Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: yakupoglu@ziraat.ege.edu.tr Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: yavuz@ziraat.ege.edu.tr Özet Hayvancılıkta büyüme ve laktasyon eğrisi gibi doğrusal olmayan bir yapı sergileyen sistemlerin tanımlanmasında doğrusal olmayan modeller kullanılmaktadır. Amaç, söz konusu sistemlere ait verilere en iyi uyumu sağlayacak modelin geliştirilmesidir. Ayrıca bu modellerin parametreleri kullanarak yorumlanması zor olan çok sayıdaki bilginin, biyolojik olarak yorumlanabilir şekilde özetlenmesidir. Bu amaçla model geliştirme çalışmaları yanında, geliştirilmiş bazı modellerin farklı alan ve özelliklere uyumunun incelendiği çalışmalar da mevcuttur. Doğrusal olmayan modellerin veri setlerine uyumunda SPSS, SAS, STATISTICA, BMDP, SAAM ve MINOS gibi istatistik paket programlarından yararlanılmaktadır. Bu çalışmada doğrusal olmayan modellerin parametre tahminlerinin yapılmasında kullanılan bazı paket programlar ulaşılabilirlik, tanımlama kolaylığı, kullandığı yöntemler gibi özellikler açısından tanıtılacak, uygulamalı karşılaştırmalar yapılacaktır. Anahtar Kelimeler: Doğrusal olmayan modeller, bilgisayar yazılımları, büyüme ve laktasyon eğrileri Abstract COMPARISON OF DIFFERENT STATISTICAL SOFTWARE FOR FITTING NONLINEAR MODELS Nonlinear models have a common use in animal breeding as lactation and growth curves. General purpose is to develop a model giving the best fitting on data set by summarizing the information into a few biologically interpretable parameters of the model. In addition to model developing, there are a lot of studies concentrated on fitting accuracy of various models on different area and traits. There are several statistical software such as SPSS, SAS, STATISTICA, BMDP, SAAM and MINOS for fitting the nonlinear models. The objectives of this study are to introduce and compare the statistical software on the basis of availability, easy to use and methods concentrated on giving practical applications. Key Words: Nonlinear models, software, growth and lactation curves 1. Giriş Bağımlı değişkenin, bağımsız değişken veya değişkenlerin doğrusal bir fonksiyonu olmadığı modeller “doğrusal olmayan (nonlinear)” modeller olarak adlandırılmaktadır [1]. Doğrusal olmayan modeller fizyoloji, kimya, ekonomi ve hayvan yetiştirme gibi bir çok bilim dalında yaygın olarak kullanılmaktadır. Doğrusal olmayan modellerin tahminlenmesi doğrusal (linear) modellerden çok daha zordur. Bu modellerde doğrusal modellerde oluğu gibi bağımsız değişkenlerin basitçe listelenmesi yerine, regresyon eşitliğinin yazılması, parametre işlemlerinin tanımlanması, bunlar için başlangıç değerlerinin seçilmesi ve parametrelere bağlı olarak modele ait türevlerin belirtilmesi gerekmektedir. Bazı modellerin uyumu zor olduğu gibi, iterasyon yönteminin, modelin uyumunu başarı ile gerçekleştireceğine garanti verilmemektedir [2]. İterasyon işlemine bir veya daha fazla parametre için mantıklı başlangıç değerlerinin seçilmesi ile başlanmaktadır. Hesaplamada bu değerleri içeren geçici eşitlik çözülürken, parametre değerleri giderek sabitleşmektedir. Parametre sayısının artması ile iterasyon sayısı da artış göstermektedir. Tahminlerin yüksek hızlı bilgisayarlarda yapılması bu konuda oldukça büyük kolalıklar sağlamaktadır [3]. Nitekim gelişen bilgisayar teknolojisi, kullanımın yaygınlaşması ve uygun yazılımların geliştirilmesi hesaplamalardaki zorlukları büyük oranda ortadan kaldırmıştır [4]. Bu çalışmada, doğrusal olmayan modellerin uyumunda yararlanılan SPSS, SYSTAT, STATISTICA ve SAS paket programlarının tanımlama biçimi, kullanılan iterasyon yöntemi ve erişilebilirlik açısından karşılaştırılması amaçlanmıştır. 2. Kullanılan Programlar ve Genel Özellikleri Çalışmada, doğrusal olmayan modellerin uyumununa örnek olması açısından, Gompertz büyüme eğrisi modeli kullanılmıştır. Bu amaçla bir bıldırcının çıkıştan itibaren, dört gün aralıklarla eşeysel olgunluk yaşına kadar elde edilmiş canlı ağırlık verisi üzerine Gompertz modelinin [5] uyumu yapılmıştır. Uyumu yapılan Gompertz modelinin fonksiyonu aşağıdaki gibidir. ( −K.t Y = A.exp − B.exp 1 ) 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Gompertz fonksiyonunun A, B ve K parametrelerine ait biyolojik yorumlar aşağıdaki gibidir. t: Zaman A: Zaman sonsuza ulaştığındaki (asimtotik) canlı ağırlık B: Başlangıç ağırlığı K: Büyüme hızı Model uyumu yapılırken, parametre başlangıç değerleri daha önceki çalışmalardan ön bilgi alınarak belirlenebilmektedir. Bu çalışmada A, B ve K parametreleri başlangıç değerleri sırasıyla 200, 3.5 ve 0.07 olarak alınmıştır. 2.1. SPSS SPSS programının, Windows altında çalışan 6.0 sürümü kullanılarak doğrusal olmayan modellerin uyumunun yapılması işlemi “Statistics” menüsünden “Regression” alt menüsü ve daha sonra da “nonlinear” seçeneği işaretlenerek başlatılmaktadır (Şekil 1). Şekil 1. SPSS programında nonlinear regresyonun tanımlanması Ekrana gelen pencerede bağımlı değişken “dependent”, model tanımlamaları ise “model expression” bölümünde yapılmakta, daha sonra parametrelere ait başlangıç değerleri “parameters” bölümünde belirlenerek modelin uyumuna geçilmektedir (Şekil 2). Şekil 2. SPSS programında nonlinear modelin tanımlanması SPSS programı ile doğrusal olmayan modellerin uyumunun yapılmasında kullanılacak kayıp fonksiyonların tanımlandığı, parametrelere ait çeşitli sınırlamaların getirildiği, kaydedilmesi istenen ayrıntı bilgiler ve kullanılacak tahminleme yönteminin belirlendiği düğmeler de mevcuttur. Bu düğmeler ve kullanımları aşağıda açıklanmıştır. 2 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Genel olarak gözlenen değerlerden beklenen değerlerin sapması tahminlemelerin güvenilirliğindeki azalmaları (loss) belirtmektedir. Bu nedenle kayıp fonksiyon, parametrelerin tahminlenmesinde minimizasyonu yapılan fonksiyondur. Yaygın olarak bilinen biçimleri, gözlenen ve beklenen değerler arasındaki farkın mutlak değerini ve maksimum olabilirlik tahmininin negatifini içermektedir. SPSS programında kayıp fonksiyon düğmesi kullanıcıya iki uygulama sunmaktadır. Bunlardan ilki olan “user defined loss function” uygulaması, tanımlanan herhangi bir fonksiyonun toplamının minimize edilmesi işlemini gerçekleştirmektedir. Program, kayıp fonksiyon belirtilmediği durumda ise en küçük kareler toplamı temeline dayalı olarak hata kareler toplamında küçültme işlemi yapan “sum of squared residuals” uygulamasını kullanmaktadır. Bu düğme ile parametre değerlerine belirli alt ve üst sınırlar tanımlanabilmektedir. Parametre değerleri için herhangi bir sınırlama yapılmadığında “unconstrained” seçeneği geçerlidir. Adından da anlaşıldığı gibi saklama düğmesi, isteğe bağlı olarak tahminlenen değerleri (predicted values), hataları (residuals), parametrelerin her bir iterasyonuna ilişkin türevlerini (derivatives) ve kayıp fonksiyon değerlerini (loss function values) korumaktadır. Bu seçenek düğmesi ise doğrusal olmayan modelin uyumu için parametrelere ait tahmin değerlerinin elde edilmesinde “sequential quadratic programming” veya “levenberg marquardt” tahminleme yönteminin seçimine imkan tanımaktadır. Herhangi bir tanımlama yapılmadığında “levenberg marquardt” iterasyon yöntemi kullanılmaktadır. SPSS programı doğrusal olmayan modeller için yapılan analiz sonucu her bir parametre için hata kareler toplamını, regresyon belirleme katsayısını, düzeltilmiş ve düzeltilmemiş kareler ortalamasını, asimtotik parametre tahminleri, standart hataları ve her birinin % 95 güven aralıklarını ve ayrıca parametre tahminlerinin asimtotik korelasyon matrislerini çıktı halinde verebilmektedir. 2.2. SYSTAT SYSTAT programının Windows altında çalışan 5.0 sürümünde, herhangi bir doğrusal olmayan modelin uyumu “Stats” menüsünden “nonlin” alt menüsü yardımı ile başlatılmaktadır (Şekil 3). Şekil 3. SYSTAT programında nonlinear regresyonun tanımlanması Bu alt menü kayıp fonksiyonun, uyumu sağlanacak modelin ve uyumun yeniden çalıştırılabildiği işlem seçeneklerine sahiptir. Modelin uyumunda kullanıcıya çeşitli alternatifler sunan seçenekler ve kullanımları aşağıdaki gibidir. SYSTAT programında, bu seçenek ile kullanılacak olan kayıp fonksiyon tanımlanabilmektedir. Ancak bu işlemin model tanımlamasından önce yapılması öngörülmektedir. Program, kayıp fonksiyon tanımlaması yapılmadığında en küçük kareler üzerinden minimizasyonu gerçekleştirmektedir. 3 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Uyumu yapılacak modelin tanımlaması “Model...” seçeneği yardımı ile yapılmaktadır. Ekrana gelen “Nonlinear Model” penceresinde kullanılacak model “Expression”, parametrelere ait başlangıç değerleri “Start”, yapılacak iterasyon sayısı “Iterations” ve iterasyon işlemini durduracak maksimum tolerans değeri “Tolerance” bölmümü ile belirlenebilmektedir (Şekil 4). Şekil 4. SYSTAT programında nonlinear model uyumu basmaklarının tanımlanması SYSTAT programında, uyumu yapılacak modelde yer alacak bağımlı ve bağımsız değişkenler Ekle (Add) düğmesi ile model tanımlamasına alınmaktadır. Bağımlı ve bağımsız değişken dışındaki herhangi bir tanımlama ise parametre olarak kabul edilmektedir. Parametrelere ilişkin tahmin değerlerinin hesaplanmasında “Quasi-Newton” ya da “Simplex” iterasyon yöntemlerinden biri seçilebilmektedir. Herhangi bir yöntem seçilmediğinde “Quasi-Newton” yöntemi üzerinden işlem yapılmaktadır. İterasyon ve tolerans değerinin belirtilmediği durumda ise, program sırasıyla “20” ve “0.00005” değerlerini kabul etmektedir. Tüm işlemler sonunda, hataları, tahminlenen değerleri ve değişkenleri SYSTAT dosyası olarak saklamak için “Save file” bölümü seçilmektedir. Modelin uyumunda istenilen sayıda iterasyonla yakınsama gerçekleşmediğinde “Resume...” seçeneği kullanılmaktadır. Bu seçeneğe geçildiğinde karşımıza gelen “Resume Estimating” penceresinde iterasyon işlem basamakları için yeniden tanımlamalar yapılabilmektedir. Böylece kullanıcı bir sonraki model uyum işlemi için önceki özetlerden yararlanabilmektedir. 2.3. STATISTICA Statistica programının Windows altında çalışan 4.3 sürümü ile doğrusal olmayan modellerin uyumu işlemi, programın “Analysis” menüsünden “User specified regression” alt menüsü kullanılarak başlatılmaktadır (Şekil 5). Şekil 5. STATISTICA programında nonlinear regresyonun tanımlanması 4 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Bu menü ile ekrana gelen pencerede, uyumu yapılması istenen model ve kayıp fonksiyon “Function to be estimated & loss function” düğmesi ile tanımlanabilmekte, “Select cases” düğmesi ile veri setlerine ait bazı mantıksal tanımlamalar yapılabilmektedir. Ayrıca tartı değişkeni ve eksik gözlemler tanımlatılabilmektedir. (Şekil 6). Bu menülere ait ayrıntı bilgi aşağıda verilmiştir. Şekil 6.STATISTICA programı doğrusal olmayan model uyumu model tanımlanma penceresi Bu menü parametreler için bazı mantıksal işlemlerin yapılmasına imkan sağlamaktadır. Örneğin “Exclude if ” seçeneği seçilip (A<=10) OR (B=C); tanımlaması yapılırsa, A parametresinin 10’ dan küçük ve eşit ya da B parametresinin C parametresine eşit olduğu durumlarda işlem yapılacağı anlaşılmaktadır. Bu menü herhangi bir değişkene ait değerler üzerinde işlem yapılacak tartı değişkeninin belirlenmesinde kullanılmaktadır. Bu menüde, analiz için kullanılan değişkenlerden herhangi birinin eksik gözlem içermediği ve herhangi bir tanımlamanın yapılmadığı durumda “Casewise deletion of missing data” seçeneği kullanılmaktadır. Eksik gözlem bulunduğunda ise “Substituted by means” seçeneği, diğer gözlemlere ait ortalama ile bu eksik kısımlara bir değer atayarak işlem yapılmasını sağlamaktadır. Uyumu yapılması istenen model ve kayıp fonksiyonun tanımlaması bu menü yardımıyla yapılmaktadır. Kayıp fonksiyon için herhangi bir tanımlama yapılmadığında program en küçük kareleri kullanmaktadır (Şekil 7). Şekil 7. STATISTICA programında model ve kayıp fonksiyon penceresi Tahminlenecek fonksiyon ve kayıp fonksiyon “Estimated function and loss function” penceresinde tanımlandıktan sonra, tahminleme yöntemleri “Estimation method”, maksimum iterasyon sayısı “maximum number of iterations”, yakınsama değeri “Convergence criterion”, parametrelere ait başlangıç değerleri “Start 5 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana values”, denenecek parametre değerlerine ait değişim aralığı “Initial step size”, parametrelere ait ortalama ve standart sapma değerleri “Means & standart deviations”, değişkenler için matris plotu “Matrix plot for all variables” ve Box & Whisker plotunun tanımlandığı pencereye geçilmektedir (Şekil 8). Bu penceredeki menü ve düğmelere ait açıklamalar aşağıda sunulmuştur. Şekil 8. STATISTICA programında nonlinear model uyumu basmaklarının tanımlanması STATISTICA programı parametre tahminleme yöntemi olarak “Quasi Newton, Simplex Procedure, HookeJeeves Pattern Moves, Rosenbrock Pattern Search” ve uygun tanımlamalarla bunların çeşitli kombinasyonlarını kullanmaktadır. Herhangi bir tahminleme yöntemi seçilmediğinde “Quasi Newton”iterasyon yöntemi ile tahminlemeler yapılmaktadır. Parametre tahminleme işleminde uygulanacak iterasyon işleminin sayısı, bu bölümde belirtilmektedir. Programda maksimum iterasyon sayısı bakımından herhangi bir tanımlama yapılmadığında maksimum iterasyon sayısı “50” kabul edilmektedir. Yakınsama kriterinin tanımlanabildiği bu bölümde, herhangi bir tanımlama yapılmadığı durumda yakınsama için “0.0001” değeri kabul edilmektedir. İterasyon içeren çözümler, başlangıç değerinin seçimine karşı çok hassastırlar. Başlangıç değerinin yanlış seçilmesi ile bir çözüme ulaşılmayabilir veya bu durumda elde edilen parametre tahminleri matematiksel olarak doğru ama biyolojik olarak yetersiz olabilir [3]. Başlangıç değerleri botunu ile iterasyonda kullanılacak parametre başlangıç değerleri belirlenebilmekte ve gereğinde değiştirilebilmektedir. Herhangi bir tanımlama yapılmadığında program herbir parametre için “0.1” değerini başlangıç kabul etmektedir. İterasyon işleminin parametreler arasında hangi büyüklükteki adımlarla gerçekleştirileceği bu düğmesi yardımıyla belirlenmektedir. Program herhangi bir tanımlama yapılmadığında “Quasi-Newton metodu için 0.5, Simplex and Rosenbrock metodu için 1.0 ve Hooke-Jeeves metodu için 2.0 değerini kabul etmektedir. Seçilen herhangi bir değişkenin veya değişkenlerin ortalama ve standart sapmasına ilişkin sonuçlar bu buton aracılığı ile alınmaktadır. Kullanılan değişkenler arasındaki ilişkinin görsel olarak belirlenmesinde bu seçenek kullanılmaktadır. Değişkenlerin ortalama, medyan ve standart hatalarına göre bir gösterim istendiğinde ise bu seçenek kullanılmaktadır. Ayrıca bu pencerede “Asymtotic standart errors” seçeneği ile parametrelere ait asimtotik standart hatalar da alınabilmektedir. 6 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Parametre tahminleri için yapılan iterasyonda yakınsama sağlanıp sağlanmadığı “Parametre Tahminleme“ (Parameter Estimation) penceresindeki açıklama ile anlaşılmaktadır (Şekil 9). Şekil 9. STATISTICA programında parametre tahminleme penceresi İterasyon sonucu yakınsama sağlanmamışsa değişik parametre başlangıç değerleri ve iterasyon yöntemleriyle işlem yeniden yapılmalıdır. Eğer yakınsama sağlanmışsa ayrıntıların verildiği “Sonuçlar” (Results) penceresine ulaşılmaktadır (Şekil 10). Şekil 10. STATISTICA programında sonuçlar penceresi. Şekilden de görüldüğü gibi sonuçlar penceresi zengin bir listeye sahiptir. Parametre tahminleri (Parameter estimates), parametrelere ait kovaryans ve korelasyon değerleri (Cov. /Corr. Of parameters), hata değerleri (Residual values) ,tahmin değerleri (Predicted values), gözlenen değerler (Observed values), ortalama ve standart sapmalar (Means & standard deviations), farklar (Difference), tahmin ve hata değerlerini saklama (Save predicted and residual values), uyumu sağlanan fonksiyonun gözlem değererine göre iki boyutlu grafiği (Fitted 2D function & observed values), uyumu sağlanan fonksiyonun gözlem değererine göre üç boyutlu grafiği (Fitted 2D function & observed values), hataların dağılışı (Distribution of residuals), hataların normal olasılık dağılışı (Normal probability of residuals), yarı normal olasılık dağılışı (Half normal probability plot), tahminlenen değerlere karşı gözlenen değerler (Predicted versus observed values), tahminlenen değerlere karşı hata değerleri (Predicted versus residual values), tüm değişkenler için matris plot (Matrix plot for all variables) ve tüm değişkenler için Box & Whisker plotu (Box & whisker plot for all variables) gibi düğmelerle istatistik analizler elde edilebilmektedir. 2.4. SAS Makalenin bu bölümüne kadar Windows altında çalışan paket programlarda uyum işlemi tanıtılmıştır. Aşağıda açıklanacak olan SAS paket programının 6.02 sürümü ise, DOS altında çalışmaktadır. Bir başka deyişle, doğrusal olmayan modellerin uyumunda değişik komutlar kullanılmakta ve daha sonra bu komutların çalıştırılması ile işlem yapılmaktadır (Şekil 11.) 7 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Şekil 11. SAS programında işlem penceresi SAS programında, doğrusal olmayan model uyumu için yararlanılan komutlar dizisi “PROC NLIN” bölümünde tanımlanmaktadır. Bir kısmının zorunlu, bir kısmının da isteğe bağlı olarak kullanıldığı bu komutlar aşağıdaki gibidir. PROC NLIN BOUNDS PARAMETERS Kullanılması zorunlu BY Kullanılması isteğe bağlı tanımlamalar MODEL DER ID OUTPUT OUT SAS programında, herhangi bir doğrusal modelin uyumu işlemi için bir takım adımlar takip edilmektedir. Analiz edilecek veri setinin adı “DATA” tanımlaması ile açıklandıktan sonra, kullanılacak iterasyon yönteminin “METHOD” tanımlaması ile seçimi ilk adımı oluşturmaktadır. Daha sonra tahminlenecek parametre isimleri ve bunlara ait başlangıç değerleri “PARAMETERS” tanımlaması ve uyumu yapılacak model ise “MODEL” tanımlaması ile belirtilmektedir. Genel olarak bu program Gauss (Modified gauss-Newton Method), Marquardt (Marquardt Method), Newton (Newton Method), Gradient (Gradient ya da Steepest-Descent Method) ya da DUD (Multivariate Secant ya da False Position (DUD)) iterasyon yöntemlerinden birini kullanmaktadır. “DER” tanımlaması DUD metodu dışında kullanılan iterasyon yöntemlerinde, parametrelere ait kısmi türevlerin kullanılmasını sağlamaktadır. Program, “DER” tanımlaması yapıldığında DUD metodunu, yapılmadığında ise Gauss metodunu hazır olarak kullanmaktadır. Ayrıca programda parametre tahminlerine “BOUNDS” tanımlaması yardımıyla bir sınırlama verilerek, tahminleme işleminin daha kısa zamanda yapılması sağlanabilmektedir. Çeşitli değişkenlere göre oluşturulmuş gruplar üzerinde ayrı ayrı analiz istendiğinde ise “BY” tanımlaması kullanılmaktadır. Fakat bu tanımlama, söz konusu değişkenler için bir sıralamanın yapılması şartını taşımaktadır. Diğer yandan, iterasyon işlemi için yakınsama kriteri “CONVERGE”, maksimum iterasyon sayısı “MAXITER” ve kayıp fonksiyon “_LOSS_”tanımlaması ile önceden belirtilebilmektedir. Herhangi bir tanımlama yapılmadığında program, yakınsama kriteri için “10-8”, maksimum iterasyon sayısı için “50” ve kayıp fonksiyon için en küçük kareleri kabul etmektedir. İterasyon işlemi sonucunda değişik amaçlar için çıktı dosyası tanımlanabilmektedir. Eğer çıktı dosyası parametre tahminleri için isteniyorsa “OUTEST”, değişkenler için isteniyorsa “ID” ve hesaplanan istatistikler için ise “OUTPUT OUT” tanımlamasının kullanımı uygun olacaktır. Öte yandan, “EFORMAT” tanımlaması ile çıktı dosyasındaki sayısal değerler “e” notasyonunda gösterilebilmektedir. Dolayısı ile farklı skalalarda olan sayısal değerler bu komutun kullanılması ile bir örnek hale getirilebilmektedir. 3. Sonuç ve Tartışma Doğrusal olmayan modellerin uyumu bakımından karşılaştırılan bilgisayar paket programları, kullandığı işletim sistemi, hard diskte kapladığı yer, verileri tanımlama şekli, öğrenme ve çalıştırma kolaylığı, kullandığı algoritmalar, analiz sonucu sunduğu bilgiler, çalışma hızı ve kolay elde edilebilirlik bakımından karşılaştırılmıştır. DOS altında çalışan SAS programına karşın SPSS, SYSTAT ve STATISTICA programları Windows işletim sistemi altında çalışması bakımından farklılık göstermektedir. 8 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana Programlar hard diskte çeşitli büyüklüklerde yer kaplamaktadır. SPSS programının 26,5 MB hard disk kapasitesi ile en fazla, SYSTAT programının 5,37 MB kapasitesi ile en az yer kaplayan program olduğu saptanmıştır. SAS ve STATISTICA programlarının sırası ile 14 ve 12,5 MB alana gereksinim duyduğu belirlenmiştir. SPSS, SYSTAT ve STATISTICA programları Windows uyumlu programlardan veri transferini kolaylıkla gerçekleştirmektedir. Ayrıca bu programlar kendine ait editör ortamından veri girişine izin vermekte ve belirli formatlardan da dönüşüme imkan sağlamaktadır. DOS altında çalışan SAS programı ise kendi editörü ile veri girişi yanında, ASCII yapıdaki dosyaları dışarıdan okuyabilmektedir. İncelenen programlar arasında SPSS, gerekli tüm tanımlamaları tek pencerede ele alırken, SYSTAT ve STATISTICA programları ayrı ayrı pencerelerde tanımlama yapmaktadır. Fakat bu programlar Windows altında çalışma, tanımlamaları çeşitli düğmelerle yapma ve her pencerede yardım menüsünü bulundurma yönleriyle kullanıcılar için büyük kolaylık sağlamaktadır. Buna karşın, işlemlerde kendi yapısına uygun bir programlama gerektiren SAS programı için aynı kolaylık söz konusu değildir. Kullanılan iterasyon yöntemine göre de programlar çeşitlilik göstermektedir. STATISTICA ve SAS paket programı diğerlerinden farklı olarak, dört ayrı iterasyon yöntemini kullanıma sunmaktadır. Ayrıca, STATISTICA programı bu yöntemlerin birbirleri arasındaki kombinasyonlarına da imkan tanımakta ve iterasyon adımlarını program akışı sırasında vermektedir. Genel olarak tüm programlar, analiz sonuçları olarak iterasyon çözümlerini, doğrusal olmayan regresyon özet istatistiklerini, parametre tahminleri ve standart hatalarını, asimtotik % 95 güven aralıklarını ve parametre tahminlerinin asimtotik korelasyon matrisini vermektedir. Ulaşılan bilgi miktarı bakımından, STATISTICA programının daha ayrıntılı olduğu belirlenmiştir. Programların çalışma performansları bakımından karşılaştırılması yapıldığında, ele aldığımız veri setinin küçüklüğü nedeniyle belirgin bir farklılık bulunmamıştır. Ancak daha büyük veri setlerinde çalışma hızı bakımından farklılıklar beklenebilmektedir. Günümüz teknolojisinde bu programların elde edilmesinde herhangi bir engel görülmemektedir. İnternet üzerinden http://www.spss.com (SPSS) http://science.software-directory.com (SYSTAT) http://www.statsoft.com(STATISTICA) http://www.sas.com (SAS) adresleri aracılığı ile programlar hakkında daha detaylı bilgiler istenebilmekte ve satın alma işlemleri yapılabilmektedir. Seçilen herhangi bir paket program, ulaşılan bilgi miktarı, kolaylık, çalışma hızı ve veri tanımlama özellikleri bakımından kullanılabilir olmalıdır. Bu çalışmada veri tanımlaması, kullanım kolaylığı açısından SPSS, sunduğu bilgi miktarı için STATISTICA ve farklı iterasyon yöntemlerini kullanıma sunması bakımından SAS paket programının diğerlerine göre üstün olduğu belirlenmiştir. 4. Kaynaklar 1. 2. 3. 4. 5. Yakupoğlu, Ç., Etlik Piliçlerde Büyüme Eğrilerinin Karşılaştırılması. Ege Üniversitesi Fen Bilimleri Enstitüsü, Zootekni Anabilim Dalı Yüksek Lisans Tezi.İzmir. 1999. SAS, Institute Inc., Cary, NC, USA. 1987. Efe E., Büyüme Eğrileri. Fen Bilimleri Enstitüsü, Zootekni Anabilim Dalı Doktora Tezi.Adana. 1990. Akbaş,Y., Büyüme Eğrisi Modellerinin Karşılaştırılması. Hayvansal Üretim Dergisi Sayı:36. 1995. Laird,A. K., Dynamics of Relative Growth. Growth 29, 249-263. 1965. 5. Ek 5.1. SPSS All Iteration 1 1.1 1.2 2 2.1 3 3.1 4 4.1 5 5.1 6 6.1 7 the derivatives will be Residual SS A B 103175,9915 200,000000 50617834444 -2641,5593 13288,11749 209,277813 13288,11749 209,277813 1095,870034 230,969629 1095,870034 230,969629 271,2985483 197,184864 271,2985483 197,184864 58,22543615 204,096593 58,22543615 204,096593 55,87667297 203,064227 55,87667297 203,064227 55,86826323 203,033951 55,86826323 203,033951 calculated K 3,50000000 -9,0397156 1,75402573 1,75402573 3,03699315 3,03699315 3,96421589 3,96421589 4,46291936 4,46291936 4,55195728 4,55195728 4,55796613 4,55796613 numerically. SPSS for WINDOWS Release 6.0 ,070000000 ,711524169 ,178240848 ,178240848 ,188373442 ,188373442 ,250120951 ,250120951 ,258852182 ,258852182 ,262135450 ,262135450 ,262324736 ,262324736 9 3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana 7.1 55,86824617 203,030730 4,55828912 ,262337973 8 55,86824617 203,030730 4,55828912 ,262337973 8.1 55,86824614 203,030649 4,55830221 ,262338430 Nonlinear Regression Summary Statistics Dependent Variable WEIGHT Source DF Sum of Squares Mean Square Regression 3 190029,20845 63343,06948 Residual 11 55,86825 5,07893 Uncorrected Total 14 190085,07670 (Corrected Total) 13 50139,07149 R squared = 1 - Residual SS / Corrected SS = ,99889 Asymptotic 95 % Asymptotic Confidence Interval Parameter Estimate Std. Error Lower Upper A 203,03064901 3,692927275 194,90257088 211,15872714 B 4,558302207 ,186671824 4,147440293 4,969164121 K ,262338430 ,009686747 ,241018043 ,283658817 Asymptotic Correlation Matrix of the Parameter Estimates A B K A 1,0000 -,6810 -,9030 B -,6810 1,0000 ,9056 K -,9030 ,9056 1,0000 5.2. SYSTATW5 ITERATION LOSS PARAMETER VALUES 0 .2308843D+04 .2000D+03 .3500D+01 1 .1202937D+04 .2000D+03 .3499D+01 2 .1200225D+04 .2000D+03 .3548D+01 3 .2285240D+03 .1946D+03 .3511D+01 4 .3223892D+01 .1929D+03 .3489D+01 5 .6089564D-01 .1929D+03 .3483D+01 6 .3980603D-01 .1929D+03 .3480D+01 7 .3359205D-01 .1929D+03 .3477D+01 8 .3246321D-01 .1929D+03 .3476D+01 9 .3226655D-01 .1930D+03 .3476D+01 10 .2843300D-01 .1936D+03 .3479D+01 11 .5823736D-02 .1975D+03 .3494D+01 12 .1305445D-02 .1994D+03 .3499D+01 13 .2863280D-03 .1994D+03 .3498D+01 14 .8142603D-04 .1999D+03 .3499D+01 15 .1460386D-04 .1999D+03 .3500D+01 16 .1010484D-05 .2000D+03 .3500D+01 17 .6882195D-06 .2000D+03 .3500D+01 DEPENDENT VARIABLE IS WEIGHT SOURCE SUM-OF-SQUARES DF MEAN-SQUARE REGRESSION 20982.653 3 6994.218 RESIDUAL 0.000 13 0.000 TOTAL 20982.636 16 CORRECTED 4993.476 15 RAW R-SQUARED (1-RESIDUAL/TOTAL) = CORRECTED R-SQUARED (1-RESIDUAL/CORRECTED) = PARAMETER ESTIMATE A 199.975 B 3.500 K 0.070 .5000D-01 .8319D-01 .8432D-01 .7774D-01 .7252D-01 .7170D-01 .7159D-01 .7152D-01 .7149D-01 .7148D-01 .7137D-01 .7056D-01 .7015D-01 .7011D-01 .7001D-01 .7002D-01 .7001D-01 .7001D-01 1.000 1.000 5.3. STATISTICA 5.4. SAS Dependent Variable CANLIAG Method: Gauss-Newton Iter A B K Sum of Squares 0 200.000000 3.500000 0.070000 103176 1 177.800316 3.402033 0.075012 102400 2 145.955403 3.249047 0.084687 101626 3 111.123165 3.063099 0.102918 100508 4 87.929771 2.960871 0.135388 94477 5 91.467330 4.602511 0.520591 32228.416213 6 111.733162 3.080229 0.299562 23834.325673 7 157.114111 3.596100 0.222567 12924.724630 8 202.616985 4.583580 0.269815 129.648794 9 203.091276 4.548021 0.261805 55.938189 10 203.029542 4.558008 0.262333 55.868278 11 203.030909 4.558283 0.262338 55.868246 12 203.030645 4.558302 0.262338 55.868246 NOTE: Convergence criterion met. Non-Linear Least Squares Summary Statistics Dependent Variable CANLIAG Source DF Sum of Squares Mean Square Regression 3 190029.20845 63343.06948 Residual 11 55.86825 5.07893 Uncorrected Total 14 190085.07670 (Corrected Total) 13 50139.07149 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper A 203.0306447 3.6929181012 194.90255574 211.15873370 B 4.5583022 0.1866728547 4.14743645 4.96916795 K 0.2623384 0.0096867578 0.24101795 0.28365893 Asymptotic Correlation Matrix Corr A B K A 1 -0.681042317 -0.902972326 B -0.681042317 1 0.9055961889 K -0.902972326 0.9055961889 1 10