Page 59 - Çevre Şehir ve İklim Dergisi - Sayı 4
P. 59
Hacı Abdullah Uçan - Tayfun Dede - Sinan Nacar
hangilerinin daha etkili olduğuna yönelik tüm olası regresyon analizleri
gerçekleştirilmiş ve tüm değişkenlerin kullanıldığı modelin en yüksek
performansa sahip olduğu belirlenmiştir. Bu kapsamda gayri safi milli hasıla
(GSYH), enflasyon oranı (%), faiz oranı (%) ve nüfus bağımsız değişkenler olarak
belirlenmiştir. Bu değişkenlerin yanı sıra her bir yıl içerisindeki dönem sayısı
da bir diğer bağımsız değişken olarak bağımsız değişkenlere eklenmiştir.
Bu bağımsız değişkenler her üç bağımlı değişken için değiştirilmeden
kullanılmıştır. Toplamda beş bağımsız değişkene karşılık üç farklı bağımlı
değişken kullanılarak modelleme çalışmalarına başlanmıştır. Modelleme
çalışmalarında kurulan modellerin doğruluklarının test edilebilmesi için veri
setleri eğitim, doğrulama ve test veri setlerine ayrılmıştır. Bu sayede eğitim ve
doğrulama veri setleri ile kurulan modellerin doğrulukları test verisi kullanılarak
değerlendirilebilmiştir. Modellere ait performanslar ortalama karesel hatanın
karekökü (RMSE), ortalama mutlak hata (MAE), ve Nash-Sutcliffe (NS)
performans istatistikleri aşağıda verilen eşitlikler kullanılarak hesaplanmıştır.
RMSE = (1)
(2)
MAE =
(3)
NS =
Verilen eşitliklerde; t ölçüm değerlerini, t tahmin değerlerini, ölçüm
i
di
değerlerinin ortalamasını ve n veri sayısını göstermektedir. RMSE ve MAE
değerlerinden küçük olanın performansı yüksek olarak değerlendirilirken,
NS değeri −∞ ile 1 arasındadır. NS=1 olması, kullanılan yöntemin mükemmel
olduğunu belirtmektedir.
Verileri eğitim, doğrulama ve test setlerine ayırma aşamasında iki farklı
senaryo denenmiştir. Bunlardan ilkinde veriler seri şeklinde ayrılmıştır. Bir
başka ifadeyle toplamda 19 yıllık veri setinin ilk 13 yılı modellerin eğitiminde,
sonraki üç yıllık veri modellerin doğrulanmasında ve kalan üç yıllık veri seti ise
modellerin test edilmesi aşamasında kullanılmak üzere hazırlanmıştır. Yapılan ön
analizler neticesinde verilerin özellikle son yıllarda pik değerlere ulaşmasından
kaynaklı test veri setinden istenen doğrulukta sonuçlar elde edilememiştir. İkinci
senaryoda ise verilerin karma olarak seçilmesi yoluna gidilmiştir. Bu senaryoda
tüm yılların eğitim, doğrulama ve test veri setlerinde temsil edilebilmesi
amacıyla ilk yılın ilk üç dönemi eğitim, son dönemi doğrulama ve bir sonraki
yılın ilk dönemi test veri setinde kalacak şekilde seçim yapılmıştır. Bu seri devam
ettirilerek her yıldan farklı dönemler eğitim doğrulama ve test veri takımlarında
yer alması sağlanmıştır. Yapılan analizler neticesinde kabul edilebilir sonuçların
44 Çevre, Şehir ve İklim Dergisi