özet
Istatistik Teori Ve Kavramların Anlatımını Kolaylaştırmak Için örnek Problemler Ve Veri Dosyaları Sunmak üzere Hazırlanmış Veri Depoları “veri Seti” Olarak Adlandırılmaktadır. Bu çalışmada, Veri Setlerinin Genel Bir Tanıtımı Yapılarak ülkemizde De Gerçekleştirilmeleri Gereken Türkçe Içerikli Veri Setlerine örnek Teşkil Edebilecek Dasl Projesi Irdelenmektedir.
Anahtar Sözcükler: Istatistik, Veri, Veri Setleri, örnek, Alıştırma, Internet, Web
1. Giriş
Istatistik Dersleri Işlenirken, Işlenmekte Olan Konu Ile Ilgili Gözlem, Deney Veya Anket Sonucunda Toplanmış Gerçek Veriler Veya Benzetim (simulasyon) Yoluyla üretilen Yapay Verilerin Elde Edilmesi En çok Sıkıntı çekilen Noktalardan Birisidir. Bilindiği Gibi, Iyi Seçilmiş Gerçek Hikayeler Ve Bununla Ilgili Olan Verilerin Kullanılması Halinde Istatistik Konuların Daha Etkili Ve Anlaşılabilir Bir şekilde Anlatılabilmesi Mümkün Olabilmektedir. Gerçekten De, Istatistik öğreticileri Anlatılan Konuyla Ilgili Gerçek Veriler Ve Hikayeleri Kullandığında Konunun öğrenciler Tarafından Anlaşılabilirliğinin Artmasına Karşın Bu Tür Veriler Ve Hikayeler Kolayca Bulunamamaktadır. Günümüzde Internet Teknolojilerinin Yaygınlaşması Ile Bu Durum Kısmen Sorun Olmaktan çıkmaya Başlamıştır. çünkü Internet Ortamında, Kategorik şekilde Düzenlenmiş Gerçek Ekonomik, Demografik, Endüstriyel Ve üretim Istatistikleri Ve Ham Verileri Kapsayan Veri Depolarına Hızla Erişmek Mümkün Olmaktadır.
Incelenen Herhangi Bir Konu Ile Ilgili Tüm Istatistik Ve Veri Kaynaklarının Tartışılması çok Geniş Bir Konu Olup Bu Bildiride Sadece Istatistik öğretiminde örnek Vermek, Alıştırma çözmek Ve Soru Hazırlamak Gibi Amaçlarla Kullanılabilecek “veri Seti” Kaynakları üzerinde Durulmaktadır. Web Ortamında, Devlet Istatistik Enstitüsü (die) [21] Gibi, Istatistik Ve Veri Yayımı Yapan çok Sayıda Ulusal Ve Uluslararası Kurum/kuruluş Mevcut Olup Farklı Konularda Toplanan Veri Ve Istatistiklere Ulaşmak Kolaylaşmıştır. Ancak, Daha önce De Belirtildiği Gibi Bu çalışmanın Amacı, Istatistik Kaynaklarını Irdelemekten çok, Veri Setleri Kullanımı Ile Ilgili Olarak, Başarılı Kabul Edilebilecek Bir Proje çalışması Olan “data And Story Library” örneği Ile Veri Seti Kavramları Ve Yararlanma Yöntemlerini Tartışmaktır.
2. Veri Setlerine Genel Bir Bakış
2.1. Veri Seti Nedir?
Farklı Konularda Gözlem, Sayım, Inceleme, Anket Veya Denemeler Sonucu Elde Edilmiş Verilerin Depolandığı Elektronik Yapılar Veri Bankası (data Bank), Veri Deposu (data Store), Veri Koleksiyonu (data Collection) Veya Veri Arşivi (data Archive) Gibi Terimlerle Adlandırılabilmektedir. Bu Terimlerin Hepsinde Temel Ve Ortak Olan şey, Veri Depolama Işlevi Olduğundan Herhangi Biri Diğerinin Yerine Kullanılabilmektedir. Günümüzde, Tarımdan Uzay Bilimlerine, Nüfus Sayımlarından Deniz Araştırmalarına Kadar Farklı Alanlarda Toplanmış Verileri Kapsayan çok Sayıda Veri Deposu Bulunmakta Olup Internet üzerinden Erişilebilir Durumdadırlar [8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21].
çalışmanın Konusu Olan Veri Setleri De Aslında Bir çeşit Veri Deposu Olup çoğu Zaman Bu Iki Terim Birbiriyle Karıştırılabilmektedir. Veri Seti, “istatistik Konularla Ile Ilgili Olarak Veri Ve Hikaye Dosyalarını Açıklamaları Ile Birlikte Kullanıma Sunan Elektronik Veri Arşivleridir” şeklinde Tanımlanabilir. Tanıma Göre Veri Setinin Kapsamı, Istatistik Dersi öğretim Ve öğrenimine Yardımcı Olmak üzere Geliştirilmiş, Açıklamalı Ve Konusal Olarak Organize Edilmiş Verilerle Sınırlıdır. Veri Setlerinde Bulunan Veriler, Matris Veya Sütun Biçiminde Listeleyen “veri Dosyaları” Ile Verilerin Kaynağı Ve Analizi Ile Ilgili Açıklamaları Içeren “hikaye Dosyaları” şeklinde Depolanmaktadırlar. Incelenen Veri Setlerinin Içeriği Istatistik Kitapları, Dergiler Ve Gazeteler Gibi Kaynaklardan Derlenmiş Veriler Olabileceği Gibi çeşitli Kurum/kuruluşlarca Toplanmış Gerçek Verilerden De Oluşabilmektedir. Esasen Sözü Edilen Ikinci Grupta Bulunanları Veri /istatistik Arşivleri Veya Veri Bankası Olarak Adlandırmanın Daha Uygun Olabileceği Yukarıda Yapılan Açıklamalardan Anlaşılabilmekle Birlikte Bunlardan Bazılarında Depolanan Veriler Veri Seti Tanımına Yakın Durumdadır. Sonuç Olarak, Eğer Sunulan Veri, Edinim öyküsü, Analizde Kullanılacak Istatistik Yöntem Ve/veya Model Unsurları Ile Birlikte Sunulmuş Ise Bunlara Veri Seti Demek Daha Uygun Olacaktır.
2.2. Web’teki Uygulamalar
Web’te, Bir Kısmı çok Iyi Yapılandırılmış Bir Kısmı Ise Sadece Arşiv Niteliğinde Sunulan Bir çok Veri Seti Mevcuttur. Bu Veri Setlerinden En çok Tanınan Bazılarına Ait Değerlendirm
NOT: Sitedeki dosyalar üye olmak için öğrencilerin, öğretmenlerin,
Akademisyenlerin gönderdiği dosyalardan oluşmaktadır. Tümü Eğitim ve öğretim
amaçlıdır. Bu dosyaların tümünün editörden kontrol edilerek geçirilmesi yoğun
bir emek gerektiğinden, gözden kaçmış olanlar olabilir. Ayrıca bir üyemiz
tarafından gönderilen bir dosyanın telif hakkına tabi olup olmadığını her
durumda tespit edemeyebiliriz. Böyle bir durumu fark etmeniz halinde dosyanın
siteden kaldırılması için dosya adını bize mail atmanız halinde İlgili dosya 1 saat içerisinde ivedilikle
siteden kaldırılır ve kaldırıldığına dair bilgilendirme size mail yolu ile bilgi
verilir.
Telif haklarına gösterilen özen konusunda bize yardımcı olduğunuz için teşekkür ederiz..