Bölüm 1 İstatistike Giriş

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Bölüm 1 İstatistike Giriş"

Transkript

1 Slide 1 1 Bölüm 1 İstatistike Giriş Slide Genel Bilgiler 1-2 Veri Türleri 1-3 Eleştirel Düşünce 1-4 Bir Deneyin Düzenlenmesi

2 Slide 3 Bölüm 1-1 Genel Bilgiler Created by Tom Wegleitner, Centreville, Virginia Çeviri: Sayın San 2 Bir anket sonucu Slide 4 Denge Araştırma Şirketi'nin Mayıs ayında 25 ilde 5 bin denekle yaptığı ankete göre, AK Parti yüzde 51.7 ile birinci parti konumunu korurken, yükseliş trendini de sürdürüyor. Ankete göre CHP yüzde 24.7 ile ikinci, MHP yüzde 12.4 ile üçüncü, BDP yüzde 7 ile dördüncü parti konumunda.

3 Slide 5 3 Başka bir araştırma sonucu Slide 6 İsveç'de 68 bin yetişkin üzerinde yürütülen bir araştırmada hiç egzersiz yapmayanlarda migren dışı baş ağrısının, aktif egzersiz yapanlara göre yüzde 14 daha fazla görüldüğü sonucuna ulaşıldı Çalışma, Cephalalgia Dergisi'nde yayınlandı. Çalışma kapsamında İsveç'de 20 yaş üzeri yetişkinlerin yıllarındaki fiziksel aktivite durumları ile yıllarındaki izlemleri sırasındaki baş ağrısı yakınması bulguları analiz edildi. İsveç'te Gothenburg Başağrısı Enstitüsü'nden araştırma ekibi başkanı Emma Varkey, sedanter yaşam şeklinin baş ağrısına yol açma şeklinin açık olmadığını, ancak baş ağrısı çeken kişilere fiziksel aktiviteyi arttırmalarının önerilmesi gerektiğini belirtti.

4 Bir başka araştırma sonucu daha Türkiye İstatistik Kurumu Hanehalkı Bütçe Anketi 2011 yılı anketi için her ay ortalama olarak 1104 farklı hane dönüşümlü olarak izlenmiş ve veriler böyle derlenmiştir yılı Hanehalkı Bütçe Anketi sonuçları 2010 yılıyla karşılaştırmalı olarak şöyledir: Harcama türü Gıda ve alkolsüz içecekler 21,9 20,7 Alkollü içecek, sigara ve tütün 4,5 4,1 Giyim ve ayakkabı 5,1 5,2 Konut ve kira 27,1 25,8 Ev eşyası 6,3 6,4 Sağlık 2,1 1,9 Ulaştırma 15,1 17,2 Haberleşme 4,1 4,0 Kültür, eğlence 2,8 2,7 Eğitim hizmetleri 2,0 2,0 Otel, lokanta, pastane 5,4 5,7 Çeşitli mal ve hizmetler 3,7 4,3 4 Slide 7 Slide 8

5 Genel Bilgiler Slide 9 Anket uygulamalarının ve diğer veri toplama araçlarının temel amacı, büyük bir grup hakkında fikir sahibi olabilmek için, bu büyük grubun küçük bir parçasından bilgi edinmektir. Bu bölümde, verileri tanımlamada kullanılan bazı yöntemleri öğreneceğiz 5 Tanımlar Slide 10 Veri Bir saha araştırması veya başka bir şekilde toplanan gözlem değerlerinden oluşur. Örneğin, bir fabrikada üretilen ürünlerin ağırlıkları, bir anket uygulamasına katılanların cinsiyetleri vs.

6 Tanımlar İstatistik (Statistics) Slide 11 Bir veri seti elde edilmesi için deneyin (saha araştırmasının) planlanması, verilerin elde edilmesi ve elde edilen verilerin düzenlenmesi, özetlenmesi ve sonuç çıkarımı işlemlerini içeren yöntemler bütünüdür. 6 Tanımlar Slide 12 Anakütle (Population) Çalışılmak istenen konudaki bütün elemanların (kişilerin, birimlerin) bilgilerinin toplanmasıdır. Örneğin, bir fabrikada üretilen bütün ürünlerin ağırlığının tespit edilmesi, bir sınıftaki bütün öğrencilerin ders notunun kayıt edilmesi vb.

7 Tanımlar Slide 13 Nüfus Sayımı (Census) Anakütlenin her bir üyesinden veri toplanmasıdır. Örneklem (Sample) Bir anakütleden çekilen alt kümenin elemanlarından oluşur. 7 Anahtar Kavramlar Slide 14 Örneklemi oluşturan veri seti, uygun yöntemler kullanılarak elde edilmelidir (örneğin, rassal seçim). Şayet örneklemdeki veri seti, uygun yollarla elde edilmezse, örneklem tamamen kullanılamaz ve faydasız olabilir.

8 Slide 15 Bölüm1-2 Veri Türleri Created by Tom Wegleitner, Centreville, Virginia Çeviri: Sayın San 8 Tanımlar Slide 16 Parametre Bir anakütlenin bazı özelliklerini tanımlayan sayısal ölçümlerdir anakütle parametre

9 Tanımlar Slide 17 İstatistik (Statistic) Bir örnekleme ait bazı özelliklerin tanımlandığı sayısal ölçümlerdir. örneklem istatistik 9 Tanımlar Slide 18 Niceliksel veri Sayımları veya ölçümleri temsil eden sayılardan oluşur. Örnek: Öğrencilerin ağırlıkları.

10 Tanımlar Slide 19 Niteliksel(kategorik) veriler Sayısal olmayan özellikleri temelinde farklı kategorilere ayrılabilirler Örneğin: sınıftaki öğrencilerin cinsiyeti (Erkek/Kadın) Niceliksel Veri ile Çalışmak Slide 20 Niceliksel veriler kendi içinde ikiye ayrılır: Kesikli (discrete) Sürekli (continuous)

11 Tanımlar Slide 21 Kesikli Veri setindeki değerler, sonlu sayıda veya sayılabilir çoklukta değerler alabilirler. 0, 1, 2, 3,... Örnek: Bir tavuğun günlük yumurtladığı yumurta sayısı Tanımlar Slide 22 Sürekli Her hangi bir boşluk kalmayacak şekilde, belirli bir sayı aralığında yer alan sonsuz değeri alabilirler Örnek: İneklerden elde edilen süt miktarı (litre) ; örneğin, günlük litre.

12 Ölçüm Düzeyleri Slide 23 Veriler, kullanılan ölçüm düzeyine göre de ayrıca sınıflandırılabilir. Dört farklı ölçüm düzeyi, takip eden slaytlarda tartışılacaktır. Bir veri setinin ölçüm düzeyi, uygulanacak istatistiksel yöntemi etkilediği için önemlidir. Örneğin, TC Kimlik numaralarının ortalamasının alınması, anlamlı bir sonuç vermeyecektir Tanımlar Slide 24 Ölçümün Nominal Düzeyi Bu düzeyde veriler sadece isimlerden, etiketlerden ve kategorilerden oluşmaktadır. Veriler, her hangi bir sıralamaya tâbi tutulamaz. Örnek: Anket sorularına cevap verilmesi: evet, hayır, kararsızım

13 Tanımlar Slide 25 Ölçümün Sıralı Düzeyi Veriler sıralanabilir, ancak aralarındaki farklar belirlenemez ve anlamlı değildir. Örnek: Ders notları: A, B, C, D, veya F Tanımlar Slide 26 Ölçümün Aralık Düzeyi Sıralı düzeyin özelliklerine ek olarak, iki değer arasındaki fark anlamlıdır. Ancak, veri elde edilemeyen, doğal bir sıfır noktası yoktur. Örnek: Yıllar: 1000, 2000, 1776, veya 1492.

14 Tanımlar Slide 27 Ölçümün Oransal Düzeyi Aralık ölçümünün bütün özelliklerine ek olarak, doğal bir sıfır noktası mevcuttur. Ayrıca bütün değerleri arasındaki farklar ve oranlar anlamlıdır. Örneğin: Üniversite kitaplarının fiyatları (0 TL kitabın bedava olduğu anlamına gelir) Özet- Ölçüm Düzeyleri Slide 28 Nominal sadece kategoriler Sıralı- Sıralı kategoriler Aralık- değerler arası fark ancak doğal bir sıfır noktası yok Oran- değerler arası farklar ve doğal bir sıfır noktası

15 Tekrar Slide 29 Bölüm 1-1 ve 1-2 de: Basit tanımları ve verileri tanımlarken kullanılan terimleri gördük Parametre ve İstatistik Veri türleri (niceliksel veya niteliksel) Ölçüm düzeyleri Slide 30 Bölüm1-3 Eleştirel Düşünme Created by Tom Wegleitner, Centreville, Virginia Çeviren: Sayın San

16 Slide 31 İstatistik dersinde başarılı olma İstatistik dersinden başarılı olmanız, matematiksel formüllerden ziyade, istatistiğin mantığını kavramanıza bağlıdır. Bu bölümde verilerin ve istatistiksel kavramların üzerinde eleştirel düşünüldüğünde istatistiğin nasıl bir mantığı olduğunun kavranması üzerinde durulacaktır. Dahası, elimize geçen her istatistiki bilgiye şüphe ile yaklaşmamızın faydaları öğretilecektir İstatistiksel suistimaller Slide 32 Kötü örneklemler Örneğin, anket sonucu elde edilen veriler, internet üzerinden alınmıştır. Ankete katılıp katılmamak, katılımcının isteğine bırakılmıştır. Bir başka örnek, ankete katılım posta yoluyla sağlanmıştır. Kişi, anket formunu doldurup doldurmamaya kendi karar vermiştir.

17 Tanımlar Slide 33 Gönüllü Tepki Örneklemi (veya kendiliğinden seçilen örneklem) Bir ankete katılıp katılmamaya katılımcının karar verdiği örneklemlerdir. Ankete katılıp katılmamaya katılımcının karar verdiği örneklemden anakütleye dair bilgi almak son derece zordur. Bu durumda sadece katılmayı kabul eden özel bir grup kişi hakkında geçerli sonuçlar elde edilecektir İstatistiksel suiistimaller Slide 34 Kötü örneklem Küçük örneklem

18 İstatistiksel suiistimaller Slide 35 Kötü örneklem Küçük örneklem Yanıltıcı grafikler Slide 36 Şekil 1-1

19 Slide 37 Bir grafiğin doğru bir şekilde yorumlanabilmesi için, şekillerde verilenlere değil, şekillere temel teşkil eden sayılara odaklanmalıyız İstatistiğin Suiistimalleri Slide 38 Kötü örneklem Küçük örneklem Yanıltıcı grafikler Resim-grafikler

20 Slide 39 Bir kübün yükseklik, genişlik ve uzunluğu iki katına çıkarsa küp, 8 kat büyür Şekil İstatistiksel suiistimaller Slide 40 Kötü örneklem küçük örneklem yanıltıcı grafikler Resim-grafikler Çarpıtılmış yüzdeler Yönlendirmeli sorular

21 Slide 41 % 97 evet: ABD Başkanı, israfın önlenmesi için kısmi veto hakkına sahip olmalı mıdır? % 57 evet: ABD Başkanı kısmi veto hakkına sahip olmalı mı olmamalı mı? İstatistiksel suiistimaller Slide 42 Kötü örneklem Küçük örneklem Yanıltıcı grafikler Resim-grafikler Çarpıtılmış yüzdeler Yönlendirme soruları Soruların sırası Katılımın reddedilmesi Korelasyon ve nedensellik Kişisel çıkar çalışmaları Net sayılar Kısmi resimler Kasıtlı çarpıtmalar

22 Bu bölümde: Tekrar Slide 43 İstatistiğe dair 13 farklı suiistimali öğrendik. Verilerin yorumlanmasında istatistiksel mantığı kavramanın önemini gördük Slide 44 Bölüm1-4 Bir deneyin düzenlenmesi Created by Tom Wegleitner, Centreville, Virginia Çeviren: Sayın San

23 Ana noktalar Slide 45 Şayet örneklem verileri uygun bir yöntem ile toplanmazsa, veri setinin istatistiksel olarak kullanılması mümkün değildir. Rassallık toplanan veri setinin oluşumunda kritik öneme haizdir Tanımlar Gözlemsel Çalışma Çalışılan konu üzerinde her hangi bir müdahalede bulunulmaksızın sadece belirli özelliklerin ölçüldüğü ve gözlemlendiği çalışmalardır. Slide 46

24 Tanımlar Slide 47 Deney Çalışma konusu üzerinde bazı müdahalelerde bulunup, bu müdahalelerin sonuçlarının gözlemlendiği çalışmalardır Tanımlar Slide 48 Kesit veriler Zamanın belli bir anında verilerin gözlemlenmesi, ölçülmesi ve toplanmasıdır. Vaka kontrol verileri Zamanda geri gidilerek verilerin toplanmasıdır. Longitudinal veya Cohort veriler Ortak özellikleri paylaşan bir gruptan (cohort) gelecekte veri toplanmasıdır.

25 Karmaşıklık Tanımlar Slide 49 Bir deneyde, deneyi düzenleyen kişi, farklı değişkenlerin etkilerini ayrıştıramazsa ortaya çıkar. Deneylerin karmaşıklık ortaya çıkarmayacak şekilde planlanması gerekir! Körlük Değişkenlerin etkilerinin kontrol edilmesi Çalışmaya konu olan bireyler veya grup, kontrol grubu veya placebo olduğunu bilmemeli Bloklar Çalışma grupları, benzer özelliklerine göre oluşturulmalı Tamamen rassal deney düzeneği Slide 50 Rassal seçim sonucunda grupların oluşturulması Katı kontrollü düzenek Kişiler çok dikkatlice seçilir

26 Tekrarlama ve örneklem büyüklüğü Tekrarlama (replication) Slide 51 Farklı denemeler sonucunda yeterli düzeyde farklı sonuçlar alınıncaya kadar bir deneyin tekrar edilmesidir Örneklem büyüklüğü Doğru sonuçları gösterecek kadar büyük uygun yöntemlerle elde edilmiş bir örneklem Tanımlar Slide 52 Rassal örneklem Şayet bir anakütledeki her bir birey, örnekleme seçilmek için eşit olasılığa sahipse, bu örneklem rassal bir örneklemdir. Basit rassal örneklem (n) seçilebilecek her bir n büyüklükteki örneklemin seçilme olasılığının eşit olmasıdır.

27 Rassal örnekleme Slide 53 Her bir bireyin eşit seçilme olasılığı olsun diye yapılan seçim Sistematik örnekleme Slide 54 Bir başlangıç noktasının seçilmesi ve sonraki her kıncı elemanın seçimi

28 Kolaycı örnekleme Elde edilmesi kolay sonuçların kullanımı Slide Katmanlı örnekleme Anakütlenin aynı özellikleri taşıyan en az iki alt gruba bölünmesi ve sonra her bir alt gruptan örneklem alınması Slide 56

29 Kümeli örnekleme Slide 57 Anakütlenin bölümlere ayrılması, bu bölümlerden birinin rassal olarak seçilmesi ve seçilen bölümdeki bütün üyelerin verilerinin alınması Örnekleme yöntemleri Slide 58 Rassal Sistematik Kolaycı Katmanlı Bölümlü

30 Tanımlar Slide 59 Örnekleme Hatası anakütle değerleri ile örneklemden elde edilen sonuçlar arasındaki farktır. Örneklemin anakütleyi tam olarak temsil edememesinden kaynaklanır. Örneklem dışı hata Örneklem veri seti, doğru toplanmamış, doğru kaydedilmemiş veya analiz edilmemiş olabilir Tekrar Slide 60 Bu bölümde: Çalışma ve deney türlerini değişkenlerin kontrol edilmesinin etkilerini rassallığı örnekleme türlerini örnekleme hatalarını gördük.