Rabu, 26 November 2014

sampling



STATISTIKA
Distribusi Sampling (Distribusi Penarikan Sampel)


1.       Pendahuluan
  
B. DISTRIBUSI SAMPLING

Distribusi sampling adalah distribusi dari mean-mean yang diambil secara berulang kali dari suatu populasi. Bila pada suatu populasi tak terhingga dilakukan pengambilan sampel secara acak berulang-ulang hingga semua sampel yang mungkin dapat ditarik dari populasi tersebut. Sampel yang diambil dari populasi terbatas dan sebelum dilakukan pengambilan sampel  berikutnya sampel unit dikembalikan kedalam populasi. Untuk mempelajari populasi kita memerlukan sampel yang diambil dari populasi yang  bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel berukuran n dari sebuah  populasi berukuran N, pada prakteknya hanya sebuah sampel yang biasa diambil dan digunakan untuk hal tersebut. Sampel yang diambil ialah sampel acak dan dari sampel tersebut nilai-nilai statistiknya dihitung untuk digunakan seperlunya. Untuk ini diperlukan sebuah teori yang dikenal dengan nama distribusi sampling. Distribusi sampling biasanya diberi nama bergantung pada nama statistik yang digunakan. Demikianlah umpamanya kita kenal distribusi sampling rata-rata, distribusi sampling proporsi, distribusi simpangan baku, dan lain-lain. Nama-nama tersebut biasa disingkat lagi berturut-turut menjadi distribusi rata-rata, distribusi proporsi, distribusi simpangan  baku, dan lain-lain. Distribusi sampling adalah distribusi dari mean-mean yang diambil secara berulang kali dari suatu populasi. Bila pada suatu populasi tak terhingga dilakukan pengambilan sampel secara acak berulang-ulang hingga semua sampel yang mungkin dapat ditarik dari populasi tersebut. Sampel yang diambil dari populasi terbatas dan sebelum dilakukan pengambilan sampel berikutnya sampel unit dikembalikan kedalam populasi. Proses ini dilakukan berulang-ulang dalam jumlah yang sangat banyak sehingga dihasilkan sampel :
                         N!
Sebanyak                                buah sampel
                        n!(N-n)!
Bila sampel-sampel yang dihasilkan dihitung rata-ratanya maka akan menghasilkan nilai rata-rata yang berbeda  hingga dapat disusun menjadi suatu distribusi yang disebut distribusi rata-rata sampel.Bila dihitung deviasi standarnya dinamakan deviasi standar distribusi rata-rata sampel atau kesalahan baku rata-rata (standard error rata-rata)
Distribusi sampling merupakan dasar atau langkah awal dalam statistic inferensial sebelum mempelajari teori estimasi, dan uji hipotesis.
Untuk memahami distribusi sampling ini perlu kita ketahui suatu ketentuan yang dapat membedakan beberapa ukuran antara sampel dan populasi
Ukuran-ukuran untuk sampel dan populasi



Nilai (karakteristik)
Sampel
Statistik
Populasi
Parameter
Mean (rata-rata hitung)
X
µ
Standar deviasi jumlah
S
σ
Unit
N
N
           
Untuk mempelajari populasi kita memerlukan sampel yang diambil dari populasi yang bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel berukuran n dari sebuah populasi berukuran N, pada prakteknya hanya sebuah sampel yang biasa diambil dan digunakan untuk hal tersebut. Sampel yang diambil ialah sampel acak dan dari sampel tersebut nilai-nilai statistiknya dihitung untuk digunakan seperlunya. Untuk ini diperlukan sebuah teori yang dikenal dengan nama distribusi sampling. Distribusi sampling biasanya diberi nama bergantung pada nama statistik yang digunakan. Demikianlah umpamanya kita kenal distribusi sampling rata-rata, distribusi sampling proporsi, distribusi simpangan baku, dan lain-lain. Nama-nama tersebut biasa disingkat lagi berturut-turut menjadi distribusi rata-rata, distribusi proporsi, distribusi simpangan baku, dan lain-lain.



DISTRIBUSI RATA-RATA

Misalkan kita mempunyai sebuah populasi berkukuran terhingga N dengan parameter rata-rata µ dan simpangan baku σ. Dari populasi ini diambil secara acak berukuran n. Jika
sampling dilakukan tanpa pengembalian, kita tahu semuanya ada buah sampel yang  berlainan. Untuk semua sampel yang didapat, masing-masing dihitung rata-ratanya. Dengan demikian diperoleh buah rata-rata. Anggap semua rata-rata ini sebagai data baru, jadi didapat kumpulan data yang terdiri atas rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat menghitung rata-rata dan simpangan bakunya. Jadi didapat rata-rata daripada rata-rata. Misalkan kita mempunyai sebuah populasi berkukuran terhingga N dengan parameter rata-rata µ dan simpangan baku σ. Dari populasi ini diambil secara acak berukuran n. Jika sampling dilakukan tanpa pengembalian, kita tahu semuanya ada  buah sampel yang berlainan. Untuk semua sampel yang didapat, masing-masing dihitung rata-ratanya. Dengan demikian diperoleh  buah rata-rata. Anggap semua rata-rata ini sebagai data baru, jadi didapat kumpulan data yang terdiri atas rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat menghitung rata-rata dan simpangan bakunya. Jadi didapat rata-rata daripada rata-rata, diberi simbol µ (baca: mu indeks eks garis), dan simpangan baku daripada rata-rata, diberi simbol σ (baca: sigma indeks eks garis).
Beberapa notasi :
n : ukuran sampel N : ukuran populasi
x : rata-rata sampel μ : rata-rata populasi
s : standar deviasi sampel σ : standar deviasi populasi
μx: rata-rata antar semua sampel
σx : standar deviasi antar semua sampel = standard error = galat baku
Contoh : Diberikan sebuah populasi dengan N=10 yang datanya : 98, 99, 97, 98, 99, 98, 97, 97, 97, 98, 99. Jika dihitung, populasi ini mempunyai µ = 98 dan σ = 0,78. Diambil sampel berukuran n=2 . Semuanya ada  = 45 buah sampel. Untuk setiap sampel kita hitung rata-ratanya. Data dalam tiap sampel dan rata-rata tiap sampel diberikan dalam daftar berikut ini.



Semua Sampel Berukuran n = 2
 Rata-ratanya Diambil dari Populasi Berukuran N = 10
Sampel
Rata-rata
Sampel
Rata-rata
Sampel
Rata-rata
(98,99)
(98,97)
(98,98)
(98,99)
(98,98)
(98,97)
(98,97)
(98,98)
(98,99)
(99,97)
(99,98)
(99,99)
(99,98)
(99,97)
(99,97)
98,5
97,5
98
98,5
98
97,5
97,5
98
98,5
98
98,5
99
98,5
98
98
(99,98)
(99,99)
(97,98)
(97,99)
(97,98)
(97,97)
(97,97)
(97,98)
(97,99)
(98,99)
(98,98)
(98,97)
(98,97)
(98,98)
(98,99)
98,5
99
97,5
98
97,5
97
97
97,5
98
98,5
98
97,5
97,5
98
98,5
(99,98)
(99,97)
(99,97)
(99,98)
(99,99)
(98,97)
(98,97)
(98,98)
(98,99)
(97,97)
(97,98)
(97,99)
(97,98)
(97,99)
(98,99)
98,5
98
98
98,5
99
97,5
97,5
98
98,5
97
97,5
98
97,5
98
98,5
Jumlah semua rata-rata = 4410

Jumlah ke-45 buah rata-rata = 4.410. Maka rata-ratanya untuk ke-45
















DISTRIBUSI PENARIKAN SAMPEL
• Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.
• Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.
• Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari  
   sampel yang kita ambil.
• Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita
   sebut sebagai : Distribusi peluang statistik sampel = Distribusi Sampling = Distribusi
   Penarikan Sampel. Statistik sampel yg paling populer dipelajari adalah Rata-Rata (x)
Bidang Inferensia Statistik yaitu bidang yang membahas generalisasi/penarikan kesimpulan dan prediksi/ peramalan. Generalisasi dan prediksi tersebut melibatkan sampel/contoh, sehingga  sangat jarang yang menggunakan  populasi. Pendataan seluruh populasi disebut sensus dan pendataan sebagian anggota populasi = penarikan contoh = pengambilan sampel disebut sampling,


Pekerjaan yang melibatkan populasi tidak digunakan, karena ada 2 :     
  1. Mahal dari segi biaya dan waktu yang panjang
  2. Bersifat merusak , populasi akan menjadi rusak atau habis jika disensus
misal :  dari populasi donat ingin diketahui rasanya, jika semua
donat dimakan, dan donat tidak tersisa, tidak ada yang dijual?

Sampel yang baik® Sampel yang representative, yaitu sampel yang dapat mewakili gambaran populasi. Besaran/ciri sampel (Statistik Sampel) memberikan  gambaran yang tepat mengenai besaran ukuran populasi(Parameter Populasi)
                                         

      Tabel 1 : Beda antara Statistik Sampel Vs Parameter Populasi

Ukuran/Ciri 
Parameter Populasi
Statistik Sampel

Rata-Rata
m : (my)
Selisih 2 Rata-rata
 : nilai mutlak
  : nilai mutlak
Standar Deviasi = Simpangan Baku
s : sigma
s
Varians = Ragam
s²
Proporsi
p : phi atau p
Selisih 2 proporsi
 : nilai mutlak
 : nilai mutlak

      catatan : pada Nilai Mutlak, nilai negatif diabaikan  misal : ½3 - 7 ½= ½-4 ½ = 4


    Sampel yang baik diperoleh dengan memperhatikan hal-hal berikut :
1.  keacakannya (randomness)
2.  ukuran
3.  teknik penarikan sampel (sampling)  yang sesuai dengan  kondisi atau sifat populasi

Sampel Acak  = Contoh Random ® dipilih dari populasi di mana setiap anggota populasi memiliki peluang yang sama terpilih menjadi anggota ruang sampel.

·      Beberapa Teknik Penarikan Sampel :
             
a.         Penarikan Sampel Acak Sederhana (Simple Randomized Sampling)
Pengacakan dapat dilakukan dengan : undian, tabel bilangan acak, program komputer.

b.         Penarikan Sampel Sistematik (Systematic Sampling)

Tetapkan interval lalu  pilih secara acak anggota pertama sampel


Contoh :          Ditetapkan interval = 20
Secara acak terpilih  :  Anggota populasi ke-7 sebagai anggota  ke-1 dalam sampel
                        maka :    
Anggota populasi ke-27 menjadi anggota ke-2 dalam sampel
                                    Anggota populasi ke-47 menjadi anggota ke-3 dalam sampel,
                                    dst.

c.         Penarikan Sampel Acak Berlapis (Stratified Random Sampling)
Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel secara acak.

Perhatikan !!!!
Antar Kelas bersifat (cenderung) berbeda nyata (heterogen). Anggota dalam suatu kelas akan (cenderung) sama (homogen).

Contoh :
Dari 1500 penumpang KA (setiap kelas memiliki ukuran yang sama) akan diambil 150 orang sebagai sampel, dilakukan pendataan tentang tingkat kepuasan, maka  sampel acak dapat diambil dari :
            Kelas Eksekutif           : 50  orang
            Kelas Bisnis                : 50  orang
            Kelas Ekonomi            : 50  orang   
           
d.         Penarikan Sampel Gerombol/Kelompok (Cluster Sampling)

            Populasi juga terdiri dari beberapa kelas/kelompok

Sampel yang diambil berupa kelompok bukan individu anggota

Antar Kelas bersifat (cenderung) sama (homogen). Anggota dalam suatu kelas akan (cenderung) berbeda (heterogen).



e.         Penarikan Sampel Area (Area Sampling)
Prinsipnya sama dengan Cluster Sampling.
Pengelompokan ditentukan oleh letak geografis atau administratif.


Sampel acak menjadi dasar penarikan sampel lain.  Selanjutnya, pembahasan akan menyangkut Penarikan Sampel Acak.

·      Penarikan Sampel Acak dapat dilakukan dengan 2 cara, yaitu :

a.         Penarikan sampel tanpa pemulihan/tanpa pengembalian  :  setelah didata, anggota sampel tidak dikembalikan ke dalam ruang sampel

b.         Penarikan sampel dengan pemulihan : bila setelah didata, anggota sampel             dikembalikan ke dalam ruang sampel.

·      Berdasarkan Ukurannya, maka sampel dibedakan menjadi  :

a.         Sampel Besar  jika ukuran sampel (n) ³ 30
b.         Sampel Kecil  jika ukuran sampel (n) < 30


Distribusi  Penarikan Sampel = Distribusi Sampling
·      Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak. 
·      Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel. 
·      Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari sampel  yang kita ambil.
·      Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita sebut sebagai : Distribusi peluang statistik sampel = Distribusi Sampling = Distribusi Penarikan Sampel

Statistik sampel yang paling populer dipelajari adalah Rata-Rata ()
(masih ingat kan, keunggulan rata-rata dibandingkan modus dan median ? )



2.       Distribusi Sampling Rata-Rata
Beberapa notasi :
n          : ukuran sampel                                               N         :  ukuran populasi
        : rata-rata sampel                                             m          :  rata-rata populasi
 s          : standar deviasi sampel                                  s          :  standar deviasi populasi
      : rata-rata antar semua sampel
     : standar deviasi antar semua sampel = standard error = galat baku
2.1       Distribusi Sampling Rata-rata Sampel Besar 

 

DALIL  1


JIKA
Sampel:                       ü
berukuran = n ³ 30      ý diambil  DENGAN PEMULIHAN dari
rata-rata =                þ
                                                                        ì Populasi berukuran = N
                                                                        í  Terdistribusi NORMAL
                                                                        î  Rata-rata = m ;  simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
            = m               dan           dan nilai


DALIL  2


JIKA
Sampel:                       ü
berukuran = n  ³ 30     ý diambil  TANPA PEMULIHAN  dari
rata-rata =                þ
                                                                        ì Populasi berukuran = N
                                                                        í  Terdistribusi NORMAL
                                                                        î  Rata-rata = m ;  simpangan baku = s
MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :
= m              dan         dan nilai

·       disebut sebagai FAKTOR KOREKSI populasi terhingga.

·      Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya

·      Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka FK akan mendekati 1 ® , hal ini mengantar kita pada dalil ke-3 yaitu DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM

Dalil 3 ( DALIL LIMIT PUSAT)

JIKA
Sampel:                       ü
berukuran = n              ý diambil dari
rata-rata =                þ
                                                                        ì Populasi berukuran = N yang BESAR
                                                                        í  distribusi : SEMBARANG
                                                                        î  Rata-rata = m ;  simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
            = m               dan           dan nilai

·      Dalil Limit Pusat berlaku untuk :   - penarikan sampel dari populasi yang sangat besar,
- distribusi populasi tidak dipersoalkan

·      Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel
     KURANG DARI  5 % ukuran populasi atau



2.2     Distribusi Sampling Rata-rata Sampel Kecil

DISTRIBUSI  t

·      Distribusi Sampling didekati dengan distribusi t Student = distribusi t (W.S. Gosset).
·      Lihat Buku Statistika-2, hal 177
    
Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil dengan distribusi normal.
Dua hal yang perlu diperhatikan dalam Tabel t adalah           1. derajat bebas (db)
                                                                                                2.  nilai a                                            
·      Derajat bebas (db)  = degree of freedom = v = n - 1.
     n : ukuran sampel. 
·      Nilai a adalah         luas daerah kurva di kanan nilai  t                  atau
                                    luas daerah kurva di kiri    nilai -t
·      Nilai a   ®  0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)
     Nilai a terbatas karena banyak kombinasi db yang harus disusun!
·      Kelak Distribusi t akan kita gunakan dalam PENGUJIAN HIPOTESIS

Nilai a ditentukan terlebih dahulu
Lalu nilai t tabel ditentukan dengan menggunakan nilai a dan db.  Nilai t tabel menjadi batas selang pengujian
Lalukan pembandingan nilai t tabel dengan nilai t hitung.
Nilai t hitung untuk kasus distribusi rata-rata sampel kecil didapat dengan menggunakan DALIL 4   

·      Pembacaan Tabel Distribusi-t

Misalkan          n = 9 ® db = 8;          Nilai a ditentukan = 2.5% di kiri dan kanan kurva
                        t tabel (db, a) = t tabel(8; 0.025)  = 2.306
                        Jadi t = 2.306 dan -t = -2.306


 



                                                           


                          2.5%                       95 %                             2.5%
 


                                   
                            -2.306                     0                       2.306

Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang 
-2.306 < t < 2.306.
Peluang t >2.306 =  2.5 %  dan Peluang t < -2.306 = 2.5 %

Coba cari nilai t tabel untuk beberapa nilai db dan a yang lain!

·      Perbedaan Tabel z dan Tabel t
     Tabel z ® nilai z menentukan nilai a
     Tabel t ® nilai a dan db menentukan nilai t

·      Dalam  banyak kasus nilai simpangan baku populasi (s) tidak diketahui, karenanya nilai s diduga dari nilai simpangan baku sampel (s)

DALIL 4


JIKA
Sampel:                                   ü
ukuran KECIL n < 30                         ý diambil dari
rata-rata =    simp. baku = s þ
                                                                                    ì Populasi berukuran = N
                                                                                    í  terdistribusi : NORMAL
                                                                                    î  Rata-rata = m
MAKA
Distribusi Rata-rata akan mendekati distribusi-t  dengan :
            = m              dan         dan nilai
pada derajat bebas = n-1 dan suatu nilai a



 =

Nilai t hitung = 1.875 berada dalam selang  -2.306 < t < 2.306
jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JARUM.

2.3     Distribusi Sampling Bagi Beda 2 Rata-rata

DALIL 5


JIKA
Dua (2) Sampel           ü
berukuran  dan    ý diambil dari
rata-rata = dan    þ                                  ì Dua (2) Populasi berukuran BESAR
                                                                        í Rata-rata  dan  
                                                                        î Ragam  dan             
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
           dan   standard error =           dan
nilai z                



·      Beda atau selisih 2 rata-rata =  ® ambil nilai mutlaknya!
·      Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS
·      Sampel-sampel  yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif) adalah sampel BESAR