STATISTIKA
Distribusi Sampling (Distribusi Penarikan Sampel)
1. Pendahuluan
B. DISTRIBUSI SAMPLING
Distribusi sampling adalah distribusi dari mean-mean
yang diambil secara berulang kali dari suatu populasi. Bila pada suatu populasi
tak terhingga dilakukan pengambilan sampel secara acak berulang-ulang hingga
semua sampel yang mungkin dapat ditarik dari populasi tersebut. Sampel yang
diambil dari populasi terbatas dan sebelum dilakukan pengambilan sampel
berikutnya sampel unit dikembalikan kedalam populasi. Untuk mempelajari
populasi kita memerlukan sampel yang diambil dari populasi yang
bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel
berukuran n dari sebuah populasi berukuran N, pada prakteknya hanya
sebuah sampel yang biasa diambil dan digunakan untuk hal tersebut. Sampel yang
diambil ialah sampel acak dan dari sampel tersebut nilai-nilai statistiknya
dihitung untuk digunakan seperlunya. Untuk ini diperlukan sebuah teori yang
dikenal dengan nama distribusi sampling. Distribusi sampling biasanya diberi
nama bergantung pada nama statistik yang digunakan. Demikianlah umpamanya kita
kenal distribusi sampling rata-rata, distribusi sampling proporsi, distribusi
simpangan baku, dan lain-lain. Nama-nama tersebut biasa disingkat lagi berturut-turut
menjadi distribusi rata-rata, distribusi proporsi, distribusi simpangan
baku, dan lain-lain. Distribusi sampling adalah distribusi dari mean-mean
yang diambil secara berulang kali dari suatu populasi. Bila pada suatu populasi
tak terhingga dilakukan pengambilan sampel secara acak berulang-ulang hingga
semua sampel yang mungkin dapat ditarik dari populasi tersebut. Sampel yang
diambil dari populasi terbatas dan sebelum dilakukan pengambilan sampel
berikutnya sampel unit dikembalikan kedalam populasi. Proses ini dilakukan
berulang-ulang dalam jumlah yang sangat banyak sehingga dihasilkan sampel :
N!
Sebanyak
buah sampel
n!(N-n)!
Bila sampel-sampel yang dihasilkan dihitung rata-ratanya maka akan
menghasilkan nilai rata-rata yang berbeda hingga dapat disusun menjadi
suatu distribusi yang disebut distribusi rata-rata sampel.Bila dihitung
deviasi standarnya dinamakan deviasi standar distribusi rata-rata sampel atau
kesalahan baku rata-rata (standard error rata-rata)
Distribusi sampling merupakan dasar atau langkah awal
dalam statistic inferensial sebelum mempelajari teori estimasi, dan uji
hipotesis.
Untuk memahami distribusi sampling ini perlu kita
ketahui suatu ketentuan yang dapat membedakan beberapa ukuran antara sampel dan
populasi
Ukuran-ukuran untuk sampel dan populasi
Nilai (karakteristik)
|
Sampel
Statistik
|
Populasi
Parameter
|
Mean (rata-rata hitung)
|
X
|
µ
|
Standar deviasi jumlah
|
S
|
σ
|
Unit
|
N
|
N
|
Untuk mempelajari populasi kita memerlukan sampel yang
diambil dari populasi yang bersangkutan. Meskipun kita dapat mengambil lebih
dari sebuah sampel berukuran n dari sebuah populasi berukuran N, pada
prakteknya hanya sebuah sampel yang biasa diambil dan digunakan untuk hal
tersebut. Sampel yang diambil ialah sampel acak dan dari sampel tersebut
nilai-nilai statistiknya dihitung untuk digunakan seperlunya. Untuk ini
diperlukan sebuah teori yang dikenal dengan nama distribusi sampling.
Distribusi sampling biasanya diberi nama bergantung pada nama statistik yang
digunakan. Demikianlah umpamanya kita kenal distribusi sampling rata-rata,
distribusi sampling proporsi, distribusi simpangan baku, dan lain-lain.
Nama-nama tersebut biasa disingkat lagi berturut-turut menjadi distribusi
rata-rata, distribusi proporsi, distribusi simpangan baku, dan lain-lain.
DISTRIBUSI RATA-RATA
Misalkan kita mempunyai sebuah populasi berkukuran
terhingga N dengan parameter rata-rata µ dan simpangan baku σ. Dari populasi
ini diambil secara acak berukuran n. Jika
sampling dilakukan tanpa pengembalian, kita tahu semuanya ada buah
sampel yang berlainan. Untuk semua sampel yang didapat, masing-masing
dihitung rata-ratanya. Dengan demikian diperoleh buah rata-rata. Anggap
semua rata-rata ini sebagai data baru, jadi didapat kumpulan data yang terdiri
atas rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat menghitung
rata-rata dan simpangan bakunya. Jadi didapat rata-rata daripada rata-rata.
Misalkan kita mempunyai sebuah populasi berkukuran terhingga N dengan
parameter rata-rata µ dan simpangan baku σ. Dari populasi ini diambil secara
acak berukuran n. Jika sampling dilakukan tanpa pengembalian, kita tahu
semuanya ada buah sampel yang berlainan. Untuk semua sampel yang didapat,
masing-masing dihitung rata-ratanya. Dengan demikian diperoleh
buah rata-rata. Anggap semua
rata-rata ini sebagai data baru, jadi didapat kumpulan data yang terdiri atas
rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat menghitung rata-rata
dan simpangan bakunya. Jadi didapat rata-rata daripada rata-rata, diberi simbol
µ
(baca: mu indeks eks garis), dan
simpangan baku daripada rata-rata, diberi simbol σ
(baca: sigma indeks eks garis).



Beberapa notasi :
n : ukuran sampel N : ukuran populasi
x : rata-rata sampel μ : rata-rata populasi
s : standar deviasi sampel σ : standar deviasi populasi
μx: rata-rata antar semua sampel
σx : standar deviasi antar semua sampel = standard error = galat
baku
Contoh : Diberikan sebuah populasi dengan N=10 yang datanya : 98, 99, 97,
98, 99, 98, 97, 97, 97, 98, 99. Jika dihitung, populasi ini mempunyai µ = 98
dan σ = 0,78. Diambil sampel berukuran n=2 . Semuanya ada
= 45 buah sampel. Untuk setiap
sampel kita hitung rata-ratanya. Data dalam tiap sampel dan rata-rata tiap
sampel diberikan dalam daftar berikut ini.

Semua Sampel Berukuran n = 2
Rata-ratanya Diambil dari Populasi Berukuran N = 10
Sampel
|
Rata-rata
|
Sampel
|
Rata-rata
|
Sampel
|
Rata-rata
|
(98,99)
(98,97)
(98,98)
(98,99)
(98,98)
(98,97)
(98,97)
(98,98)
(98,99)
(99,97)
(99,98)
(99,99)
(99,98)
(99,97)
(99,97)
|
98,5
97,5
98
98,5
98
97,5
97,5
98
98,5
98
98,5
99
98,5
98
98
|
(99,98)
(99,99)
(97,98)
(97,99)
(97,98)
(97,97)
(97,97)
(97,98)
(97,99)
(98,99)
(98,98)
(98,97)
(98,97)
(98,98)
(98,99)
|
98,5
99
97,5
98
97,5
97
97
97,5
98
98,5
98
97,5
97,5
98
98,5
|
(99,98)
(99,97)
(99,97)
(99,98)
(99,99)
(98,97)
(98,97)
(98,98)
(98,99)
(97,97)
(97,98)
(97,99)
(97,98)
(97,99)
(98,99)
|
98,5
98
98
98,5
99
97,5
97,5
98
98,5
97
97,5
98
97,5
98
98,5
|
Jumlah semua rata-rata = 4410
|
Jumlah ke-45 buah rata-rata = 4.410. Maka rata-ratanya untuk ke-45
DISTRIBUSI PENARIKAN SAMPEL
• Jumlah Sampel Acak yang dapat
ditarik dari suatu populasi adalah sangat banyak.
• Nilai setiap Statistik Sampel
akan bervariasi/beragam antar sampel.
• Suatu statistik dapat dianggap
sebagai peubah acak yang besarnya sangat tergantung dari
sampel yang kita ambil.
• Karena statistik sampel adalah
peubah acak maka ia mempunyai distribusi yang kita
sebut sebagai : Distribusi peluang statistik sampel = Distribusi
Sampling = Distribusi
Penarikan Sampel. Statistik sampel yg paling populer dipelajari adalah
Rata-Rata (x)
Bidang Inferensia Statistik
yaitu bidang yang membahas generalisasi/penarikan kesimpulan dan prediksi/
peramalan. Generalisasi dan prediksi
tersebut melibatkan sampel/contoh, sehingga sangat jarang yang menggunakan populasi. Pendataan seluruh populasi disebut
sensus dan pendataan sebagian anggota populasi = penarikan contoh = pengambilan
sampel disebut sampling,
Pekerjaan yang
melibatkan populasi tidak digunakan, karena ada 2 :
- Mahal dari segi biaya dan waktu yang panjang
- Bersifat merusak , populasi akan menjadi rusak atau habis jika disensus
misal : dari populasi donat ingin diketahui rasanya,
jika semua
donat dimakan,
dan donat tidak tersisa, tidak ada yang dijual?
Sampel yang baik® Sampel yang representative,
yaitu sampel yang dapat mewakili gambaran populasi. Besaran/ciri sampel
(Statistik Sampel) memberikan gambaran
yang tepat mengenai besaran ukuran populasi(Parameter Populasi)
Tabel 1 : Beda antara Statistik Sampel Vs
Parameter Populasi
Ukuran/Ciri
|
Parameter Populasi
|
Statistik Sampel
|
Rata-Rata
|
m : (my)
|
![]() |
Selisih 2 Rata-rata
|
![]() |
![]() |
Standar Deviasi =
Simpangan Baku
|
s : sigma
|
s
|
Varians = Ragam
|
s²
|
s²
|
Proporsi
|
p : phi atau p
|
![]() |
Selisih 2 proporsi
|
![]() |
![]() |
catatan : pada Nilai Mutlak, nilai
negatif diabaikan misal : ½3 - 7 ½= ½-4 ½ = 4
Sampel yang baik diperoleh dengan
memperhatikan hal-hal berikut :
1. keacakannya
(randomness)
2. ukuran
3. teknik penarikan sampel (sampling) yang sesuai dengan kondisi atau sifat populasi
Sampel Acak = Contoh Random ® dipilih dari populasi di
mana setiap anggota populasi memiliki peluang yang sama terpilih menjadi
anggota ruang sampel.
·
Beberapa Teknik Penarikan Sampel :
a. Penarikan Sampel Acak
Sederhana (Simple Randomized Sampling)
Pengacakan dapat
dilakukan dengan : undian, tabel bilangan acak, program komputer.
b. Penarikan Sampel
Sistematik (Systematic Sampling)
Tetapkan interval lalu pilih secara acak anggota pertama sampel
Contoh : Ditetapkan interval = 20
Secara acak
terpilih : Anggota populasi ke-7 sebagai anggota ke-1 dalam sampel
maka :
Anggota
populasi ke-27 menjadi anggota ke-2 dalam sampel
Anggota
populasi ke-47 menjadi anggota ke-3 dalam sampel,
dst.
c. Penarikan Sampel Acak
Berlapis (Stratified Random Sampling)
Populasi terdiri dari beberapa
kelas/kelompok. Dari setiap kelas diambil sampel secara acak.
Perhatikan !!!!
Antar Kelas
bersifat (cenderung) berbeda nyata (heterogen). Anggota dalam suatu kelas akan
(cenderung) sama (homogen).
Contoh :
Dari 1500
penumpang KA (setiap kelas memiliki ukuran yang sama) akan diambil 150 orang
sebagai sampel, dilakukan pendataan tentang tingkat kepuasan, maka sampel acak dapat diambil dari :
Kelas
Eksekutif : 50 orang
Kelas Bisnis : 50 orang
Kelas Ekonomi : 50 orang
d. Penarikan Sampel
Gerombol/Kelompok (Cluster Sampling)
Populasi juga terdiri dari beberapa kelas/kelompok
Sampel yang
diambil berupa kelompok bukan individu anggota
Antar Kelas bersifat
(cenderung) sama (homogen). Anggota dalam suatu kelas akan (cenderung) berbeda
(heterogen).
e. Penarikan Sampel Area
(Area Sampling)
Prinsipnya sama
dengan Cluster Sampling.
Pengelompokan
ditentukan oleh letak geografis atau administratif.
Sampel acak menjadi dasar
penarikan sampel lain. Selanjutnya,
pembahasan akan menyangkut Penarikan Sampel Acak.
·
Penarikan Sampel Acak dapat dilakukan dengan 2 cara,
yaitu :
a. Penarikan sampel tanpa pemulihan/tanpa pengembalian :
setelah didata, anggota sampel tidak dikembalikan ke dalam ruang
sampel
b. Penarikan sampel dengan
pemulihan : bila setelah didata, anggota sampel dikembalikan ke dalam ruang sampel.
·
Berdasarkan Ukurannya,
maka sampel dibedakan menjadi :
a. Sampel Besar jika ukuran sampel (n) ³ 30
b. Sampel Kecil jika ukuran sampel (n) < 30
Distribusi Penarikan Sampel = Distribusi Sampling
·
Jumlah Sampel Acak yang dapat ditarik dari suatu
populasi adalah sangat banyak.
·
Nilai setiap Statistik Sampel akan
bervariasi/beragam antar sampel.
·
Suatu statistik dapat dianggap sebagai peubah acak
yang besarnya sangat tergantung dari sampel
yang kita ambil.
·
Karena statistik sampel adalah peubah acak maka ia
mempunyai distribusi yang kita sebut sebagai : Distribusi peluang statistik
sampel = Distribusi Sampling = Distribusi Penarikan Sampel
Statistik sampel yang paling
populer dipelajari adalah Rata-Rata (
)

(masih ingat kan, keunggulan
rata-rata dibandingkan modus dan median ? )
2. Distribusi Sampling Rata-Rata
Beberapa notasi :
n :
ukuran sampel N
:
ukuran populasi

s : standar deviasi sampel s : standar deviasi populasi


2.1 Distribusi Sampling Rata-rata Sampel Besar
DALIL 1
JIKA
Sampel: ü
berukuran = n ³ 30 ý diambil DENGAN PEMULIHAN dari
rata-rata =
þ

ì Populasi berukuran = N
í Terdistribusi NORMAL
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan
mendekati distribusi Normal dengan :



DALIL 2
JIKA
Sampel: ü
berukuran = n ³ 30 ý diambil TANPA PEMULIHAN dari
rata-rata =
þ

ì Populasi berukuran = N
í Terdistribusi NORMAL
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan
mendekati distribusi Normal dengan :



·
disebut sebagai FAKTOR KOREKSI populasi terhingga.

·
Faktor Koreksi (FK) akan menjadi penting jika sampel
berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya
·
Jika sampel berukuran n diambil dari populasi
berukuran N yang sangat besar maka FK akan mendekati 1 ®
, hal ini mengantar kita pada dalil ke-3 yaitu DALIL LIMIT
PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM

Dalil 3 ( DALIL LIMIT PUSAT)
JIKA
Sampel: ü
berukuran = n ý diambil dari
rata-rata =
þ

ì Populasi berukuran = N yang
BESAR
í distribusi : SEMBARANG
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan
mendekati distribusi Normal dengan :



·
Dalil Limit Pusat berlaku untuk : - penarikan sampel dari populasi yang sangat
besar,
- distribusi
populasi tidak dipersoalkan
·
Beberapa buku mencatat hal berikut : Populasi
dianggap BESAR jika ukuran sampel
KURANG DARI 5 % ukuran populasi
atau 

2.2 Distribusi Sampling Rata-rata Sampel Kecil
DISTRIBUSI t
·
Distribusi Sampling didekati dengan distribusi t
Student = distribusi t (W.S. Gosset).
·
Lihat Buku Statistika-2, hal 177
Distribusi-t pada
prinsipnya adalah pendekatan distribusi sampel kecil dengan distribusi normal.
Dua hal yang
perlu diperhatikan dalam Tabel t adalah 1. derajat bebas (db)
2. nilai a
·
Derajat bebas (db)
= degree of freedom = v = n - 1.
n : ukuran sampel.
·
Nilai a adalah luas daerah kurva di kanan nilai t atau
luas daerah kurva di kiri nilai -t
·
Nilai a ® 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01
(1%) ; 0.005(0.5%)
Nilai a terbatas karena banyak
kombinasi db yang harus disusun!
·
Kelak Distribusi t akan kita gunakan dalam PENGUJIAN
HIPOTESIS
Nilai a ditentukan terlebih dahulu
Lalu nilai t tabel
ditentukan dengan menggunakan nilai a dan db. Nilai t tabel menjadi batas selang pengujian
Lalukan pembandingan nilai t
tabel dengan nilai t hitung.
Nilai t hitung untuk kasus
distribusi rata-rata sampel kecil didapat dengan menggunakan DALIL 4
·
Pembacaan Tabel Distribusi-t
Misalkan n = 9 ® db = 8; Nilai a ditentukan = 2.5% di kiri
dan kanan kurva
t tabel (db, a) = t tabel(8; 0.025) = 2.306
Jadi t = 2.306 dan -t = -2.306
![]() |





-2.306 0 2.306
Arti Gambar di atas nilai t
sampel berukuran n = 9, berpeluang 95% jatuh dalam selang
-2.306 < t < 2.306.
Peluang t >2.306 = 2.5 %
dan Peluang t < -2.306 = 2.5 %
Coba cari nilai t tabel
untuk beberapa nilai db dan a yang lain!
·
Perbedaan Tabel z dan Tabel t
Tabel z ® nilai z menentukan nilai a
Tabel t ® nilai a dan db menentukan nilai t
·
Dalam banyak
kasus nilai simpangan baku populasi (s) tidak
diketahui, karenanya nilai s diduga dari
nilai simpangan baku sampel (s)
DALIL 4
JIKA
Sampel: ü
ukuran KECIL n < 30 ý diambil dari
rata-rata =
simp. baku = s þ

ì Populasi berukuran = N
í terdistribusi : NORMAL
î Rata-rata = m
MAKA
Distribusi Rata-rata akan
mendekati distribusi-t dengan :



pada derajat bebas = n-1 dan
suatu nilai a


Nilai t hitung = 1.875
berada dalam selang -2.306 < t <
2.306
jadi hasil penelitian
Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JARUM.
2.3 Distribusi Sampling Bagi Beda 2 Rata-rata
DALIL 5
JIKA
Dua (2) Sampel ü
berukuran
dan
ý diambil dari


rata-rata =
dan
þ ì Dua (2) Populasi berukuran
BESAR


í Rata-rata
dan


î Ragam
dan


MAKA
Distribusi Rata-rata akan
mendekati distribusi Normal dengan :


nilai z


·
Beda atau selisih 2 rata-rata =
® ambil nilai mutlaknya!

·
Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS
·
Sampel-sampel
yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif)
adalah sampel BESAR