Translate

Ad

Monday, November 17, 2014

Ilmu statistik tidak seseram yang kita bayangkan

Ngomong-ngomong masalah "Statistik" mungkin yang terbayang dalam benak kita adalah sekumpulan angka-angka yang banyak dan rumit. Wuiih pokoknya kelihatannya sereem gitu kalau membayangkan tentang istilah statistik ini. Tahu tidak sebenarnya dalam kehidupan kita sehari-hari, kita  banyak berhubungan dengan yang namanya statistik ini, bahkan menurut  para ahli, pengolahan informasi statistik mempunyai sejarah jauh kebelakang semenjak awal peradaban manusia. Dahulu kala, banyak  Bangsa-bangsa kuno di dunia yang mengumpulkan data statistik untuk mendapatkan informasi  deskriptif mengenai banyak hal, misalnya pajak, perang, hasil pertanian, dan bahkan pertandingan atletik. Seiring dengan kemajuan ilmu pengetahuan dan metode pengolahan tatistik, pada masa sekarang seiring dengan kemajuan perkembangan ilmu statistik memungkinkan kita untuk dapat meneropong jauh diluar data yang kita kumpulkan dan masuk ke wilayah pengambilan keputusan melalui generalisasi dan peramalan.  Istilah "generalisasi"  kurang lebih maksudnya adalah " Kesimpulan",  kalau istilah " peramalan" saya rasa kita semua sudah tidak asing lagi dengan istilah tersebut terutama bagi anda-anda yang suka datang ke dukun ramal untuk meramalkan nasib percintaannya sama si doi (he...he... ayo siapa tuuh..?).  Sampai disini, bagaimana  apakah masih ngeri  mendengar istilah "statistik" ??, kalau masih ngerii, sekarang kita coba telaah lagi dech.. agak lebih mendalam.  Nah... setelah kita telaah lagi  secara lebih mendalam Ternyata kita-kita ini sering lho menggunakan ilmu statistik dalam kehidupan kita dalam  sehari-hari, contohnya: misalnya kita meramalkan bahwa hari ini kemungkinan bakal hujan hanya dengan mengamati banyaknya awan yang berwarna hitam dilangit, atau kita menyimpulkan bahwa dugaan kita ternyata benar bahwa pacar kita ini memang tidak setia setelah kita memiliki bukti bahwa berkali-kali dia ketahuan lagi mesra-mesraan dengan cowok atau cewek lain. Istilah kemungkinan, mengamati, menyimpulkan, dugaan, bukti merupakan sebagian istilah-istilah yang berkaitan dengan ilmu statistik.  Nah sampai disini apakah masih menganggap ilmu statistik ini adalah ilmu yang menyeramkan??? he..he..
   Nah sekarang kita mulai serius lagi dech... Pertanyaannya adalah apa sih yang dimaksud statistik itu ???.  Menurut buku " Pengantar Statistika karya Ronald E. Walpole" Ada dua pengertian mengenai statistik. Pengertian pertama adalah statistik sebagai kumpulan angka-angka, maksudnya adalah kumpulan angka-angka yang dapat menjelaskan sesuatu. Pengertian kedua adalah statistik sebagai cabang ilmu pengetahuan, yaitu pengetahuan tentang pengumpulan, pengelompokan, penyajian, analisis dan interpretasi data untuk membantu pengambilan keputusan yang lebih efektif.
   Dalam mempelajari statistik, kita pada dasarnya berkepentingan dengan penyajian dan penafsiran kejadian yang bersisfat peluang yang terjadi dalam suatu penyelidikan terencana atau penelitian ilmiah. Jadi pengolahan statistik sangat berkaitan dengan pengolahan data numerik yang berupa hasil cacahan ataupun hasil pengukuran, atau mungkin dengan data kategorik yang diklasifikasikan menurut kriteria tertentu.. Yang mana kita dapat menyebut setiap informasi yang tercatat tersebut baik itu berupa numerik ataupun kategorik sebagai pengamatan. Misalnya dalam kasus kita menyimpulkan hari ini kemungkinan akan hujan, kita meramalkan demikian karena kita telah mengamati beberapa data-data atau informasi yang bisa kita jadikan rujukan yaitu jumlah awan yang hitam serta ukuran kepekatan warna hitam di awan tersebutyang sangat hitam

Data dalam Staistik

Pengolahan statistik selalu berkaitan dengan data. Lalu apakah yang dimaksud dengan data? Berdasarkan pengertian yang di dapat dari wikipedia, data adalah catatan atas kumpulan fakta. Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, citra, ataupun simbol tertentu. Dalam keilmuan (ilmiah), fakta dikumpulkan untuk menjadi data. Data kemudian diolah sehingga dapat diutarakan secara jelas dan tepat sehingga dapat dimengerti oleh orang lain yang tidak langsung mengalaminya sendiri, hal ini dinamakan deskripsi. Pemilahan banyak data sesuai dengan persamaan atau perbedaan yang dikandungnya dinamakan klasifikasi.
 Jenis data dalam statistik terbagi menjadi dua macam, yaitu:
 1.   Data kuantitatif, yaitu data yang berupa angka-angka, jadi sifat informasi yang dikandungnya berupa informasi angka-angka. Misal data jumlah penduduk di kota surabaya pada tahun 2012, jumlah keluarga di kecamatan gunung anyar surabaya. Data kuantitatif  dapat berupa variabel diskrit, yaitu variabel yang berasal dari perhitungan yang mempunyai sifat bulat tidak dalam bentuk pecahan, dan variabel kontinyu yang merupakan data dari hasil pengukuran. Hasil pengukuran ini tergantung pada keakuratan dari alat ukur yang digunakannya, misalnya data hasil pengukuran tinggi badan Pak Udin adalah 173,12 cm.
2.   Data kualitatif adalah jenis data yang mempunyai sifat non angka, misal data jenis kelamin ada laki-laki dan perempuan, data tingkat pendidikan. Untuk dapat mengolah data kuantitatif ini maka perlu adanya transformasi data kualitatif ke bentuk kuantitatif. Mengapa demikian? Karena pengolahan statistika menggunakan rumus-rumus matematika yang mengolah angka-angka.  Untuk transformasi data dari data kualitatif menjadi data kuantitatif harus memperhatikan atribut dari data tersebut. Misalkan data jenis kelamin terdiri dari laki-laki dan perempuan.  Jenis laki-laki dapat kita ubah kedalam angka atau kode  1 (satu) dan data perempuan kita beri kode 0 (nol).

Ilmu Statistik dan Manfaatnya

Statistik adalah ilmu pengetahuan tentang data yang mencakup pengumpulan data, mengklasifikasian data, meringkas, mengorganisir, menganalisis data, serta menafsirkan informasi numerik yang dikandung data sehingga menjadi informasi yang bermanfaat.

Statistik digunakan dalam berbagai disiplin ilmu yang berbeda (baik ilmiah dan non-ilmiah) untuk membuat keputusan dan menarik kesimpulan berdasarkan data.

Sebagai contoh:

• Dalam industri farmasi, sebuah perusahaan Farmasi ingin mengetahui apakah obat baru yang mereka temukan lebih ampuh dari obat lama atau tidak, sehingga apabila hasilnya lebih baik maka mereka akan segera diluncurkan ke pasar. Untuk mengetahui  tingkat kemanjuran obat baru tersebut maka mereka  dapat berkonsultasi dengan ahli statistik yang dapat membantu mereka mengambil sampel individu dan melakukan uji sampel kepada mereka. Ahli statistik kemudian dapat menganalisis efek obat pada sampel dan menggeneralisasi  hasil dari temuannya. Jika obat gagal untuk mengurangi gejala negatif atau dengan kata lain keampuhannya tidak lebik dari obat lama bahkan lebih buruk, maka mungkin obat ini tidak siap untuk diluncurkan kepada masyarakat.
 .
• Dalam bisnis, manajer seringkali  harus memutuskan target konsumen manakah yang memiliki potensi yang besar untuk produk yang mereka tawarkan. Untuk menetapkan target konsumen maka mereka terlebih dahulu harus mengklasifikasikan berbagai konsumen mereka menjadi beberapa kelas atau golongan (segmentasi).  Selanjutnya dianalisis segmen mana yang paling potensial untuk produk mereka. Pemilihan segmen konsumen yang paling potensial ini adalah proses targeting konsumen mereka  Misalnya , sebuah perusahaan kartu kredit harus menilai seberapa berisiko pelanggan potensial . Di dunia kredit , risiko sering diukur dengan mengukur kemungkinan bahwa seseorang akan lalai dalam membayar tagihan kartu kredit mereka . Ini jelas merupakan tugas yang rumit karena kita memiliki informasi yang terbatas tentang kecenderungan individu untuk tidak membayar tagihan mereka . Untuk mengukur risiko , manajer sering merekrut ahli statistik untuk membangun model statistik yang memprediksi kemungkinan seseorang akan default
membayar tagihan mereka . Manajer kemudian dapat menerapkan model untuk pelanggan potensial untuk menentukan risiko mereka dan informasi yang dapat digunakan untuk memutuskan apakah akan menawarkan atau tidak produk keuangan mereka pada individu tersebut.  Tentu saja setelah adanya proses segementasi dan targeting konsumen.

Untuk contoh yang lebih konkret, anggaplah bahwa seorang individu, Dave, perlu menurunkan berat badannya. Dave memutuskan bahwa cara terbaik baginya untuk melakukan hal ini adalah melalui diet atau mengadopsi  latihan rutin. Seorang konselor kesehatan yang Dave telah disewa untuk membantunya, memberinya empat pilihan:

1.     The Atkins Diet
2.  The South Beach Diet
3.  Diet mana Anda sangat mengurangi asupan kalori Anda
4.  Boot Camp, yang merupakan sangat kuat, sehari-hari, latihan.

Dave memahami bahwa dengan menggunakan data-data  yang tercakup pada masing-masing program diet  dalam pengambilan keputusannya dapat memberikan wawasan tambahan yang bermanfaat, memutuskan untuk menganalisis beberapa kecenderungan sejarah tingkat penurunan bobot individu dari beberapa program diet yang dianjurkan oleh konselor kesehatannya. Berikut data  penurunan bobot untuk masing-masing individu  yang pergi  diet dari beberapa program diet selama periode delapan minggu.

Berat
Diet
1
2
3
4
5
6
7
8
Atkins
310
310
304
300
290
285
280
284
Sout Beach
310
312
308
304
300
295
290
289
Reduced Calori
310
307
306
303
301
299
297
295
Boot camp
310
308
305
303
297
294
290
287

Berdasarkan angka-angka ini,program  Diet mana yang sebaiknya diambil Dave?

Bagaimana jika tujuan Dave adalah untuk menurunkan berat badan yang paling besar? Atkins diet akan tampak seperti pilihan yang wajar karena ia akan kehilangan bobot paling besar pada akhir periode delapan minggu. Namun, sifat protein tinggi diet mungkin tidak menarik bagi Dave. Juga, Atkins tampaknya memiliki beberapa pasang surut dalam penurunan berat badan (lihat minggu 7 sampai minggu 8). Bagaimana jika Dave ingin menurunkan berat badan dengan cara yang stabil dan mantap? Maka mungkin boot camp akan menjadi pilihan Dave karena data menunjukkan penurunannya  mantap dan stabil dalam penurunan berat badan

Ada dua jenis statistik yang sering disebut ketika membuat keputusan statistik atau bekerja
pada masalah statistik. Yaitu Statistik Deskriptif dan Inferensia.


Statistik Deskriptif: Statistik deskriptif menggunakan metode numerik dan grafis untuk mencari pola dalam data, untuk meringkas informasi yang terungkap dalam kumpulan data, dan menyajikan informasi dalam bentuk yang nyaman selanjutnya dapat digunakan untuk membuat keputusan. Tujuan utama dari statistik deskriptif adalah untuk menjelaskan suatu kumpulan data. Dengan demikian, kelas statistik deskriptif meliputi langkah-langkah numerik (misalnya mean atau median) dan menampilkan grafis dari data (mis. pie chart atau grafik batang).

Statistik inferensial: statistik inferensial menggunakan data sampel untuk membuat estimasi, keputusan, prediksi, atau generalisasi tentang satu set data yang lebih besar. Beberapa contoh statistik inferensial mungkin z statistik atau t-statistik.


1.       Statistik Deskriptif
Dave dapat menggunakan beberapa statistik deskriptif dasar untuk lebih memahami pola makannya dan di mana mungkin ada kesempatan untuk mengubah beberapa kebiasaan diet nya. Tabel di bawah ini menampilkan isi kalori dari makanan yang telah dimakan Dave minggu terakhir ini.

Hari
Sarapan
kalori
Makan siang
Kalori
Makan malam
kalori
Snack
Kalori
Minggu
Kopi
200
Makan pizza
1200
Makanan sisa
1000
3 Bir
300
Senin
Sepiring protein
175
Salad
375
Makanan Beku
275
3 Bir
300
Selasa

0
Super burrito
750
Makanan beku
300
3 Bir
300
Rabu
Buah-buahan
200
Salad
375
Makanan beku
300
3 Bir
300

Informasi apa yang bisa dipetik dari log asupan kalori diatas? Hal paling sederhana yang harus dilakukan adalah dengan melihat pada total kalori yang dikonsumsi setiap hari. Total ini ditunjukkan di bawah ini.

Hari
Total harian kalori
Minggu
2700
Senin
1125
Selasa
1350
Rabu
1175

Informasi baru apakah yang dapat diambil dari tabel diatas?

Harid dengan konsumsi  kalori paling banyak adalah pada hari Minggu.
Menikmati tiga bir per malam mengkonsumsi sekitar 20% dari kalori Dave di setiap hari (kecuali hari Minggu).
Dave cenderung memiliki kalori yang lebih tinggi di waktu makan siang pada hari-hari ketika dia melewatkan sarapan (atau hanya memiliki kopi).

Poin ketiga diatas adalah cukup menarik untuk  dianalisis. Ketika Dave melewati sarapannya maka
makan siang secara signifikan lebih tinggi dalam asupan kalorinya dari pada hari-hari yang dia makan sarapan.  Berdasarkan data-data ini Dave dapat mengambil suatu informasi yang cukup jelas - ia harus memulai setiap hari dengan sarapan yang sehat karena ini menghindari asupan kalori yang tinggi di waktu makan siang yang secara keseluruhan akan menghindari penambahan jumlah asupan kalori per hari.


2.       Statistik Inferensial

Tujuan utama dari statistik inferensial adalah untuk membuat kesimpulan tentang populasi didasarkan dari sampel Data dari populasi itu. Salah satu yang paling umum digunakan dalam teknik inferensial adalah pengujian hipotesis.

Definisi kunci
Satuan Eksperimental: Sebuah objek pada data yang dikumpulkan.
Populasi: Satu set unit yang menarik untuk belajar.
Variabel: Karakteristik atau milik unit eksperimental individu.
Contoh: Sebuah subset dari unit populasi.

Apa yang dimaksud dengan hipotesis statistik? Hipotesis adalah pendugaan tentang hubungan antara dua (atau lebih) variabel. Sebagai contoh, perhatikan pertanyaan yang akan menjadi penting untuk seorang CEO sebuah  Perusahaan sepatu lari: Apakah seseorang pelari marathon memiliki kesempatan yang lebih baik dalam  menyelesaikan maratonnya jika mereka memakai sepatu merek perusahaannya daripada jika mereka memakai merek pesaing? Maka Hipotesis dari CEOnya menjadi : pelari yang mengenakan sepatu dari perusahaannya akan memiliki kesempatan yang lebih baik dalam menyelesaikan balapan semenjak dia menggunakan sepatu tersebut. Setelah hipotesis terbentuk, mekanisme selanjutnya adalah melakukan uji dari hipotesis tersebut. Langkah pertama adalah mendefinisikan variabel. Ada beberapa  jenis variabel, diantaranya  yaitu  variabel dependen dan variabel independen.


definisi
Dependent Variable: Variabel yang mewakili efek yang sedang diuji
Variabel Independen: Variabel yang mewakili masukan untuk variabel dependen, atau variabel yang dapat dimanipulasi untuk melihat apakah mereka penyebabnya.

Dalam contoh ini, variabel dependen adalah apakah seorang individu pelari  mampu menyelesaikan maraton. Sedangkan variabel independennya  adalah merek sepatu yang mereka kenakan, merek CEO atau merek yang berbeda.
Variabel ini akan dioperasionalkan dengan mengadopsi ukuran  variabel dependen (Pelari yang  menyelesaikan maraton) dan mengadopsi ukuran untuk jenis sepatu yang mereka kenakan (jika mereka memakai merek CEO ketika mereka berlari balapan).

Setelah variabel dioperasionalkan dan data dikumpulkan,selanjutnya adalah memilih uji statistik, untuk mengevaluasi data-data. Dalam contoh ini, CEO mungkin membandingkan proporsi pelari  yang menyelesaikan maraton yang mengenakan sepatu CEO terhadap proporsi yang menyelesaikan maraton yang mengenakan merek yang berbeda. Jika CEO hipotesis benar (bahwa memakai sepatu merek CEO membantu untuk menyelesaikan maraton) maka orang akan berharap bahwa tingkat penyelesaian akan lebih tinggi bagi mereka yang memakai merek CEO dan uji statistik akan mendukung hal tersebut.

Karena tidak realistis untuk mengumpulkan data pada setiap pelari dalam perlombaan, pilihan yang lebih efisien adalah dengan mengambil sampel pelari dan mengumpulkan pengukuran dependen dan independen pada mereka. kemudian melakukan uji inferensial pada sampel dan (dengan asumsi uji  telah dilakukan dengan benar) menggeneralisasi kesimpulannya untuk seluruh total individu dari pelari maraton.


ada beberapa perbedaan dari deskriptif dan inferensial yang dapat kita soroti dalam menentukan langkah kunci dari permasalahannya, yaitu:

Elemen Masalah statistik deskriptif
1) Tentukan populasi (atau contoh)
2) Pilih variabel yang akan diselidiki
3) Pilih tabel, grafik, atau alat ringkasan numerik.
4) Mengidentifikasi pola dalam data.

Elemen inferensial statistik Masalah
1) mendefinisikan populasi
2) Pilih variabel yang akan diselidiki
3) Pilih sampel dari unit populasi
4) Jalankan uji statistik pada sampel.
5) Generalisasi hasil untuk populasi dan menarik kesimpulan.