Statistik adalah ilmu pengetahuan tentang data yang mencakup pengumpulan data, mengklasifikasian data, meringkas, mengorganisir, menganalisis data, serta menafsirkan informasi numerik yang dikandung data sehingga menjadi informasi yang bermanfaat.
Statistik digunakan dalam berbagai disiplin ilmu yang berbeda (baik ilmiah dan non-ilmiah) untuk membuat keputusan dan menarik kesimpulan berdasarkan data.
Sebagai contoh:
• Dalam industri farmasi, sebuah perusahaan Farmasi ingin mengetahui
apakah obat baru yang mereka temukan lebih ampuh dari obat lama atau
tidak, sehingga apabila hasilnya lebih baik maka mereka akan segera
diluncurkan ke pasar. Untuk mengetahui tingkat kemanjuran obat baru tersebut maka mereka dapat
berkonsultasi dengan ahli statistik yang dapat membantu mereka
mengambil sampel individu dan melakukan uji sampel kepada mereka. Ahli
statistik kemudian dapat menganalisis efek obat pada sampel dan
menggeneralisasi hasil dari
temuannya. Jika obat gagal untuk mengurangi gejala negatif atau dengan
kata lain keampuhannya tidak lebik dari obat lama bahkan lebih buruk,
maka mungkin obat ini tidak siap untuk diluncurkan kepada masyarakat.
.
• Dalam bisnis, manajer seringkali harus
memutuskan target konsumen manakah yang memiliki potensi yang besar
untuk produk yang mereka tawarkan. Untuk menetapkan target konsumen maka
mereka terlebih dahulu harus mengklasifikasikan berbagai konsumen
mereka menjadi beberapa kelas atau golongan (segmentasi). Selanjutnya
dianalisis segmen mana yang paling potensial untuk produk mereka.
Pemilihan segmen konsumen yang paling potensial ini adalah proses
targeting konsumen mereka Misalnya
, sebuah perusahaan kartu kredit harus menilai seberapa berisiko
pelanggan potensial . Di dunia kredit , risiko sering diukur dengan
mengukur kemungkinan bahwa seseorang akan lalai dalam membayar tagihan
kartu kredit mereka . Ini jelas merupakan tugas yang rumit karena kita
memiliki informasi yang terbatas tentang kecenderungan individu untuk
tidak membayar tagihan mereka . Untuk mengukur risiko , manajer sering
merekrut ahli statistik untuk membangun model statistik yang memprediksi
kemungkinan seseorang akan default
membayar tagihan mereka .
Manajer kemudian dapat menerapkan model untuk pelanggan potensial untuk
menentukan risiko mereka dan informasi yang dapat digunakan untuk
memutuskan apakah akan menawarkan atau tidak produk keuangan mereka pada
individu tersebut. Tentu saja setelah adanya proses segementasi dan targeting konsumen.
Untuk contoh yang lebih konkret, anggaplah bahwa seorang individu, Dave, perlu menurunkan berat badannya. Dave memutuskan bahwa cara terbaik baginya untuk melakukan hal ini adalah melalui diet atau mengadopsi latihan rutin. Seorang konselor kesehatan yang Dave telah disewa untuk membantunya, memberinya empat pilihan:
1. The Atkins Diet
2. The South Beach Diet
3. Diet mana Anda sangat mengurangi asupan kalori Anda
4. Boot Camp, yang merupakan sangat kuat, sehari-hari, latihan.
Dave memahami bahwa dengan menggunakan data-data yang tercakup pada masing-masing program diet dalam
pengambilan keputusannya dapat memberikan wawasan tambahan yang
bermanfaat, memutuskan untuk menganalisis beberapa kecenderungan sejarah
tingkat penurunan bobot individu dari beberapa program diet yang
dianjurkan oleh konselor kesehatannya. Berikut data penurunan bobot untuk masing-masing individu yang pergi diet dari beberapa program diet selama periode delapan minggu.
Berat
|
Diet
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Atkins
|
310
|
310
|
304
|
300
|
290
|
285
|
280
|
284
|
Sout Beach
|
310
|
312
|
308
|
304
|
300
|
295
|
290
|
289
|
Reduced Calori
|
310
|
307
|
306
|
303
|
301
|
299
|
297
|
295
|
Boot camp
|
310
|
308
|
305
|
303
|
297
|
294
|
290
|
287
|
Berdasarkan angka-angka ini,program Diet mana yang sebaiknya diambil Dave?
Bagaimana jika tujuan Dave adalah untuk menurunkan berat badan yang paling besar? Atkins diet akan tampak seperti pilihan yang wajar karena ia akan kehilangan bobot paling besar pada akhir periode delapan minggu. Namun, sifat protein tinggi diet mungkin tidak menarik bagi Dave. Juga, Atkins tampaknya memiliki beberapa pasang surut dalam penurunan berat badan (lihat minggu 7 sampai minggu 8). Bagaimana jika Dave ingin menurunkan berat badan dengan cara yang stabil dan mantap? Maka mungkin boot camp akan menjadi pilihan Dave karena data menunjukkan penurunannya mantap dan stabil dalam penurunan berat badan
Ada dua jenis statistik yang sering disebut ketika membuat keputusan statistik atau bekerja
pada masalah statistik. Yaitu Statistik Deskriptif dan Inferensia.
Statistik Deskriptif: Statistik deskriptif menggunakan metode numerik dan grafis untuk mencari pola dalam data, untuk meringkas informasi yang terungkap dalam kumpulan data, dan menyajikan informasi dalam bentuk yang nyaman selanjutnya dapat digunakan untuk membuat keputusan. Tujuan utama dari statistik deskriptif adalah untuk menjelaskan suatu kumpulan data. Dengan demikian, kelas statistik deskriptif meliputi langkah-langkah numerik (misalnya mean atau median) dan menampilkan grafis dari data (mis. pie chart atau grafik batang).
Statistik inferensial: statistik inferensial menggunakan data sampel untuk membuat estimasi, keputusan, prediksi, atau generalisasi tentang satu set data yang lebih besar. Beberapa contoh statistik inferensial mungkin z statistik atau t-statistik.
1. Statistik Deskriptif
Dave dapat menggunakan beberapa statistik deskriptif dasar untuk lebih memahami pola makannya dan di mana mungkin ada kesempatan untuk mengubah beberapa kebiasaan diet nya. Tabel di bawah ini menampilkan isi kalori dari makanan yang telah dimakan Dave minggu terakhir ini.
Hari
|
Sarapan
|
kalori
|
Makan siang
|
Kalori
|
Makan malam
|
kalori
|
Snack
|
Kalori
|
Minggu
|
Kopi
|
200
|
Makan pizza
|
1200
|
Makanan sisa
|
1000
|
3 Bir
|
300
|
Senin
|
Sepiring protein
|
175
|
Salad
|
375
|
Makanan Beku
|
275
|
3 Bir
|
300
|
Selasa
|
|
0
|
Super burrito
|
750
|
Makanan beku
|
300
|
3 Bir
|
300
|
Rabu
|
Buah-buahan
|
200
|
Salad
|
375
|
Makanan beku
|
300
|
3 Bir
|
300
|
Informasi apa yang bisa dipetik dari log asupan kalori diatas? Hal paling sederhana yang harus dilakukan adalah dengan melihat pada total kalori yang dikonsumsi setiap hari. Total ini ditunjukkan di bawah ini.
Hari
|
Total harian kalori
|
Minggu
|
2700
|
Senin
|
1125
|
Selasa
|
1350
|
Rabu
|
1175
|
Informasi baru apakah yang dapat diambil dari tabel diatas?
• Harid dengan konsumsi kalori paling banyak adalah pada hari Minggu.
• Menikmati tiga bir per malam mengkonsumsi sekitar 20% dari kalori Dave di setiap hari (kecuali hari Minggu).
• Dave cenderung memiliki kalori yang lebih tinggi di waktu makan siang pada hari-hari ketika dia melewatkan sarapan (atau hanya memiliki kopi).
Poin ketiga diatas adalah cukup menarik untuk dianalisis. Ketika Dave melewati sarapannya maka
makan siang secara signifikan lebih tinggi dalam asupan kalorinya dari pada hari-hari yang dia makan sarapan. Berdasarkan data-data ini Dave dapat mengambil suatu informasi yang cukup jelas - ia harus memulai setiap hari dengan sarapan yang sehat karena
ini menghindari asupan kalori yang tinggi di waktu makan siang yang
secara keseluruhan akan menghindari penambahan jumlah asupan kalori per
hari.
2. Statistik Inferensial
Tujuan
utama dari statistik inferensial adalah untuk membuat kesimpulan
tentang populasi didasarkan dari sampel Data dari populasi itu. Salah
satu yang paling umum digunakan dalam teknik inferensial adalah
pengujian hipotesis.
Definisi kunci
Satuan Eksperimental: Sebuah objek pada data yang dikumpulkan.
Populasi: Satu set unit yang menarik untuk belajar.
Variabel: Karakteristik atau milik unit eksperimental individu.
Contoh: Sebuah subset dari unit populasi.
Apa yang dimaksud dengan hipotesis statistik? Hipotesis adalah pendugaan tentang hubungan antara dua (atau lebih) variabel. Sebagai contoh, perhatikan pertanyaan yang akan menjadi penting untuk seorang CEO sebuah Perusahaan sepatu lari: Apakah seseorang pelari marathon memiliki kesempatan yang lebih baik dalam menyelesaikan maratonnya jika mereka memakai sepatu merek perusahaannya daripada jika mereka memakai merek pesaing? Maka Hipotesis dari CEOnya menjadi : pelari yang mengenakan sepatu dari perusahaannya akan memiliki kesempatan yang lebih baik dalam menyelesaikan balapan semenjak dia menggunakan sepatu tersebut. Setelah hipotesis terbentuk, mekanisme selanjutnya adalah melakukan uji dari hipotesis tersebut. Langkah pertama adalah mendefinisikan variabel. Ada beberapa jenis variabel, diantaranya yaitu variabel dependen dan variabel independen.
definisi
Dependent Variable: Variabel yang mewakili efek yang sedang diuji
Variabel Independen: Variabel yang mewakili masukan untuk variabel
dependen, atau variabel yang dapat dimanipulasi untuk melihat apakah
mereka penyebabnya.
Dalam contoh ini, variabel dependen adalah apakah seorang individu pelari mampu menyelesaikan maraton. Sedangkan variabel independennya adalah merek sepatu yang mereka kenakan, merek CEO atau merek yang berbeda.
Variabel ini akan dioperasionalkan dengan mengadopsi ukuran variabel dependen (Pelari yang menyelesaikan maraton) dan mengadopsi ukuran untuk jenis sepatu yang mereka kenakan (jika mereka memakai merek CEO ketika mereka berlari balapan).
Setelah variabel dioperasionalkan dan data dikumpulkan,selanjutnya adalah memilih uji statistik, untuk mengevaluasi data-data. Dalam contoh ini, CEO mungkin membandingkan proporsi pelari yang menyelesaikan maraton yang mengenakan sepatu CEO terhadap proporsi yang menyelesaikan maraton yang mengenakan merek yang berbeda. Jika CEO hipotesis benar (bahwa memakai sepatu merek CEO membantu untuk menyelesaikan maraton) maka orang akan berharap bahwa tingkat penyelesaian akan lebih tinggi bagi mereka yang memakai merek CEO dan uji statistik akan mendukung hal tersebut.
Karena tidak realistis untuk mengumpulkan data pada setiap pelari dalam perlombaan, pilihan yang lebih efisien adalah dengan mengambil sampel pelari dan mengumpulkan pengukuran dependen dan independen pada mereka. kemudian melakukan uji inferensial pada sampel dan (dengan asumsi uji telah dilakukan dengan benar) menggeneralisasi kesimpulannya untuk seluruh total individu dari pelari maraton.
ada beberapa perbedaan dari deskriptif dan inferensial yang dapat kita soroti dalam menentukan langkah kunci dari permasalahannya, yaitu:
Elemen Masalah statistik deskriptif
1) Tentukan populasi (atau contoh)
2) Pilih variabel yang akan diselidiki
3) Pilih tabel, grafik, atau alat ringkasan numerik.
4) Mengidentifikasi pola dalam data.
Elemen inferensial statistik Masalah
1) mendefinisikan populasi
2) Pilih variabel yang akan diselidiki
3) Pilih sampel dari unit populasi
4) Jalankan uji statistik pada sampel.
5) Generalisasi hasil untuk populasi dan menarik kesimpulan.