Potongan data yang parsialDalam statistik, data yang hilang, atau nilai yang hilang, terjadi ketika tidak ada nilai data yang disimpan untuk variabel dalam suatu observasi. Data yang hilang merupakan kejadian umum dan dapat berdampak signifikan pada kesimpulan yang dapat ditarik dari data tersebut. Data yang hilang dapat terjadi karena tidak responsif: tidak ada informasi yang diberikan untuk satu atau beberapa item atau untuk seluruh unit ("subjek"). Beberapa item lebih cenderung menghasilkan respons yang tidak merespons daripada yang lain: misalnya item tentang subjek pribadi seperti pendapatan. Gesekan adalah jenis kesalahan yang dapat terjadi dalam studi longitudinal-misalnya mempelajari perkembangan di mana pengukuran diulang setelah jangka waktu tertentu. Missingness terjadi ketika peserta putus sekolah sebelum tes berakhir dan satu atau lebih pengukuran hilang. Data sering hilang dalam penelitian di bidang ekonomi, sosiologi, dan ilmu politik karena pemerintah atau entitas swasta memilih untuk tidak melaporkan statistik penting,[1] atau karena informasinya tidak tersedia. Terkadang, nilai yang hilang disebabkan oleh peneliti—misalnya, ketika pengumpulan data dilakukan secara tidak benar atau terjadi kesalahan dalam entri data.[2] Bentuk-bentuk kelalaian ini memiliki tipe yang berbeda-beda, dengan dampak yang berbeda terhadap validitas kesimpulan dari penelitian: Hilang sama sekali secara acak, hilang secara acak, dan hilang tidak secara acak. Data yang hilang dapat ditangani dengan cara yang sama seperti data yang disensor. Referensi
Pranala luar |