Pengelasan data (pengurusan data)

Dalam bidang pengurusan data, pengelasan data sebagai sebahagian daripada proses pengurusan kitaran hayat maklumat boleh ditakrifkan sebagai alat pengelasan data untuk membolehkan/membantu organisasi menjawab soalan berikut dengan berkesan:

Apabila dilaksanakan, ia menyediakan jambatan antara profesional teknologi maklumat (TM) dan pemilik proses atau aplikasi. Kakitangan TM dimaklumkan tentang nilai data dan pihak pengurusan (biasanya pemilik aplikasi) lebih memahami bahagian mana pusat data perlu dilaburkan untuk memastikan operasi berjalan dengan berkesan. Ini boleh menjadi sangat penting dalam pengurusan risiko, penemuan perundangan, dan pematuhan kepada peraturan setempat. Pengelasan data biasanya merupakan proses manual; walau bagaimanapun, terdapat banyak alatan daripada vendor berbeza yang boleh membantu mengumpulkan maklumat tentang data.

Pengelasan data perlu mengambil kira perkara berikut:

  • Keperluan kawal selia
  • Nilai strategik atau proprietari
  • Dasar khusus organisasi
  • Pertimbangan etika dan privasi
  • Perjanjian kontrak[1]

Permulaan proses pengelasan data

Langkah-langkah terawal ialah menilai dan membahagikan pelbagai aplikasi dan data ke dalam kategori masing-masing seperti berikut:

  • Data perhubungan atau berjadual (kira-kira 15% daripada data bukan audio/video):
    • Secara umumnya menerangkan data proprietari yang boleh diakses hanya melalui antara muka pengaturcaraan aplikasi atau aplikasi (API).
    • Aplikasi yang menghasilkan data berstruktur biasanya merupakan aplikasi pangkalan data.
    • Jenis data ini biasanya membawa prosedur penilaian data yang kompleks dan penghijrahan antara peringkat storan.
    • Untuk memastikan standard kualiti yang mencukupi, proses pengelasan perlu dipantau oleh pakar subjek.
  • Data separa berstruktur atau polistruktur (semua data bukan audio/video lain yang tidak mematuhi bentuk di atas yang ditentukan sistem atau platform).
    • Secara amnya menerangkan fail data yang mempunyai struktur semantik dinamik atau tidak berkaitan (cth dokumen, XML, JSON, output peranti atau log sistem, output sensor).
    • Proses pengelasan data yang agak mudah ialah penetapan kriteria.
    • Proses mudah pemindahan data antara segmen yang diperuntukkan bagi peringkat storan yang telah ditetapkan.

Jenis pengelasan data lazim termasuk data geografikal, kronologi, kualitatif (berdasarkan sifat/kualiti) dan kuantitatif (terukur).

Ia juga harus dinilai merentas tiga dimensi:

  1. Kebolehcaman: betapa mudahnya data ini digunakan untuk mengenal pasti individu?
  2. Sensitiviti: berapa banyak kerosakan yang boleh dilakukan jika data ini sampai ke tangan yang salah?
  3. Kekurangan: sejauh manakah data ini tersedia?[2]

Manfaat pengelasan data

Manfaat pelaksanaan pengelasan data yang sesuai dengan berkesan boleh meningkatkan proses ILM dengan ketara dan menjimatkan sumber storan pusat data. Jika dilaksanakan secara sistematik, ia boleh menjana peningkatan prestasi dan penggunaan pusat data. Pengelasan data juga boleh mengurangkan kos dan overhed pentadbiran. Klasifikasi data yang "cukup baik" boleh menghasilkan kesan ini:

  • Pematuhan data dan pengurusan risiko yang lebih mudah. Data terletak di tempat yang dijangkakan pada peringkat storan yang telah ditetapkan dan "titik masa"
  • Memudahkan penyulitan data kerana semua data tidak perlu disulitkan. Ini menjimatkan kitaran pemproses yang berharga dan semua urutan yang berkaitan.
  • Pengindeksan data untuk meningkatkan masa akses pengguna
  • Perlindungan data ditakrifkan semula di mana RTO (Objektif Masa Pemulihan) dipertingkatkan.

Rujukan

  1. ^ "Get the scoop on data classification and GDPR before you're too late - LightsOnData". LightsOnData (dalam bahasa Inggeris). 2018-05-23. Dicapai pada 2018-05-23.
  2. ^ Khatibloo, Fatemeh (May 2017). "How Dirty Is Your Data? Strategic Plan: The Customer Trust And Privacy Playbook". The Customer Trust and Privacy Playbook for 2018.