Metode linear kongruen (Inggris: linear congruent method, dapat disingkat dengan LCM) merupakan algoritma yang menghasilkan barisan bilangan acak semu lewat persamaan linear bagian-demi-bagian. Metode ini juga dikenal dengan metode kongruen linear,pembangkit kongruensial linear dan generator kongruensial linear (Inggris: linear congruential generator, LCG). Metode ini termasuk algoritma yang tertua dan terkenal untuk membangkitkan bilangan acak semu.[1] Konsep metode ini relatif mudah dipahami, mudah diimplementasikan, dan memiliki waktu eksekusi yang cepat, khususnya untuk perangkat keras komputer yang mendukung aritmetika modular dengan pemotongan pada bit-bit penyimpanan. LCM memanfaatkan relasi rekursif linear:
dengan sebagai barisan bilangan acak semu, dan konstanta bilangan bulat
dengan sebagai "benih", "nilai awal", atau "kondisi awal"
sebagai parameter khas untuk LCM. Jika , metode ini umum disebut degan metode kongruensial multiplikatif (Inggris: multiplicative congruential generator, MCG) atau pembangkit Lehmer. Jika , metode ini disebut metode kongruensial campuran.[2] Ketika , relasi rekursif LCM sebenarnya adalah sebuah transformasi affine, bukan transformasi linear. Namun penggunaan istilah linear yang salah sudah sangat umum pada bidang ilmu komputer.[3]
Demonstrasi
Terdapat 50 soal pada sebuah sistem database ujian. Untuk setiap ujian, soal akan dipilih secara acak dari database. Untuk mengusahakan tidak terjadi repetisi soal-soal yang telah dikerjakan, sistem memilih soal "baru" dengan menggunakan LCM; dengan konstanta, , , dan . Berikut adalah lima bilangan acak (semu) pertama yang dihasilkan oleh LCM tersebut
Lebih lanjut, barisan 20 bilangan acak pertama yang dibangkitkan adalah: 18, 5, 12, 39, 36, 3, 40, 47, 24, 21, 38, 25, 32, 9, 6, 23, 10, 17, 44, 42.
Pemilihan nilai konstanta pada , , dan pada LCM ini sesuai untuk menghindari perulangan soal pada saat melakukan ujian. Saat melakukan ujian pertama kali, nilai dan peserta akan mendapatkan soal bernomor {18, 5, 12, 39, 36}. Namun ujian yang kedua memiliki nilai awal dan peserta akan mendapatkan soal bernomor {3, 40, 47, 24, 21}.
Sejarah
Metode pembangkit Lehmer dipublikasikan pada tahun 1951,[4] dan the Metode linear kongruen dipublikasikan pada tahun 1958 oleh W. E. Thomson and A. Rotenberg.[5][6]
Panjang periode
Ciri dari LCM adalah akan terjadi pengulangan hasil setelah sekian kali pembangkitan. Dengan pemilihan parameter yang baik, periode pengulangan dapat diketahui dan dipilih agar lebih lama. Walaupun bukan satu-satunya kriteria, periode yang sangat singkat adalah kesalahan fatal bagi pembangkit bilangan acak semu.[7][8]
Walaupun LCM dapat menghasilkan bilangan acak semu yang lulus uji keacakan, kualitas bilangan yang dihasilkan sangat sensitif terhadap pemilihan parameter dan .[3][7][9][10][11][12] Sebagai contoh, dan menghasilkan bilangan modulo-m yang terurut, yang walau memiliki periode yang panjang, jelas tidak acak. Secara historis, pemilihan konstanta yang buruk berujung pada implementasi LCM yang buruk. Contoh khusus kasus ini adalah RANDU, yang digunakan secara luas pada awal 1970-an dan berujung pada banyak hasil yang tidak kredibel.[13]
Terdapat tiga keluarga parameter yang umum digunakan:
Ini adalah konstruksi dasar dari pembangkit bilangan acak Lehmer. Periode LCM adalah jika pengali dipilih sebagai elemen primitif dari modulo . Kondisi awal perlu dipilih antara dan .
Kelemahan dari menggunakan modulus bilangan prima adalah operasi modulo memerlukan double-width productdan langkah operasi modulo yang eksplisit. Umumnya prima yang dekat dengan perpangkatan angka 2 ( prima Mersenne yang berbentuk 231−1 dan 261−1 populer), sehingga operasi modulo dapat dihitung sebagai
Hal ini perlu diikuti oleh pengurangan nilai jika hasilnya terlalu besar, namun banyaknya pengurangan terbatas oleh , yang dapat dibatasi dengan mudah menjadi 1 jika nilai kecil.
Jika double-width product tidak tersedia, namun pengali dipilih secara seksama, metode Schrage[14] dapat digunakan. Untuk melakukannya:
Faktorkan , misal dengan dan .
Hitung nilai
Karena , suku pertama tegas lebih kecil dari . Jika dipilih sehingga (sehingga ), maka suku kedua juga akan lebih kecil dari karena .
Dengan cara ini, untuk menghitung kedua suku cukup digunakan single-width product, dan selisih antara keduanya terletak di , sehingga dapat disederhanakan menjadi dengan satu kondisi penjumlahan.[15]
Kekurangan kedua dari metode ini adalah cukup canggung untuk mengonversi nilai ke distribusi bit acak yang uniform. Jika sebuah prima yang dekat dengan perpangkatan 2 digunakan, bilangan acak (yang tidak pernah muncul) dapat diabaikan.
m perpangkatan 2, c = 0
Memilih sebagai perpangkatan dari 2, umumnya atau , menghasilkan LCM yang efisien karena hal ini memungkinan operasi modulo dihitung dengan memotong representasi biner bilangan. Faktanya, bit paling signifikan umumnya tidak dihitung sama sekali. Namun, parameter ini memiliki kekurangan.
Bentuk ini memiliki periode maksimum , diperoleh ketika atau . Kondisi awal perlu bilangan ganjil, dan nilai tiga bit terkecil dari berseling antara dua nilai sehingga tidak berguna. Dapat ditunjukkan bahwa bentuk ini setara dengan pembangkit dengan modulus dan .[12]
Isu yang lebih serius karena menggunakan modulus perpangkatan 2 adalah bit-bit rendah memiliki periode yang lebih kecil dibandingkan bit-bit tinggi. Bit terendah dari tidak pernah berubah (karena selalu bilangan ganjil), dan dua bit selanjutnya berseling antara dua nilai (jika , nilai bit 1 tidak pernah berubah dan nilai bit 2 berseling, sedangakan jika nilai bit 1 berseling dan nilai bit 2 selalu tetap).
c ≠ 0
Ketika , pemilihan parameter yang baik memungkinkan periode dapat sepanjang , untuk semua kondisi awal. Hal ini terjadi, jika dan hanya jika:[12]
Tiga syarat ini dikenal sebagai Teorema Hull–Dobell.[16][17]
Bentuk ini dapat digunakan untuk sebarang , namun hanya bekerja dengan baik untuk yang memiliki banyak faktor prima yang berulang, seperti perpangkatan angka 2. Jika bilangan bebas-kuadrat, hal ini mengakibatkan , menjadikannya pembangkit bilangan acak yang sangat buruk. Pengali dengan periode maksimum hanya tersedia ketika memiliki faktor prima yang berulang.
Walau teorema Hull–Dobell memberikan periode yang maksimum, hal tersebut belum cukup untuk membuktikan pembangkit yang baik. Sebagai contoh, yang lebih sulit dibagi oleh faktor-faktor prima lebih disukai. Karena itu, jika adalah perpangkatan angka 2, maka perlu dapat dibagi 4 namun tidak dapat dibagi 8, misal .[12]
Tentu, kebanyakan pengali menghasilkan barisan yang gagal untuk suatu uji keacakan, dan memilih pengali yang memenuhi semua kriteria uji cukup sulit. Uji spektral adalah salah satu uji keacakan terpenting.
Perhatikan bahwa modulus berupa perpangkatan angka 2 memiliki permasalahan yang sama dengan kasus : bit terendah menghasilkan pembangkit dengan modulus dan karenanya memiliki periode ; hanya bit paling signifikan yang memiliki periode penuh. Jika sebuah bilangan acak semu kurang dari yang diperlukan, menghitung memberikan hasil yang lebih baik ketimbang . Sayangnya pada kebanyakan bahasa pemrograman, bentuk terakhir lebih banyak digunakan karena lebih mudah ditulis
Pembangkit LCM sendiri tidak sensitif terhadap pemilihan , selama nilainya koprima terhadap modulus (misal, jika merupakan perpangkatan angka 2, maka perlu bernilai ganjil), sehingga nilai umum dipilih.
Barisan yang dihasilkan dari pemilihan yang lain dapat ditulis sebagai fungsi sederhana dari barisan ketika .[12] Secara spesifik, jika adalah barisan yang didefinisikan dengan dan , maka barisan dapat ditulis sebagai fungsi affine dari :
Secara umum, dua barisan dan yang memiliki pengali dan modulus yang sama memiliki hubungan:
Parameter yang umum digunakan
Tabel berikut berisi daftar parameter LCM yang umum digunakan, termasuk fungsi rand() yang umum dimiliki oleh banyak kompilator. Tabel ini hanya menunjukkan parameter yang populer, bukan sebagai parameter implementasi yang baik. Tabel dengan parameter yang bagus tersedia.[3][18]
Seperti terlihat di atas, LCM tidak selalu menggunakan semua bit bilangan yang dihasilkan. Sebagai contoh, implementasi Java beroperasi dengan 48-bit pada setiap iterasi, namun hanya menghasilkan nilai dari 32 bit pertama. Hal ini disebabkan karena bit dengan order yang lebih tinggi memiliki periode yang lebih lama dibandingkan dengan bit dengan order rendah. LCM yang menggunakan teknik pemotongan bit ini menghasilkan nilai yang secara statistik lebih baik jika dibandingkan dengan yang tidak. Hal ini terlihat pada implementasi kode yang menggunakan operasi modulo untuk memperkecil jangkauan hasil; tanpa pemotongan, modulo 2 dari bilangan acak yang dihasilkan akan menghasilkan hasil 0 dan 1 yang periodik.
Kelebihan dan kekurangan
Metode LCM cepat dan hanya memerlukan memori yang kecil (satu bilangan modulo-m, umumnya 32 atau 64 bit) untuk penyimpanan sementara bilangan yang dihasilkan. Hal ini yang membuat LCM berguna untuk menyimulasikan beberapa keadaan independen. LCM tidak ditujukan, dan jangan digunakan, untuk aplikasi dalam bidang kriptografi; pembangkit bilangan acak semu (Inggris: pseudo random number generator, PRNG) yang aman secara kriptografi diperlukan untuk hal tersebut.
Walau LCM memiliki beberapa kelemahan spesifik, kebanyakan kelemahannya diakibatkan dari pemilihan parameter yang terlalu kecil. LCM dengan parameter yang cukup besar dapat lulus dari tes statistik yang ketat; LCM modulo-2 yang menghasilkan 32 bit bilangan lulus SmallCrush oleh TestU01,[butuh rujukan] dan LCM 96-bit lulus dari tes BigCrush yang jauh lebih sulit.[33]
Untuk contoh yang spesifik, pembangkit bilangan acak semu (PNRG) dengan keluaran 32 bit, memiliki ekspektasi (lewat teorema Birthday) mulai mengulangi keluaran yang pernah dihasilkan setelah melakukan keluaran. Setiap PNRG dengan keluaran tanpa pemotongan bit, tidak akan berulang sampai periode maksimumnya tercapai; sebuah cacat statistik yang mudah dideteksi. Dengan alasan serupa, PNRG perlu memiliki periode yang lebih panjang daripada akar dari banyak keluaran yang diinginkan. Mempertimbangkan kecepatan komputer modern, periode sebesar dibutuhkan untuk aplikasi kurang penting (secara kriptografi), dan periode yang lebih besar untuk aplikasi yang penting.
Satu kecacatan spesifik LCM adalah, jika digunakan untuk memilih titik pada ruang dimensi , titik tersebut akan terletak (maksimal) pada hyperplane, berdasarkan teorema Marsaglia (yang dikembangkan oleh George Marsaglia).[34] Hal ini disebabkan oleh serial correlation antar nilai yang berurutan pada barisan . Pengali yang dipilih dengan lalai umumnya menghasilkan sedikit bidang, dengan jarak antar bidang yang besar, yang dapat menyebabkan masalah. Uji spektral, yang merupakan tes kualitas LCM yang sederhana, mengukur jarak antar bidang dan memungkinkan untuk memilih nilai pengali yang baik.
Jarak antar bidang bergantung pada modulus dan pengali LCM. Modulus yang cukup besar dapat memperkecil jarak ini sehingga kurang dari bilangan double precision. Pemilihan pengali menjadi kurang penting ketika modulus yang dipakai besar. Namun masih penting untuk menghitung indeks spektral dan memastikan tidak memilh pengali yang buruk, walau secara statistik hampir mustahil mendapatkan pengali yang buruk ketika nilai modulus lebih besar dari .
Salah satu kecacatan lain yang spesifik pada LCM adalah periode bit-rendah yang pendek ketika dipilih sebagai bilangan perpangkatan 2. Hal ini dapat dihindari dengan menggunakan modulus yang lebih besar daripada banyak keluaran yang diinginkan, dan menggunakan bit-bit tinggi dari hasil yang dikeluarkan.
Walaupun demikian, LCM dapat menjadi pilihan yang bagus untuk beberapa aplikasi. Sebagai contoh, pada sistem tertanam, banyak memori yang tersedia sangat terbatas. Pada lingkungan yang serupa, seperti pada konsol permainan, mengambil beberapa bit-tinggi dari LCM mungkin sudah cukup. Keacakan nilai bit-bit rendah dari LCM dengan modulus berupa perpangkatan 2 tidak disarankan untuk digunakan. Hal ini disebabkan karena periode yang sangat pendek. Sebagai contoh, LCM dengan modulus berupa perpangkatan 2, dan dengan hasil yang tidak mengalami pemotongan bit, akan menghasilkan bilangan genap dan bilangan ganjil yang berselang-seling.
LCM perlu dievaluasi secara mendalam untuk penggunaan pada aplikasi non-kriptografis yang memerlukan kualitas keacakan tinggi. Untuk simulasi Monte Carlo dibutuhkan LCM dengan nilai modulus yang (jauh) lebih besar daripada pangkat tiga dari banyak keluaran yang dibutuhkan. Hal ini mengartikan, sebagai contoh, LCM 32 bit (yang baik) dapat digunakan untuk menghasilkan sekitar 1000 bilangan acak, dan LCM 64 dapat digunakan untuk menghasilkan (sedikit diatas dua juta) bilangan. Karena keadaan tersebut, LCM secara praktis tidak cocok untuk simulasi Monte Carlo skala besar.
Implementasi
Berikut salah satu implementasi LCM dalam bahasa pemrograman Python:
Seperti semua pembangkit bilangan acak semu lainnya, LCM perlu menyimpan dan mengubah keadaan bilangan acak yang dihasilkan. Komputer dengan banyak utas yang mengakses keadaan ini dapat menyebabkan race condition. Implementasi dengan setiap utas memiliki inisialisasi nilai awal yang unik diperlukan agar tidak ada utas dengan barisan bilangan acak yang sama.
Turunan LCM
Terdapat beberapa pembangkit dengan bentuk yang didasarkan pada LCM, sehingga teknik yang digunakan untuk menganalisis LCM juga dapat dipakai untuk mereka.
Salah satu metode untuk menghasilkan periode yang lebih panjang adalah dengan menjumlahkan beberapa LCM, dengan periode yang berbeda dan memiliki faktor bersama yang besar. Pembangkit Wichmann-Hill adalah salah satu contoh metode ini. Metode ini dapat ditunjukkan ekuivalen dengan sebuah LCM dengan modulus sebagai hasil perkalian modulus LCM komponen-komponennya.
^Lehmer, Derrick H. (1951). "Mathematical methods in large-scale computing units". Proceedings of 2nd Symposium on Large-Scale Digital Calculating Machinery: 141–146.
^L'Ecuyer, Pierre (13 July 2017). Chan, W. K. V.; D’Ambrogio, A.; Zacharewicz, G.; Mustafee, N.; Wainer, G.; Page, E., ed. History of Uniform Random Number Generation(PDF). Proceedings of the 2017 Winter Simulation Conference (to appear). Las Vegas, United States. hal-01561551.
^ abcdeKnuth, Donald (1997). Seminumerical Algorithms. The Art of Computer Programming (edisi ke-3). Reading, MA: Addison-Wesley Professional. hlm. 10–26.Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
^In spite of documentation on MSDN, RtlUniform uses LCG, and not Lehmer's algorithm, implementations before Windows Vista are flawed, because the result of multiplication is cut to 32 bits, before modulo is applied