Ini adalah daftar kata untuk software Diceware / Passphrase Generator / XKCD-style Password Generator untuk Bahasa Indonesia. Saat ini daftar ini digunakan untuk 2 situs saya: frasa-sandi.adianto.id dan babelpassgen.gitlab.io .
Daftar yang digunakan saat ini adalah daftar modifikasi dari https://github.com/ardwort/freq-dist-id/blob/master/data/kompas.1gram . Dari daftar tersebut saya memfilter kata-kata yang kira-kira sesuai kemudian mengambil top 2048 kata dengan harapan agar berhasil mendapatkan kata-kata yang umum digunakan di indonesia saja. File excel berisi pemfilteran yang saya gunakan dapat diakses di https://drive.google.com/file/d/1QjitJF9dj3GBjeJ2gR4NK6v1bYN3Hfr7/view?usp=sharing
Daftar yang sebelumnya digunakan adalah list dari https://github.com/geovedi/indonesian-wordlist/blob/master/05-ivanlanin2011-sort-alpha.lst . List ini cukup bagus karena jumlah kata-katanya banyak, namun banyak menggunakan kata-kata yang jarang digunakan.
Dilisensikan dibawah Creative Common Attribution 4.0 International (CC BY 4.0)
Lanin, I., Geovedi, J., & Soegijoko. W. (2013). Perbandingan distribusi frekuensi kata bahasa Indonesia di Kompas, Wikipedia, Twitter, dan Kaskus. In Proceedings of Konferensi Linguistik Tahunan Atma Jaya Kesebelas (KOLITA11) (pp. 249-252).