Pembicaraan Wikikamus:Kelayakan entri
Bagian baruKomentar
[sunting]- Mungkin daftar bahasa daerah bisa diambil dari daftar yang resmi, seperti peta bahasa kemdikbud?
- Attestation (pencatatan? kurang yakin bahasa Indonesianya apa) - salah satu hal yang penting juga, karena jika lemanya hanya dipakai 2-3 orang, atau hanya merupakan hapax legomenon dalam karya yang tidak layak/notable, mungkin tidak layak masuk kamus juga
Sekian feedback saya. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 05.08 (UTC)
- @Fehufanga: Untuk bahasa daerah saya usulkan mengikuti Daftar Ethnologue saja, karena selain sudah memuat kode ISO, banyak juga bahasa tidak tercatat di daftar Kemdikbud (seperti Kaidipang). Saya setuju mengenai atestasi (bentuk tercatat?), mungkin bisa menggunakan korpus seperti Korpus Leipzig atau Korpus SEALANG, menghindari kasus seperti "kulacino" dalam KBBI. Mbee-wiki (bicara) 22 Juni 2022 13.30 (UTC)
- Oh iya juga, ada Ethnologue. Kedua korpus tersebut nampaknya bagus untuk atestasi. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.04 (UTC)
- Untuk kata-kata yang berasal dari karya fiksi (misalnya mithril dari seri LoTR), apakah "memerlukan paling tidak atestasi di luar karya fiksi" merupakan kriteria atestasi yang dapat digunakan? Tinggal menentukan berapa nilai . --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.09 (UTC)
- Saya mengusulkan 5-10 kemunculan diluar karya fiksi yang bersangkutan. Namun apakah kemunculan di internet (termasuk sosial media) dihitung? Apakah ada cara tertentu untuk mencari dari korpus Internet? Saya mengambil contoh kata-kata yang lazim digunakan seperti "pintu ke mana saja" dari Doraemon dan "jubah gaib" dari Harry Potter, keduanya lazim digunakan di sosmed namun tidak atau sulit ditemukan di korpus ataupun di google trends. Mbee-wiki (bicara) 23 Juni 2022 11.01 (UTC)
- Kalau menurut saya, bobot penggunaan lema di sosmed seharusnya tidak sebesar bobot penggunaan lema dalam karya tulis yang lebih dikenal. --*Fehufangą (✉ Pembicaraan) 24 Juni 2022 09.57 (UTC)
- Saya mengusulkan 5-10 kemunculan diluar karya fiksi yang bersangkutan. Namun apakah kemunculan di internet (termasuk sosial media) dihitung? Apakah ada cara tertentu untuk mencari dari korpus Internet? Saya mengambil contoh kata-kata yang lazim digunakan seperti "pintu ke mana saja" dari Doraemon dan "jubah gaib" dari Harry Potter, keduanya lazim digunakan di sosmed namun tidak atau sulit ditemukan di korpus ataupun di google trends. Mbee-wiki (bicara) 23 Juni 2022 11.01 (UTC)
- @Fehufanga: Saya sudah mencoba membuat bagian untuk ketercatatan (attestation), sila dilihat dan dikembangkan lebih jauh. Mbee-wiki (bicara) 29 Juli 2022 12.48 (UTC)
- Ada masalah dengan ketercatatan dalam bahasa Indonesia yang tidak ada (atau hampir ada) dalam bahasa Inggris. Itu teks berkualitas buruk yang dibuat dengan terjemahan mesin dari bahasa Inggris. Apakah kata seperti "dimana" ("kota dimana saya pernah bersekolah") atau "diluar" atau "di gunakan" atau "sosial media" (melawan aturan "baik dalam kata majemuk maupun dalam kalimat, segala sesuatu yang menerangkan terletak di belakang yang diterangkan") bagus? Taylor 49 (bicara) 29 Juli 2022 20.33 (UTC)
- Menurut saya, dimana, diluar, di gunakan, dan kesalahan ejaan lainnya dapat memiliki halamannya sendiri. Namun, halaman itu hanya berfungsi sebagai pengalihan ke kata dengan ejaan yang benar (contoh: en:pronounciation mengalihkan pembaca ke en:pronunciation). Kalau sosial media, karena sudah banyak digunakan, seharusnya tidak ada masalah dimasukkan ke dalam kamus. Saya tidak ingat ada kata-kata lain yang melawan urutan kata utama/head-directionality dalam bahasa Indonesia, namun Inggris juga memiliki kata-kata dengan kata utama yang dibalik. en:court martial, en:attorney general, adalah beberapa contoh yang saya ingat. --*Fehufangą (✉ Pembicaraan) 29 Juli 2022 23.12 (UTC)
- Kembang kol, Amerika Serikat, dan perdana menteri adalah kata-kata yang lazim dan baku, namun letak inti-pewatasnya terbalik. Ini biasa terjadi pada kata-kata serapan terjemah (calque) dari bahasa asing ke bahasa Indonesia. Bentuk "kali pertama", "kali kedua", dst. juga lazim ditemukan meskipun tidak selazim "pertama kali", "kedua kali", dst. Setuju dengan Fehufanga, tidak masalah sepertinya selama penggunaannya lazim dan berterima, serta bukan hapax legomenon. Mbee-wiki (bicara) 30 Juli 2022 04.05 (UTC)
- Menurut saya, dimana, diluar, di gunakan, dan kesalahan ejaan lainnya dapat memiliki halamannya sendiri. Namun, halaman itu hanya berfungsi sebagai pengalihan ke kata dengan ejaan yang benar (contoh: en:pronounciation mengalihkan pembaca ke en:pronunciation). Kalau sosial media, karena sudah banyak digunakan, seharusnya tidak ada masalah dimasukkan ke dalam kamus. Saya tidak ingat ada kata-kata lain yang melawan urutan kata utama/head-directionality dalam bahasa Indonesia, namun Inggris juga memiliki kata-kata dengan kata utama yang dibalik. en:court martial, en:attorney general, adalah beberapa contoh yang saya ingat. --*Fehufangą (✉ Pembicaraan) 29 Juli 2022 23.12 (UTC)
- Ada masalah dengan ketercatatan dalam bahasa Indonesia yang tidak ada (atau hampir ada) dalam bahasa Inggris. Itu teks berkualitas buruk yang dibuat dengan terjemahan mesin dari bahasa Inggris. Apakah kata seperti "dimana" ("kota dimana saya pernah bersekolah") atau "diluar" atau "di gunakan" atau "sosial media" (melawan aturan "baik dalam kata majemuk maupun dalam kalimat, segala sesuatu yang menerangkan terletak di belakang yang diterangkan") bagus? Taylor 49 (bicara) 29 Juli 2022 20.33 (UTC)
Bahasa Buatan
[sunting]Saya mengusulkan cukup Esperanto (eo) saja yang termasuk dalam cakupan dari WT-ID. Bahasa ini sudah memiliki sumber dan komunitas yang cukup berkembang di Indonesia, sementara bahasa-bahasa buatan yang lain masih belum sampai level demikian. Untuk Toki Pona mungkin bisa dibuat menjadi lampiran saja, seperti di WT-EN. Mbee-wiki (bicara) 22 Juni 2022 13.44 (UTC)
- Saya tidak ada masalah dengan itu. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.06 (UTC)
- Cukup bagus untuk saya. Taylor 49 (bicara) 24 Juni 2022 14.36 (UTC)
- @Fehufanga @Taylor 49: Apakah perlu dibuat voting di Warung Kopi? Mbee-wiki (bicara) 26 Juni 2022 02.34 (UTC)
- Cukup bagus untuk saya. Taylor 49 (bicara) 24 Juni 2022 14.36 (UTC)
- Saya mengubah teks ke "Bahasa buatan lain (seperti Toki Pona) dapat diperbolehkan dalam ruang nama utama atau Lampiran hanya sesudah diskusi tertentu.". Taylor 49 (bicara) 26 Juni 2022 09.16 (UTC)
- skolo dalam bahasa Ido. Hapus? Taylor 49 (bicara) 7 Juli 2022 19.55 (UTC)
- Diganti saja semua dengan b. Esperanto. Jika merujuk dari Esperanto-Indonezia Vortaro, "skolo" bermakna "sekolah (dalam seni atau filsafat)". Mbee-wiki (bicara) 8 Juli 2022 12.36 (UTC)
- Tidak ada semua. Halaman "skolo" sudah menjadi halaman lema Esperanto. Bagian tentang bahasa Ido dihapus dari dua halaman lain yang memiliki bahasa lagi yang diperbolehkan. Dua halaman lema dan dua halaman lain untuk bahasa Ido diusulkan untuk penghapusan. Taylor 49 (bicara) 9 Juli 2022 19.52 (UTC)
Entri
[sunting]Saya rasa perlu ada pengkategorian yang jelas di dalam wikikamus. Merujuk ke diskusi sebelumnya, kondisi kategorisasi wikikamus, serta membandingkan dengan WT-EN, saya mengusulkan rancangan berikut:
- Kategori tertinggi dari tiap bahasa adalah "Kategori:Bahasa X". Kategori ini termasuk juga untuk indeks, templat, modul, juga untuk bentuk morfem.
- Kategori berikutnya adalah "Kategori:xx:Lema" untuk lema dan "Kategori:xx:Sublema" untuk segala bentuk turunan dari lema (mis. "jalan" adalah lema, maka "berjalan" adalah sublema). Kedua kategori ini bisa dihubungkan secara interwiki. Di sisi lain "Kategori:Kata bahasa X" dihapuskan atau dipindahkan
- Kategori berikutnya terbagi menurut lema atau sublema. Untuk lema adalah "Kategori:xx:kelas kata" atau "Kategori:xx:Frasa", sementara untuk sublema adalah "Kategori:xx:Sublema kelas kata".
Contohnya: "Kategori:Bahasa Tionghoa" > "Kategori:zh:Lema" > "Kategori:zh:Nomina" / "Kategori:zh:Frasa"
- "Kategori:zh:Sublema" > "Kategori:zh:Sublema nominal".
Mbee-wiki (bicara) 8 Juli 2022 14.00 (UTC)
- Setuju. Apalagi dengan "Kategori tertinggi dari tiap bahasa adalah "Kategori:Bahasa X". Kategori ini termasuk juga untuk indeks, templat, modul, juga untuk bentuk morfem", dan jangan berisi lema. Struktur lema (juga frasa dan "bentuk kurang-lema" seperti "dogs" dari "dog") harus ditentukan. Taylor 49 (bicara) 9 Juli 2022 19.52 (UTC)
- Ya, lema dan sublema tidak perlu masuk halaman kategori tertinggi, cukup halaman kategorinya saja. Penentuan apa yang dianggap sebagai lema dan sublema sepertinya perlu ditentukan dalam tiap-tiap bahasa. Mungkin nanti dibutuhkan juga semacam panduan entri tiap-tiap bahasa seperti di WT-EN (macam halaman-halaman "Wiktionary:About X"). Mbee-wiki (bicara) 28 Juli 2022 14.38 (UTC)
Cakupan bahasa
[sunting]Memastikan cakupan kode bahasa sepertinya juga penting, karena "tanpa kode" bisa berarti:
- Tidak pernah dideskripsikan (praktis tidak dapat dimuat)
- Sudah dideskripsikan:
- Pernah memiliki kode sendiri, tapi kemudian digabungkan ke kode lain (cf. Palembang < Musi, Kayuagung < Komering)
- Belum pernah memiliki kode sendiri:
- Sudah tercakup di dalam kode yang lain (cf. Banyumasan < Jawa)
- Belum jelas tercakup dalam kode yang mana (cf. Kuansing < Melayu/Minang?, Kotawaringin < Melayu/Banjar?)
Plus, ada juga bahasa yang memiliki kode sendiri, tetapi cakupannya seringkali dianggap lebih luas dan meliputi kode lainnya (cf. Lamaholot?).
Mungkin akan lebih baik kalau poin-poin cakupan bahasa untuk "bahasa alami" ditulis sebagai prosa dan disederhanakan menjadi sbb.:
- Bahasa Indonesia sebagai bahasa proyek berfungsi ganda sebagai bahasa utama yang dijabarkan, serta sebagai bahasa penjabaran bagi semua bahasa di Wikikamus. Semua ragam bahasa dengan kode ISO 639-1 atau ISO 639-3 juga dapat diperlakukan sebagai bahasa yang dijabarkan di Wikikamus, seperti misalnya bahasa Sunda (su), bahasa Minangkabau (min), bahasa Swedia (sv), bahasa Mapuche (arn) dsb. Dalam beberapa kasus, cakupan sebuah kode bahasa dapat diperluas hingga meliputi beberapa ragam lainnya, atau dipersempit untuk memisahkan ragam tertentu. Penetapan perlakuan bahasa yang berbeda dari standar ISO 639 hanya dapat dilakukan melalui diskusi dan pertimbangan yang matang.
Bagian lihat pula bisa dijadikan hatnote atau tambahan teks setelah prosa ini.
Aku secara eksplisit menghilangkan poin "... maka di bagian "Terjemahan" suatu lema non-Indonesia..." dst., karena lema non-Indonesia tidak perlu memiliki bagian terjemahan sendiri, cukup definisi dalam bahasa Indonesia saja (ini bisa dijelaskan di pedoman tata letak entri). Penyederhanaan ini juga menghilangkan pembedaan perlakuan antara bahasa daerah dan bahasa di luar Indonesia, tetapi masih menjamin bahwa patokan utamanya tetap kode ISO 639. Swarabakti (bicara) 9 Juli 2025 20.38 (UTC)
- Tambahan, perlakuan bahasa yang sudah disepakati melalui diskusi dapat didokumentasikan pada satu halaman tersendiri (cf. en:Wiktionary:Language treatment). Swarabakti (bicara) 10 Juli 2025 00.50 (UTC)
- Kebijakan menyatakan "tanpa kode ISO 639-3". Pasti artinya " sekarang tidak memiliki kode ISO 639-3 sendiri yang aktif ".
Agak setuju dengan halaman tersendiri en:Wiktionary:Language treatment, tetapi itu sama sekali tidak mendesak. Wiki ini kecil, tidak ada kebutuhan mutlak memiliki semua halaman yang ada di wikikamus bahasa Inggris. Taylor 49 (bicara) 12 Juli 2025 16.45 (UTC)
- @Taylor 49: Mungkin maksudku itu, bukan ragam bahasanya yang mesti didefinisikan "memiliki" kode ISO 639 atau tidak. Sebaliknya, kode ISO 639-nya yang perlu didefinisikan mencakup ragam bahasa apa saja (apalagi kalau ragam bahasanya punya nama Indonesia yang beragam dan berbeda dari nama kanonik bahasa Inggrisnya di standar ISO). Swarabakti (bicara) 14 Juli 2025 13.01 (UTC)
- Kebijakan menyatakan "tanpa kode ISO 639-3". Pasti artinya " sekarang tidak memiliki kode ISO 639-3 sendiri yang aktif ".
Revisi:
- Bahasa Indonesia sebagai bahasa proyek berfungsi ganda sebagai bahasa utama yang dijabarkan, serta sebagai bahasa penjabaran bagi semua bahasa di Wikikamus. Setiap ragam bahasa yang direpresentasikan oleh kode ISO 639-1 atau ISO 639-3 sendiri yang masih aktif juga dapat diperlakukan sebagai bahasa yang dijabarkan di Wikikamus, seperti misalnya bahasa Sunda (su), bahasa Minangkabau (min), bahasa Swedia (sv), bahasa Mapuche (arn) dsb. Dalam beberapa kasus, cakupan sebuah kode bahasa dapat diperluas hingga meliputi ragam tertentu, atau dipersempit untuk mengecualikan ragam tertentu. Penetapan perlakuan bahasa yang berbeda dari standar ISO 639 hanya dapat dilakukan melalui diskusi dan pertimbangan yang matang. Swarabakti (bicara) 14 Juli 2025 13.31 (UTC)
Ketercatatan
[sunting]Usul untuk memperjelas subkriteria dari bagian Ketercatatan:
Ketercatatan
[sunting]Sebuah istilah dianggap tercatat (attested) apabila keberadaannya dapat dibuktikan melalui:
- Kelazimannya di kalangan penutur bahasa Indonesia; atau
- Penggunaannya yang menyatakan makna dalam teks-teks berbahasa Indonesia yang dapat dilacak, dengan kemunculan terpisah sebanyak 3 kali atau lebih, setidaknya dalam jangka waktu satu tahun.
Menyatakan makna
[sunting]Istilah yang dimuat dalam kutipan mestilah digunakan untuk menyatakan makna yang dikandungnya secara langsung, bukan hanya sekadar disebutkan atau dijelaskan maknanya. Misalnya, contoh berikut ini tidak sah untuk dijadikan bukti ketercatatan bagi kata palum dalam bahasa Indonesia:
Dapat dilacak
[sunting]Kutiplah sumber teks berbahasa Indonesia yang kemungkinan akan terus dapat diakses, sehingga pembaca Wikikamus di masa mendatang tetap dapat melacaknya kembali di sumber aslinya.
- Sumber teks yang diutamakan adalah peraturan perundang-undangan, karya sastra ternama, buku teks pendidikan, kamus, kitab suci, dan media massa ternama dalam bahasa Indonesia.
- Korpus bahasa Indonesia (seperti Korpus Leipzig dan Korpus SEALANG) juga dapat digunakan untuk melihat ketercatatan sebuah entri.[1]
Kemunculan terpisah
[sunting]Kemunculan dalam dua kutipan dianggap terpisah jika diambil dari kalimat berbeda dan dari orang yang berbeda pula. Sepasang kutipan tidak dianggap sebagai kemunculan terpisah jika:
- Satu di antaranya merupakan kutipan langsung dari yang satunya lagi; atau
- Keduanya merupakan terjemahan atau kutipan langsung dari sumber asli yang sama; atau
- Keduanya berasal dari penulis atau penutur yang sama.
Jangka waktu
[sunting]Panjang rentang waktu antara kutipan paling awal dan paling akhir menunjukkan kestabilan penggunaan sebuah istilah. Penggunaan yang bertahan selama satu tahun atau lebih menandakan bahwa istilah tersebut sudah stabil dan layak dimuat. Ketentuan ini mengecualikan semua jenis istilah yang belum dapat dibuktikan kestabilannya, termasuk neologisme yang baru diusulkan (oleh badan resmi ataupun perorangan) ataupun istilah yang baru mencuat secara alami di kalangan penutur.