Common Voice - Matnlarni tasdiqlash mezonlari
Abbosjon KudratovManbalar:
https://discourse.mozilla.org/t/discussion-of-new-guidelines-for-uploaded-sentence-validation/37718
https://discourse.mozilla.org/t/discussion-of-new-guidelines-for-recording-validation/36465
https://discourse.mozilla.org/t/validating-meaningless-sentences-in-the-sentence-collector/37129/4
Matn quyidagi mezonlarga javob berishiga ishonch hosil qiling:
- Grammatik to'g'ri yozilishi kerak, imlo xatolarisiz. (Gap grammatika jihatidan to'g'ri, lekin oxirida faqat nuqta yo'q bo'lsa - buni to'g'ri jumla deb olinadi)
- Mantiqiy bo'lishi, grammatik jihatdan to'g'ri va mustaqil jumla bo'lishi kerak.
- Jumlani odam qiynalmasdan gapira oladigan bo'lishi kerak.
- Agar matnda fe'l bo'lmasa, bu muammo emas. Rasmga sarlavha sifatida ishlatilishi mumkin bo'lgan har qanday iborani to'g'ri jumla deb atash mumkin.
- Jumla kichkina harf bilan boshlangan bo'lsa, bu katta ehtimol bilan xato jumla, chunki u mustaqil jumla emas va boshqa jumla tarkibida degan ehtimol bor.
- Maxsus belgilar ishlatilishi mumkin emas (•,@,*,#,/,|,^,~ va boshqa)
- Matnda emoji ishlatish mumkin emas! (masalan 👉✅🙂)
- Qisqartmalar ishlatilgan bo'lishi mumkin emas (masalan AQSH)
- Boshqa xorijiy tillardagi so'zlar ishlatilgan bo'lishi mumkin emas (masalan Facebook, Google)
- O'zbek lotin alifbosida yo'q harflar ishlatilishi mumkin emas
- O'zbek lotin alifbosida yozilmagan matnlar xato hisoblanadi (masalan Аёллар спартакиадаси ғолиблари аниқланди)
Shu tepadagi qoidalarga asoslanib, agar shunday xato jumlalarni o'qish jarayonida uchratsangiz yoki ovozli yozuvlarni tekshirish/tinglash jarayonida shunday xato jumlalarni kimdir o'qigan bo'lsa ham - "Xabar berish" tugmasini bosing va shikoyat sifatida yuboring.
Misollar:
To'g'ri deb hisoblanishi kerak matnlar uchun ✅ ishlatilgan, ❌ = bunday matnlarni rad etish kerakligini bildiradi.
(✅)Avtobus bekati asfalt bo'yida edi.
(✅) Avtobus bekati asfalt bo'yida edi
[oxirida nuqta yo'qligi xato hisoblanmaydi]
(✅ )Avtobus Bekati asfalt bo'yida edi.
[Noan'anaviy katta harflar ishlatilishini qabul qiling - bu ba'zi kontekstlarda aynan shunday ko'zda tutilgan bo'lishi mumkin]
(❌) Aftobuz bekati aspalt bo'yida edi.
[Imlo xatosi - avtobus, asfalt]
(❌) "Avtobus bekati asfalt bo'yida edi.
[Punktuatsiya xatosi]
(❌) Avtobus bekati asfalt.
[Mustaqil jumla emas va grammatik to'g'ri emas, manoga ham ega emas]
(❌) Avtobus bekati asfalt boyida edi.
["Bo'yida" so'zida imlo xato]
(❌) bunday fikr tarixiy xatolik.
[Mustaqil jumla emas va grammatik to'g'ri emas. Kichkina harf bilan boshlangani uchun, boshqa jumla tarkibida degan ehtimol bor.]
(❌) havola 👇, 🎄 Dam olish kunlari pul o'tkazmalari ishlamayotganidan xafa bo'ldingizmi? 😔
[Matnda emoji ishlatish mumkin emas!]
(❌) • Mehribon bo‘l.
[Maxsus belgilar(•,@,*,#,/,|,^,~ va boshqa) ishlatish mumkin emas. ]
(❌) …Istaymanki, ertagini tugatsin baxshi
[Uch nuqta bilan boshlash mumkin emas]
(❌) “Oʻlim, — deydi, —
[Tugallanmagan jumla]
(❌) Andijonlik yigit Oslo universitetida oftalmologiya yo‘nalishida PhD dissertatsiyasini himoya qildi
[Qisqartmalar mumkin emas (PhD)]
(❌) Аёллар спартакиадаси ғолиблари аниқланди
[O'zbek lotin alifbosida emas jumla xato hisoblanadi]
(❌) Mauris Chevalier
[boshqa tildagi ismlar, so'zlar]
(❌) Uşbu
[o'zbek lotin alifbosida yo'q harflar]
(❌) V Buxare deputatы obsudili zakonoproyekt
[ruscha matnni o'zbekchada yozilishi]
(❌) Xorazm viloyatining turizm salohiyati Rossiyaning “Первый” telekanali orqali namoyish etiladi
[boshqa tildagi so'zlar, ruscha so'zlar ishlatilgan]
(❌)Azoblarga
[mustaqil jumla emas va manoga ega emas]
(❌) Avrangzeb
[o'zbek tilida mavjud emas so'z]
(❌) Avstraliya va Facebook mojarosi.
[boshqa tildagi so'zlar ishlatilgan]