Common Voice - Matnlarni tasdiqlash mezonlari

Common Voice - Matnlarni tasdiqlash mezonlari

Abbosjon Kudratov

Manbalar:

https://discourse.mozilla.org/t/discussion-of-new-guidelines-for-uploaded-sentence-validation/37718

https://discourse.mozilla.org/t/discussion-of-new-guidelines-for-recording-validation/36465

https://discourse.mozilla.org/t/validating-meaningless-sentences-in-the-sentence-collector/37129/4


Matn quyidagi mezonlarga javob berishiga ishonch hosil qiling:

  • Grammatik to'g'ri yozilishi kerak, imlo xatolarisiz. (Gap grammatika jihatidan to'g'ri, lekin oxirida faqat nuqta yo'q bo'lsa - buni to'g'ri jumla deb olinadi)
  • Mantiqiy bo'lishi, grammatik jihatdan to'g'ri va mustaqil jumla bo'lishi kerak.
  • Jumlani odam qiynalmasdan gapira oladigan bo'lishi kerak.
  • Agar matnda fe'l bo'lmasa, bu muammo emas. Rasmga sarlavha sifatida ishlatilishi mumkin bo'lgan har qanday iborani to'g'ri jumla deb atash mumkin.
  • Jumla kichkina harf bilan boshlangan bo'lsa, bu katta ehtimol bilan xato jumla, chunki u mustaqil jumla emas va boshqa jumla tarkibida degan ehtimol bor.
  • Maxsus belgilar ishlatilishi mumkin emas (•,@,*,#,/,|,^,~ va boshqa)
  • Matnda emoji ishlatish mumkin emas! (masalan 👉✅🙂)
  • Qisqartmalar ishlatilgan bo'lishi mumkin emas (masalan AQSH)
  • Boshqa xorijiy tillardagi so'zlar ishlatilgan bo'lishi mumkin emas (masalan Facebook, Google)
  • O'zbek lotin alifbosida yo'q harflar ishlatilishi mumkin emas
  • O'zbek lotin alifbosida yozilmagan matnlar xato hisoblanadi (masalan Аёллар спартакиадаси ғолиблари аниқланди)


Shu tepadagi qoidalarga asoslanib, agar shunday xato jumlalarni o'qish jarayonida uchratsangiz yoki ovozli yozuvlarni tekshirish/tinglash jarayonida shunday xato jumlalarni kimdir o'qigan bo'lsa ham - "Xabar berish" tugmasini bosing va shikoyat sifatida yuboring.

Noto'g'ri jumlalar ustidan shikoyat berish




Misollar:

To'g'ri deb hisoblanishi kerak matnlar uchun ✅ ishlatilgan, ❌  = bunday matnlarni rad etish kerakligini bildiradi.


(✅)Avtobus bekati asfalt bo'yida edi.


(✅) Avtobus bekati asfalt bo'yida edi 

[oxirida nuqta yo'qligi xato hisoblanmaydi]


(✅ )Avtobus Bekati asfalt bo'yida edi.

[Noan'anaviy katta harflar ishlatilishini qabul qiling - bu ba'zi kontekstlarda aynan shunday ko'zda tutilgan bo'lishi mumkin]


(❌) Aftobuz bekati aspalt bo'yida edi.

[Imlo xatosi - avtobus, asfalt]


(❌) "Avtobus bekati asfalt bo'yida edi.

[Punktuatsiya xatosi]


(❌) Avtobus bekati asfalt.

[Mustaqil jumla emas va grammatik to'g'ri emas, manoga ham ega emas]


(❌) Avtobus bekati asfalt boyida edi.

["Bo'yida" so'zida imlo xato]


(❌) bunday fikr tarixiy xatolik.

[Mustaqil jumla emas va grammatik to'g'ri emas. Kichkina harf bilan boshlangani uchun, boshqa jumla tarkibida degan ehtimol bor.]


(❌) havola 👇, 🎄 Dam olish kunlari pul o'tkazmalari ishlamayotganidan xafa bo'ldingizmi? 😔

[Matnda emoji ishlatish mumkin emas!]


(❌) • Mehribon bo‘l.

[Maxsus belgilar(•,@,*,#,/,|,^,~ va boshqa) ishlatish mumkin emas. ]


(❌) …Istaymanki, ertagini tugatsin baxshi

[Uch nuqta bilan boshlash mumkin emas]


(❌) “Oʻlim, — deydi, —

[Tugallanmagan jumla]


(❌) Andijonlik yigit Oslo universitetida oftalmologiya yo‘nalishida PhD dissertatsiyasini himoya qildi

[Qisqartmalar mumkin emas (PhD)]


(❌) Аёллар спартакиадаси ғолиблари аниқланди

[O'zbek lotin alifbosida emas jumla xato hisoblanadi]


(❌) Mauris Chevalier

[boshqa tildagi ismlar, so'zlar]


(❌) Uşbu

[o'zbek lotin alifbosida yo'q harflar]


(❌) V Buxare deputatы obsudili zakonoproyekt

[ruscha matnni o'zbekchada yozilishi]


(❌) Xorazm viloyatining turizm salohiyati Rossiyaning “Первый” telekanali orqali namoyish etiladi

[boshqa tildagi so'zlar, ruscha so'zlar ishlatilgan]


(❌)Azoblarga

[mustaqil jumla emas va manoga ega emas]


(❌) Avrangzeb

[o'zbek tilida mavjud emas so'z]


(❌) Avstraliya va Facebook mojarosi.

[boshqa tildagi so'zlar ishlatilgan]

Report Page