"Kompyuter ko'ruvi bu judayam oddiy" - Computer vision qanday ishlaydi?

"Kompyuter ko'ruvi bu judayam oddiy" - Computer vision qanday ishlaydi?

Shifokor AyTichi @Shamshod_Jalilov

Sizni hech qiziqtirganmi - Tesla avtomobillaridagi avto pilot qanday qilib haydovchisiz kerakli joyga yetib borishi, Iphone qurilmangiz qanday yuzingizdan siz egasi ekanligingizni bilib olishi, Snapchat kabi ilovalarda yuzingizga maskalarni qanday taqishi yoki berilgan rasmdagi matnlar qanday qilib kompyuter tomonidan o'qilishi?

Agarda javobingiz "HA" bo'lsa ushbu maqolada sizga bular asosidagi kompyuterli ko'ruvni qanday ishlashini eng sodda tilda tushintirib beraman. Kola va chipsni tayyorlab oling biz esa boshlaymiz.

Odam rasmni qanday anglaydi?

Sizga judayam oddiy bir savol beraman, ushbu rasmda nechi raqam tasvirlangan?

Agarda siz rasmda 4 raqami ko'rayotgan bo'lsangiz(aks holda okulistga ko'rining), unda sizga yana savol, qayerdan bildingiz ushbu raqamni aynan 4 ekanini?

Inson ko'rish va kompyuter ko'rishini taqqoslash

Gap shundaki siz ham maktab davringizda ushbu raqamni 4 ekanini o'rgangansiz va hayolingiz uni obrazi(shakli) bilan 4 qiymatini o'zaro bog'lagansiz.

Kompyuter ko'ruvi ham huddi shundek unga ham mana shu tasvir 4 deb o'qitiladi va u ham keyingi safar ushbu rasmni ko'rganda mana shuncha ehtimollikda bu 4 raqami deydi.

Kompyuter ko'ruvi nimalardan tashkil topgan?

Bu chizmadagi nuqtalar nimani anglatishini bilarmidingiz?

Inson ko'ruviga qaytamiz, biz qandaydir tasvirni ko'ramiz va tasvir biz uchun KIRUVCHI ma'lumot bo'ladi. So'ngida esa tasvir haqida xulosa olamiz, xulosa biz uchun CHIQUVCHI ma'lumot bo'ladi. Ko'zimiz tasvirni olib miyyada uni nima ekanini tushinishga ketgan jarayonlarda YASHIRIN QAVATLAR hisoblanadi.

Kompyuter ko'ruvida ushbu qavatlar qanday ishlashini birgalikda ko'rib chiqamiz. Buning 28x28 piksel bo'lgan rasmni olamiz.

Agarda sizga piksel nima ekanini tushunish qiyin bo'lsa matematika varog'ingizni eslang, undagi har bir katak bu bir piksel deb tasavur qiling. Shunda 28x28 piksel bu bo'yiga va eniga 28 katakdan tashkil topgan rasm bo'ladi.

Har bir pikselga bu bitta NEYRON, neyron deganda biz o'zida qandaydir qiymat saqlovchi katak deb hisoblashimiz mumkin. Endi yuqoridagi kataklarni ko'rayotganingizda bazilari bo'yalgan, bazilari esa yo'q. Biz ularga 0 dan(qora) - 1 gacha(oq) qiymat berib chiqamiz.

Endi keling hisoblaymiz, 28x28 piksel bo'lgan tasvirimizda nechta neyronlar bor ekan, buning uchun ularni ko'paytiramiz 28*28=784, demak rasmimizda 784 ta katak(neyron) bor.

Endi tasavur qiling ushbu kataklarga bo'linishdagi har bir qatorni yonma yon joylashtirib chiqsak - bizda uzun kataklardan iborat qator paydo bo'ladi.

Endi ushbu kataklar(neyronlar)dan iborat qatorni shunchaki ko'ngalang qiling:

Va nixoyat biz siz bilan kiruvchi ma'lumotlar nima ekanini tushunib oldik.

Kompyuter ko'ruvi tasvirni qanday taxlil qiladi?

Kiruvchi ma'lumot bu tasvir ekanini tushunib oldik, unda chiquvchi ma'lumot nima? - chiquvchi ma'lumot esa rasmdagi tasvir natijasidir. Masalan:

Rasmda ko'rayotganingizdek kiruvchi tasvirda 4 raqami aks ettirilganda, natijada ham 4 raqami chiqayotganini ko'rishimiz mumkin. Demak chiquvchi ma'lumotlar bu bevosita biz oladigan natijamizdir.

Diqqat savol, yashirin qavatda nima joylashgan?

Gap shundaki biz tasvirlarga qaraganimizda uni qismlarga(komponentlarga) bo'lib idrok etamiz.

Masalan 9 bu - yuqoridagi dumaloq va tayoqcha qismlardan
8 bu - yuqoridagi dumaloq va pastdagi dumaloq qismlardan
4 raqami esa 3 ta qismdan tashkil topgan

Shunday qilib, qatlamlardan biri o'zida shu ko'rinishdagi komponentlarni saqlaydi.

Demak biror tasvirni aniqlash vaqtida kiruvchi ma'lumotdagi shunday komponentlar saqlagan natija bizga kerakli natija sifatida aks ettiriladi.

3-qatlamni ham nimaligini bilib oldik, ammo 2-qatlamda nima?

3-qatlamda bir qismlar(komponentlar)ni butun sifatida olgandik, ammo biz xatto komponentlarni ham subkomponentlarga bo'la olamiz, masalan yumaloq shakli:

Demak yumaloq komponent ham mayda subkomponentlardan tashkil topishi mumkin ekan:

Yoki tayoqcha shaklidagi qismni olaylik:

Aynan mana shu kabi subkomponentlarda 2-qatlam tashkil topishi mumkin.

Demak bitta raqamni kompyuter ko'ruvi yordamida tahlil qilish bosqichma bosqich yuz beruvchi jarayondir:

Keyingi maqolalarimizda shu kabi modullarni o'z qolingiz bilan yaratish haqida suhbatlashamiz. E'tiboriz uchun rahmat, siz bilan shifokorlikdan voz kechmagan AyTichi Jalilov Shamshod.

Report Page