Mashinali o‘rganish masalalari

Atamalar

Keling endi, birinchi, ba’zi bir atamalarni kiritsakda va shu atamalarga izchil rioya qilib davom etsak. Birinchi atamamiz - bu obyekt ba’zida esa namuna ham deymiz. Yuqoridagi misollarda bular: ‘hayvonlar’ va ‘rasmlar’ obyekt yoki naumuna deyiladi. Ular o‘rtasidagi juda nozik farq bu naumunalar deb biz yechimi bo‘lgan obyektlarga aytishimiz mumkin, obyektlarni esa hammasiga qo‘llash mumkin. Ikkinchisi esa, o‘rgatuvchi va sinov to‘plamlar. Algoritmni o‘rgatish uchun ishlatiladigan namunalar bu o‘rgatuvchi to‘plam deyiladi, uning qanday ishlayotgani tekshirish uchun esa biz o‘rgatish jarayonida mavjud bo‘lmagan obyektlardan foydalanamiz, buni esa sinov to‘plam deymiz. Keyinchalik boshqa turdagi to‘plamlarni ham qo‘shamiz.

Eslatma. Oldingi mavzularda biz test to’plam degan atamani ham bir necha bor qo’lladik. Ushbu test va sinov atamalari bir xil hisoblib, biz ularni almashtirib ishlatamiz.

Keyingisi esa biz qanday masalani yechayotganimizga oid bo‘lib, yuqoridagi ikki misolda ham biz yangi obyektni qaysidir jamoaga tegishli ekanligini aniqlashmiz zarur bo‘ldi, masalan rasmda qanday raqam joylashgan yoki yangi hayvon qaysi hayvonligi. Obyektni qaysi turga kirishini umumiy holda obyektning Sinfi deymiz. Masalan, ‘itlar’ yoki ‘bo‘rilar’ sinfi va hakozo.

Oxirgisi esa alomat bo‘lib, har bir obyekt ifodaluvchi qiymatlar uning alomatlari deyiladi. Biz ingliz tilidagi “feature” so‘zini shu tarizda tarjima qildik. Yuqoridagi misollarda: rasmlar uchun uning piksellarining qiymatlarini ularning alomatlari deymiz, “It va bo‘ri” misolida esa ularning bo‘yi va uzunligini alomatlar deb ataymiz. Ba’zida bu tushunchani simptomlar(symptoms) bilan adashtirishadi, aslida bu so‘z faqat fizik va ruhiy alomatlarni ifodalash uchun ishlatiladi va odata kasalikning qanday sharoitda ekanligni anglatadi. Biz mashinali o‘rganishda umumiyroq holni qaraymiz. Ushbu alomatlar qo‘yilgan masalaga ko‘ra ikki qismga bo‘linadi. Obyektni tasvirlovchi alomatlar va maqsadli (target) alomat(lar). Yuqorida “It va bo‘ri” masalasida ularning bo‘yi va uzunligi tasvirlovchi alomatlar bo‘lsa, ularning qaysi sinfga tegishli bo‘lishi maqsadli alomat hisoblanadi. Chunki obyektlarning tasvirlanishi orqali ularning qaysi sinfga tegishli bo‘lishini aniqlashimiz asosiy maqsadimizdir.

O‘rgatuvchili o‘rganish

Ushbu ingliz tilidagi “Supervised Learning” atamasini biz “O‘rgatuvchili o‘rganish” deb tarjima qildik hamda ushbu qo‘llanma davomida shunday deb murojaat qilamiz. Biz birinchi sodda masala ko‘rdik va uni yaxshiroq tushinish uchun esa yanada sodda misolni geometrik usulda bayon qildik. Endi bu qismda ushbu o‘rgangan “Eng yaqin qo‘shni” algoritmi asosida Mashinali o‘rganish fanining ba’zi nazariy qoidalari va ta’riflarini o‘rganamiz.

Keling birinchi “o‘rgatuvchi (supervised)” so‘zini yuqoridagi masalada aniqlashtirib olsak. Ramslarni o‘zida jamlagan MNIST rasmlar to‘plami, oldin ham aytganimizdek, ikki qismdan iborat: birinchisi algoritmni o‘rgatish va ikkinchisi esa uni sinov qilish uchun. Birinchi qismdagi to‘plamdagi hamma ramsda qanday raqamlar turganini bizga ayon. Xudi shunday, yuqoridagi “It va bo‘ri”ga oid to‘plamda ham 10 ta (5 ta it va 5 ta bo‘ri) hayvoning qiymati oldindan bor va ularning qanday hayvon ekanligini ham bilamiz. Mana shu MNISTning birinchi to‘plami va yuqoridagi ramsdagi 10 ta hayvon bizning algoritm uchun “o‘rgatuvchi” to’plam hisoblanadi. Shuning uchun ham bu turdagi masalalarni “o‘rgatuvchili o‘rganish” deb nomlaymiz. Demak soddaroq qilib aytsak algortimni o‘rgatish uchun oldindan yechimi bo‘lgan namunalar berilar bo‘lsa, u holda biz shularga qarab yangi muammoni yechimini topishimiz “o‘rgatuvchili o‘rganish” bo‘lar ekan.

O‘rgatuvchili o‘rganishning turlari

Ushbu turdagi o‘rganishning o‘zini ham maqsadli alomatning turlariga qarab bir qancha turlarga ajratib o‘rganamiz:

Regressiya - ushbu turda maqsadli alomat ma’lum bir son bo‘lib uni topish talab etiladi. Masalan, ertangi haroratni topish yoki uyning narxini baholashlar regressiya masalalaridir.
Klassifikatiya (Sinflash) - bunda maqsadli alomat toifali bo‘ladi, son bo‘lmaydi. Bu toifalilar odatda mantlar bilan ifodalanadi. Masalan, yuqoridagi misolda yangi obyektning qaysi sinfga tegishli bo‘lishi bu klassifikatsiya masalasidir. Ushbu narsa MNIST rasmlar masalasida, qaysi raqamligi bo‘lsa, “it va bo‘ri” masalasida esa qaysi hayvonligidir.

Umumiy olganda ushbu turlar yana bir qancha ichki turlarga bo‘linadi va ularni keyinchalik o‘rganamiz.

Matematik ifodalanishi

Biz kelajakda o‘qigan narsalarnimizni tushunish uchun har doim matematik ifodalashga zarurat bo‘ladi. Chunki bu soha vaklillari har doim ilmiy maqola o‘qishiga to‘g‘iri kelishi mumkin, bunda esa masalarni qanday ifodalashni bilish juda muhim hisoblanadi. Shuning uchun har bir turdagi masaladan so‘ng biz ushbu masalaning matematik ko‘rinishini yozib ketamiz va bir necha boblardan so‘ng biz deyarli hamma algoritmlarni matematik ko‘rinishda ifodalashga harakat qilamiz.

Klassifikatsiya masalasi. Aytaylik bizga yuqoridagi masalardagi obyektlarni ifodalovchi \(\mathbb{X}=\{\mathbf{x}^1, \mathbf{x}^2, \dots, \mathbf{x}^m\}\) to‘plam berilgan. Bu yerdagi har bir \(\mathbf{x}^i \in \mathbb{R}^n, i\in \{1, 2, \dots, m\}\) to‘plamdagi bitta obyektni tafsiflaydi. Namuna uchun, “it va bo‘ri” misolida \(\mathbf{x}^1=(yosh, bo‘y)\), aniq qiymat bo‘lsa, u holda \(\mathbf{x}^1=(85, 95)\) birinchi obyektnining qiymatini saqlaydi. \(\mathbb{X}\) to‘plam o‘zida vektorlarni saqlagani uchun u umumiy holda \(\mathbb{X} \in \mathbb{R}^{m\times n}\) bo‘ladi, ya’ni o‘lchami \(m \times n\) bo‘lgan matritsa. Hamda har bir obyektning maqsadli alomatini ifodalash uchun \(\mathbf{y}=\{y^1, y^2, \dots, y^m\}\), har bir sinfning qiymati 0 dan to sinflarning sonigacha \(c\) o‘zgaradi, ya’ni \(y^i \in \{1, 2, \dots, c\}\). Biz qisqalik uchun har doim sinfning nomlarini matn ko‘rinishda tasvirlamasdan, uning o‘rnida, ularni ixtiyoriy tartibda joylashtirib, ularga joylashuvi bo‘yicha raqamlar beramiz. Bu keyichalik dasturlash va eng asosiysi mashinali o‘rganishda zarur bo‘ladi. Masalan, yuqoridagi “it va bo‘ri” masalasida, “it” lar sinfini 0 desak “bo‘r” larni 1 deymiz.

Masalaning qo‘yilishi Ushbu masalada bizning asosiy maqsadimiz yuqoridagi ikki o‘zgaruvchi, \(\mathbb{X}\) va \(\mathbf{y}\), bizga oldindan o‘rgatuvchi to‘plam sifatida berilsa, u holda yangi obyekt \(\mathbf{x}^*\) uchun maqsadli alomatning (\(y\)) qiymatini topishimiz kerak bo‘ladi. Buni sodda matematik ko‘rinishda quyidagicha yozamiz, \(y=f(x)\). Biz shunday funksiya (ba’zida, algoritm, usul yoki operator) topishimiz kerak bo‘ladi, unga \(\mathbf{x}^*\) qiymat sifatida bersak, u \(f(\mathbf{x}^*)\) bizga \(y\) ning qiymatini qaytarishi kerak.

Sodda misol sifatida valyuta ayriboshlash funksiyasini qarab chiqaylik. Agar bizga joriy AQSH dollorining o‘zbekiston so‘miga nisbati berilgan bo‘lsa, u holda \(g\) funksiyaga biz AQSH dollorda qiymat ko‘rsatsak, u bizga shu qiymatning o‘zbekiston so‘mida qancha bo‘lishini qaytarishi kerak. Xudi shunday, yuqoridagi funksiya (ba’zida, algoritm, usul yoki operator) qo‘yilgan masalaga berilgan \(\mathbb{X}\) va \(\mathbf{y}\) asosida mos javob qaytarishi kerak.

Endi yuqoridagi biz ko‘rib chiqqan ikki masalanining matematik ifodalanishi qisqacha yozib qo‘sak. Birinchi masalada, biz rasmlar bilan ishladik. Aslida rasmlar \(28\times 28\) ko‘rinishidagi jadval (matritsa) edi. Lekin biz uni \(784\) o‘lchamli vektor ko‘rinishiga o‘tkazib oldik. Shunda, obyektlarni o‘zida saqlovchi o‘rgatuvchi to‘plam \(\mathbb{X} \in \mathbb{R}^{60000\times 784}\) va maqsadli alomat \(\mathbf{y}=\{y^1, y^2, \dots, y^{60000}\}\) bo‘ladi. Bu yerda har bir \(y^i \in \{1, 2, 3, \dots, 10\}\), chunki \(c=10\). Ikkinchi namunamiz ham birinchisiga o‘xshaydi, faqat ancha soddaroq, o‘rgatuvchi to‘plam \(\mathbb{X} \in \mathbb{R}^{10 \times 2}\) va maqsadli alomat \(\mathbf{y}=\{y^1, y^2, \dots, y^{10}\}, {y^i} \in \{1, 2\}\)

Regressiya masalasi. Ushbu tur masalalar boshqalaridan ko‘ra ko‘proq uchraydi, chunki ko‘pchilik masalalar ushbu turga keltirib yechiladi. Ushbu turning oldingisidan asosiy farqi bu \(\mathbf{y}\) qiymati sinflar qiymatini saqlamasdan, o‘rniga haqiqiy sonlarni saqlaydi, ya’ni \(\mathbf{y}=\{y^1, y^2, \dots, y^m\}\), bu yerda har bir \(y^i \in \mathbb{R}\).