Duboko učenje i budućnost pretraživačkog marketinga

Dok SEO tržište raspravlja o tome hoće li se u Yandexu pojaviti povratni algoritmi bez povezivanja ili ne, pričajmo o takvom stvarima kao što je duboko učenje (a onda nemojte reći da niste čuli).

Zašto morate znati za to? Zato što je duboko učenje revolucija u strojnom učenju koje se događa pred našim očima. A u bliskoj budućnosti, duboko učenje će se neprepoznatljivo promijeniti i u samoj potrazi, i po rangiranju u prirodnom prikazu, i našem svijetu kao cjelini (ne mnogo, nedovoljno).

Dakle, što je duboko učenje? U ruskom, ovaj pojam još nije riješen, i prevesti ga na različite načine. Radije bih preveo "duboko učenje" (a ne "duboko"), koje je predložio Dmitrij Vetrov, jedan od ruskih stručnjaka, kao glavni.

“Duboko učenje” je vrsta strojnog učenja temeljenog na neuronskim mrežama. Danas se "duboko učenje" temelji na sustavima prepoznavanja govora, prepoznavanju vizualnih objekata (i statičkih i pokretnih) i, konačno, na interakciji računalnih sustava s prirodnim jezikom i izolacijom značenja.

Čini se da je sve jednostavno, sve je jasno i, čini se, ne tiče nas se. Ali ... Ali zapravo govorimo o pravoj revoluciji u strojnom učenju. To nije počelo jučer, opća načela "dubokog učenja" postoje već duže vrijeme. No, stvarno utjelovljenje dubokog učenja postalo je moguće početkom ovog desetljeća, kada je stvaranje računalnih neuronskih mreža bilo znatno jeftinije. Počevši od 2012. godine, pravi se bum povezan s tehnologijama "dubokog učenja" pojavio u strojnom učenju. Ipak, još uvijek postoji vrlo malo stručnjaka za "dubinsko učenje" u svijetu, a potreba za njima je vrlo visoka. Primjerice, algoritam za prepoznavanje značenja u tekstovima stvorio je praktički jedna osoba - Thomas Mikolov. U to vrijeme radio je na Googleu, ali je gotovo odmah nakon toga bio “zakačen” putem Facebooka.

Iznad, već sam rekao da je "duboko učenje" vrsta strojnog učenja. Ali to zapravo nije istina. Klasično strojno učenje je izvlačenje novih znanja iz velikog broja podataka koje osoba unosi u stroj. Osoba formulira pravila strojnog učenja (zbog takozvanog "trening seta"), a pravilo strojnih pogrešaka (eliminira učinak tzv. "Prekvalifikacije"). Ali klasično strojno učenje ima značajne nedostatke - podatke za obradu i primjere rješenja stroj daje čovjek. Drugim riječima, u klasičnom strojnom učenju računalo obavlja veliki broj zadataka, ali te zadatke ne oblikuje samostalno. Koncept "dubokog učenja" sugerira da stroj sam stvara funkcionalnost za sebe, koliko je to moguće u sadašnje vrijeme.

Koncept "dubine" koji se primjenjuje na strojno učenje uključuje modeliranje apstrakcija na više razina ("slojeva") i njihovo prevođenje u podatke. Što je više tih "slojeva" ("dubina"), to su intelektualne zadaće koje neuronska mreža može obavljati više intelektualne. Istodobno ih izvodi bez pomoći osobe.

Zapravo, "duboko učenje" je prvi i prilično velik korak prema umjetnoj inteligenciji. Neuronske mreže su sustavi koji, iako još uvijek primitivni, mogu misliti, odnosno stvoriti nova otkrića iz podataka koje su sami stvorili. Mehanizam višestrukih apstrakcija ("slojeva"), koji se koristi u dubinskom osposobljavanju, vrlo je sličan mehanizmu učenja mladog čovjeka. Kao dijete prvo uči zvukove, zatim pojedinačne riječi, a tek tada rečenice - „duboka“ neuronska mreža prelazi s jednostavnih (površinskih) apstrakcija na složenije.

Duboko učenje revolucije

Tijekom 2012. i 2013. Google tiho, ali metodično, kupuje aktivne tvrtke i start-upove na području dubokog učenja. Među njima su obje prilično velike tvrtke (na primjer, trošak britanskog DeepMinda, prema mišljenju stručnjaka u vrijeme kupnje od strane giganta za pretraživanje, u rasponu od 400-500 milijuna dolara), i vrlo patuljastog - na primjer, DNNresearch, u kojem je Google radio u vrijeme kupnje tvrtke samo tri zaposlenika - Jeffrey Hinton i njegova dva studenta.

Hinton, profesor na Sveučilištu u Torontu, započeo je istraživanja u području izgradnje neuronskih mreža još 80-ih godina prošlog stoljeća i zapravo je danas najugledniji stručnjak u svijetu u dubokom učenju. Na znanstvenom radu Hintona zasnivaju se mnogi sustavi koji se temelje na "dubokom učenju". Godine 2011. Google izrađuje svoju prvu neuronsku mrežu, nazvanu Google Brain (koja se već razvija kao kultna podjela Google X-a), a Hinton u početku sudjeluje u razvoju neuronske mreže kao angažirani konzultant, a dvije godine kasnije pridružuje se timu sa svojim studentima. Google Brain (bez napuštanja nastave na Sveučilištu u Torontu).

Google Brain neuronska mreža (u 2012, ona se sastojala od 16 tisuća procesora) počinje učiti. Usput, rješavanje primijenjenih problema - na primjer, upravo zbog neuronske mreže, broj pogrešaka prepoznavanja glasovnih naredbi u pretraživanju smanjio se za 25% - otkriva stvorenje poput mačke.

Proučavajući milijune slika na Youtube kanalu, umjetna neuronska mreža otvorila je mačku. Naime, rješenje takvog problema je iznimno komplicirano, jer ga je teško formalizirati. Možete stvoriti algoritam koji će prepoznati mačke na određenim tipovima fotografija (sa sličnim kutom, sličnih veličina objekata). Možete stvoriti algoritam koji će privući ove mačke. Ali kako stvoriti algoritam koji će prepoznati mačke iz bilo kojeg kuta, ako on, algoritam, ne razumije što je mačka?

Neuronska mreža bi to trebala shvatiti. I to je naučila. Trenirala se, osoba joj nije postavila takav zadatak.

Jasno je da za sada sve nije tako ružičasto. Neuralna mreža razlikuje mačke u slikama samo u 15% slučajeva. Točnost može biti mnogo veća ako mreža istražuje istu vrstu materijala. To jest, u stvari, točnost prepoznavanja mačaka neuronskom mrežom trenutno je mnogo gora od prepoznavanja mačaka za 4-5 djece koja lete. No, za razliku od djeteta, nitko nije učio neuronsku mrežu, nitko nije pokazao predmete s mačkom, nazivajući ih. Mreža je rodila koncept mačke.

Što se dalje događa

U ožujku 2015. u svijetu SEO eksplodirala je "nuklearna bomba" - Google je objavio članak pod naslovom "Pouzdanje temeljeno na znanju: procjena pouzdanosti web-resursa". Bez sumnje, pretjerujem, vijesti su, zapravo, prošle nezapaženo. Pa, za nekoliko dana, društveni menadžeri su bili zbunjeni i skepticirani - ispričavam se za ovu glupu riječ, ali ne znam kako drugačije identificirati buzziness na društvenim forumima i društvenim mrežama. Nije bilo granica ogorčenja ("Google nas ponovno stavlja na eksperimente") i skepticizam ("ništa od toga neće doći, kao Yasha s otkazivanjem reference"). Razumljivo je, u čisto znanstvenom članku, predstavnici Googlea objavili su novi algoritam rangiranja, koji se ne temelji na referentnom autoritetu dokumenta, nego na činjeničnoj točnosti. Ako je pojednostavljen, onda se suština novog algoritma može izraziti sljedećom maksimom: dokument s pouzdanom faktologijom, ako su sve ostale jednake, treba rangirati više od dokumenta s netočnom faktologijom.

Skepticizam SEO-a općenito je razumljiv - oni (kao i uvijek) su samo vidjeli ono što su htjeli vidjeti. A glavno pitanje koje je postavljeno na forumima zvučalo je ovako: "To je ono što svi želite učiniti, ispada - sada moramo stvoriti sadržaj koji će citirati činjenice iz Wikipedije ili drugih mjerodavnih izvora, čak i ako uopće nisu relevantni na stranici ? "

No, činjenica je da novi algoritam ne može raditi bez razumijevanja značenja koje se kaže na stranici. Razumijevanje značenja pisanog / izgovorenog teksta na stranici, umjesto prepoznavanja semantike, učiniti će pretraživanje neprepoznatljivim.

Kako će "duboko učenje" raditi u potrazi? Okrećem se iskustvu ljudi koji to bolje razumiju od mene. To je ono što Rand Fishkin kaže u sljedećem izdanju Whiteboard Fridaya (usput rečeno, ovo se pitanje zove “Što dubinsko učenje i strojno učenje znače za buduće SEO?”):

"Neuralna mreža se sastoji od različitih slojeva. Prvi sloj će otkriti sve različite značajke dokumenta. Drugi sloj neuronske mreže klasificirat će tipove tih značajki. Stoga će Google uzeti u obzir sve moguće značajke bilo koje vrste web-mjesta i bilo koje vrste stranice kako bi odlučio koji su korisni signali. u ovom slučaju, neuronska mreža će uzeti u obzir akumulirane podatke o ponašanju korisnika na svim stranicama Interneta (gdje može doći) kako bi predvidjela. rezultate - hoće li se korisniku dopasti ovaj ili onaj dokument u izdanju ili ne.

No, osnovna ideja je da u budućnosti, dolazni podaci neće biti pod kontrolom ljudi. Sam stroj će pokušati razumjeti sadržaj stranice. Da, zvuči čudno. Ali uskoro, ako pitate Googleovog inženjera - na primjer, vrijedi li nastaviti s izgradnjom dolaznih linkova na web-lokaciju? - najvjerojatnije će vam odgovoriti: ne znam. Oni, doista, više neće točno znati što signalizira isticanje algoritma pretraživanja za određeni upit i određenu vrstu stranice. Samo će stroj to znati, ali nikome neće moći objasniti, jer će se algoritam rangiranja stalno mijenjati kako se pojave novi dokumenti na tu temu, a mnoge metrike koje će neuronska mreža koristiti će biti izvedene iz derivata velikog broja drugih mjernih podataka. "

"Duboko učenje" dolazi

Zapravo, revolucija dubokog učenja tek počinje. No, danas neuronske mreže s upotrebom "dubokog učenja" funkcioniraju.

Na primjer, usluge praćenja zastoja u prometu djeluju na tehnologijama dubokog učenja. Da, Yandex.Proborks ne samo da prikazuje stvarnu sliku, nego također pokušava predvidjeti pojavu prometnih gužvi, ali bez dubokog učenja takvo predviđanje je nemoguće.

Google Voice Search i Apple Siri pokreću tehnologije "dubinskog učenja".

Googleova usluga predviđanja gripe radi na tehnikama dubokog učenja.

Algoritmi prepoznavanja za osobe u fotografskim i video snimkama koje se svakodnevno učitavaju na Facebook temelje se na tehnologijama dubokog učenja.

Za pretraživanje. Algoritmi za personaliziranje rezultata pretraživanja temelje se na tehnologijama dubokog učenja.

Ulazimo u novi predivan svijet. I sljedećih pet godina bit će doista revolucionarno - ne samo za tražilice, nego i za čovječanstvo u cjelini. Uskoro ćemo sve to vidjeti vlastitim očima.

Ostavite Komentar