Znanstvenici Su Obučili Neuronsku Mrežu Kako Bi Utvrdili Spol Osobe Iz Pisanog Teksta - Alternativni Prikaz

Znanstvenici Su Obučili Neuronsku Mrežu Kako Bi Utvrdili Spol Osobe Iz Pisanog Teksta - Alternativni Prikaz
Znanstvenici Su Obučili Neuronsku Mrežu Kako Bi Utvrdili Spol Osobe Iz Pisanog Teksta - Alternativni Prikaz

Video: Znanstvenici Su Obučili Neuronsku Mrežu Kako Bi Utvrdili Spol Osobe Iz Pisanog Teksta - Alternativni Prikaz

Video: Znanstvenici Su Obučili Neuronsku Mrežu Kako Bi Utvrdili Spol Osobe Iz Pisanog Teksta - Alternativni Prikaz
Video: Сталкер (фантастика, реж. Андрей Тарковский, 1979 г.) 2024, Svibanj
Anonim

Tim znanstvenika s Nacionalnog istraživačkog nuklearnog sveučilišta "MEPhI", Nacionalnog istraživačkog centra "Kurchatov institut" i Državnog sveučilišta Voronezh razvili su metodu koja računalo uči da prepozna tekst osobe iz teksta koji je napisao s točnošću od 80 posto. Znanstveni razvoj pripada području računske lingvistike. Istraživanje je provedeno uz potporu Ruske zaklade za znanost. Rezultati su objavljeni u časopisu Procedia Computer Science.

Brojna znanstvena istraživanja pokazuju da pisani tekst neminovno odražava karakteristike njegova autora - spol, psihološke karakteristike, stupanj obrazovanja. Govor je vrijedan psihodijagnostički alat koji koriste stručnjaci za ljudske resurse velikih tvrtki, kao i sigurnosne službe.

Na temelju analize govora moguće je dijagnosticirati prisutnost određenih bolesti kod osobe (demencija, depresija) i sklonost samoubilačkom ponašanju. Potreba za utvrđivanjem karakteristika autora teksta također raste s razvojem internetskih komunikacija: važno je da tvrtke znaju koje skupine ljudi vole svoje proizvode i usluge.

Znanstvenici koji rade u ovom smjeru (lingvisti, psiholozi, stručnjaci za informatičku tehnologiju) na temelju brojčanih vrijednosti različitih parametara teksta grade matematičke modele za dijagnosticiranje određenih parametara ličnosti.

Tim stručnjaka analizirao je učinkovitost različitih tehnologija strojnog učenja koristeći neuronske mreže za analizu teksta.

Tijekom studije uspoređivali su točnost rješavanja problema rodne identifikacije tekstova utemeljenih na dva pristupa modeliranju zasnovanom na podacima: s jedne strane, algoritmima strojnog učenja (stroj za podršku vektora i gradijentima), s druge strane, neuronske mreže dubokog učenja (konvolucijske neuronske mreže i ponavljajuće neuronske mreže s dugoročnom memorijom).

„Postigli smo visoke rezultate u određivanju spola autora teksta zahvaljujući naprednim modelima neuronske mreže, u uvjetima kada autor ne krije svoj spol. Sljedeći je zadatak odrediti spol u smislu njegovog namjernog prikrivanja , kaže Alexander Sboev, izvanredni profesor na NRNU MEPhI.

Dakle, u sljedećim tekstovima, koji su u početku objavljeni na stranicama za upoznavanje, neuronska mreža lako pronalazi ulov u deset od deset slučajeva, štoviše, autor namjerno u potpis stavlja ime suprotnog spola.

Promotivni video:

Tekst je napisala djevojka: „Ja sam zgodan, mišićav muškarac od 30 godina. Radim za veliku naftnu i plinsku kompaniju u dobroj poziciji s pristojnom plaćom. Živim u svom stanu u Moskvi. Nekretnina također ima malu, ali lijepu kuću u jednom od sela u Italiji. Obožavam sport, posebno nogomet. Obožavam izlaziti za vikend, mrzim ostati kod kuće. Djevojka koja bi mi odgovarala trebala bi biti skromnog stava, lijepog izgleda i atraktivne figure po modernim standardima. Trebala bi dijeliti moje interese, ne bi trebala biti ljubomorna i ne bi me trebala pokušavati natjerati na ljubomoru. Neću podržavati djevojčicu, jer vjerujem da u obitelji trebaju raditi oboje. Također radije držim proračun odvojeno. Neću tolerirati izdaju."

Tekst je napisao muškarac: "Pozdrav! Izuzetno sam nesretan, izuzetno! Zašto se tako ponašaš s nama ?! I mi smo ljudi, svi smo jednaki! Jeste li seksist? Neću ovo više podnijeti! Slomit ću vam automobil, obojiti ga. Čekaj, neljudski. Ja ću ovako završiti."

Rezultati ove studije pokazali su da je najoptimalniji pristup koji se temelji na korištenju konvolucijskih neuronskih mreža i metoda dubokog učenja za prepoznavanje spola osobe koja je napisala tekst.

Sada skupina istraživača radi na problemu prepoznavanja dobi.