Kako Se Otkrivaju Tajne Rukopisa Voynich: Istraga - Alternativni Pogled

Sadržaj:

Kako Se Otkrivaju Tajne Rukopisa Voynich: Istraga - Alternativni Pogled
Kako Se Otkrivaju Tajne Rukopisa Voynich: Istraga - Alternativni Pogled

Video: Kako Se Otkrivaju Tajne Rukopisa Voynich: Istraga - Alternativni Pogled

Video: Kako Se Otkrivaju Tajne Rukopisa Voynich: Istraga - Alternativni Pogled
Video: TAJNA TESLINE SVETLOSNE FORMULE: Naš naučnik je uspeo da je sačuva kako ne bi pala u ruke Hitleru! 2024, Svibanj
Anonim

Ono što stoji iza senzacionalnih vijesti o rukopisu Voynicha i o ruskim znanstvenicima, je li moguće točno odrediti jezik iz teksta i koliko su adekvatni matematičari u radu na "polju" lingvistike.

Ruski su mediji 19. travnja širili vijesti o "epohalnom" otkriću ruskih matematičara: znanstvenici koji su koristili novu metodu ne samo da su dokazali značaj znakovitog "Voynichovog rukopisa", već su uspjeli utvrditi i da je napisan na dva jezika, s izuzetkom slova za samoglasnike.

Rukopis Voynich srednjovjekovni je ilustrirani rukopis koji je 1912. kupio antikvar Wilfred Voynich. Stvoren u 15. stoljeću (na temelju radiokarbonske analize pergamenta - ali većina znanstvenika u ovom trenutku sam tekst ne smatra kasnijim krivotvorenjem), napisan je na nepoznatom jeziku pomoću nepoznate abecede. Sudeći prema ilustracijama, tekst se sastoji od tematskih blokova: botanički, astronomski, farmakološki i drugi. Složenost dekodiranja teksta učinila je Voynichov rukopis "svetim gralom" za kriptografe i predmetom mnogih studija, uključujući ona koja koriste metode velikih podataka.

Vijest o rukopisu prijavljena je kao nešto senzacionalno. To je odmah izazvalo određenu zabrinutost. “Prije toga, svi pokušaji dešifriranja jedinstvenog dokumenta, pa čak i samo razumijevanja je li riječ o značajnom tekstu, nisu uspjeli. 600 godina beskorisnih napora!.. Kriptografi CIA-e i NSA-e, superračunala, pa čak i doktori "okultnih znanosti" potpisali su svoju potpunu nemoć. Najnovija poruka kriptologa Gordona Rugga sa sveučilišta Keele u Velikoj Britaniji glasi: „Rukopis Voynich lažan je. Takav "složeni tekst" lako je konstruirati svima koji su upoznati s jednostavnim metodama kopiranja ", navodi se u članku.

Prvo, smislenost teksta prepoznata je još 1970-ih i nekoliko puta potvrđena u studijama 2010-ih, o čemu se dovoljno detaljno pisalo čak i u domaćim medijima. Kao drugo, otkriće dostavljeno vijestima predstavljeno je samo u obliku instituta, a ne u članku u međunarodnom recenziranom časopisu (preprint je također objavljen 2016.).

Te neobičnosti u izlaganju materijala natjerale su nas da prvo tražimo pojašnjenja od autora studije, a zatim i neovisnih stručnjaka - lingvista koji rade sa statističkim i matematičkim metodama, kao i s dekodiranjem drevnih skripti.

Lako je napisati formulu, ali vrlo je skupo provoditi numeričku analizu

Promotivni video:

Prvo, ukratko o suštini studije. Autori pretiska, matematičari s Moskovskog fizičko-tehnološkog instituta i Instituta primijenjene matematike Ruske akademije znanosti, oslanjaju se na svoja djela prema kojima je "učestalost raspodjele tekstualnih simbola stabilna karakteristika ne autora ni predmeta teksta, već jezika". Odnosno, pomoću skupa pomoću matematičkih alata moguće je odrediti na kojem je jeziku napisan, s obzirom na činjenicu da svaki jezik ima svoj karakteristični „profil“(distribucija Hurstovog eksponenta). Nadalje, uzimajući ove metode kao osnovu, znanstvenici su ustanovili da je tekst rukopisa napisan na mješavini nekoliko jezika. Istodobno, dodani su joj lažni razmaci i uklonjeni simboli koji označavaju samoglasnike.

Glavni autor studije, Yuri Orlov (IPM RAS i MIPT), naglasio je da Voynichov rukopis uopće nije glavni cilj njihova rada. "Senzacionalni" rukopis samo je ilustracija matematičke metode prepoznavanja jezika iz teksta - zapravo problem za strojno učenje ", rekao je Orlov.

Sam nam rukopis apsolutno nije zanimljiv. Znanost se posebno odnosi na statistiku jezika. Kroz nju možemo razumjeti na kojem je jeziku napisan ovaj rukopis. Ali ne i ono što je tamo napisano, ovo je važna stvar. - Jurij Orlov. MIPT i Institut za primijenjenu matematiku imena M. V. Keldysh

U vezi s jezičnom metodom koja se koristi u radu, Orlov primjećuje da je sama analiza učestalosti kombinacija slova u tekstovima dobro poznata stvar. Međutim, pokazatelj Hurst slabo je poznat lingvistima, jer ga je teško izračunati čak ni u matematičkom smislu. Sama formula je jednostavna za pisanje, ali numerička analiza vrlo je skupa. Za to je superračunalo smješteno u Institutu imena M. V. Keldysh, naglašava matematičar.

Izbor indoeuropskih jezika za analizu objašnjava se činjenicom da su svi vrlo slični, kaže Orlov. Pokazatelji koje su razvili matematičari olakšavaju razlikovanje jezika unutar iste jezične skupine, ali ne i među obiteljima. Naravno, teoretski je moguće provesti isti posao s drugim skupinama (Ural, Altaj ili druge), ali vrijednost analize leži u njezinoj cjelovitosti, siguran je Orlov. U slučaju indoeuropskih jezika nije teško upisati korpus tekstova za svaki jezik, teže je to učiniti s drugim obiteljima.

Vraćajući se na rukopis Voynicha, Orlov je primijetio da su on i njegovi kolege naveli pet dokaza (logaritamski profil učestalosti redoslijeda slova u tekstu na jednom i nekoliko jezika, raspodjela eksponenta Hurst, spektralni portret matrice uvjetnih vjerojatnosti i drugi) hipoteze o mješavini jezika u rukopisu i brisanju slova za samoglasnike. Izuzetno se distanciraju od "druženja oko rukopisa", ali predstavili su jedinstveni rezultat - otvorenu metodu, statističku analizu s procjenom pouzdanosti koja se može neovisno provjeriti.

Zaključak je amortiziran činjenicom da ne razumijemo iz kojeg su materijala izvukli i na temelju čega su provjerili njihovu formulu

Sama pretpostavka da je tekst rukopisa Voynich lišen slova za samoglasnike, s pogrešno razmaknutim razmacima lijepa je i dobra, napominje lingvistica Evgenia Korovina, koja se bavi matematičkom statistikom jezika (Institut za lingvistiku Ruske akademije znanosti). Prije toga nitko nije iznosio takvu hipotezu. Ona, na primjer, lijepo objašnjava zašto ima manje slova nego što bi se očekivalo za europski tekst. Ali problem je u tome što autori studije nisu ni naznačili koje su tekstove na različitim jezicima uspoređivali i koliki je bio opseg tih testova. U pretprintu se spominje ogroman broj jezika. Stoga se studija ne može ponoviti: ako uzimate proizvoljne tekstove na istim jezicima, nije činjenica da će se pojaviti isti obrasci.

Maria Molina, specijalistica za korpusne metode u proučavanju drevnih jezika (Institut za lingvistiku RAN), slaže se s Korovinom. Nove metode obrade lingvističkih podataka, prema njezinom mišljenju, pomažu u dobivanju informacija o onome što je prethodno bilo zatvoreno za istraživače jezika. Međutim, loše pripremljeni ulazni materijal često diskreditira i najfinije tehnike obrade podataka.

Zaključak je amortiziran činjenicom da ne razumijemo na kojem su materijalu crtali i na čemu su provjeravali svoju formulu. Za svoj materijal sigurno znam da postoji mala metodološka pogreška - i dobivam kritično različite brojeve. - Maria Molina. Institut za lingvistiku RAN

"Smeće ulazi - smeće izlazi", dodaje Molina (GIGO je princip u računalnoj znanosti koji znači da će netočni ulazni podaci rezultirati netočnim rezultatima, čak i ako je sam algoritam točan, - napominje Indicator. Ru).

Statističke metode su i dalje nagovještaji rezultata, a ne rezultati

Albert Davletshin (zaposlenik Centra za lingvističke komparativne studije Instituta za komparativne studije Ruskog državnog humanističkog sveučilišta, koji proučava jezik Maya i polinezijski jezik) govorio je još oštrije. Ako autori pretiska nisu htjeli dešifrirati Voynichov rukopis, zašto to čine? I dalje, ako govorimo konkretno o dekodiranju nepoznatog spisa, postavlja se pitanje za pitanjem: „Ne postoje početni podaci o pisanju - koja vrsta slova? Kako se dobivaju različiti prijepisi? Koliko likova? Što je u osnovi postojećih pretpostavki o prirodi pisanja? Koja je duljina riječi odvojene razmacima i bez razmaka? Što znače razmaci? Koliko je velik rječnik? Koliki je omjer potpisa i crteža?

Isprva se ispostavlja da je tekst danski i samo danski (a to je povijesno nemoguće, o čemu u radu nema ni riječi). Tada se ispostavlja da je tekst na dva nepoznata jezika (provjera u ovoj fazi ispada nemoguća i preuzima se na vjeru). Štoviše, postoje mnogi konzervativni načini da se pokaže da su dvije (velike) stranice napisane jednim slovom, ali na različitim jezicima, bez pribjegavanja složenim matematičkim modelima. Konačno, ako se samoglasnici uklone iz teksta, koliko se to potvrđuje standardnim, već poznatim metodama (na primjer, Sukhotin, Shevoroshkina i Ventris)?"

Davletshin također kritizira neosjetljivost na filologiju i povijest karakterističnu za ovu vrstu istraživanja:

Ono što vidim u tekstu: često postoje ljudi koji žele uzeti izvor X i zaboraviti da je izvor i postoji u nekom povijesnom, uključujući jezični kontekst, i nekako nešto ubrojiti u njega. Zanimljiva je hipoteza da u rukopisu postoji više jezika. Ali to biste mogli nekako ljudski pokazati. Statističke metode su i dalje nagovještaji rezultata, a ne rezultati. -Albert Davletshin. Centar za jezične komparativne studije IVKA RSUH

Ne postoji kriterij za razlikovanje zanimljivih rezultata od strašnih

Uravnoteženiji stav zauzeo je Georgy Starostin, stručnjak za komparativnu povijesnu lingvistiku (RSUH). Više ga je zanimalo koliko su nove matematičke metode korisne za rješavanje problema s kojima se suočavaju lingvisti. “Model predstavljen u članku ostavlja neobičan dojam. S jedne strane, čini se da pripada kategoriji "slijepih", analizirajući tekstualne podatke bez ikakvih preliminarnih prosudbi o strukturi abecede (na primjer, digrafe, poput engleskog ch, sh, treba smatrati kombinacijama dvaju slova, iako je ovo zapravo jedno zvuk). S druge strane, iz uspoređenih žica izbacuju se samoglasnici koji, prema autorima teksta, sadrže manje informacija i radije dodaju buku. Općenito, baza testova je očito vrlo mala, nemoguće je govoriti o nečemu temeljnom na toliko jezika."

Rezultati usporedbe indoeuropskog i uralskog jezika, predstavljeni u usporednoj tablici 3 u članku, ne ulijevaju poseban optimizam Starostinu. Neki pokazatelji stupnja blizine jezika dobro su zabilježeni (na primjer, unutarnjemačke ili unutarromaničke veze), neki loše (na primjer, metodologija više ne identificira indoeuropsku obitelj). Glavna stvar je da ne postoji kriterij za razlikovanje zanimljivih rezultata od strašnih. U najboljem slučaju, metoda omogućuje izdvajanje malih jezičnih skupina (premda ni ovdje ne djeluje između usko povezanih finskih i estonskih), ali sve se te skupine mogu pouzdano identificirati bez nje.

Tablica 3 iz pretiska, koja prikazuje rezultate usporedbe indoeuropskog i uralskog jezika. Ista boja u tablici. Identificirane su 3 skupine jezika koje su u paru bliske (u smislu norme L1 raspodjele uređenih frekvencija u tekstovima bez samoglasnika). Neki neočekivano bliski jezični parovi označeni su crvenom bojom, kao što su njemački / mađarski, engleski / estonski, latinski / baskijski i grčki / finski. Autori pretiska: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Tablica 3 iz pretiska, koja prikazuje rezultate usporedbe indoeuropskog i uralskog jezika. Ista boja u tablici. Identificirane su 3 skupine jezika koje su u paru bliske (u smislu norme L1 raspodjele uređenih frekvencija u tekstovima bez samoglasnika). Neki neočekivano bliski jezični parovi označeni su crvenom bojom, kao što su njemački / mađarski, engleski / estonski, latinski / baskijski i grčki / finski. Autori pretiska: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Tablica 3 iz pretiska, koja prikazuje rezultate usporedbe indoeuropskog i uralskog jezika. Ista boja u tablici. Identificirane su 3 skupine jezika koje su u paru bliske (u smislu norme L1 raspodjele uređenih frekvencija u tekstovima bez samoglasnika). Neki neočekivano bliski jezični parovi označeni su crvenom bojom, kao što su njemački / mađarski, engleski / estonski, latinski / baskijski i grčki / finski. Autori pretiska: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Konačno, utvrditi genetske karakteristike jezika distribucijom Hurstovog eksponenta zanimljiva je ideja, koja je možda čak i dovedena do neke znanstvene točke. Ali to će zahtijevati obradu velikog broja tekstova na različitim jezicima. I problem se odmah pojavljuje: mnogi su jezici nepisani, a koliko je ispravno uspoređivati abecedne sustave snimanja s fonetskim transkripcijama ostaje nejasno. Iz ove će ideje biti vrlo malo praktičnog smisla, siguran je Starostin. U najboljem slučaju, doista se može primijeniti na incidente poput Voynichovog rukopisa, kada postoji hipoteza da je neki jezik sa standardnim abecednim zapisom šifriran prema određenim načelima (na primjer, brisanjem samoglasnika itd.). Međutim, u svijetu je vrlo malo takvih incidenata.

Sumirati

Što je u konačnici? Diskusija oko istraživanja IPM-a i MIPT-a otkrila je duboki razdor između jezične zajednice (čak i one koja koristi statističke metode) i "stranaca" u vezi s lingvističkim stručnjacima koji su odlučili primijeniti svoje matematičke alate na lingvistički materijal.

Činjenica da matematičari ne žele surađivati s lingvistima ne dovodi samo do grubih grešaka, koje se potom migriraju u medije (na primjer, baskijski jezik u pretprintu naziva se indoeuropskim, postoji izraz "samoglasnička slova"). Ljepota modela i računska snaga superračunala zapravo su obezvređene pogreškama na mjestu ulaska. Opet, uz želju i otvorenost kontakata s kolegama iz druge discipline, te bi se pogreške lako mogle izbjeći.

Ovdje pogledajte sam Voynichov rukopis.

Preporučeno: