Umjetna Inteligencija Naučila Je Pravilno Prepoznavati Govor Među Bukom - Alternativni Prikaz

Umjetna Inteligencija Naučila Je Pravilno Prepoznavati Govor Među Bukom - Alternativni Prikaz
Umjetna Inteligencija Naučila Je Pravilno Prepoznavati Govor Među Bukom - Alternativni Prikaz

Video: Umjetna Inteligencija Naučila Je Pravilno Prepoznavati Govor Među Bukom - Alternativni Prikaz

Video: Umjetna Inteligencija Naučila Je Pravilno Prepoznavati Govor Među Bukom - Alternativni Prikaz
Video: Umjetna inteligencija 2024, Svibanj
Anonim

Virtualni asistenti i sustavi prepoznavanja glasa naučili su "prepoznavati" što im osoba kaže i slijediti njegove naredbe. Ali za ispravan rad istih Siri i Cortane, vanjska buka može biti veliki problem. U rješavanju ove tehničke mane mogu pomoći stručnjaci iz Mitsubishi Electric koji su predstavili novu tehnologiju za odvajanje govora jedne osobe od opće buke.

Tehnologija japanske tvrtke naziva se Deep Clustering (čija je funkcioniranje izgrađena na principima strojnog učenja). Za početak, umjetna inteligencija naučila je samostalno odvajati govor jedne osobe od opće struje raznih zvukova i buke. Neuronska mreža razdvaja dolazne audio podatke u različite elemente i analizira svaki zasebno, nakon čega već može obraditi ljudski glas. Sličan se rad primjećuje kada se dva ili više sugovornika "spoje".

Tijekom demonstracije tehnologije od japanske tvrtke, sustav je uspio uspješno odvojiti govor dvoje ljudi koji izgovaraju istu rečenicu na različitim jezicima u jedan mikrofon. Sva obrada izvršena je u stvarnom vremenu, a kašnjenje nije prelazilo tri sekunde. Točnost prepoznavanja bila je 90 posto, a kada su tri osobe počele govoriti u mikrofon, postotak "hitova" smanjio se na 80, što je također dobar rezultat. Prema autorima projekta Anthony Vetro i Yohei Okato, "Za razliku od odvajanja govora od pozadinskih buka, odvajanje govora jedne osobe od" glasovne "buke ljudi koji govore istovremeno je vrlo težak zadatak, jer zvukovi glasova različitih ljudi imaju mnogo osobina. U većini sustava problem razdvajanja glasa rješava se instaliranjem dva ili više mikrofona, ali u slučaju korištenja samo jednog mikrofona, samo umjetna inteligencija može podnijeti zadatak razdvajanja glasa. Ova se tehnologija može koristiti tamo gdje je potrebna visoka točnost prepoznavanja glasovnih poruka. Na primjer, u sustavima za glasovnu kontrolu automobila, dizala, kućanskih i drugih elektroničkih uređaja."

VLADIMIR KUZNETSOV