Primenjena fizika i elektronika

Poređenje arhitektura i topologija rekurentnih neuronskih mreža za klasifikaciju govornika

Nemanja Gemović (2003)
učenik 3. razreda Gimnazije "Jovan Jovanović Zmaj", Novi Sad

Mentorstvo:
Stefan Vukanić, student osnovnih studije, Elektrotehnički fakultet, Univerzitet u Beogradu

Poređene su long short-term memory (LSTM) i gated recurrent unit (GRU) arhitekture i stacked i bidirectional topologije rekurentnih neuronskih mreža prilikom klasifikacije govornika nezavisno od sadržaja govora, kako bi se odredile optimalna topologija i arhitektura radi optimizacije tačnosti sistema za klasifikaciju govornika koji su bazirani na rekurentnim neuronskim mrežama. Korišćena je VoxCeleb2 baza podata iz koje je izdvojeno 4905 različitih govornika sa po 10 primera govora kako bi se trenirale mreže. Prilikom poređenja stacked LSTM, stacked GRU, bidirectional LSTM, bidirectional GRU i bidirectional COMB mreže (koja se sastoji od 2 kombinovana bidirectional sloja tako da forward sloj koristi LSTM, a backward GRU arhitekturu) ustanovljeno je da bidirectional COMB mreža daje najbolje rezultate, osim kada je prilikom testiranja korišćeno 8 snimaka govora svakog govornika. Takođe je utvrđeno da u opštem slučaju GRU arhitektura daje bolje rezultate od LSTM arhitekture i da bidirectional topologija daje bolje rezultate od stacked topologije.

Poređenje metoda za klasifikaciju žanra muzike koristeći neuralne mreže

Branko Grbić (2001)
učenik 4. razreda Gimnazije Zaječar, Zaječar
Pavle Pađin (2001)
učenik 4. razreda Matematičke gimnazije, Beograd

Mentorstvo: 
Milomir Stefanović, student osnovnih studija, Elektrotehnički fakutlet, Univerzitet u Beogradu

Cilj istraživanja je poređenje 4 različite metode (Fingerprint, spektar, MFCC i LPCC metode) za klasifikaciju žanra muzike koristeći neuralne mreže. Fingerprint metoda detektuje 10 komponenti spektra (frekvencija) najveće spektralne gustine signala. Spektar metoda podrazumeva korišćenje karakterističnih obeležja kao što su spektar signala i logaritam spektra signala. LPCC i MFCC su kepstralni koeficijenti, dobijeni pomoću kepstra signala na koje je primenjena Melova filterbanka (MFCC), odnosno linearne predikcije (LPCC). Korišćene su 2 baze koje sadrže audio fajlove, sačuvane u .wav formatu, gde je svaki audio fajl isečak iz pesme dužine 5 sekundi. Svaki audio fajl je označen žanrom muzike kome pesma iz audio fajla pripada. Prva baza je NATA, koja sadrži 6 različitih žanrova za klasifikaciju (klasična muzika, folk, haus, džez, R&B i rok), sa po 300 pesama po žanru. Druga baza je GTZAN, koja sadrži 10 žanrova za klasifikaciju (bluz, klasična muzika, kantri, disko, hiphop, džez, metal, pop, rege i rok), sa po 100 pesama po žanru. Najbolji rezultat nad NATA bazom je 95.9%, dobijen kombinacijom MFCC i Spektar karakterističnih obeležja, dok je nad GTZAN bazom dobijena maksimalna tačnost od 63.3% kombinujući Spektar i MFCC karakteristična obeležja. Ista tačnost (63.3%) nad GTZAN bazom postignuta je i kombinacijom Spektar, MFCC i LPCC karakterističnih obeležja.

Određivanje smera pogleda korišćenjem jedne fiksne kamere

Petar Janićijević (2001)
učenik 4. razreda Gimnazije Kruševac, Kruševac

Mentorstvo: 
Lazar Milenković, student doktorskih studija, Univerzitet u Tel Avivu (Izrael)
Teo Šarkić, Microsoft Development Center Serbia, Beograd
Ervin Seke, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu

Predstavljen je sistem za određivanje smera pogleda korisnika korišćenjem samo jedne RGB kamere kakva se može naći u svakodnevnoj upotrebi na kompjuterima, laptopovima i telefonima. Jedan od najvažnijih koraka u radu sistema je određivanje centra zenice na slici, za šta su predstavljene dve metode: centra mase i aproksimacije kruga. Tačnost ovih metoda je ispitana na BioID bazi sa po dva praga tačnosti i dobijeni rezultati iznose 95.5% i 58.4% za prvu, odnosno 92.2% i 64.2% za drugu metodu. Greška konačnog rezultata sistema tj. smera pogleda dobijena je korišćenjem Eye Of The Typer baze i iznosi 4.46° kada se koristi metod centra mase, odnosno 5.6° za metod aproksimacije kruga.

Prepoznavanje gestova obradom elektromiografskih signala

Nataša Jovanović (2001)
učenica 4. razreda Gimnazije Kraljevo, Kraljevo
Marija Nedeljković (2001)
učenica 4. razreda Gimnazije Kraljevo, Kraljevo

Mentorstvo: 
Milomir Stefanović, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu
Stefan Vukanić, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu

Cilj ovog rada je klasifikacija gestova šake obradom elektromiografskih signala i upotrebom konvolucionih neuronskih mreža. Korišćeni su signali iz NinaPro baze podataka koji su prvobitno procesirani na različite načine. Metode pretprocesiranja koje su se koristile bile su: Butterworth bandpass filtar sa propusnim opsegom od 30Hz do 300Hz, bandstop Notch filtar u okolini frekvencije od 50Hz sa Butterworth filtrom na frekvenciji od 30Hz do 300Hz i Hampel filtar. Obrađeni, kao i sirovi podaci, vizualizovani su metodom spektrograma. Izdvajanjem odgovarajućih slika iz svih 12 kanala, i njihovim spajanjem, dobija se jedna slika. Svaki spektrogram odgovara jednom ponavljanju jednog pokreta. Formirane slike predstavljaju ulaz za odgovarauću neuronsku mrežu. Treniranje je izvršeno na svim podacima i zaključeno je da nefiltrirani signali daju najbolje rezultate od 87,6% test tačnosti. Signali prethodno filtrirani Butterworth filtrom, Notch filtrom i Hampel filtrom daju redom rezultate od 84%, 68,8% i 85,8% test tačnosti. Za svako treniranje određene su matrice konfuzije sa kojih se može videti da je najčešće pogrešno prepoznat pokret palac postavljen nasuprot malića (klasa 4), dok je najčešće pogrešno određen pokret ispruženi palac, kažiprst i srednji prst, dok su ostali savijeni (klasa 3). Najčešće tačno protumačene klase su klasa 14 (istezanje ruke spolja), 16 (pomeranje šake ulevo) i 17 (istezanje pesnice), dok je veoma mali broj klasa pogrešno prepoznat kao klasa 10 (okret raširene ruke udesno).

X-NAS

Luka Milivojević (2002)
učenik 4. razreda Prve kragujevačke gimnazije, Kragujevac

Mentorstvo:
Stefan Stepanović, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu
Andrej Lojdl, Continental Automotive, Novi Sad

Cilj istraživanja je upoređivanje rada automatizovanog procesa pretrage optimizovanih arhitektura neuronskih mreža sa arhitekturama optimizovanim od strane čoveka. Predloženo rešenje ovog problema jeste NSGA-II – elitistički genetski algoritam za multiparametarsku optimizaciju, sa jedinkama kodiranim u liste realnih brojeva koje predstavljaju arhitekturu neuronskih mreža. Parametri po kojima se arhitekture mreža optimizuju su broj neurona mreže i vrednost funkcije gubitka iste – cilj je minimizovati obe vrednosti. Rad genetskog algoritma se vrši kroz 100 generacija, dok svaka generacija u sebi sadrži 200 jedinki. Svaka neuronska mreža se trenira na setu podataka sa 60000 crno-belih slika ručno pisanih cifara veličine piksela. Za konačnu vrednost funkcije gubitka se uzima vrednost dobijena evaluacijom podataka test seta koji se sastoji od 10000 slika istog tipa. Mreža za cilj ima prepoznavanje napisane cifre sa slike. Najveća postignuta uspešnost mreže iznosi 97,27%, dok broj parametara mreže (direktno srazmeran broju neurona) iznosi 68815. Kada se ova mreža uporedi sa najboljom mrežom iz rada – Ardakani, A., Condo, C., Gross, W., 2016. Sparsely-Connected Neural Networks: Towards Efficient VLSI Implementation of Deep Neural Networks., koja je najpribližnija po broju neurona dobijaju se sledeći rezultati. Mreža iz pomenutog rada pogrešno klasifikuje podatke za 1.75% i sadrži 67231 parametar. Dakle, moguće je automatizovanim procesom postići tačnost uporedivu sa arhitekturama optimizovanim od strane čoveka. Takođe, najuspešnija mreža nema najveći broj neurona među jedinkama, odakle sledi zaključak da algoritam uspešno teži optmizaciji arhitekture, nasuprot postizanju samo jednog od dva cilja. Pretpostavlja se da je, uz određena poboljšanja u vidu određivanja stepena konvergencije algoritma i efikasnijeg kodiranja mreža, moguće značajno povećati efikasnost algoritma.

Poređenje metoda za klasifikaciju emocije lica pomoću karakterističnih tačaka

Milena Staničić (2003)
učenica 2. razreda Gimnazije Ćuprija, Ćuprija

Mentorstvo: 
Vladimir Ranković, Computer vision inžinjer, ydrive.ai
Filip Parag, student osnovnih studija, Fakultet tehničkih nauka, Univerzitet u Novom Sadu

Raspoznavanje emocija na licu je popularna primena kompjuterske vizije (eng. Computer VIsion) u stvarnom svetu, ima različite primene od auto industrije do psihologije. Postoje različiti načini za rešavanje ovog problema, a u ovom radu je korišćen način preko određivanja karaterističnih tačaka lica, odnosno relativnih razdaljina izmedju karaterističnih tačaka. Implementirana su 3 algoritma, Support Vector Machine, K Nearest Neighbors i Locality-Sensitive Hashing, ispitane su tačnost, preciznost, odziv i brzina izvršavanja klasifikacije neklasifikovanog podatka. Jedan od vektora odlika se sastoji od karaterističnih tačaka kojih ima 68 tako da se vektor odlika sastoji od 67 informacija o razdaljini između 68 tačaka, a drugi od 15 tako da se sastoji od 14 razdaljina. U radu su korišćene dve baze Cohn-Kanade Dataset (CK+) (Lucey et al. ) i Japanese Female Facial Expression (Jaffe) (Lyons et al. ). Najveću tačnost nad CK+ bazom ima linear SVM sa načinom klasifikacije one vs rest sa tačnošću od 74.62%, a nad Jaffe bazom kernelski SVM (poly) sa načinom klasifikacije one vs one tačnost je 69.76%. Uz smanjenje dimenzionalnosti uz pomoć LDA, najveću tačnost nad CK+ bazom ima KNN sa tačnošću 98.5%, a JAFFE isto KNN sa tačnošću 90.69%.

Dizajniranje autopilota za stabilizaciju aviona korišćenjem adaptivnog PID kontrolera

Momir Stanišić (2003)
učenik 2. razreda ETŠ "Mihajlo Pupin", Novi Sad

Mentorstvo: 
Nikola Milenić, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu
Damjan Dakić, Microsoft Development Center Serbia, Beograd
Vladimir Levkov, Microsoft Development Center Serbia, Beograd

U ovom radu dizajniran je autopilot za održavanje konstantnog ugla propinjanja i valjanja na modelu aviona Cessna 172 Skyhawk. Za stabilizaciju aviona na željenim uglovima koriste se dva adaptivna PID kontrolera čiji koeficijenti zavise od trenutne brzine aviona, omogućavajući tako efikasnu stabilizaciju na svim operativnim brzinama leta. Kontroleri su dizajnirani na osnovu matematičkih modela dobijenih identifikacijom sistema iz snimljenih letova u X-Plane simulatoru [11], koji je takođe korišćen i za verifikaciju dizajniranih kontrolera. Za dizajniranje PID kontrolera korišćena je root locus metoda. Autopilot stabilizuje ugao valjanja sa -10° na 0° sa vremenom smirenja ispod 2.4 sekunde i preskokom ispod 0.36°, ugao propinjanja sa -10°na 0°stabilizuje sa vremenom smirenja ispod 2 sekunde i preskokom ispod 0.49°, avion se smatra stabilizovanim ako se konstantno nalazi u opsegu od 0.3° od željenog ugla.

Ispitivanje uticaja geometrije na osobine kirigami omotača inspirisanog zmijskom kožom

Mašan Vučinić (2001)
učenik 4. razreda, Politehnika - škola za nove tehnologije, Beograd

Mentorstvo: 
Đorđe Marjanović, student osnovnih studija, Elektrotehnički fakultet, Univerzitet u Beogradu
Vuk Vukomanović, Microsoft Development Center Serbia, Beograd

Kirigami je drevna japanska veština slična origamiju koja obuhvata i rezanje materijala. Primer spoja ove tehnike i mekane robotike je bioinspirisani mehanizam sačinjen od silikonskog aktuatora i kirigami omotača nalik zmijskoj koži koji aktuatoru omogućava kretanje. U radu je ispitan uticaj ugla koji definiše oblik i veličinu elemanata omotača na karakteristike mehanizma. Ispitan je uticaj zatezanja na omotače i utvrđen koeficijent trenja omotača sa različitim uglovima. Rezultati ukazuju na to da sa povećanjem ugla dolazi do smanjenja elastičnosti omotača, kao i da sa povećanjem ugla do određene vrednosti dolazi do povećanja koeficijenta trenja između omotača i grube podloge, dok u slučaju fine podloge ne dolazi do značajnih promena.