Govor strave i užasa: Analiza strategija algogovora u srpskoj TikTok zajednici na primeru vulgarnosti i vulgarizama iz seksualnog domena
Kapetan Lea, II razred, Gimnazija Žarko Zrenjanin
Mentorke:
Vujić Helena, Eotvos Lorand University, Budimpešta
Isidora Dekić, Univerzitet u Beogradu
Algogovor je skup strategija kojima se korisnici_e društvenih mreža služe, pre svega na TikTok-u, kako bi zaobišli ograničenja koja na njoj postoje, a zbog kojih bi sadržaji koje postavljaju, videi ili komentari, mogli biti zabranjeni/uklonjeni. Ove strategije uključuju izostavljanje, te zamenu celih izraza ili njihovih delova drugim karakterima, simbolima i emodžijima kojima se originalni oblik skriva od algoritma za detekciju zabranjenog sadržaja. Prethodna istraživanja rađena na diskursu anglofone digitalne zajednice izdvajaju opšte principe zajedničke algogovora i ukazuju na mogućnost varijacija spram geografskih i socio-kulturnih razlika pod-zajednica (Steen E., Yurechko K., i Klug D. 2023. You Can (Not) Say What You Want: Using Algospeak to Contest and Evade Algorithmic Content Moderation on TikTok. Social Media+ Society, 9(3): 1–17.). Stoga, cilj ovog istraživanja bio je da se kroz diskursnu analizu TikTok komentara koji sadrže vulgarnosti/vulgarizme, specifično one iz seksualnog domena, ispita koliko je algogovor zastupljen u srpskoj digitalnoj zajednici i na kojim se strategijama zasniva. Korpus je činio 37971 komentar, sakupljen sa 209 snimaka sa profila osam influensera_ki i dodatne teme pretražene #. Primeri algogovorom izmenjenog vulgarizma/nosti iz seksualnog domena pronađeni su u 220 komentara u okviru koji je uočeno sedam strategija algogovora – zamena slova asteriskom (78) interpunkcijskim znakom (40), najčešće tačkom (34), brojevima, simbolima i zamenskim slovima (39), emodžijima (23), te izostavljanje slova (27), upotreba žargonizama i neologizama (11) i ubacivanje velikih slova (2). Kada se radi bilo koji tip zamene ili izostavljanja, uočeno je da se uvek ostavlja prvo slovo/slog, dok se najčešće menja slovo(a) iz sredine, a, ako se nešto ostavlja na kraju, to je najviše jedan slog. Osim u slučaju asteriska i tački gde jedan karakter može zameniti više slova ili celu reč, zamene se u svim drugim slučajevima vrše na nivou slova. Ipak, više različitih zamena može se naći u istom izrazu. Odabir broja, simbola, zamenskog slova ili emodžija kojim se menja neko slovo (tj. reč ili izraz u slučaju emodžija) može biti vizuelna, fonetska ili fonološka sličnost između zamene i zamenjenog ili ustaljena metaforička konceptualizacija.
Modelovanje tema i analiza sentimenata srpskog medijskog diskursa o projektu Jadar
Ćurčić Tamara, II razred, Gimnazija Jovan Jovanović Zmaj
Đurđević Mila, IV razred, V beogradska gimanzija
Mandić Miljana, III razred, Filološka gimnazija
Mentorka:
Dekić Isidora, Univerzitet u Beogradu
Cilj istraživanja bio je istražiti tematsku strukturu i prisutni sentiment u medijskom diskursu o projektu Jadar u srpskim medijima. Metodom skrejpovanја (engl. scraping), prikupljeni su članci objavljeni na web-sajtovima sedam medija, napisani na srpskom, označeni sa #riotinto. Tekstovi su prečišćeni i normalizovani, te sačuvani u dva oblika – normalizovanom i dodatno tokenizovanom lematizovanom. Korpus, sačinjen iz 851 teksta, podeljen je u dva dela, gde su jednu grupu (494) činili članci iz Informera i Kurira a drugu (357) oni iz BIRN-a, CINS-a, Crte, Mašine i Radara. Teme unutar grupa su modelovane primenom metoda LDA (Latent Dirichlet Allocation) i BERTopic, pri čemu su merene koherentnost i diverzitet tema za svaki od testiranih modela. Primenom LDA-a, na unigramima, te bigramima, sa fino podešavanim brojem tema i alpha i beta parametrima, u okviru prve grupe dobijen je optimalan broj tema četiri, a u okviru druge dva. Primenom BERTopic-a sa embedding modelom distiluse-base-multilingual-cased-v2 sa redukcijom broja tema, dobijeno ih je pet u okviru prve grupe i četiri u okviru druge. U prvoj grupi, to su bile teme (1.1) dijalog predsednika sa narodom, (1.2) pitanje izvodljivosti Projekta i uticaja na životnu sredinu, (1.3) povezanost opozicije i protesta, (1.4) vladino ukidanje dozvole Rio Tintu i (1.5) održavanje referenduma o zakonu o eksproprijaciji i protest protiv istog, a u drugoj (2.1) nepravilnost izbora i bojkot opozicije, (2.2) istraživanje o uticaju Projekta na životnu sredinu i zagađenost vode, (2.3) uticaj Evropske unije na iskopavanje litijuma u Srbiji i (2.4) ekološki protesti. Primenom rečničkog metoda, koristeći se rečnikom sentimenata Senti-Pol-sr (dostupan na: http://fuseki.jerteh.rs/#/dataset/Senti-Pol-sr/query), određen je sentiment svakog članka i prevalentni sentiment svake teme. Sve teme su ocenjene pozitivno, sa istaknutijim udelom negativnog sentimenta u temi 1.3 i ambivalentnog senitmenta u temama 2.1 i 2.2.
Stavovi ruskih imigranata u Srbiji prema srpskom jeziku
Vojinović Sofija, III razred, XIII beogradska gimnazija
Mentorka:
Vujić Helena, Eotvos Lorand University, Budimpešta
U ovom radu opisana je sociolingvistička situacija ruske jezičke zajednice u Srbiji na primeru ruskih imigranata koji su od 2021. godine došli kao politički imigranti. Za potrebe istraživanja formiran je upitnik od 84 stavke koje su se odnosile na ispitanikovo znanje, korišćenje i stav prema srpskom jeziku i njegovim govornicima_ama, kao i na upotrebu ruskog jezika u različitim domenima. Uzorak je činilo 65 ispitanika_ca, od čega je 33 ušlo u analizu (17 ženskog i 16 muškog pola). Najveći broj ispitanika_ca je došao u Srbiju 2022. godine, a prosečan uzrast je 33 godine. Ispitanici_e svoje znanje srpskog procenjuju kao prosečno, dok stavove prema srpskom jeziku i njegovim govornicima ocenjuju pozitivno. U porodičnom okruženju najčešće koriste ruski jezik. Analiza pokazuje da češće susretanje sa ruskim jezikom u obrazovnim sadržajima utiče na veću motivisanost za učenjem o srpskoj kulturi. Veća upotreba srpskog jezika na društvenim mrežama poput Instagrama i Tiktoka povezana je sa time da se ispitanici_e osećaju prijatnije tokom korišćenja srpskim jezikom, manje izbegavaju komunikaciju na njemu, ali i sa manjim vrednovanjem značaja ruskih zajednica u Srbiji i okruženosti govornicima ruskog jezika. Nasuprot tome, veća upotreba ruskog jezika na društvenim mrežama poput Telegrama i Vkontakta pozitivno korelira sa važnosti postojanja ruskih zajednica u Srbiji i upotrebom ruskog jezika. Veća nedeljna upotreba srpskog jezika u grupama u kojima su prisutni govornici_e i srpskog i ruskog jezika, kao i češće slušanje muzike na srpskom, povećavaju želju za unapređivanjem srpskog jezika, kao i želju za imanjem prijatelja koji su govornici_e srpskog jezika. Sa višim samoprocenjenim nivoom znanja i češćom nedeljnom upotrebom srpskog jezika u formalnim i neformalnim situacijama, ispitanici_e se osećaju prijatnije dok koriste srpski jezik i manje izbegavaju komunikaciju.
Predikcije tokom kognitivne obrade muških i ženskih nomina agentis u srpskom jeziku – na preseku pola, roda i prestižnosti
Tešić Sara, III razred, Zrenjaninska gimnazija
Mentorke:
Sara Barać, Univerzitet u Beogradu
Bojana Ristić, Smart Plus Research
Prethodna istraživanja ukazuju da stereotipičnost obavljanja zanimanja od strane muškaraca i žena, te rod imenice koja to zanimanje označava, kao i pol ispitanika mogu uticati na predikcije do kojih dolazi tokom kognitivne obrade rečenica. Stoga, ovo pilot istraživanje ima za cilj da istraži kako prestižnost zanimanja i rod imenice koja ga imenuje, te pol ispitanika utiču na predviđanje pola vršioca radnje tokom kognitivne obrade rečenica na srpskom jeziku, kojeg karakteriše bogata morfološka struktura. Sačinjen je onlajn eksperiment po uzoru na Bernotat J. (2021. Keep an Eye on Stereotypes – The Impact of Gender Stereotypes (Toward Humans and Robots) on Language Processing. Doctoral dissertation, Bielefeld University, Department of Psychology) baziran na paradigmi vizuelnog sveta (engl. Visual World Paradigm). Eksperiment su činili audio-snimci rečenica davani paralelno sa odgovarajućim ilustracijama prikazanim na ekranu: ilustracijom vršioca radnje označenih poslednjom izgovorenom imenicom muškog i ženskog pola, rodno neutralnog objekta rečenice i predmeta-distraktora. Za ove potrebe korišteno je 14 imenica ujednačenih po prestižnosti označenih zanimanja, svih u (1) muškim/ženskim glasom izgovorenim rečenicama prikazanih u (2) muškom/ženskom obliku, latinskim kvadratom raspoređenih u dve verzije eksperimenta. Web-kamerom su beleženi pokreti očiju, a analiziran je odnos vremena gledanja u žensku i mušku ilustraciju zanimanja tokom trajanja rečenice. Uzorak je činilo 76 izvornih govornika šumadijsko-vojvođanskog dijalekta, pretežno srednjoškolskog i fakultetskog uzrasta. Rezultati analize pokazuju da se prilikom slušanja imenica u muškom rodu statistički značajno više fokusirala muška ilustracija naspram ženske, kao i ženska više od muške prilikom slušanja imenica u ženskom rodu. Međutim, ispitanici muškog pola statistički značajno više fokusiraju muške ilustracije u odnosu na ženske, čak i posle imenice u ženskom rodu. Ispitanice, pak, statistički značajno više fokusiraju ilustraciju koja odgovara poslušanoj imenici. Prestižnost zanimanja i glas kojim je čitana rečenica nisu imali statistički značajan uticaj na fokusiranje muške spram ženske ilustracije.
Protest 15 za 15: Modelovanje tema u diskusijama o studentskim protestima na Reditu
Drašković Luna, III razred, Gimnazija Žarko Zrenjanin
Mentorka:
Dekić Isidora, Univerzitet u Beogradu
Cilj ovog istraživanja bio je utvrditi tematsku strukturu diskusija na platformi Redit u nedelji koja je prethodila studentskom protestu 15 za 15, održanom u Beogradu, 15. marta 2025. Koristeći se metodom skrejpovanja (engl. scraping), za potrebe istraživanja konstruisan je korpus od 8298 objava i komentara sakupljenih sa subreddit-a srbija, serbia, serbiacasual, AskSerbia, StudentiSrbija, i to onih koji su sadržali neku od ključnih reči/sintagmi, uključujući reči i sintagme kao što su studenti, protesti, blokade, pad nadstrešnice, ćaćilend, obojena revolucija i petnaesti mart (slovima i brojevima napisan). Nakon uklanjanja duplih, kratkih, neadekvatnih i sa temom nepovezanih objava i njihovih komentara, u dalju analizu je ušlo 6634, naknadno prečišćenih i normalizovanih. Primenom metoda LDA (Latent Dirichlet Allocation) i BERTopic, analizirane su najobuhvatnije teme od kojih je korpus sačinjen, pri čemu su za svaki od testiranih modela merene koherentnost i diverzitet tema, te je rezultat svakog pojedinačno interpretiran. Metoda LDA primenjena je na unigramima i bigramima, a sprovedena je i pretraga po mreži optimalnih vrednosti parametara broja tema, alpha i beta. BERTopic model testiran je sa tri multilingvalna embeding modela, među kojima se najboljim pokazao paraphrase-multilingual-mpnet-base-v2, koji je prvobitno pronašao 45 tema, a koje su naknadno redukovane na devet, koje su ujedno prestavljale i najinterpretabilniju strukturu tema od svih analiziranih. Poređane od najzastupljenijih do najmanje zastupljenih, ove teme su interpretirane i imenovane kao (1) odlike i određenja studentskih protesta – nekada i sad, (2) prevoz do Beograda i parking u njemu, (3) diskusije ad hominem, (4) traktori okružuju Pionirski park, (5) Šta poneti na protest?, (6) političko neslaganje među prijateljima, (7) šta (ni)je fašizam?, (8) Pionirski park postaje ljudski zoo vrt i (9) politička svest različitih generacija.

