ICT školovanje

Computational linguistucs

Ajar čet 13.6.2019 11:22
Srle22 kaže...

Ima li nekoga na sajtu ko se bavi kompjuterskom lingvistikom? Neko ko studira ovu oblast ili je vec zavrsio i bavi se ovom problematikom.

 ako misliš na računalnu obradu prirodnih jezika, taj sam. točnije, bio sam. odustao sam zbog katastrofalnog stanja na ffzg. 

ihush čet 13.6.2019 12:27

-lingvistika je preširok pojam-znanost.. kompjutersko prevođenje kao npr googletrasnlator je samo dio tj uz pravopis-gramatiku jedini dijelovi koji se kompjuteriziraju.

-naši timovi-programeri su izuzetno dobri u tome (naš jezik, mala nepoznata zemlja + padeži i sl. u odnosu na npr engleski koji dominira) .. pa je tako iz 'prapovijesti' hr pravopis postao model kako se to radi i uključen u MS-win-mso.. za sve ostale zemlje (jer je nama zbog padeža bio potreban nazovimo generator dok su npr englezi radili s običnom bazom riječi.. u doba floppyja na koji je stalo 1.44MB.. i zato su to smislili-riješili.. dok je u to vrijeme bio popularan i OCR scan, zajedno s mađarima npr recognita i sl.. danas je to već utopljeno u masi, kao što je normalno vidjeti mobitel na uhu (prije par desetljeća samo u startreku).

 

-lingvistika? što bi takav soft radio? Praktična primjena npr translatora ili autocorecta za pravopis.. su dijelovi, no linvistika je nešto iznad, što?

-čitanje-skeniranje-ocr nije ono što bi bila lingvistika, izgovor-sinteza.. a sve to mogu današnja računala, no kao što klavir-sintić nije taj koji stvara glazbu nego glazbenik-autor ili pisača mašina-pisac itd.. tako ne vidim što bi bila kompjuterska lingvistika, tj tu je već problem 'prevođenja' termina kako ga tko koristi, npr možemo reći i cyber-crime ili cyber-lingvistics.. ili digitalizacija ili .. no za računala je stvar algoritma i što tad algoritam treba raditi, ponavljanje nekog repetitivnog ciklusa ili izračun calculatorom.. gaming-igranje u digitalnom svijetu koji ima svoju fiziku pa i jezik kao klingonski.. kompjuter može npr pronaći riječ na francuskom, jednako kao što googlemaps pokaže kartu dok gps pozicionira lokaciju i imamo navigaciju koja nas može voditi putem.. govori nam (zvučni signal) ''skernite lijevo'' i sl. no to nije lingvistika. Računala mogu biti alat, AI je još uvjek više stvar hypea i mutnih opisa (više onih koji o tome ne znaju ništa ili referiraju na filmove) tad je pitanje što bi računalo 'computalo' u lingvistici? Računalo-computing znači obrada podataka, kako obraditi lingvistiku?

 

- Što bi bio cilj ili ideja? npr želiš li napraviti kuću, pitaš se za dimenzije, oblik, materijal, mogućnosti kao snaga ili praktičnost kao raspored, otpornost na kišu ili potres.. kuću možeš napraviti od blata, možeš napraviti cigle od istog tog blata ili keramiku, tad je trajnije-otpornije, možeš čak isprintati kuću novim 3dprinterom.. ili je napraviti od drva, betona. To radiš alatima, rukama.. što bi kompjuter radio ili obrađivao u lingvistici? Recitirao pjesme ili slušao radio drame, radio popis riječi kao klaić ili prevođenje kao vrančić... to sve već kao npr translator ili pravopis postoji i već je 'neprimjetno' kao mobitel, kao topla voda ili kotač-vatra.. npr google translator, ali to nije lingvistika koja bi obuhvatila sve u vezi jezika (pa i u množini-svih jezika znanih..). Kako bi nazvali osobu koja govori sve jezike svijeta i zna sva gramatička pravila, fonetiku, itd.. nazvali bi ga lingivist. Kako bi nazvali računalo? Što bi to računalo radilo.. ono što radi googletranslator ili ono što radi profesor nekog jezika?

-prošlih stoljeća je prikupljanje riječi bio zadatak .. izrade riječnika, standardizacije, danas je to manje-više gotovo. Danas se to ne otkriva nego koristi tj praktična primjena tehnologije i znanja, kao što je to običan calculator ili bilo što u vezi s računalima, tv-radio, sateliti, digitalizacija svega.

-digitalizacija jezika? On je od početka već digitaiziran, tj to je i programski jezik ili asembler, 0-1.. to je svako slovo-font ili znamenka, znak koji vidiš na ekranu ili tipkama. Jezik je komunikacija, mreža-linija-modem ili morzeova abeceda, dok je digitalizacija samo stvar notacije, sporedno jel to japanski ili francuski, jel klinasto arabsko ili latinično pismo.. nevažno je za prijenos i obradu informacija jel ovaj font na ekranu sarif ili sanserif, plavi ili zeleni, veći-manji.. digitaliziran je i time pogodan za obradu, računala-computing. Što bi bilo lingvistički computing-obrada? Što bi bio rezultat? Prijevod već imamo, sintetizatore imamo, pravopis imamo.. sve to zajedno = robot/AI? koji bi tad bio lingvistički robot kao iz starwarsa 3PO.. nije on linvista nego prevoditelj-diplomat/protokolarni, koliko se sjećam :) mada ga možemo nazvati lingvistom, no tad imamo problem 'nerazumijevanja' tj što precizno znači termin lingvistika a tad se opet vrtimo u krug, jer smisao jezika mora primarno biti razumijevanje i prijenos informacija, ideja, misli.. ne uvođenje nerazumijevanja ili đabriša. Problem je sam termin, dok prevoditelje već imamo. Kao multimedija, termin koji je nastao spajanjem raznih medija, papirnatih, slikovnih, zvučnih.. film, glazba, zabava (igre).. i digitalizacija koje je sve medije izjednačila (analogni, pa i tv-sat signal bilo što, novine-portali..). Film na DVDu je digitaliziran, na analognoj filmskoj vrpci je isti film, isti sadržaj, isti rezultat.. samo drugi medij-tehnologija a svaki digitalni signal da bi ga mogli percipirati ili koristiti mora biti pretvoren u analogni (zvuk-svjetlost i sl.) kao što je za računalo potrebno digitalizirati i to su razni konverteri koji to rade, možemo ih nazvati prevodioci.. tehnički je to isto, razlika je samo što kompajler prevodi npr ljudski jezik u strojni, dok prevoditelj jezika prevodi s ljudskog francuskog na ljudski engleski i sl. ili kao što bi neki adapter prilagođavao račualni port npr maca neki mini usb na neki pc-normalan format usba itd. jesu li to prevodioci-adapteri-knverteri .. jel to lingvistika?

- Što bi bila računalana lingvistika? (osim buzzworda.. i hypea oko AIja, no to rade oni koji o materiji nemaju dovoljno znanja u IT struci, jer jezik je oduvjek tu i morzeova abeceda je jezik, jezik kojeg žica+struja razumiju i mogu prenjeti do cilja gdje telegrafist primi i prevede poruku)..

-može li bilo koja znanost dobiti prefix kompjuterska? npr fizika, kemija.. i što to tad znači? Ako je računalo samo alat-sretstvo, ne nazivamo po alatu npr građevinu, čekić-bager-mješalica su alat kojim gradimo, no građevino nazovemo most, kuća, piramida.. alat ili materijal su samo to. Sredstva kao i svi resursi za bilo što, znanje, novac.

 

-znanost je znanje. Za sad ne postoji kompjutersko znanje, postoji isključivo naše, ljudsko, postoje algoritmi.. AI je dalek. Po tome ne može postojati (za sad) kompjuterska lingvistika, osim onih koji misle da je 3PO kompjuter-robot, u stvarnosti to je glumac s malo pozlaćene plastike. Ako bi nešto jednog dana postalo kompjuterska lingvistika, tad bi se to bavilo čime, nastankom jezika od nule-jedinice, oblikom fonta na ekranu kojeg računala prikazuju humanoidu (računalu je to nepotrebno-nečitljivo).. francuski lingvista se bavi frncuskom lingvistikom, računalni?

-problem je terminologija, što to znači.. ili laički-kolokvijalno možemo reći jezik, no i tad je to recimo besmislica, computing lingivistics. Može biti jedino za bilo koji oblik digitaliziranih podataka za strojnu obradu, od bušenih vrpci do dvd-usb ili mrežnih impulsa-paketa i adapteri-konverteri na putu od a-do-b, tj do cilja. Jezici koji bi bili pandan ljudskima su tad assembler, java, c..

-tad bi došli do računalnog jezikoslovlja.. od st.7mog u kamenu ili 20tog u digitaliji? Vidjeli bi da je java na osnovi c-a, da korjene vuku od boolea-touringa-faradeja-ide.. i da su u osnovi bušena vrpca koja se pojavila u doba industrijske revolucije (francuz u uk) za tkalačke strojeve.

 

Jezikoslovlje? :)) možda binaristika?

Srle22 čet 13.6.2019 13:35

@ihush

 

Zao mi je ako imas nedoumicu oko toga sta je kompjuterska lingvistika, izguglaj malo po netu, naci ces vrlo jasna i detaljna objasnjenja. Vec nekoliko decenija se ova multidisciplinarna oblast kao takva proucava na mnogim univerzitetima u Evropi i Americi.

 

No, svrha mog pitanja nije bila da raspravljamo sta je to kompjuterska lingvistika, vec mi treba praktican savet nekoga ko se time bavi, s obzirom da moj sin planira da upise ovaj smer naredne jeseni, verovatno u Nemackoj, pa sam zeleo da cujem prakticna iskustva ljudi koji su zavrsili studije iz ove oblasti ili trenutno studiraju.

Ako ima takvih, bicu im zahvalan ako se jave da malo razmenimo informacije.

Top Bugovac čet 13.6.2019 19:29
Srle22 kaže...

@ihush

 

Zao mi je ako imas nedoumicu oko toga sta je kompjuterska lingvistika, izguglaj malo po netu, naci ces vrlo jasna i detaljna objasnjenja. Vec nekoliko decenija se ova multidisciplinarna oblast kao takva proucava na mnogim univerzitetima u Evropi i Americi.

 

No, svrha mog pitanja nije bila da raspravljamo sta je to kompjuterska lingvistika, vec mi treba praktican savet nekoga ko se time bavi, s obzirom da moj sin planira da upise ovaj smer naredne jeseni, verovatno u Nemackoj, pa sam zeleo da cujem prakticna iskustva ljudi koji su zavrsili studije iz ove oblasti ili trenutno studiraju.

Ako ima takvih, bicu im zahvalan ako se jave da malo razmenimo informacije.

 Sva pitanja pucaj javno da i drugi forumasi vide.

 

Sto te zanima?

Srle22 pet 14.6.2019 09:01

Vrlo prakticne stvari me zanimaju.

Ako si iz pomenute branse, interesuje me sta mislis da  je bolje upisati za osnovne studije CL - Trinity College u Dublin-u ili Univesitet u Tuebingenu u Nemackoj, i zasto?

Koliko je ovaj profil strucnjaka realno trazen u Evropi i Americi?

Da li je bolje zavrsiti skolovanje do kraja (master, postdiplomske studije) na istom fakultetu ili kasnije otici npr. iz Evrope u Ameriku. Naravno, ukoliko te zele primiti....

Ako moze neki odgovor na ova pitanja, seticu ih se u msdjuvremenu jos.

 

Top Bugovac sub 15.6.2019 01:05
Srle22 kaže...

Vrlo prakticne stvari me zanimaju.

  1. Ako si iz pomenute branse, interesuje me sta mislis da  je bolje upisati za osnovne studije CL - Trinity College u Dublin-u ili Univesitet u Tuebingenu u Nemackoj, i zasto?
  2. Koliko je ovaj profil strucnjaka realno trazen u Evropi i Americi?
  3. Da li je bolje zavrsiti skolovanje do kraja (master, postdiplomske studije) na istom fakultetu ili kasnije otici npr. iz Evrope u Ameriku. Naravno, ukoliko te zele primiti....

Ako moze neki odgovor na ova pitanja, seticu ih se u msdjuvremenu jos.

 

 

Nisam jos u toj bransi, ali znam ponesto te znam ljude koji rade te stvari.

 

1. Ne znam, ali sam studij tesko da ce ti dati dovoljno temelja da radis u tom podrucju. Druga stvar su mentorstva al to ti je tek bitno za eventualno diplomski, a sigurno za postdoc. Ciljas na jako usko podrucje i faks ti tu do diplomskog i postdoca ne igra preveliku ulogu.

2. Vecina tih strucnjaka (u EU) radi u akademiji 

3. Nema "boljeg". Puno toga ti ovisi o prilici, ali kako ih dosta ostaje akademiji onda je valjda bolje ici na postdoc

 

Mislim da ides previse duboko u jedno podrucje, a klinjo ti jos nije ni upisao faks :) 
Puno stvari se moze (i treba) promijeniti tokom studiranja.

Ajar sub 15.6.2019 04:16
Srle22 kaže...

Vrlo prakticne stvari me zanimaju.

Ako si iz pomenute branse, interesuje me sta mislis da  je bolje upisati za osnovne studije CL - Trinity College u Dublin-u ili Univesitet u Tuebingenu u Nemackoj, i zasto?

Koliko je ovaj profil strucnjaka realno trazen u Evropi i Americi?

Da li je bolje zavrsiti skolovanje do kraja (master, postdiplomske studije) na istom fakultetu ili kasnije otici npr. iz Evrope u Ameriku. Naravno, ukoliko te zele primiti....

Ako moze neki odgovor na ova pitanja, seticu ih se u msdjuvremenu jos.

 

 preporučujem beč. izvrsno su organizirani, kvaliteta studiranja (u svim aspektima) je nedostižna, bliže je, smještaj u domovima nije stoliko skup itd.