Prevajanje in računalniki

NigelM

Pingvin
19. avg 2007
17.286
4
36
ena vas naprej od Jest-a
Citat:
Uporabnik PIC pravi:
...
Moje subjektivno mnenje o pomnilnikih prevodov je dokaj slabo, saj so relikti neke stare programerske logike, ki pa z učinkovitim prevajanjem nimajo velike veze. Že samo dejstvo, da orodja sub-segment leveraging podpirajo šele zadnje leto/dve, pove vse o logiki "kako je treba ravnati z jezikom". Krivdo za to pripisujem podjetjem, ki so dala programerjem za programirati orodja za prevajalce
smile-1.gif
.
...
LP,
PIC

Katerega od CAT programov si zares uporabljal več kot samo "od segmenta do segmenta" - se pravi, da si si naredil glosarje, se povezal z zunanjimi slovarji itd.

Tako kot velika večina uporablja CAT, je vsak CAT dober oz. enako slab - večina se nauči nastaviti TM in se začeti sprehajati od segmenta do segmenta, potem se pa neha. Večina je preprosto prelena, da bi prebrala navodila, se izobrazila in začela prevajati učinkovito in predvsem dosledno - ima pa obilo časa za tarnanje, hkrati pa dela za vsako ceno (beri pod ceno).

Sam sem jih temeljito preskusil (ali bil prisiljen uporabljati) kar nekaj, ampak čez WF ga ni. In če bi ti WF zares spoznal, bi videl, da se v zgornji trditvi hudo motiš.
 

PIC

Fizikalc
17. avg 2007
2.466
2
38
Detaljno poznam naslednje:

Trados
MemoQ
Deja Vu
Idiom

Manj detaljno pa:
Across
Wordfast

Glede izkoriščanja možnosti različnih programov ti ne bi razlagal, upam da je podatek, da jaz drugim nudim podporo in trike za efektiven workflow, dovolj.

WF Pro sem po službeni dolžnosti implementiral za stranko, seveda sem ga sam tudi potestiral. Najprej sem znorel, ker ni bilo slovenskega črkovalnika. Pohvalim lahko, da so v roku 1 tedna uredili posodobitev za to "napako".

Splošnih pripomb z vidika freelancerja na program nimam, saj nudi večino nujnih stvari, ki jih potrebuje prevajalec pri delu.

Všeč mi je tudi:
- koncept VLTM
- dejstvo, da je ustanovitelj Wordfasta zelo na strani prevajalcem (imel z njim nekajkrat pogovor, zdaj že starejši gospod je res strokovnjak, kapo dol)
- neodvisnost glede na platformo (velik plus)

Sicer pa za čisto osnovno delo zadostuje že Googlovo orodje za prevajanje, če res ne izkoriščaš tega, kar ostala orodja ponujajo.

Za kompleksnejše rešitve in LSP implementacijo pa jaz nisem izbral WF-ja, ker je premalo orientiran za ekipno delo.

Trenutno med vsemi orodji preferiram MemoQ, ki je že zdaj med najboljšimi orodji, v prihodnje pa bodo še boljši od konkurence.

LP,
PIC
 

NigelM

Pingvin
19. avg 2007
17.286
4
36
ena vas naprej od Jest-a
Tudi sam sem se nekaj časa trudil na tem področju (izobraževanje), pa sem zadevo opustil - komaj kaj zainteresirane publike, pa še tisti, ki so bili, bi radi nekaj vedeli brez lastnega truda.

Za MemoQ sem samo slišal, trestiral ga nisem.

WFPro sem si samo namestil, vendar si še nisem prebral navodil. Očitno sem preičakoval preveliko podobnost s klasičnim WF, tako da sem bil na začetku kar malo razočaran.

Itak velja, da je najboljše orodje tisto, ki ga najbolje obvladaš. Sam sem uporabljal oz. bil prisiljen uporabljati tudi Trados, Transit XV in še TransTool, ki je čisto interno orodje neke prevajalske agencije. Kot rečeno, od teh največ prilagoditev omogoča ravno WF, da o razmerju med cena/zmogljivost niti ne govorim.

Skupinsko delo?
Kaj pa vem - glede na to, da WF že v osnovi omogoča povezavo do 20 delovnih mest na isto bazo in iste glosarje, je spet neprekosljiv v razmerju cene/zmogljivost. Poleg tega ne vem, ali še kakšen od omenjenih programov nudi uporabo skupnega TM-ja nekje na omrežju. Tako mrežna uporaba TM-ja ni omejena na lokalno mrežo.

Drži pa, da WF ni ravno "trotl zihr" in da ravno njegova odprtost za optimizacijo potrebuje nekaj neprevajalskega znanja - tega pa v slovenskem prevajalskem okolju močno primanjkuje.

PS: midva se morava enkrat dobiti in kakšno reči na to temo!

EDIT: Yves je faca prve kategorije - imel sem čast, da sem ga spoznal osebno.
 
Nazadnje urejeno:

BossTonE

Zelenc'
11. okt 2007
6
0
1
Da se še jaz vključim v tole debato in pristavim svoj deci. PIC, pri machine translation ne gre za to, da bi moral kdo kaj filat s slovenskimi zadetki, ker potem to ni več MT, ampak, če jaz kaj vem, zgolj dvojezični korpus, iz katerega potem prihajajo zadetki, se pravi, je googlov translate (popravita me, če nimam prav), ki izkorišča svoj iskalnik in črpa iz dokumentov, ki na netu obstajajo tako v izvornem kot v ciljnem jeziku, prav to. Pri MT pa gre predvsem za to, da bi se naj računalnik nekoč naučili človekovega razmišljanja, da bi torej prepoznal sintakso, besedne zveze in kontekst posameznega jezika in bi se sproti učil. Tega pa še menda dolgo ne bo.

Glede pomnilnikov prevodov pa: vidim, da oba sedita na drugi strani mize, saj govorita o optimizaciji stroškov in povečanju storilnosti in gledata na vso stvar s stališča naročnika oz. prevajalskih agencij, ki bi radi imeli prevod opravljen najraje zastonj in še to že včeraj. TM-ji so bili v prvi vrsti razviti kot pomoč izključno prevajalcu, pa še to samo tehničnemu (za druge veje prevajanja so maltene neuporabni), in so ob premišljeni uporabi čist super, a kaj, ko je v določenem trenutku ta razvoj skrenil v napačno smer. Dodale so se aplikacije za vodenje projektov, revizije, gradnjo terminoloških baz in kajvemkajše. Sedaj agencije to veselo izkoriščajo. Naročniku zaračunajo polno ceno za celotno besedilo, prevajalcu pa potem pošljejo v prevod en tak dokument, ki ni ne t.ič ne miš. Polovica dokumenta je predprevedena (če imaš srečo, zadetki prihajajo iz sorodnega projekta, če nimaš, pa iz enega čisto tretjega), ta drugo polovico pa potem zaflikaj s svojimi zadetki, kakor veš in znaš. Da ne zgubljam besed o tem, kako TM-ji prevedejo enobesedne segmente, ki so (predvsem zaradi posebnosti slovenščine v primerjavi z recimo angleščino in nemščino) še posebej občutljivi (Trados recimo vzame in uporabi pač tazadnjega po datumu), kako vstavlja t.i. placeables in še in še. Gre za dvorezen meč, ki pa ni na obeh straneh oster. Prevajalci to vedo, ne vem pa, če se tega zavedajo tudi menedžerji s svojo dogmo optimizacije stroškov. NigelM, morda je bil prav zato odziv na predavanjih pri prevajalcih tako mlačen.

Ob navalu vseh teh novih CAT orodij, saj skoraj vsaka multinacionalna agencija že razvija lastnega, pa bi s stališča končnega uporabnika rekel samo: isto sr...je, drugo pakovanje. Pa lahko še tako trobijo o tem, kako jih razvijajo za prevajalce in samo zato, da bi njim olajšali delo. Japajade. Saj niso samaritani. Pa smo spet pri denarju:)

Saj drugače pa so kar kul tile pomnilniki. Hehe.

LP
 

Anubis

Fizikalc
4. nov 2007
524
108
43
ksz

Nedavno sem prebral nekaj tudi o Metatexisu, ki naj bi ponujal še boljšo razmerje med ceno in zmogljivostjo kot Wordfast. Ker pa nisem imel časa omenjene zavede preizkusiti, me zanima, če ima kdo kaj več izkušenj.

OFF: Kaj pa če organiziramo srečanje prevajalcev (in tolmačev), ki so na Alterju?
grin1.gif
 

NigelM

Pingvin
19. avg 2007
17.286
4
36
ena vas naprej od Jest-a
Citat:
Uporabnik BossTonE pravi:
Da se še jaz vključim v tole debato in pristavim svoj deci. PIC, pri machine translation ne gre za to...
Bi rekel, da PIC kar dobro loči MT in CAT. MT še zelo dolgo časa ne bo mogel brez človeškega pregleda, je pa vedno boljši in dobrodošla pomoč. Znanec in WF skupine zelo hvali ProMT, saj ga je mogoče "učiti" itd. - MT je izpopolnil do nivoja, da je prag za zadetke v WF-ju nastavil na 85%...

Ne samo za tehnične, tudi za pravne in še kakšne prevode je zadeva zelo uporabna. Poznam prevajalca pri časopisu, ki uporablja WF. Zatetkov skoraj nima, a mu vse ostalo dvigne produktivnost.

In kaj je narobe z dvigom produktivnosti? In če je pri prevajalcih odziv mlačen, so si krivi sami. Vem, da tole posega že v ideološko polje, ampak vsi, vključno s prevajalci, se moramo izobraževati. In tisti prevajalci, ki vidijo samo zaslužek agencije, naj se osamosvojijo - ena lažjih stvari pri tem poklicu. Potem naj pridobijo še kakšen večji projekt, zadevo koordinirajo in na koncu potegnejo črto. Bil sem na obeh koncih enačbe in vem kaj govorim.

Prav ti tam glede slabih predlogov pri enobesedbih segmentih, ampak za to pa je tukaj prevajalec - tudi če je zadetek 100% (tu WF spet omgoča odlične prilagoditve) je potrebno prevod pregledati, zato pa se 100% zadetki in ponovitve tudi zaračunajo s 25-30% polne cene. Zato pa govorimo o CAT, ne MT!

Mnoge agencije ga pa res "serjejo" in verjamejo v vsemogočnost raznih izvlečkov itd. - ampak na dolgi rok delajo škodo sami sebi. Ravno tako kot prevajalci, ki sprejmejo prevode pod ceno.

S prevajalci in znanjem je pa tako - nekateri so mnenja, da jim zadošča znanje jezika - in taki so plačani najslabše. Tisti, ki vsaj približno obvladajo računalnik in se trudijo še s kakšnim CAT-om dosegajo boljše cene. Če pa je agencija tako blesava da ne zna nagraditi takega prevajalca, se prevajalec lahko osamosvoji - prevajalec brez znanja CAT (in/ali drugih orodij) nima nobenih možnosti. (Slednje velja za vse poklice - tarnati je najlažje)

@Anubis: organiziraj
 

PIC

Fizikalc
17. avg 2007
2.466
2
38
Pozdrav!

Bosstone, pozdravljen! MT imaš dva, oz. zdaj že tri vrste (pišem ti to, kar že veš, pa bo mogoče za druge zanimivo).

Prvi je rule-based, kjer se pripravijo "zakonitosti" jezika, torej računalniku poveš, kako mora "razmišljati".

Drugi je statistični, kjer mu filaš tone in tone besedila. Ja, v bistvu mu daješ korpus, on pa se uči. Več kot mu daš hrane, večja je možnost, da statistično "zadane" pravilen "prevod". Zato trdim, da je MT za npr. EN-SL precej slabši v primerjavi z npr. EN-DE in to za isti MT engine. Pač, EN-SL ima neprimerno manj futra kot EN-DE.

Google MT je, če se ne motim, neke vrste hibrid, čeprav je poudarek bolj na statističnem modelu. Trik z orodjem za prevajanje (Google Translator Toolkit) je ravno v tem, da bi človeški prevajalci prispevali čim več svojih prevodov, ki bi jih nato futrali v Google MT. Ravno zaradi tega je Google na začetku pobral vse možne "zastonj" človeške spomine (UN, EU itd.), da je MT engine dobil kakovostne človeške prevode. Dobil pa sem tudi namig iz zelo zanesljivega vira, da Google za MT indeksira večjezične strani, kriterijev za izbor strani in drugih detajlov žal ne poznam.

Kakor mi razlagajo tuji kolegi, MT prevajalske agencije že precej uporabljajo, žal s tem pride tudi spremenjena vloga prevajalca, ki se prelevi v post-editorja MT prevodov. Ideja je ta, da bi bil MT tako dober, da bi prevajalec popravil toliko besed/stavkov na dan, da bi ob občutno nižji tarifi kljub temu zaslužil več kot sedaj. Moj hendikep, da se sprehajam po prevajalskih tehnologijah je ta, da sem primarno prevajalec, zato brudram ob vsaki degradaciji prevajalskega poklica. Razumem pa, da nekatere zanimajo samo stroški in profit.

Kot prevajalec, ki namaka noge v tehnološki del procesa prevajanja, razmišljam predvsem v smeri, da s tehnologijo prevajalcem dam ČIM VEČ. Torej orodje, ki nudi pomnilnik prevodov, glosarje, povezave na zunanje korpuse, slovarje, pa TUDI MT zadetke, s katerimi si lahko pomaga. Skratka, prevajalec mora čim več prevajati in čim manj iskati ter zapravljati čas z raziskovanjem (kar je sicer integralni del poklica, pa vseeno nihče ne mara pol ure iskanja za en določen izraz).

Skratka, jaz bi rad ustregel vsem, Prevajalcem, ki bi dobili kakovostnejše pomnilnike prevodov, glosarje, QA orodja, prevajalska orodja, ki bi omogočala hitrejše delo. V bistvu je za agencijo že zmaga to, da urediš prevajalski del. Prevajalci, ki delajo hitro in kakovostno, neposredno nosijo več denarja agenciji. Ko pa pridemo do izkoriščanja ...

Tudi slovenske prevajalske agencije dobivajo zahteve za skorajšnjo implementacijo MT-ja, glede na "kakovost" se potem določi cena MT zadetkov, ki jih mora prevajalec urediti. Kot rečeno, za slovenščino so zaenkrat rezultati porazni.

Primer iz prakse, ko sem skorajda odletel na Irsko in prebutal projektnega vodjo, ki ni razumel, da v slovenščini ni mogoče narediti naslednje: "This city is very beautiful." "To [value] je zelo lepo." Hoteli so, da za njihov MT pošljemo prevod. Ni jim bilo jasno, da je beseda "mesto" lahko zapisana še v kakšni drugi obliki
smile-1.gif
.

Meni gredo, kot je omenil že Bosstone, zelo na organ prevajalska orodja, ki jih razvijejo prevajalske agencije same. V skoraj 99% primer gre za počasna, okorna in brezvezna orodja, ki jih je razvil kar hišni programer. Kozlanje, skratka.

NigelM in glede prevajalcev zelo prav. Velika večina je z muko sprejela prevajalska orodja, zato jih uporabljajo res samo za nabiranje segmentov, večje dodane vrednosti pa v tem ne vidijo. Škoda.

Edit: Problem spominov se začne precej višje kot pri slovenski agenciji. Velike tuje agencije morda svojemu naročniku res zaračunajo full rate (pa še v to dvomim), ampak podizvajalci pa zagotovo delajo po analizah. Si upam trditi, da so v Sloveniji večinoma samo podizvajalske prevajalske agencije.

Pa še glede analiz. Nekatere agencije (tuje) gredo zdaj tako daleč, da ne pošljejo samo analizo pred začetkom dela, v obračun vključijo tudi "interne fuzzy zadetke", ki jih nato odbijejo! To pa je podlo!

LP,
PIC
 
Nazadnje urejeno:

NigelM

Pingvin
19. avg 2007
17.286
4
36
ena vas naprej od Jest-a
Delo prevajalca (in še koga drugega) se pač s časom spreminja. 30 let nazaj (ne tako dolgo, kajne), so se originali pošiljali po pošti, prevodi pa pisali na pisalnem stroju - slovarji, kolikor jih je bilo, so bili izključno na papirju.
Potem je prišel faks, računalnik, elektronski slovarji, internet, CAT, MT...
Življenje je dinamično, poklic je dinamičen - stalno se je treba prilagajati. Nekateri poklici tudi umirajo, prevajalstvo zagotovo ne bo med njimi, se bo pa zelo preoblikovalo.
 

Anubis

Fizikalc
4. nov 2007
524
108
43
Med drugim je ta dinamičnost tudi čar prevajalskega poklica. Danes se mora prevajalec prilagoditi tako hitrim spremembam jezika kot tudi hitremu razvoju prevajalskih pripomočkov. Seveda pa situacija v Sloveniji še zdaleč ni rožnata. Del odgovornosti nosijo tudi prevajalski oddelki na obeh fakultetah, ki CAT orodjem - vsaj kolikor je meni znano - ne posvečajo pretirane pozornosti. Izkušenih prevajalcem, ki svoje delo opravljajo recimo 30+ let, nekako ne morem zameriti odklanjanja uporabe omenjenih orodij. Ne razumem pa nekaterih mlajših prevajalcev, ki so včasih enostavno preleni, da bi si prebrali navodila. Seveda moje zadnje sodbe ne moremo posploševati na vse.