Masintõlkesüsteemide peamised tüübid. Teadusliku distsipliinina põhinevad VKEd reeglitel

Masintõlkesüsteemide peamised tüübid.  Teadusliku distsipliinina põhinevad VKEd reeglitel

Masintõlge, õigemini arvutitõlge, on samuti kirjalik tõlge, sest selle tulemusena saame kirjaliku teksti. Seda ei teosta aga tõlkija, vaid spetsiaalne arvutiprogramm. Kaasaegsed arvutitõlkeprogrammid on üsna arenenud, kuid siiski ei suuda nad lahendada tõlkeprotsessi kõige keerulisemat ülesannet: kontekstiliselt vajaliku valiku valikut, mis igas tekstis on tingitud paljudest põhjustest. Praegu saab seda tüüpi tõlke tulemust kasutada tulevase teksti mustandversioonina, mida tõlkija toimetab, aga ka vahendina üldise ettekujutuse saamiseks teksti teemast ja sisust isegi äärmuslikul tõlgi puudumisel.

Veelgi keerulisem ülesanne on suulise teksti tõlkimine arvutiprogrammide abil, kuna suulise kõnetuvastuse probleem on alles selle lahendamise algfaasis. Siiani on ületamatuks takistuseks olnud kõnelõigu heli individuaalne värvimine - mis tahes keeles on selline kõne halvasti vormistatud.

Süntaktilise struktuuri eelredigeerimine võib olla:

· ülipika lause (üle 40 sõna) tükeldamine mitmeks lühemaks, samas lisades (vajadusel) linkivaid elemente;

· artiklite sisseviimine ingliskeelsesse teksti, kui see on vajalik või grammatiliselt põhjendatud;

· elementide kordamine fraaside koordinatiivses seoses lauses;

· liitude kasutuselevõtt lausetevahelise liitseose kasutamisel;

· sulgudes olevate struktuuride kõrvaldamine nimisõnafraasi või lause keskel;

· aeg-ajalt kasutatavate lühendite asendamine täisnimedega või erimärkide sisseviimine, mis ei võimalda nende tõlkimist;

· leksikaalsete ja loogiliste ellipside, mitteformaalsete konstruktsioonide ja metafooride kõrvaldamine;

· tekstis leiduvate pideva, sidekriipsuga ja vaba kirjaviisiga konstruktsioonide või liitsõnade ühtseks vormiks toomine.

Käsitsi redigeeritud teksti töödeldakse seejärel automaatselt MP-süsteemis.

25. Masintõlke üldskeem.

Kogu maailmas on masintõlkesüsteemide kasutamine kõigist nõrkustest hoolimata juba ammu olnud tõlkija professionaalse töö elemendiks, kes peab oskama arvutit kasutada mitte ainult kirjutusmasinana. Tõlkija tööjaama kontseptsioon, mis sisaldab kompleksi residendist sõnastike, tesauruseid, õigekirjakontrollisüsteeme, infole juurdepääsu süsteeme erinevate andmeedastusvõrkude kaudu, peaks saama erialafiloloogi jaoks igapäevaseks.

Sellise tõlkija tööjaama osana saab kasutada tekstide masintõlkesüsteemi (MT), pakkudes samal ajal kvaliteetset tõlget, mis on rangelt keskendunud konkreetsele ainevaldkonnale, kasutaja ülesannetele ja dokumentatsiooni tüübile. Lisaks võib selline süsteem aidata kasutajal, kes ei oska võõrkeelt väga kiiresti ja madalate kuludega saada ligikaudse (umbkaudse) tõlke (umbkaudse) tõlke tekstidest teda huvitavas valdkonnas, mis on piisav teabe mõistmiseks. teksti kaudu edastatud võõrkeel.

Üldnõuded praktilistele süsteemidele

masintõlge (MT)

· Süsteemi stabiilsus. MT süsteem peaks andma tulemuse, mida saab kasutada ka algmaterjali puuduste ja puuduliku sõnavaratoe korral.

· Süsteemi korratavus. Süsteemil peaks olema üsna lihtne tarkvara ja keelelised tööriistad, et selle rakendusala laiendada.

· Süsteemi kohanemisvõime. MP-süsteemil peaksid olema vahendid, mida saab kohandada vastavalt konkreetsete kasutajate vajadustele ja töödeldavate dokumentide omadustele.

· Ajastuse optimaalsus. Tekstide tõlkimise kiirus peab vastama kas ajaühikus saadava teabe mahule või kasutajate töönormidele.

· Kasutaja mugavus. Süsteemi teenindustööriistad peaksid tagama kasutaja mugavuse süsteemi kõigis võimalikes töörežiimides.

Konkreetse masintõlkesüsteemiga töötades tuleb meeles pidada, et tõlkimine toimub süsteemi juurutamise mitmel alluval tasemel.

Need tasemed hõlmavad tavaliselt järgmist:

· automaatse teksti eelredigeerimise tase;

· leksikaalse ja morfoloogilise analüüsi tase;

· kontekstuaalse analüüsi ja rühmaanalüüsi tase;

· funktsionaalsete segmentide analüüsi tase;

· ettepaneku analüüsi tase;

· väljundteksti sünteesi tase;

· automaatne järeltoimetamise tase.

KEELETEORIA TÕLKE AINE, OBJEKT JA ÜLESANDED

Praeguseks on lingvistiline tõlketeooria end iseseisvana kindlalt kinnitanud teadusdistsipliini. Siiski on mitmed põhimõttelised küsimused, mis määravad tõlketeooria staatuse, endiselt lahendamata. Üks neist küsimustest on tõlketeooria subjekti ja objekti küsimus.

Kirjanduses on väljendatud erinevaid, sageli vastakaid seisukohti selle kohta, mida tuleks pidada tõlketeooria subjektiks ja objektiks. Nii väidavad I.I.Revzin ja V.Yu Rozentsveig, et tõlkeobjektiks on tõlkeprotsess ise, mille käigus toimub üleminek ühelt märgisüsteemilt teisele ja mida saab kirjeldada semiootiliste terminitega 86 . Need autorid eristavad põhimõtteliselt tõlkimisprotsessi ja tõlkimise tulemust. Need lähtuvad sellest, et traditsiooniliselt oli tõlketeadus üles ehitatud normiteadusena, mille peamisteks eesmärkideks oli tõlke tulemuse väljaselgitamine ja tõlkekvaliteedi hindamise kriteeriumide väljatöötamine. Normatiivne tõlketeooria on üles ehitatud empiiriliselt, originaalide ja tõlgete võrdleva analüüsi põhjal. Teoreetilised sätted laenati leksikoloogiast, grammatikast, stilistikast ja kirjanduskriitikast. Sellise lähenemisega ei saa I.I.Revzini ja V.Yu.Rozentsvey sõnul tõlkeprotsessist teoreetilist arusaamist saavutada. Teadus, mis püüab kirjeldada

"Revzin I. I., Rozentsveig V. Yu. M.: Kõrgem. kool, 1964. Lk.21.


68 V.V. Sdobnikov, O.V. PetrovaTÕLKETEORIA

Tõlge kui protsess ei peaks olema normatiivne, vaid teoreetiline. See tähendab, et see ei peaks kirjeldama seda, mis peaks olema, vaid seda, mis on omane nähtuse olemusele 87 .

A.D. Schweitzer ei nõustunud selle vaatenurgaga ja ta usub, et nii terav vastandamine teoreetilise ja normatiivse lähenemise vahel on vaevalt õigustatud. Tõlkeprotsessi tulemuste arvestamisest kõrvalejätmine kitsendab liigselt tõlketeooria teemat ega aita vaevalt paljastada selle olemust. A.D.Schweitzeri sõnul on tõlkimine sihikindel tegevus, mis vastab teatud nõuetele ja standarditele ning on keskendunud saavutamisele. kindel tulemus. Need reeglid peegeldavad väärtusorientatsioon tõlkija, mida arvesse võtmata on võimatu tõlkeotsuste loogikat rahuldavalt selgitada 88 . Seega hõlmab A.D.Schweitzer tõlketeooria ainesse nii tõlkeprotsessi enda kui ka tõlkeprotsessi tulemuse.



Näib, et tõlkeuurijad, püüdes tõlketeooria subjekti määratleda, ei võtnud täielikult arvesse tõsiasja, et tõlkimine on keeruline, kompleksne nähtus, mida mõjutavad väga mitmekesised tegurid. Sellest asjaolust arusaamine saavutatakse suuremal määral VN Komissarovi töödes, kes märgib täiesti õigesti, et vaevalt on legitiimne tõlkeprotsessi vastandada selle tulemusele. Just tõlketulemus esindab seda vahetult jälgitavat reaalsust, mille analüüsi põhjal saab kaudselt otsustada, kuidas tõlkeprotsess kulges, mis on otseseks vaatluseks kättesaamatu.

"Revzin I. I., Rosenzweig V. Yu. Üld- ja masintõlke alused. M.: Kõrgem. kool, 1964. Lk.21.

"Schweitzer A.D. Tõlketeooria: staatus, probleemid, aspektid. M: Nauka, 1988. Lk.7.


II OSA. Tõlketeooria kui teadusdistsipliin 69

Lingvistiline tõlketeooria käsitleb nii lähtekeeles (SL) ja sihtkeeles (TL) tekste kui ka algteksti sihttekstiks teisendamise protsessi. Kuid see lähenemisviis ei ole täiesti piisav. Tõlketegevus on oma olemuselt vahendava iseloomuga. Tõlge pakub võimalust keeltevaheliseks suhtluseks. Ja see tähendab, et täisväärtusliku tõlke loomiseks peab tõlkija arvestama nii algsõnumi autori kui ka selle sõnumi saajate iseärasusi, teadmisi, kogemusi, aga ka tõlke tajumise iseärasusi. inimesed, kellele tõlge on mõeldud jne. kõik muud keeltevahelise suhtluse aspektid, mis mõjutavad tõlkeprotsessi kulgu ja tulemust. See tähendab, et tõlketeooria aine on keeruline ega piirdu tõlkeprotsessi ja selle tulemusega. Lingvistiline tõlketeooria käsitleb tõlkimist keeltevahelise suhtluse laias raamistikus ning uurib kõiki selle aspekte ja määravaid tegureid, nii keelelisi kui ka keeleväliseid, kuid otseselt või kaudselt mõjutavaid keeleüksuste valikut tõlkeprotsessis 89 .

Sellest probleemiesitlusest on näha, et tõlkeuurijate seas puudub ühtsus kasutatava terminoloogia osas. Esiteks juhitakse tähelepanu sellele, et teadusliku uurimistöö subjekti ja teadusliku uurimise objekti mõisted ei ole selgelt eristatavad. Muide, ka vene keele sõnaraamatute pakutud definitsioonide analüüs ei too selles küsimuses suuremat selgust. Näiteks, teema teaduslikku uurimistööd defineeritakse kui "teemat, mis toimib mõtte, kõne sisuna, millele kognitiivne või loominguline

89 Komissarov V.N. Tõlketeooria (keelelised aspektid). M.: Kõrgem. kool., 1990. S.40-41.


70 V.V. Sdobnikov, O.V. PetrovaTÕLKETEORIA

Tegevused” 99 . Objekt see on määratletud kui “see, mis vastandub subjektile, millele on suunatud tema sisuline praktiline ja tunnetuslik tegevus” 100 . Nagu näeme, on mõlemad mõisted defineeritud kui midagi, mis on suunatud praktilisele, kognitiivsele ja loominguline tegevus uurimisobjekt. Samas oleks otstarbekas käsitleda uurimisobjektina midagi, mis tõesti kuulub maailma materiaalsete nähtuste ringi, ning uurimisobjektina - teatud probleemi, mille lahendamiseks Teaduslikud uuringud tegelikult juhitud. Selle põhjal nog lingvistilise tõlketeooria objektina mõistame keeltevahelise suhtluse raames toimuvat vahendavat tõlketegevust, mis esitatakse nii otseselt (protsess) kui ka kaudselt ehk kajastub tõlkeprotsessi tulemustes. Tõlketeooria õppeaine on tõlkeprotsessi seaduspärasuste, tõlkeprotsessi kulgu mõjutavate ja tõlketulemust määravate tegurite uurimine.

V. N. Komissarov 101 sõnastab järgmise ülesandeid lingvistiline tõlketeooria:

1) paljastada ja kirjeldada üldist keelelist OS-i
uued tõlked, s.o. näitavad, millised keele omadused
kovy süsteemid ja toimimismustrid
Keeled on tõlkeprotsessi keskmes
sa, tehke see protsess võimalikuks ja määrake
selle iseloom ja piirid;

2) määratleb tõlkimise kui keeleteaduse objekti
kes uurivad, näitavad selle erinevust teistest
keelevahenduse liigid;

3) töötab välja pe liikide klassifitseerimise alused
tõlketegevus;

99 Vene keele sõnaraamat 4 köites. III köide. M.: Rus yaz., 1983. S.366. "Vene keele sõnaraamat 4 köites. 11. köide. M: Venemaa. yaz., 1983. S.579. 101 K o m i s s a r o v V. N. Tõlketeooria (keelelised aspektid). M.: Kõrgem kool., 1990. S.35-36.


II OSA. Tõlketeooria kui teadusdistsipliin 71

4) paljastab tõlke võrdväärsuse olemuse kui originaali ja tõlke tekstide kommunikatiivse samaväärsuse aluse;

5) arendada üldised põhimõtted ja funktsioonid
tõlke era- ja eriteooriate konstrueerimine
jah erinevate keelekombinatsioonide jaoks;

6) töötab välja teadusliku kirjeldamise üldpõhimõtted
tõlkeprotsessist kui tõlkija tegevusest
algteksti teisendamiseks teksti kordustrükkimiseks
vesi;

7) avaldada mõju tõlkeprotsessile
pragmaatilised ja sotsiolingvistilised tegurid;

8) defineerida mõiste "tõlkekiirus" ja aeg
tõlke kvaliteedi hindamise põhimõtted.

Nende ülesannete kohaselt ehitatakse meie kursus. üldine teooria tõlge. Kuid kõigepealt peaksime käsitlema tõlketeaduse esialgse koostise ja tõlke lingvistilise teooria küsimust.

Tõlketeadus kui teadusdistsipliin on tõlketeooriast laiem ja hõlmab mitmeid teadusharusid või sektsioone. Tõlkeõppe alla kuuluvad tõlketeooria, tõlketegevuse ajalugu, tõlkekriitika, tõlkeleksikograafia, tõlkedidaktika (tõlke õpetamise meetodid). Nagu näeme, on lingvistiline tõlketeooria vaid üks tõlketeaduse osadest, kuid samal ajal on see keeruka iseloomuga ja sisaldab järgmisi jaotisi:

Üldine tõlketeooria- lingvistilise tõlketeooria osa, mis uurib tõlke kõige üldisemaid keelelisi mustreid, sõltumata tõlkeprotsessis osalevast konkreetsest keelepaarist, selle protsessi rakendamise meetodist ja konkreetse tõlkeakti individuaalsetest omadustest.

Spetsiaalne tõlketeooria- lingvistilise tõlketeooria osa, mis uurib erinevat tüüpi ja erineva mõjuga tekstide tõlkimise protsessi iseärasusi


72 V.V. Sdobnikov, O.V. PetrovaTÕLKETEORIA

Nie selle kõnevormide protsessi ja selle rakendamise tingimuste kohta. Spetsiaalseid tõlketeooriaid on mitmeid: ilukirjanduse tõlke teooria, teadusliku ja tehnilise tõlke teooria, suulise tõlke teooria, masintõlke teooria jne.

Privaatne tõlketeooria- lingvistilise tõlketeooria osa, mis uurib ühest antud keelest teise antud keelde tõlkimise lingvistilisi aspekte. Eraldi tõlketeooriaid võib olla palju: inglise keelest vene keelde tõlkimise teooria, tõlke teooria keelest saksa keel jaapani keelde, tõlketeooria prantsuse keel suahiili keeles jne.

TÕLKETEORIA SUHE TEISTE KEELEDISTSIPLEENIDEGA

Lingvistiline tõlketeooria on tihedalt seotud selliste keeleteaduslike distsipliinidega nagu kontrastiivlingvistika, sotsiolingvistika, psühholingvistika, tekstilingvistika.

Tõlketeooria ja kontrastne lingvistika

Kontrastiivne lingvistika on üldkeeleteaduse uurimissuund, mille eesmärk on kahe, harvemini mitme keele võrdlev uurimine, et teha kindlaks nende sarnasused ja erinevused keelestruktuuri kõigil tasanditel 102 . Nagu märgib A.D. Schweitzer, on kontrastiivse lingvistika ja tõlketeooria vaheliste suhete küsimus endiselt vastuoluline. Varem polnud sageli selget vahet

102 Lingvistiline entsüklopeediline sõnaraamat. M: Öökullid. entsüklopeedia, 1990. S.239.


. Tõlketeooria kui teadusdistsipliin 73

Nende distsipliinide esitamine. JI Retsker kirjutas juba 1950. aastal, et „tõlge... on mõeldamatu ilma kindla keelelise aluseta. Selliseks aluseks peaks olema keelenähtuste võrdlev uurimine ning teatud vastavuste tuvastamine algkeele ja sihtkeele vahel. Need sõnavara, fraseoloogia, süntaksi ja stiili valdkonna vastavused peaksid moodustama tõlketeooria keelelise aluse” 103 . Seega identifitseeriti keelte ja keeleliste nähtuste võrdlus tegelikult tõlke keeleteooriaga.

Mõnikord samastatakse tõlketeooriat mitte kontrastiivse lingvistikaga üldiselt, vaid selle ühe osaga, nimelt võrdleva stilistikaga. Sellele traditsioonile pani aluse J.-P. Vine'i ja J. Darbelneti töö "Prantsuse ja inglise keele võrdlev stilistika" (1958), milles autorid panid tegelikult võrdusmärgi võrdleva stilistika ja tõlketeooria mõistete vahele. I.I.Revzin ja V.Yu.Rozentsveig pöörasid sellele keelelise tõlkeuuringute tunnusele hiljem tähelepanu: „Tunnistades selle suuna teoste väärtust tõlketeooria seisukohalt, ... samas ei saa märkamata jätta ka segadust. neis stilistika ja tõlketeooria mõistetest” 104 . Ja ometi väitsid mõned uurijad isegi kümmekond aastat hiljem, et „lingvistiline tõlketeooria pole midagi muud kui „võrdlev tekstilingvistika”, st semantiliselt identsete mitmekeelsete tekstide võrdlev uurimine” 105 .

Juba meetodi kirjeldus viitab kontrastiivse lingvistika ja tõlketeooria tihedale seosele.

103 Shveytser A.D. M:
Nauka, 1988. S.Yu.

104 R e v z i n I. I., R o z ents v e g V. Yu. Üldise ja masina alused
tõlge. M.\
Kõrgem kool, 1964. Lk.32.

105 B a r k h u d a r o v L. S. Keel ja tõlge (üldised ja eraprobleemid
tõlketeooria). M.:
Rahvusvaheline suhted, 1975. Lk.28.


74 V.V. Sdobnikov, O.V. PetrovaTÕLKETEORIA

Keelte võrdlev uurimine. Võrdleva kirjeldamise põhimõtted on sõnastanud A. V. Fedorov järgmiselt: „Konkreetse keele jaoks on omane mitte väljendatud tähendus, mis on talle ühine teise keelega, vaid formaalsed kategooriad, milles seda väljendatakse, struktuurilised tunnused. Formaalsest kategooriast, nagu objektiivsest etteantust (näiteks teatud tüüpi sõnadest, sõnamoodustusmudelitest, sõnajärjest, kaheosalistest lausetest teatud tüüpi subjektiga jne) läheb uurija määrata selle tähendused ühes keeles ja seejärel neid tähendusi väljendavatele teise keele formaalsetele vahenditele (kokkulangevad või muud tüüpi sõnad, sama või erineva sõnajärjega, kahe- või üheosalised laused jne). Loomulikult on sellise analüüsiviisi juures tõlgete materjal väga tänuväärne...” 106 . Sellest uurimismeetodi määratlusest järeldub, et keeleteadlased kasutasid keelte võrdleva uurimise huvides meetodit, millega võrreldakse konkreetseid kõneteoseid. erinevad keeled, mis on tegelikult originaalid ja tõlked. See on täielikult kooskõlas E. Koseriu väitega, et kontrastiivne keeleteadus tasemel keelenorm, mis uurib funktsionaalsete üksuste tegelikku kasutust, katab täpselt selle valdkonna, kus tõlkeprotsess toimub, ja langeb sellega kokku. Tõlketeooriale on E. Koseriu sõnul kõige lähedasem kontrastse keeleteaduse valdkond, mis on keskendunud keelele tegevuses. Sarnaselt tõlketeooriaga tegeleb see valdkond keelestruktuuri kõnerakendustega, kõnes funktsioneeriva keele valdkonnaga ning nagu konkreetne tõlketeooria, on see ühesuunaline (näiteks leidmise probleem).

106 op. autor: RevzinI. I., Rosenzweig, V. YU. Üld- ja masintõlke alused. M.: Kõrgem. kool., 1964. Lk.33


OSA //. teooria tõlkimine kui teadusdistsipliin 75

Vastavus gerundile on asjakohane ainult vene keelest tõlke ja kontrastiivlingvistika puhul, mille algkeel on vene) 107 .

Kontrastiivse lingvistika andmed on lingvistilise tõlketeooria jaoks kahtlemata kasulikud. Uurides keele A ja keele B funktsionaalsete üksuste vahelisi suhteid, loob kontrastiivne lingvistika vajaliku aluse tõlketeooria ülesehitamiseks. Tõepoolest, paljud tõlketeisendused, mis moodustavad tõlkimise "tehnoloogia", taanduvad lõpuks funktsionaalsetele ja struktuurilistele erinevustele keelte vahel, mis "põrkavad" tõlkimise käigus üksteisega kokku. Kontrastiivne lingvistika annab paljudel juhtudel vastuse küsimusele, miks tõlkes üht või teist operatsiooni tehakse 107 . Tõlketeisenduste kasutamise üheks põhjuseks on nn "mitteekvivalentsete vormide" olemasolu ühes interakteeruvas keeles, mille tuvastamist hõlbustavad kontrastiivse keeleteaduse andmed.

Võib öelda, et tõlketeooria vajab lähteandmete allikana kontrastiivset keeleteadust. Need andmed, mis valgustavad lahknevusi keelte struktuuritüüpide, süsteemide ja normide vahel, on õige tõlkeanalüüsi lähtepunktiks 108 .

Hoolimata kontrastiivse lingvistika ja tõlketeooria tihedast seosest ei saa neid omavahel samastada. Kontrastiivse keeleteaduse ülesanne on keelte võrdlemine, nende sarnasuste ja erinevuste väljaselgitamine. Tõlketeooria omakorda uurib tõlkimist kui spetsiifilist keeltevahelise suhtluse tüüpi, keelelist vahendamist. Selle eesmärk on paljastada olemus, tõlge, selle olemus

107 Shveytser A.D. Tõlketeooria: staatus, probleemid, aspektid M:
Nauka, 1988. SP.

108 Ibid. C.12.


76 V.V. Sdobnikov, O.V. PetrovaTÕLKETEORIA

Mehhanismid, teostusmeetodid, seda mõjutavad keelelised ja keelevälised tegurid. Tõlketeooria võtab lisaks lähte- ja sihttekstidele arvesse sotsiaalkultuurilisi ja psühholoogilisi erinevusi mitmekeelsete suhtlejate vahel, aga ka mitmeid teisi tõlkeprotsessi sotsiaalkultuurilisi ja psühholingvistilisi determinante. Samas arvestatakse, et tõlkimine ei ole lihtne keelekoodi muutmine, vaid ka teksti kohandamine selle tajumiseks läbi teise kultuuri prisma.

Masintõlke lähenemisviisid

Masintõlkesüsteemid võivad kasutada keelereeglitel põhinevat tõlkemeetodit. Kõige sobivamad lähtekeele sõnad asendatakse lihtsalt sihtkeele sõnadega.

Sageli väidetakse, et masintõlke probleemi edukaks lahendamiseks on vaja lahendada loomulikus keeles teksti mõistmise probleem.

Reeglipõhises tõlkemeetodis kasutatakse reeglina sümboolset esitust (vahendajat), mille alusel luuakse sihtkeelne tekst. Ja kui võtta arvesse vahendaja olemust, siis saame rääkida keeltevahelisest masintõlkest või ülekandemasintõlkest. Need meetodid nõuavad väga suuri sõnastikke koos morfoloogilise, süntaktilise ja semantilise teabega ning suure hulga reeglitega.

Kui masintõlkesüsteemil on piisavalt andmeid, on võimalik saada hea kvaliteediga tõlge. Peamine raskus seisneb nende andmete moodustamises. Näiteks statistiliste tõlkemeetodite jaoks vajalikud suured tekstikorpused pole grammatikapõhise tõlkimise jaoks piisavad. Veelgi enam, viimase jaoks on vaja grammatika lisaülesannet.

Seotud keelte (vene, ukraina) tõlkimiseks võib piisata sõnade lihtsast asendamisest.

Kaasaegsed süsteemid masintõlge on jagatud kolme suurde rühma:

reeglipõhine

näidete põhjal

SMP reeglite alusel

Reeglipõhised masintõlkesüsteemid on üldmõiste, mis viitab masintõlkesüsteemidele, mis põhinevad lähte- ja sihtkeelte lingvistilisel teabel.

Need koosnevad kakskeelsetest sõnaraamatutest ja grammatikatest, mis hõlmavad iga keele peamisi semantilisi, morfoloogilisi ja süntaktilisi mustreid. Sellist lähenemist masintõlkele nimetatakse ka klassikaliseks.

Nende andmete põhjal teisendatakse lähtetekst järjestikku, lausete kaupa tõlketekstiks. Sageli vastandatakse selliseid süsteeme masintõlkesüsteemidele, mis põhinevad näidetel.

Selliste süsteemide tööpõhimõte on seos sisend- ja väljundlausete struktuuri vahel. Tõlge pole eriti kvaliteetne. Kuid see töötab lihtsate näidete puhul.

Tõlge inglise keelest saksa keelde näeb välja selline:

Tüdruk sööb õuna. Ein Madchen isst einen Apfel.

Need süsteemid jagunevad kolme rühma:

sõna-sõnalt tõlkesüsteemid;

· ülekandesüsteemid;

keeltevaheline;

Sõna tõlge

Selliseid süsteeme kasutatakse praegu tõlke halva kvaliteedi tõttu üliharva. Lähteteksti sõnad teisendatakse (nagu on) tõlgitud teksti sõnadeks. Sageli toimub selline transformatsioon ilma lemmatiseerimise ja morfoloogilise analüüsita. See on lihtsaim masintõlkemeetod. Seda kasutatakse tõlkimiseks pikad nimekirjad sõnad (näiteks kataloogid). Seda saab kasutada ka TM-süsteemide jaoks interlineaarseks koostamiseks.

Ülekandesüsteemid

Nagu ülekandesüsteemid, ja keeltevahelisel, on sama üldine idee. Tõlkimiseks on vaja vahendajat, kes kannab tõlgitava väljendi tähendust. Keeltevahelistes süsteemides ei sõltu vahendaja keelepaarist, ülekandesüsteemides aga.

Ülekandesüsteemid töötavad väga lihtsal põhimõttel: sisendtekstile rakendatakse reegleid, mis vastavad lähte- ja sihtkeele struktuuridele. Töö algetapp sisaldab teksti morfoloogilist, süntaktilist (ja mõnikord ka semantilist) analüüsi sisemise esituse loomiseks. Tõlge genereeritakse sellest esitusest kakskeelsete sõnaraamatute ja grammatikareeglite abil. Mõnikord ehitatakse lähtetekstist saadud esmase esituse põhjal "abstraktsem" sisemine esitus. Seda tehakse selleks, et rõhutada tõlkimiseks olulisi kohti ja jätta kõrvale teksti ebaolulised osad. Tõlketeksti konstrueerimisel toimub sisemiste esituste tasandite teisenemine vastupidises järjekorras.

Seda strateegiat kasutades saavutatakse üsna kõrge tõlgete kvaliteet, mille täpsus on umbes 90% (kuigi see sõltub suuresti keelepaarist). Mis tahes ülekandesüsteemi töö koosneb vähemalt viiest osast:

morfoloogiline analüüs;

leksikaalne ülekanne;

struktuurne ülekanne;

morfoloogiline põlvkond.

Morfoloogiline analüüs. Lähteteksti sõnad liigitatakse kõneosade kaupa. Selguvad nende morfoloogilised tunnused. Sõnalemmad on määratletud.

Leksikaalsed liigitused. Igas tekstis võib mõnel sõnal olla rohkem kui üks tähendus, mis põhjustab analüüsis ebaselgust. Leksikaalne kategoriseerimine paljastab sõna konteksti. Võimalikud on mitmesugused märkused ja täpsustused.

Leksikaalne ülekanne. Kakskeelse sõnaraamatu alusel tõlgitakse sõnade lemmad. Tegevus on väga sarnane sõna-sõnalt tõlkimisele.

struktuurne ülekanne. Sõnad lauses ühtivad.

Morfoloogiline põlvkond. Struktuuriülekande väljundandmete põhjal luuakse tõlketeksti sõnavormid.

Transtsendentsete masintõlkesüsteemide üheks põhijooneks on etapp, mille käigus lähtekeeles teksti vahepealne esitus "kanda üle" sihtkeeles olevale teksti vahepealsele esitusviisile. See võib toimida ühel kahest keeleanalüüsi tasemest või mõlemal.

1. Pinnapealne (süntaktiline) ülekanne. Seda taset iseloomustab "süntaktiliste struktuuride" ülekandmine lähte- ja sihtkeele vahel. Sobib samasse perekonda või sama tüüpi keelte jaoks, näiteks romaani keeled, itaalia hispaania, katalaani, prantsuse jne.

2. Sügav (semantiline) ülekanne. Taset iseloomustab semantiline esitus. Oleneb originaalkeelest. See esitus võib koosneda mitmest väärtust esindavast struktuurist. Tõlge nõuab tavaliselt ka struktuuriülekannet. Seda taset kasutatakse tõlkimiseks kaugemate keelte vahel.

Keeltevaheline masintõlge

Keeltevaheline masintõlge on üks klassikalisi masintõlke lähenemisviise. originaal tekst muudetakse abstraktseks esituseks, mis on keelest sõltumatu (erinevalt ülekandetõlkest). Tõlgitud tekst genereeritakse selle esituse põhjal. Selle lähenemisviisi peamine eelis on uue keele lisamine süsteemi. Matemaatiliselt saab tõestada, et selle lähenemisviisi raames vähendab iga uue keeletõlgi loomine sellise süsteemi jaoks selle maksumust, võrreldes näiteks ülekande tõlkesüsteemiga. Pealegi võib see lähenemine

· rakendada "teksti ümberjutustust", lähteteksti ümbersõnastamist ühe keele piires;

· väga erinevate keelte, näiteks vene ja araabia keele tõlkimise suhteliselt lihtne teostus.

Siiski pole selle lähenemisviisi rakendusi, mis töötaksid õigesti vähemalt kahe keele puhul. Paljud eksperdid kahtlevad sellise rakendamise võimalikkuses. Suurim raskus selliste süsteemide loomisel seisneb keeleülese esituse kujunduses. See peaks olema nii abstraktne kui ka konkreetsetest keeltest sõltumatu, kuid samal ajal peaks see peegeldama mis tahes olemasoleva keele tunnuseid. Teisalt raamistikus tehisintellekt, teksti tähenduse esiletõstmise ülesanne Sel hetkel ikka veel lahendamata.

Keeltevahelise lähenemisviisi pakkusid esmakordselt välja 17. sajandil Descartes ja Leibniz, kes pakkusid välja universaalsed sõnastikud, mis kasutavad numbrilisi koode. Teised, nagu Cave Beck, Athanasius Kircher ja Johann Joachim Becher, töötasid välja ühemõttelise universaalse keele, mis põhineb loogika ja ikonograafia põhimõtetel.

1668. aastal rääkis John Wilkins oma traktaadis An Essay on Genuine Symbolism and Philosophical Language oma interlinguast.

18. ja 19. sajandil töötati välja palju universaalseid keeli, sealhulgas esperanto. On teada, et idee universaalsest masintõlkekeelest ei ilmnenud kuidagi varajased staadiumid selle tehnoloogia arendamine. Selle asemel võeti arvesse ainult keelepaare. Kuid 1950. ja 60. aastatel alustasid selles valdkonnas tööd Cambridge'i teadlased eesotsas Margaret Mastermaniga, Leningradis Nikolai Andrejeviga ja Milanos Silvio Ceccatoga.

1970. ja 1980. aastatel tehti selles valdkonnas mõningaid edusamme ja ehitati mitmeid masintõlkesüsteeme.

Selle tõlkemeetodi puhul võib keeltevahelist esitust käsitleda kui viisi, kuidas kirjeldada teksti analüüsi originaalkeeles. Samas säilivad esituses teksti morfoloogilised, süntaktilised omadused. Eeldatakse, et nii on võimalik tõlketeksti loomisel "tähendust" edasi anda.

Sel juhul kasutatakse mõnikord kahte keeltevahelist esitust. Üks neist peegeldab rohkem lähtekeele tunnuseid. Teine on sihtkeel. Sel juhul toimub tõlkimine kahes etapis.

Mõnel juhul kasutatakse kahte või enamat sama taseme esitust (mõlema keelega võrdselt lähedasi), kuid sisult erinevad. See on vajalik konkreetsete tekstide tõlkimise kvaliteedi parandamiseks.

See lähenemine pole keeleteaduses uus. See põhineb keelte läheduse ideel. Tõlkekvaliteedi parandamiseks kasutatakse loomulikku keelt sillana kahe teise keele vahel. Näiteks ukraina keelest inglise keelde tõlkides kasutatakse mõnikord vene keelt.

Keeltevahelise masintõlkesüsteemi kasutamiseks vajate:

Sõnastikud tekstide analüüsimiseks ja genereerimiseks;

keelte grammatika kirjeldus;

mõistete teadmistebaas (keeltevahelise esituse loomiseks);

· Keelte ja esituste mõistete projektsioonireeglid.

Kõige keerulisem hetk selle tüübi loomisel on suutmatus luua baasi laiadele teadmiste valdkondadele. Ja need andmebaasid, mis on loodud väga konkreetse teema jaoks, on suure arvutusliku keerukusega.

58. Retsker Ya.I. Regulaarsetel kirjavahetustel keelde tõlkimisel emakeel// Õppetõlke teooria ja meetodid. - M., 1950. S.

59. Retsker Ya.I. Tõlketeooria ja tõlkepraktika. - M., 1974

60. Semenova M.Yu. Tekstitõlke alused. - M., 2009

61. Strelkovskiy G.M. Sõjaväe tõlke teooria ja praktika. - M., 1979

62. Ter-Minasova S. G. Keel ja kultuuridevaheline suhtlus. – M.. 2000

63. Tjulenev S.V. Tõlketeooria. - M.: Gardariki, 2004

64. Fedorov A.V. Tõlke üldteooria alused. - SPB., 2002

65. Florin S., Vlakhov S. Tõlkes tõlkimatu. - M., 1980

66. Khaleeva I.I. Võõrkõne mõistmise õpetamise teooria alused (tõlkijate koolitus). - M., 1989

67. Chomsky N. Keel ja mõtlemine. - M., 1972

68. Tšernov G.V. Sünkroontõlke teooria ja praktika. - M., 1978

69. Tšužakin A., Palažtšenko P. Tõlkemaailm ehk vastastikuse mõistmise igavene otsing. M., 1997-2004

70. Tšukovski K.I. Kõrge kunst. - M., 1968.

71. Schweitzer A.D. Tõlketeooria (staatus, probleemid, aspektid). M., 1998

72. Schweitzer A. D. Tõlge ja keeleteadus. - M., 1973.

73. Shiryaev A. F. Tõlge kui kompleksse teadusliku uurimistöö objekt // Tõlke keelelised probleemid. - M., 1981.

74. Shiryaev A.F. Sünkroontõlke käsiraamat. - M., 1982.

75. Shiryaev A.F. Tõlketeooria. Olek. Probleemid, aspektid. M., 1988

76. Shadrin V.I. teooria varsti kaasaegses tõlketeaduses // XXVІІІ ülikoolidevahelise õppejõudude ja magistrantide teadusliku ja metoodilise konverentsi materjalid. Probleem. 5. Tõlke teooria ja praktika aktuaalsed probleemid. 15.-22.03.1999 Peterburi 1999.a.

Alys shetelde shyққan adebietter:

1. Bassnett-McGuire S. Tõlkeuuringud. - Methuen, L. ja N.-Y., 1980.

2. Brislin R.W. (toim). tõlge. Rakendus ja uurimine. - N.-Y., 1976.

3. Brower R. (toim). Tõlkimise kohta. - Cambridge (Massachusetts), 1959.

5. Catford J. Keeleline tõlketeooria. - L., 1965.

6. Coseriu E. Teoria del lenguaje in lingliistica general. Cinco estudias. - Madrid, 1973.

7. Dolet E. De la manie're de bien traduire d'une langue en l'autre. – P., 1540

8. Delisle J. L'analyse du discourse comme methode de traduction. – Ottawa, 1984

9. Dryden J. Ovidiuse epistolid // W.P. Ker (toim.) Essays of John Dryden. - Oxford, 1926.

10. Firth J.R. Keeleline analüüs ja tõlkimine // Roman Jakobsonile. - Haag, 1956.

11. Goethe J.W. Drei Stucke vom Übersetzen // H.J. Storig (Hrsg.). Das Problem des Obersetzen. - Stuttgart, 1963.

12. Gutt E.-A. Tõlge ja asjakohasus. Tunnetus ja kontekst. - Cambridge (Massachusetts), 1991.

13. Guttinger F. Zielsprache. Teooria ja tehnika des Ubersetzens. - Zürich, 1963.

14. Halliday M.A.K. Võrdlus ja tõlkimine // M.A.K. Halliday, A. McIntosh, P. Strevens. Keeleteadused ja keeleõpetus. - L., 1964.

15. Halliday M.A.K. Keelte võrdlus // A.Mclntosh, M.A.K.

16. Halliday. Keele mustrid. L., 1966.

17. Holz-Mänttäri J. Transtatorisches Handeln. teooria ja meetod. - Helsingi, 1964.

18. Humboldt, W. Einleitung zu "Agamemnon" // H.J. Störig (Hrsg.). Das Problem des Obersetzens. - Stuttgart, 1963.

19. Jäger G. Translation und Translationslinguistik. - Halle (Saale), 1975. a.

20. Jäger G., Müller D. Kommunikative und maximale Äquivalenz von Texten

// Äquivalenz bei der Translation. - Leipzig, 1982.

21. Jäger G. Die sprachlichen Bedeutungen - das zentrale Problem bei der Translation und ihrer wissenschaftlichen Beschreibung // Bedeuting und Translation. Leipzig, 1986.

22. Jakobson R. Tõlke keelelistest aspektidest // R. Brower (toim.). Tõlkimise kohta. - Cambridge (Massachusetts), 1959.

23. Kade O. Zufall und Gezetzmassigkeit in der Übersetzung. - Leipzig, 1968.

24. Kade O. Die Sprachmittling als gesellschaftliche Erscheinung und Gegenstand wissenschaftlicher Untersuchung. - Leipzig, 1980.

25. Kelletat A.F. Die Ruckschritte der Obersetzungstheorie. - Vaasa, 1986.

26. Koller W. Einfürung in die Übersetzungswissenschaft // 6. Auflage. Wiebelsheim, 2001

27. Krings H.P. Oli den Kopfen von Übersetzern vorgeht. - Tübingen, 1986.

28. Lederer, M. La traduction simultanee. Kogemus ja teooria. - Pariis, 1981.

29. Luther M. Sendbrief vom Dolmetschen // H.J. Störig (Hrsg.). Das Problem des Obersetzens. - Stuttgart, 1963.

30. Ljudskanov A. Prevezhdat chovekt ja masin. - Sofia, 1957.

31. Mounin C. Les Problems Theoriques de la Traduction. - Pariis, 1963.

32. Mounin G. Teoria et storia, della traduzione. - Torino, 1965.

33 Mounin G. Linguistique et traduction. - Brüssel, 1976.

34. Neubert A. Pragmatische Aspekte der Übersetzung // A. Neubert (Hrsg.).

Grundfragen der Übersetzungswissenschaft. - Leipzig, 1968.

35 Neubert A. Tekst ja tõlge. - Leipzig, 1985.

37. Nida E. Tõlkepõhimõtted piiblitõlke näitel. // R.Broper (toim.) Tõlkimisest. - Cambridge (Massachusetts), 1959.

38. Nida E. Tõlketeaduse poole. - Leiden, 1964

39. Nida E., Taber C.R. Tõlke teooria ja praktika. - Leiden, 1964.

40. Nida E, Reyburn W.D. Tähendus Kultuuride lõikes. - N-Y, 1976.

41 Quine W. Tähendus ja tõlge. // R. Brower (toim.) Tõlkimisest. - Cambridge (Massachusetts), 1959.

42. Reiss K. Möglichkeiten und Grenzen der Übersetzungskritik. - München, 1971.

43. Reiss K.. Vermeer H.J. Grundlegung einer allgermeinen Tõlketeooria. Tubingen, 1984.

44 Rose M.D. (toim.). Tõlkespekter. Esseed teooriast ja praktikast. - Albany, 1981.

45 Ross C.D. Tõlge ja sarnasus // M.D. Rose (toim.) Tõlkespekter. - Albany, 1981.

46. ​​Savory T. Tõlkekunst. - L., 1952.

47. Schleiermacher F. Methoden des Übersetzens // H.J.Störig. Das Problem des Obersetzens. - Stuttgart, 1963.

48. Seleskovich D., Lederer M. Interpreter pour traduire. - Pariis, 1987.

49. Snell-Hornby M. Tõlkeuuringud. Integreeritud lähenemine. - Amsterdam, Philadelphia, 1988.

50. Sperber D., Wilson D. Asjakohasus: Suhtlemine ja tunnetus. - Oxford, 1986.

51. Tirkkonen-Condit S. Tekstilised kriteeriumid tõlkekvaliteedi hindamisel, - Jyvaskyla, 1982.

52. Toury G. Tõlketeooriat otsides. - TelAviv, 1980.

53. Tytler A.F. Essee tõlkimise põhimõtetest. - L., 1791.

54. Vehmas-Lehto I. Kvaasikorrektsus. - Helsingi, 1989.

55. Vinay J.-P., Darbelnet J. Stilistique comparée du français et de 1 "anglais. - Pariis, 1968.

56. Voegelin C.F. Mitmeastmeline tõlge // IJAL. - Vol.20, nr.4, 1954.

57. Wilss W. Übersetzungswissenschaft: Probleme und Methoden. - Stuttgart, 1978.

58. Wilss W. Kognition und Übersetzen: Zu Theorie und Praxis der menschlichen und der maschinellen Übersetzung. - Tüsbingen, 1988.

59. Shuttleworth M., Cowie M. Tõlkeuuringute sõnaraamat. - Manchester, UK: St. Jerome Publishing, 1997. - 234 lk.

Paidalangan sozdikter, resmi kuzhattar, okulyktar, audarylgan enbekter:

1. Ayapova Zh.M., Arynov E.M. Isker adamnyn oryssha-kazaksha economicallyk tusindirme sozdigі. A., 1993

2. Egeubay A. Kisilik kitaby. - Almatõ, 1998.

3. Ibatov A. Kutbtyn "Khusrau ua Shirіn" poemsynyn sozdigі (XIV ғasyr) .- Almatõ, 1974.

4. Ibraeva A. Zan terminderinіn kazaksha-oryssha zhane oryssha-kazaksha kyskasha tusindirme sozdigі. A., 1996

5. Kasahstani Respublikasynõni põhiseadused. A., 1995

6. Kasahstan Respublikasynyn Constitutionynyn tusindirme sozdigі. A., 1996

7. Kalijev G. Tіl bіlіmi terminderіnіn tүsіndіrme сөzdіgі. A., 2005.

8. Kaliev G., Bolganbaev A. Kazirgі kazak tiliniini leksikoloogia ja fraseoloogia. A., 2006

9. Kozhakhmetova H.K., t.b. Kasahsha-oryssha fraseologylyқ sozdik. A., 1988

10. Rakhmatullin Kh. A., 1992

11. Rustemov L.Z. Araabia-Iraani kirme sozderinin kazaksha-oryssha tusindirme sozdigi. A., 1989

12. Vene-kasahhi vanasõnad ja kõnekäänud / Koost. A. Turehanov ja teised - A., 1999

13. Sapargalijev G. Zaң terminderinіn tүsіndіrme sozdіgі. A., 1995

14. Tazkire-i-Bұғra khan – tuba Serikbai Kosan. - Almatõ: Tolagay, 2007.

Paidalangan derekkozder:

1. Abay. Shygarmalarynyn ekі tomdyk tolyk zhinagy. Ekinshi vol. Olender men audarmalar. Poemalar. Kara lõi. A., 1995

2. Altynsarin Ybyray. Eki tomdyk shygarmalar zhinagy. A., 1988

4. Auezov M. Abai tee / Tõlkinud A. Kim. - A., 2007. 1. raamat.

5. Auezov M. Zhiyrma tomdyk shygarmalar zhinagy. A., XII kd, 1983, XIX kd, 1985.

6. Auezov Muhtar. Abai Zholy: eepiline romaan. A., 1989.

7. Jambul. Valitud teosed. A., 1981

8. Esenberlin I. Almas kylysh (tarihi romaan). A., 1971

  • DE-1. Materjalide struktuuri ja omaduste alused. Faaside teisendused.
  • DE-2 Sulamite kuumtöötlemise ja pinnakarastamise alused
  • Loeng 13. Teksti masintõlge. Arvutikeele sõnastikud

    Masintõlke põhialused

    Tõlge- See on teatud tüüpi keelevahendus, mis on keskendunud võõrkeelsele originaalile. Tõlkimist käsitletakse kui originaalis sisalduva sõnumi olemasolu võõrkeelset vormi. Keeltevaheline suhtlus toimub enamasti tõlkimise teel rohkem reprodutseerib otsese verbaalse suhtluse protsessi, milles suhtlejad kasutavad sama keelt.

    Masintõlge on loomulikus keeles kirjutatud teadmiste ja tekstide automaatne ammutamine keelelisel toel põhinevate arvutiprogrammide abil.

    Masintõlke protsess on arvuti toimingud ühes loomulikus keeles teksti teisendamiseks teises keeles sisult ekvivalentseks tekstiks, samuti sellise tegevuse tulemus.

    Automaatne teksti mõistmise süsteem, tuleneb asjaolust, et loomuliku keele tekst, mis on koostatud kooskõlas loomuliku keele sõnaraamatute, grammatika ja algoritmidega, mis põhineb semantilisel võrgul, raamidel ja tesaurusel, on kasutajale arusaadav tänu sellele, et tal on keelealased teadmised. - süntaktilis-semantilised struktuurid ja eriteadmised.

    Enamik automaatseid keeletöötlussüsteeme seab endale ülesandeks analüüsida tekste, mis on eelnevalt lauseteks jagatud. Siiski on keeleandmed meile kõige sagedamini kättesaadavad lõikude, peatükkide ja muude suuremate üksuste kaupa märgistatud tekstidena. Seetõttu on nende tõhusaks automaatseks analüüsiks vaja sobivaid segmenteerimisalgoritme.

    Ülesanded automaatse tekstimõistmissüsteemi loomisel:

    algupärase loomuliku teksti analüüs, mis võimaldab konstrueerida keelelisi struktuure, sh erinevaid semantilisi struktuure, täielik, osaline, tihendatud, kaldudes esitama teksti sisu vormis andmebaasid,

    teksti keeleliste struktuuride võrdlemine eri- või individuaalsete teadmistega, esitatuna ka andmebaasi kujul

    · tekstide üldistamine traditsioonilistes relatsiooniandmebaasides, aga ka kontseptuaalsetes tekstistruktuurides või üksikutes andmebaasides sisalduva teabe põhjal.

    Sest masintõlge arvutisse sisestatakse spetsiaalne programm, mis realiseerib tõlkealgoritm, mida mõistetakse tekstiga üheselt ja rangelt määratletud toimingute jadana, et leida tõlkevastused antud keelepaaris antud suund tõlge (ühest konkreetsest keelest teise). On olemas ka eraldiseisvad masintõlkesüsteemid, mis on loodud tõlkima kolmes või enamas keeles, kuid need on praegu katsetavad.

    Kaasaegne masintõlge või automaattõlge toimub inimese abiga: eeltoimetaja, kes tõlgitava teksti ühel või teisel viisil eeltöötleb, tõlkeprotsessis osalev intertoimetaja või järeltoimetaja. kes parandab masinaga tõlgitud teksti vigu ja puudujääke .

    Masintõlkesüsteem sisaldab kakskeelseid sõnastikke, mis on varustatud vajaliku grammatilise teabega (morfoloogiline, süntaktiline ja semantiline), mis võimaldavad edastada ekvivalentseid, variante ja teisenduslikke tõlkevasteid, selgitavaid ja eritemaatilisi sõnaraamatuid, samuti grammatilise analüüsi algoritmilisi tööriistu, mis rakendavad. mis tahes formaalne grammatika, mis on vastu võetud automaatseks tekstitöötluseks.

    Kõige tavalisem on järgmine formaalsete toimingute jada, analüüsi ja sünteesi pakkumine masintõlkesüsteemis:

    tekstisisestus ja sisestussõnavormide otsimine sisestussõnastikust koos kaasneva morfoloogilise analüüsiga, mille käigus tehakse kindlaks antud sõnavormi kuuluvus teatud lekseemi. Analüüsi käigus võib sõnavormist saada ka infot, mis on seotud keelesüsteemi teiste organiseerituse tasanditega.

    · antud ainevaldkonna idiomaatiliste fraaside, fraseoloogiliste üksuste või templite tõlkimine, sisendteksti elementide põhiliste grammatiliste tunnuste määramine, homograafia lahendamine, leksikaalne analüüs ja lekseemide tõlkimine. Tavaliselt eraldatakse selles etapis üheväärtuslikud sõnad polüsemantilistest, misjärel tõlgitakse üheväärtuslikud sõnad vastete loendite järgi ning polüsemantiliste sõnade tõlkimiseks kasutatakse nn kontekstoloogilisi sõnaraamatuid, mille sõnastikukirjed on algoritmid konteksti päringu tegemiseks kontekstuaalsete väärtusdeterminantide olemasolu / puudumise kohta.

    · Lõplik grammatiline analüüs, mille käigus määratakse väljundkeele andmeid arvestades vajalik grammatikainfo.

    · Väljundsõnavormide ja lausete süntees sihtkeeles üldiselt.

    Analüüsi ja sünteesi saab teha nii fraaside kaupa kui ka kogu arvuti mällu sisestatud teksti kohta; viimasel juhul näeb tõlkealgoritm ette nn anafoorsete linkide definitsiooni.

    Masintõlke kvaliteet sõltub:

    Sõnaraamatute maht

    leksikaalsetele üksustele omistatud teabe hulk,

    analüüsi- ja sünteesialgoritmide töö koostamise ja testimise põhjalikkust,

    tarkvara tõhusus.

    Ükski programm ei saa aga veel oodata keerukatest fraasidest koosneva teksti “õiget”, kirjanduslikku tõlget.

    Kaasaegne riist- ja tarkvara võimaldavad kasutada suuri sõnastikke, mis sisaldavad üksikasjalikku grammatilist teavet. Teavet saab esitada kujul deklaratiivne(kirjeldav) ja protseduuriline(arvestades algoritmi vajadusi) vormi.

    Masintõlkeprogrammide täiustamine seostatakse pehme teksti mõistmise kontseptsiooniga, mille kohaselt erinevad kasutajad ammutavad samast tekstist oma informatsiooni ja oma individuaalse tähenduse. Pehme teksti mõistmise mudel seisneb võimes genereerida algse objekti kohta erinevaid tähenduslikke tõlgendusi, sõltuvalt selle tajumise erinevatest tingimustest ja komponentidest.

    Privaatsem "masin tähendab" tõlkija ja toimetaja abistamiseks - need on automaatsed sõnastikud ja terminiandmebaasid, arvutitesaurused, ekraanitöötlusvahendid, tekstide õigekirja-, terminoloogilise ja grammatikaparandussüsteemid.

    Kaasaegset masintõlget tuleks eristada arvuti kasutamisest inimtõlkija abistamiseks. Viimasel juhul tähendab see automaatne sõnastik, mis aitab inimesel kiiresti valida soovitud tõlkeekvivalent. Kuigi mõlemal juhul töötab arvuti koos inimesega (tõlkija või toimetajaga), sisaldab mõiste "masintõlge" sisu mõtet, et masintõlge võtab põhilise, suurema osa tõlkimise ja tõlke vastete ja tõlkevastavuste otsimise tööst enda peale. ise, jättes inimesele vaid kontrolli ja vigade parandamise.

    arvutisõnastik inimese abistamiseks - see on abivahend tõlgitud vastete kiireks leidmiseks; Samas saab sellistes sõnaraamatutes piiratud määral realiseerida ka mõningaid masintõlkesüsteemidele omaseid funktsioone.

    AT infotehnoloogia erinevad Masintõlke kaks peamist lähenemisviisi:

    pinnapealne tutvumine dokumendi sisuga võõras keeles

    Masintõlke kasutamine tavalise "inimliku" asemel. See hõlmab hoolikat toimetamist ja tõlkesüsteemi häälestamist konkreetsele teemavaldkonnale.

    Siin mängib rolli sõnastiku terviklikkus, keskendumine tõlketekstide sisule ja keelevahendite komplektile, leksikaalse polüseemia lahendamise meetodite tõhusus, grammatilise teabe väljavõtmise algoritmide tõhusus, tõlkevastavuste leidmine ja sünteesialgoritmid.

    Keeletegevuse liigina tõlkimine mõjutab kõiki keeletasandeid – alates grafeemide (ja foneemide äratundmisest suulise kõne tõlkimisel) kuni lausungi ja teksti tähenduse ülekandmiseni. Lisaks annab masintõlge võimaluse testida teoreetilisi hüpoteese teatud keeletasemete struktuuri ja pakutud algoritmide efektiivsuse kohta.

    Vajadus täiustada masintõlge kasvab pidevalt, kuna see on kõige olulisem tingimus keeltevahelise suhtluse tagamisel, mille maht kasvab iga aastaga.

    Muud võimalused keelebarjääride ületamiseks suhtlemisel – arendamine või lapsendamine ühine keel, samuti võõrkeelte õpet - ei saa tõhususe poolest võrrelda tõlkimisega.

    sünnikuupäev masintõlget peetakse uurimisvaldkonnaks tavaliselt 1947. aasta märtsiks; just siis püstitas krüptograaf Warren Weaver oma kirjas Norbert Wienerile esmakordselt masintõlke probleemi, kõrvutades seda dekrüpteerimise probleemiga.

    tegeleb masintõlke probleemidega arvutuslingvistika, mis sündis 1954. aasta jaanuaris, mil Georgetowni ülikoolis (USA) viidi läbi maailma esimene avalik masintõlke eksperiment. Samal ajal suurima matemaatiku ja küberneetiku Aleksei Ljapunovi juhtimisel aktiivne töö masintõlke kohta ja Moskvas. 1956. aasta alguses Instituudis rakendusmatemaatika M.V. Keldyshi järgi nimetatud (IPM) hakkas tööle esimene kodumaine prantsuse keelest vene keelde masintõlkesüsteem.

    Liidrid seas kaasaegsed programmid masintõlge Venemaal - süsteem PROMT (arendatud PROMT, www.e-promt.ru) ja SOCRAT süsteem (arendatud Arsenali poolt, www.ars.ru).

    AT Uusim versioon PROMT-l on põhimõtteliselt uus funktsioon "Seotud mälu". "Seotud mälu" mehhanism võimaldab teil süsteemi treenida. Tema abiga saad salvestada teadmusbaasi Sind rahuldava teksti tõlke ja kasutada selle fragmente hiljem sarnaste tekstide tõlkimisel.

    SOKRATES püüab leida ühemõttelist lahendust ega anna terminites dispersiooni: sõna, mida sõnastikus pole, jääb algsesse kirjaviisi. PROMT pakub tavaliselt mitut võimalust sõnade ja fraaside tõlkimiseks.

    Praegu keskendutakse masintõlkele, mis on läbinud oma arengu mitu etappi idee modelleerida inimtõlgi tegevust. Tõlkeprotsess on väga keeruline ja tarkvara eeliste õige kasutamine määrab suuresti tõlke kvaliteedi. Kaasaegsed masintõlkesüsteemid sisaldavad palju lisasõnastikke. Lingvistiliste algoritmide arhitektuursete lahenduste iseärasuste põhjal jagatakse süsteemid kahte tüüpi - "Transfer" ja "Interlingua". Automaattõlkeprogrammid on ehitatud vastavalt sellele jaotusele. Nii et näiteks programm "Socrates" tõlgib palju paremini kui näiteks "Magic Goody", sest esimese programmi keeleline tugi on palju tugevam ja sõnaraamatute maht on palju suurem.

    Masintõlke tulemusi tuleb alati redigeerida. Nii näeb näiteks programm "Pars" ette erinevate ainete sõnaraamatute täiendava ühendamise funktsiooni. Masina toodetud tõlke kvaliteet sõltub ju ka tarkvara kvaliteedist. Kuid isegi süsteemi peenhäälestamisel tõlgitud teksti sõnavara järgi ei võeta arvesse kõiki selle omadusi, nii et tõlgitud sõnad, millel on mitu sünonüümi, on tähistatud tärniga või antakse sulgudes valikuliselt.

    Interneti-tehnoloogiad andis masintõlkele uue arengu, aitas viia selle uude arenguetappi. Masintõlge on tõhus vahend võõrkeelse teabe vaatamiseks ja otsimiseks ning see on peamine funktsioon Internetis töötamisel. Masintõlke praegune seis võimaldab teil saada enamikust keeltest veebilehtede suhteliselt korrektse tekstitõlke. Ja kuigi täisautomaatne kvaliteetne tõlge pole võimalik, on tarkvara, mis hõlbustab tegelikku tõlkeprotsessi, juba saadaval.

    Ainevaldkonnaga kohandamise ja teiste dokumenditöötlusprogrammidega integreerimise tulemusena võimaldab masintõlge automatiseerida tõlgitud teksti vastuvõtmist.

    Peamine probleem kõigist masintõlkeprogrammidest on õige valik temaatiline sõnaraamat, samuti abisõnastike koostamine.

    Tõlge sõltub osaliselt kasutaja teadmiste tasemest (keeleoskus, programmidega töötamise oskus, keeletunnetus), aga ka suuremal määral oskusest õigesti töötada tekstiredaktoriga, abiutiliitidega, sõnaraamatud ja fraseoloogilised viited. Temaatiliste sõnaraamatute seostamisel tehtud tõlkevariandid annavad hea tõlke, sõna tähenduse õige valiku ja fraaside kasutamise tekstis. Selle põhjuseks on asjaolu, et masin kohandab oma sõnavara, et valida need sünonüümid, mis oleksid sisestuskeele teema jaoks asjakohasemad ja tõlgiksid vastavalt sihtkeele teemale.

    2 lähenemist masintõlke arendamise probleemile:

    seadistus kasutada universaalset tähenduskeelt, otsekäsitlus tõlkele, originaalteksti teisendamine sihttekstiks

    vahekeele seadmine, inimkeeleoskuse modelleerimine

    Probleem on selles, et loomuliku keele teksti tähendus ei sõltu ainult lausest endast, vaid ka kontekstist, mis on seotud sõnade mitmetähenduslikkusega ja süntaktilised konstruktsioonid, maailma semantilise struktuuri globaalse kirjeldamise praktiline võimatus isegi piiratud ainevaldkonnas, tõhusate formaalsete meetodite puudumine keelemustrite kirjeldamiseks.

    Lahendamata probleemid masintõlge on

    teksti eraldatud lausete formaalse süntaktilise analüüsi mitmetähenduslikkuse lahendamine

    teksti lõikude (fragmentide) struktuurse ja semantilise ebatäielikkuse ületamine

    erinevate ainevaldkondade paindliku ühendamise korraldamine

    teksti kui terviku mõistmise vajadus

    Masintõlkeprogrammid suudavad paremini töödelda teaduslikke, tehnilisi ja õppetekste, mida iseloomustab materjali range esitus.

    Sissejuhatavaks tõlkeks sobib kõnekeelne ja ajakirjanduslik stiil, kus on palju spetsiifilisi pöördeid, kuid suurem osa sõnadest on kasutusel otseses tähenduses, kuid pädeva väljundteksti saamiseks on vajalik käsitsi toimetamine. Saadud tõlge on omamoodi sissejuhatav tekst, kus edastatakse vaid teksti üldine temaatiline suunitlus.

    Tõlge ilukirjandus ja luule ei vasta masina nõuetele. Allegoorilistele väljenditele üles ehitatud teksti tähendus on masintõlke käigus moonutatud ega ole isegi ülevaatamiseks kättesaadav. Masin ei mõista mitmetähenduslikkust, mis omakorda viib tõlgitud teksti valesti tõlgendamiseni, mis muutub jaburaks.

    Saate püüda selliseid arusaamatusi vaadeldes minimeerida järgides reegleid:

    Koostage temaatilisi sõnaraamatuid õigesti

    kontrollige originaalteksti selle tõlke ettevalmistamise etapis

    toimetada tõlke viimases etapis

    sõnaraamatuprogrammide õige kasutamine

    grammatika ja sõnavara, samuti algteksti ainese hea tundmine

    Sõnavara, klišeede ja sõnavormide õige kasutamine

    õigeaegselt täiendada spetsiaalseid sõnaraamatuid uute terminitega



    üleval