Arendusmahtusid on hinnatud funktsionaalsuste kaupa. Masinõppe arenduse mahtude juures ei ole arvestatud andmekogude korjamise ja märgendamisega. On võimalik, et olemasolevate avalike andmestike ja tõlkemälude pealt on võimalik juba väga edukalt treenida adekvaatset tõlkemootorit, aga on tõenäoline, et anonümiseerimiseks ja tekstiliigi tuvastamiseks on vaja eraldi andmeid märgendada, mis ei ole õnneks aga kuigi suur ega kulukas töö.

Samuti on juba olemasolevad kõnetuvastuse mudelid eesti keele jaoks üpris head ning vabalt kättesaadav andmestik aina kasvab. Kõnetuvastuse puhul on aga tihtipeale vaja mudelit kohandada spetsiifilise ülesande jaoks. Eriti oluline on see parema täpsuse saavutamiseks lindistamistingimustes, mis ei ole ideaalsed - kehv mikrofon, taustahelid, kajad ruumis, telefonikõned, jne. Mudelit võib aga ka kohandada andma sobivamat väljundit tõlkeprotsessi jaoks - punktuatsioon, suured algustähed jne.

Arvestatud on ka asjaoluga, et kasutusele võetakse (kasvõi osaliselt) vabavaraline CAT-tööriist (nt MateCat) ning valmisolev kvaliteedikontrollilahendus, mida saab vajadusel täiendada.

Masinõppe töö mahtude puhul on ka eeldatud, et töid teostavad kogemusega spetsialistid - väljatoodud mahtudes ei ole kuigi palju eksperimenteerimise või õppimise ruumi. Masintõlkemudelite vastuvõtmiseks oleks mõistlik defineerida mingid kvaliteedistandardid (iga valdkonna jaoks mingid testandmed, mille peal peaks veaprotsent mingi kasutamiskõlbuliku piiri sisse jääma). Kasulik on ka küsida mudelite treenimise dokumentatsiooni, skripte ja tarkvara, et oleks tulevikus lihtsam sarnaseid mudeleid juurde treenida või olemasolevaid häälestada.

Allpool on tabel, milles on välja toodud oodatavad arendusmahud funktsionaalsuste lõikes, iga etapi eeldatav maksumus ning vajalikud ressursid.

Detailsem arenduskava koos mahuhinnangutega tundides funktsionaalsuste lõikes on välja toodud Exceli tabelis: Rakendamise kava (1) (2).xlsx

EtappEtapi tulemusEeldatav maksumus ja kestus kalendrikuudes (ilma puhvrita)Vajalikud ressursid

Etapp I

Minimaalselt kasutatava rakenduse (MVP) loomine
  1. Loodud detailanalüüsi dokumentatsioon, kasutaja- ja paigaldusjuhendid jm vajalik süsteemi tööd kirjeldav dokumentatsioon.
  2. Kasutajate ja rollide haldus.
  3. Klassifikaatorite haldus ja kõige vajalikumad klassifikaatorid.
  4. Peamiste teavituste saatmine ja seadistatud kriitilisemad teavitused. Teavituste haldus kasutajaliidese kaudu võib puududa.
  5. Vajalike töövoogude seadistamine. Töövoogude haldus kasutajaliidese kaudu võib puududa. Töövoo seadistamise võimalused on minimaalsed.
  6. Esmased liidesed ja nende kasutamine (nt Ekilex).
  7. Tegevuste logimine ja logide vaatamise võimalus.
  8. Tellimuste loomine, korraldamine ja tõlkimine (sisemine tõlkimise tööriist).
  9. Anonümiseerimise teenus.
  10. Vähemalt ühe masintõlkemootori (mudeli) integreerimine.
  11. Tõlkemälude genereerimise ja allalaadimise võimalused.
  12. Lõppkasutajate koolitamine.

Maksumus: 416 024 eurot ilma KM-ta / 499 229 eurot KM-ga

Kestus: 6 kuud
  • Projektijuht (1)
  • Süsteemiarhitekt (1)
  • Masinõppe spetsialist (1)
  • Äri- ja süsteemianalüütik (1)
  • UX-UI disainer (1)
  • Vanem front-end arendaja (1)
  • Vanem back-end arendaja (1)
  • Testija (1)

Etapp II

Optimaalse tarkvara loomine
  1. Loodud/uuendatud detailanalüüsi dokumentatsioon, kasutaja- ja paigaldusjuhendid jm vajalik süsteemi tööd kirjeldav dokumentatsioon.
  2. Järgmiste masintõlkemootorite (mudelite) integreerimine.
  3. Tekstiliigi tuvastamise võimalused.
  4. Masintõlkemootori valdkonna valikuvõimalused ja masintõlke ning tõlkemälu prioriteedi valikuvõimalused.
  5. Tõlkemälu haldamise funktsionaalsuse loomine.
  6. Täiendavate terminibaaside liidestamine.
  7. Kasutajate isiklike sõnastike loomise võimalus.
  8. Töövoogude seadistamise täiendavad võimalused (haldus kasutajaliidese kaudu).
  9. Statistika vaatamine ja eksportimine.
  10. Teavituste haldus kasutajaliidese kaudu.
  11. Avalikkusele mõeldud masintõlke kasutamise võimalused (teksti ja faili tõlkimine).
  12. Lõppkasutajate koolitamine (sh teavituskampaaniad).

Maksumus: 443 506 eurot ilma KM-ta / 532 207 eurot KM-ga

Kestus: 8 kuud
  • Projektijuht (1)
  • Süsteemiarhitekt (1)
  • Masinõppe spetsialist (1)
  • Äri- ja süsteemianalüütik (1)
  • UX-UI disainer (1)
  • Front-end arendaja (1)
  • Back-end arendaja (1)
  • Testija (1)

Etapp III

Avalikkuse vaade, täiendused ja hooldustööd
  1. Loodud/uuendatud detailanalüüsi dokumentatsioon, kasutaja- ja paigaldusjuhendid jm vajalik süsteemi tööd kirjeldav dokumentatsioon
  2. Avalikkusele mõeldud ülejäänud vaated (projektide, tõlkemälude haldamine jne).
  3. Kahe esimese etapi jooksul lisandunud liidesed
  4. Kahe esimese etapi käigus lisandunud funktsionaalsus
  5. Ülejäänud liideste integreerimine.
  6. Kvaliteedikontroll.
  7. Toimetamise funktsionaalsus
  8. Avaandmete defineerimine ja eksportimise võimalused
  9. Tõlkemootori treeningmoodul.
  10. Kõnetuvastusmoodul.
  11. Lõppkasutajate koolitamine (sh teavituskampaaniad).

Maksumus: 373 758 eurot ilma KM-ta / 448 510 eurot KM-ga

Kestus: 6 kuud
  • Projektijuht (1)
  • Süsteemiarhitekt (1)
  • Masinõppe spetsialist (1)
  • Äri- ja süsteemianalüütik (1)
  • UX-UI disainer (1)
  • Front-end arendaja (1)
  • Back-end arendaja (1)
  • Testija (1)
Kokku

Maksumus: 1 233 288 eurot ilma KM-ta, 

1 479 946 eurot KM-ga

Kestus: 20 kuud

Süsteemi arendamisel on mõistlik kaasata erinevaid riigiasutusi, kellel on otsene kokkupuude tõlketeenuse osutamisega ning vajadus süsteemis arendatavate lisafunktsionaalsuste järele. Analüüsi käigus selgus, et väga aktiivsed tõlketeenuste tarbijad on sellised asutused, nagu politsei- ja piirivalveamet, prokuratuur ja erinevad ministeeriumid. Mõistlik on kaasata asutusi etapiviisiliselt. Sellega on võimalik säilitada rakendamise kavas planeeritud arendusi ning maandada riski, et soovitud lisafunktsionaalsuste arv kasvab.

I etapi raames võib kaasata järgnevaid asutusi:

  1. Politsei- ja Piirivalveamet. Asutus on väga aktiivne tõlketeenuse tarbija ning on huvitatud paljudest tõlkekeskkonda planeeritud funktsionaalsusest. Samuti on asutusel hästi organiseeritud olemasolev tõlkekorraldus, mis võimaldab jagada kasulikku kogemust.
  2. Eesti Keele Instituut. Tegeleb masintõlkemootori arendamisega ja saab palju kaasa rääkida just keeletehnoloogia ning erinevate terminibaaside liidestamise osas.
  3. Ministeerium (nt justiitsministeerium või rahandusministeerium). Lisaks projekti koordineerija ning ka tõlketeenuse tarbija. Omab kogemust erasektorist tõlkebüroodega suhtlemisel, vandetõlkidega ning oskab ühtlustada kõikide ministeeriumite vajadusi.

Järgmiste etappide raames võib kaasata rohkem asutusi (lisaks olemasolevatele), sest MVP peab olema juba loodud ning süsteemi ulatus on juba paigas. Süsteemi arendamisprotsessiga liitunud asutused saavad olemasolevaid nõudeid täiendada ning kaasa rääkida ülejäänud funktsionaalsuste arendamisel.

Asutused, keda võiks kaasata II ja III etapi raames: prokuratuur, maksu- ja tolliamet, statistikaamet ja erasektorist tõlkebüroo.

Samuti on oluline järgida teatud protsessi süsteemi juurutamisel uutele asutustele. Lähtuma peab vähemalt järgmistest tegevustest:

  1. Süsteemi lisatakse uus asutus koos kasutajate rollidega (vajadusel luuakse uusi rolle) ja kasutajatega.
  2. Süsteemi lisatakse asutuse peakasutaja, kes teeb vajalikud seadistused ära.
  3. Toimub peakasutajate koolitus (ja tõlkemälu omanikule nt).
  4. Seadistatakse asutuse töövood, muud vajalikud parameetrid, mis on asutusepõhised.
  5. Toimuvad koolitused ülejäänud kasutajatele.
  6. Oluline on tagada teiste asutuste peakasutajate tugi ehk asutused, kes on süsteemi juba mõnda aega kasutanud, saavad vajadusel uusi lisandunud liikmeid nõustada.

  • No labels