Par digitālajiem valodas resursiem digitālajā nedēļā

24. martā ar Valsts pētījumu programmas „Humanitāro zinātņu digitālie resursi: integrācija un attīstība” atbalstu LU Latviešu valodas institūta direktore vadošā pētniece SANDA RAPA Latvijas novadiem tiešsaistē rādīja un stāstīja par institūta pētnieku izstrādātajiem un publicētajiem latviešu valodas resursiem, kas ar LU Matemātikas un informātikas institūta gādību brīvi pieejami internetā: par pirmo svarīgāko valodas vārdnīcu – Kārļa Mīlenbaha un Jāņa Endzelīna sastādīto „Latviešu valodas vārdnīcu”, par pagājušā gadsimta apjomīgāko latviešu valodas avotu – „Latviešu literārās valodas vārdnīcu”, kā arī par patlaban koptiem un papildināmiem resursiem.

Patlaban LU Latviešu valodas institūtā koptie digitālie resursi – „Latviešu valodas vēsturiskā vārdnīca”, „Mūsdienu latviešu valodas vārdnīca” un „Tautas vietvārdu datubāze” – aptver mūsu valodas piecus gadsimtus jeb ceturtdaļu mūsu ēras – sākot no 16. gadsimta senajiem tekstiem, kad valodas liecības reģistrēja galvenokārt aizrautīgi cittautieši, līdz pat mūsdienām, kad valodas datus var reģistrēt jebkurš latvietis.

„Latviešu valodas vēsturiskajā vārdnīcā” pašlaik iekļauti gandrīz 1600 senajos rakstu avotos iekļauti vārdi (piemēram „cūku piperi”, „čaukstas”, „mārnakas”, „dzeguzesietavas”, „mīkne”, „miesmetis”, „atķīlam”). Vārdu nozīmes un apraksti ir rūpīgi izstrādāti – valodniekiem šajos meklējumos jāiepazīst ne tikai teksts un konteksts, bet reizēm arī teksta autora paradumi un pat raksturs, jāizsijā visas saskarvalodas, jāpārveido mūsdienu valodā un rakstībā un jātulko. Un rezultāts var noderēt jebkuram vārdu krājuma papildināšanai, kopšanai, nozīmju precizēšanai un daudz kur citur.

Tā kā „Latviešu valodas vēsturiskā vārdnīca” ir vēsturiska vārdnīca, vārdu nozīmes sniegtas to fiksēšanas secībā. Savukārt visas vārdformas ir elektroniski saistītas ar „Latviešu valodas seno tekstu korpusu”, no kura iespējams nonākt konkrētu avotu konkrētās vietās, proti, aplūkot katru piemēru tā oriģinālajā kontekstā. Kopumā „Latviešu valodas seno tekstu korpusā”, no kura tiek un tiks lobīts materiāls vēsturiskajai vārdnīcai, ir piecdesmit seši avoti: vienpadsmit no 16. gadsimta un četrdesmit pieci no 17.

„Latviešu valodas vēsturiskajai vārdnīcai” ir viens no labākajiem meklēšanas rīkiem, kas arī lieliski darbojas. Te ir iespējama gan vienkāršā, gan izvērstā meklēšana. Izvērstā meklēšana dod vēl papildu meklēšanas iespējas pēc vairākiem parametriem, piemēram, pēc vārdšķiras, pēc nozīmēm, pēc dažādiem vārdu savienojumu tipiem, pēc dažādām cilmēm; ir iespējama vairāku parametru kombinēšana.

„Mūsdienu latviešu valodas vārdnīca” pamatos sastādīta no 2003. līdz 2019. gadam, un tajā apkopoti mūsdienu latviešu valodā bieži lietotie vārdi. Šajā digitālajā vārdnīcā patlaban rit galvenokārt papildināšanas, precizēšanas, rediģēšanas un tehniskās uzlabošanas darbi, vienlaikus cenšoties reģistrēt pašus jaunākos darinājumus, tos izvērtēt un aprakstīt. Vārdnīcā var atrast norādes par vārdu gramatisko informāciju (dzimti, vārdšķiru, skaitli utt.), vienmēr būs skaidrota arī nozīme, doti piemēri. Dažiem vārdiem, kur tas nav izsecināms no pieraksta, būs norādes par izrunu, kā arī cilme vai pats vārda rašanās brīdis. Reizēm pievienots arī vārda normatīvais raksturojums.

Pašlaik vārdnīcā ir 45 884 šķirkļi, un tā nekad nebūs pabeigta, jo allaž tiks papildināta. Patlaban tiek spriests galvenokārt par jaunvārdu iekļaušanu. Vairāki no tiem ar dažādām leksikostilistiskajām norādēm tur jau iekļuvuši. Par jaunvārdiem te uzskatīti gan latviešu valodā darināti vārdi, piemēram, „vēlbrokastis”, gan  no citām valodām aizgūti vārdi, piemēram, „jūtūbe”, gan valodā jau eksistējoši vārdi, kas ieguvuši jaunu nozīmi, piemēram, „trollis”.

„Tautas vietvārdu datubāzē” vietvārdus reģistrē gan pētnieki, gan jebkurš kāda vietvārda zinātājs. Patlaban tā glabā gandrīz 5500 vietvārdu un joprojām atvērta jauniem vietvārdiem. Reģistrēšanas ceļš ir pavisam vienkāršs – tikai trīs obligāti aizpildāmi lauki: vietas nosaukums, objekta kategorijas nosaukums un lokalizācija, tāpēc šajā datubāzē vietvārdus var reģistrēt gandrīz jebkāda līmeņa digitālie pratēji. Pavisam drīz, rudenī, šās datubāzes uzlabošanā iesaistīsies LU Matemātikas un informātikas institūts un konkrēti šīs lapas autors Ilmārs Poikāns, kura nesavtība vispār ļāva tai sākotnēji tapt. Datubāze tiks padarīta atvērtāka un aktuālāka, un vietvārdus datubāzē, iespējams, varēs ievadīt caur karti, virtuāli izceļojot vietvārda ģeogrāfisko apkārtni. Pašlaik datubāzē tiek ievadīti daudzie iesūtītie rokraksta materiāli. Viskuplākais iegūtais materiāls pēdējā gadā ir no Daugavpils novada, kur vietvārdus reģistrējusi ģeogrāfe Ruta Avotiņa. Bagātīgi ir arī ikgadējās vietvārdu dienās (Turnā, Viesītē un Gaiķos) savāktie vietvārdu kopumi. Ikreiz šajās vietvārdu dienās pāris stundu laikā iegūstam ap 100–300 jaunu vietvārdu, kas nozīmē, ka Latvijas novados joprojām ir daudz nereģistrētu valodas resursu.

Sanda Rapa

Sanda Rapa

LU Latviešu valodas institūta vadošā pētniece

Citas ziņas

Izskanējusi Jāņa Endzelīna konference

Ziemīgajam noskaņojumam mijoties ar pavasara vēsmu tuvošanos, 2024. gada 22.–23. februārī Latvijas Universitātes Latviešu valodas institūtā norisinājās akadēmiķa Jāņa Endzelīna 151. dzimšanas dienas atcerei veltītā starptautiskā zinātniskā

Lasīt vairāk »

Mēs sociālajos tīklos