Hornjoserbski tekstowy korpus

Pokiwy

Powšitkowne informacije

Korpusowe pytanje je lochko přistupny nastroj, kotryž přewozmje za zajimowany lajski a interdisciplinarny fachowy publikum formulowanje kompleksnych wotprašenjow a dowola potajkim wobšěrne rešerše w hornjoserbskich tekstach z pomocu jednorych pytanskich wurazow. Tuž njejsu trěbne dokładne znajomosće prawopisneje wšelakorosće wosebje staršich tekstow (ortografiskeje wariancy) a mnohotnosće formow hornjoserbskich słowow (morfologiskeho paradigma) kaž tež techniskeho formulowanja wotprašenjow (regularnych wurazow).

Za rešeršowanje na tutym městnje je so wuběrk hornjoserbskich tekstow k nowemu digitalnemu korpusej zestajił a intensiwnje přihotował. Korpus tuchwilu wopřijima něhdźe 7,5 milionow tokenow (běžnych słownych formow); tekstowa baza so poněčim rozšěrja.

Informacije wo alternatiwnych korpusach a korpusowych přistupach kaž tež wo wuwiću korpusoweho pytanja namakacé pod wuwićom.

Wužiwanje

Teksty za korpusowe pytanje buchu tak připrawjene, zo wobsahuja informacije wo zakładnych formach (lematach) a aktualizowanym prawopisu (normalizaciji) w nim jewjacych so słowow (tokenow).

Pytanje za wón abo čas (normalizowanej zakładnej formje) wunjese tuž zdobom wuslědki za njón, jeho, jemu resp. cżaß, časomaj atd.

Pytanje za cżaß (zestarjena forma tokena) poda wuslědki za cżaß, ale žanych wuslědkow za čas.

Pytanje za jemu (normalizowana forma tokena) wunjese wšitke jemu, ale žane wón, jeho atd.

Wobšěrniše přepytanje skići tuž pytanje za lematami (zakładnymi słownymi twórbami w płaćiwym pisanju). Hdźež dopušći w teksće wustupowaca forma wjace wułoženjow (je homonymna) – móže so potajkim mašinelnje wjesć na wšelake zakładne formy wróćo – wupišu so wšě potencielne zakładne formy, hačkuli za konkretne słowo móže być korektna stajnje jenož jedna zakładna forma.

Na přikład pytanje za lětać wjedźe dla toho tež k tajkim namakankam za lěta, hdźež da so po konteksće tale twórba póznać jako skłonjowana forma wot lět abo lěto.

Slěd słowow (kolokaciju) móže so tak pytać, zo jednotliwe pytanske wurazy zapodadźa so mjez sobu z prózdnotami dźělene.

Pytanje za wón być doda na přikład wuslědki kaž jemu było.

Standardnje so přepytuje cyły korpus. W pytanskich nastajenjach móže wšak so pytanje na wěste dźělne korpusy wobmjezować. Přehlad dźělnych korpusow namakaće pod žórłami.

Pochadźa-li korpusowy podkład z teksta, za kotryž je so tež čitanski přistup poskićił, jewi so na prawej kromje dokłada znamjo . Stłóčiwši symbol wotewrjeće čitanski napohlad.

Informacije wo ekspertowych nastajenjach namakacé pola pokiwow za ekspertowe pytanje.