Hierdie webblad gebruik koekies om jou gebruikerservaring te verbeter. (Klik op "JA" om 'n koekie op jou rekenaar te laai wat die opwipvenster wegsteek. Die koekie bevat geen persoonlike inligting nie.)

Gebruiksvoorwaardes

Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.

Annotasie

Alle korpora is outomaties gelemmatiseer (~90% akkuraat) en van woordsoortetikette voorsien (~75% akkuraat). Geen kwaliteitskontrole toegepas nie.

Beskikbaarheid

Daar is drie vlakke van toegang tot VivA se korpusportaal:

OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.

OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

Verwysing

Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.

Handleiding

'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.

KORPUSPORTAAL: Oop 1.1

NCHLT-Afrikaanse korpus 1.1

'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regerering.

Grootte

2 229 214 woorde / 2 496 685 tekseenhede

KORPUSPORTAAL: Omvattend 2.1

Afrikaanse Leipzig-korpus 1.5

'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans tot en met 2020. © 2020 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.

Grootte

122 213 769 woorde / 137 362 752 tekseenhede

NCHLT-Afrikaanse korpus 1.1

'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regerering.

Grootte

2 229 214 woorde / 2 496 685 tekseenhede

Taalkommissie-korpus 1.1

'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.

Grootte

47 321 344 woorde / 53 683 890 tekseenhede

VivA Blogkorpus 1.0

Versameling van VivA se blogs, soos gepubliseer op viva-afrikaans.org.

Grootte

311 370 woorde / 369 017 tekseenhede

VivA Spraakkorpus 1.0

Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra.

Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".

Grootte

363 756 woorde / 496 987 tekseenhede

VivA/ATKV-Tienertoneelkorpus 1.0

Versameling toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Huidige versameling sluit 2023 se inskrywings in.

Grootte

4 227 887 woorde / 5 159 081 tekseenhede

VivA/FAK-korpus 1.0

Korpus van die FAK se spogpublikasie - Flink vanaf 2017 - 2023.

Grootte

421 127 woorde / 477 893 tekseenhede

VivA/Maroela Media-korpus 1.0

Versameling nuusartikels en blogs soos gepubliseer op die mediahuis, Maroela Media, se webtuiste in Oktober 2023. Historiese data word ook mettertyd bygewerk.

Grootte

531 898 woorde / 603 685 tekseenhede

VivA/RSG-nuuskorpus 1.0

Versameling nuusbulletins vanaf 13 April 2011 tot en met 30 Okbober 2023 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.

Grootte

17 593 853 woorde / 19 181 220 tekseenhede

VivA-Uitgewerskorpus 1.0

Korpus van Afrikaanse kortverhale gepubliseer deur VivA-Uitgewers.

Grootte

86 547 woorde / 102 586 tekseenhede

Wikipedia-Afrikaanse korpus 1.6

'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op einde Augustus 2022.

Grootte

27 046 082 woorde / 33 199 825 tekseenhede

SAMEVATTING
Naam Aantal woorde Aantal tekseenhede Frekwensie: "die"
Korpusportaal: Oop 1.1 2 229 214 2 496 685 156 704
  NCHLT-Afrikaanse korpus 1.1 2 229 214 2 496 685 156 704
Korpusportaal: Omvattend 2.1 222 346 847 253 133 621 14 525 460
  Afrikaanse Leipzig-korpus 1.5 122 213 769 137 362 752 7 292 720
  NCHLT-Afrikaanse korpus 1.1 2 229 214 2 496 685 156 704
  Taalkommissie-korpus 1.1 47 321 344 53 683 890 3 198 933
  VivA Blogkorpus 1.0 311 370 369 017 19 665
  VivA Spraakkorpus 1.0 363 756 496 987 16 795
  VivA/ATKV-Tienertoneelkorpus 1.0 4 227 887 5 159 081 160 638
  VivA/FAK-korpus 1.0 421 127 477 893 28 673
  VivA/Maroela Media-korpus 1.0 531 898 603 685 37 587
  VivA/RSG-nuuskorpus 1.0 17 593 853 19 181 220 1 757 388
  VivA-Uitgewerskorpus 1.0 86 547 102 586 4 774
  Wikipedia-Afrikaanse korpus 1.6 27 046 082 33 199 825 1 851 583
224 576 061 255 630 306 14 682 164