Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.
Alle korpora is outomaties gelemmatiseer en van woordsoortetikette voorsien. Geen kwaliteitskontrole is toegepas nie.
Daar is drie vlakke van toegang tot VivA se korpusportaal:
OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.
OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.
'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans tot en met 2020. © 2020 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.
Grootte:
122 213 769 woorde / 137 362 752 tekseenhede
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.
Grootte:
47 321 344 woorde / 53 683 890 tekseenhede
'n Versameling tydskrifartikels van die ATKV se spogpublikasie – Taalgenoot – vanaf 2021-2023.
Grootte:
343 777 woorde / 391 124 tekseenhede
'n Versameling toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Huidige versameling sluit 2023 se inskrywings in.
Grootte:
4 191 956 woorde / 5 127 924 tekseenhede
'n Korpus van die FAK se spogpublikasie – Flink – vanaf 2017-2023
Grootte:
421 914 woorde / 476 800 tekseenhede
'n Versameling nuusartikels en blogs soos gepubliseer op die mediahuis, Maroela Media, se webtuiste vanaf Oktober 2023 tot Februarie 2024. Historiese data word ook mettertyd bygewerk.
Grootte:
1 924 821 woorde / 2 182 268 tekseenhede
'n Versameling nuusbulletins vanaf 13 April 2011 tot en met 30 April 2024 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.
Grootte:
14 293 782 woorde / 15 528 455 tekseenhede
'n Versameling van VivA se blogs, soos gepubliseer op viva-afrikaans.org.
Grootte:
312 129 woorde / 368 743 tekseenhede
Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra. Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".
Grootte:
363 756 woorde / 496 987 tekseenhede
'n Korpus van Afrikaanse kortverhale gepubliseer deur VivA-Uitgewers.
Grootte:
86 785 woorde / 102 436 tekseenhede
'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op einde Augustus 2022.
Grootte:
27 046 082 woorde / 33 199 825 tekseenhede
Naam | Aantal woorde | Aantal tekseenhede | Frekwensie: "die" | ||
---|---|---|---|---|---|
Korpusportaal: Oop 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Korpusportaal: Omvattend 2.3 | 220 749 329 | 251 417 889 | 14 305 642 | ||
Afrikaanse Leipzig-korpus 1.5 | 122 213 769 | 137 362 752 | 7 292 720 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Taalkommissiekorpus 1.1 | 47 321 344 | 53 683 890 | 3 198 933 | ||
VivA/ATKV-Taalgenootkorpus 1.0 | 343 777 | 391 124 | 19 785 | ||
VivA/ATKV-Tienertoneelkorpus 1.1 | 4 191 956 | 5 127 924 | 159 094 | ||
VivA/FAK-korpus 1.1 | 421 914 | 476 800 | 28 452 | ||
VivA/Maroela Media-korpus 1.1 | 1 924 821 | 2 182 268 | 132 573 | ||
VivA/RSG-nuuskorpus 1.1 | 14 293 782 | 15 528 455 | 1 424 566 | ||
VivA-Blogkorpus 1.1 | 312 129 | 368 743 | 19 663 | ||
VivA-Spraakkorpus 1.0 | 363 756 | 496 987 | 16 795 | ||
VivA-Uitgewerskorpus 1.1 | 86 785 | 102 436 | 4 774 | ||
Wikipedia-Afrikaanse korpus 1.6 | 27 046 082 | 33 199 825 | 1 851 583 | ||
222 978 543 | 253 914 574 | 14 462 346 |