Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.
Alle korpora is outomaties gelemmatiseer en van woordsoortetikette voorsien. Geen kwaliteitskontrole is toegepas nie.
Daar is drie vlakke van toegang tot VivA se korpusportaal:
OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.
OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.
'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans tot en met 2020. © 2020 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.
Grootte:
122 213 769 woorde / 137 362 752 tekseenhede
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.
Grootte:
47 321 344 woorde / 53 683 890 tekseenhede
'n Versameling tydskrifartikels van die ATKV se spogpublikasie – Taalgenoot – vanaf 2021-2024.
Grootte:
466 511 woorde / 531 594 tekseenhede
'n Versameling toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Huidige versameling sluit 2024 se inskrywings in.
Grootte:
4 579 490 woorde / 5 595 860 tekseenhede
'n Korpus van die FAK se spogpublikasie – Flink – vanaf 2017-2023
Grootte:
421 914 woorde / 476 800 tekseenhede
'n Versameling nuusartikels en blogs soos gepubliseer op die mediahuis, Maroela Media, se webtuiste vanaf Oktober 2023 tot Februarie 2025. Historiese data word ook mettertyd bygewerk.
Grootte:
6 609 751 woorde / 7 510 969 tekseenhede
'n Versameling nuusbulletins vanaf 13 April 2011 tot en met 28 Februarie 2025 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.
Grootte:
16 034 034 woorde / 17 433 561 tekseenhede
'n Versameling artikels uit Weet – die Afrikaanse e-naslaangids vir leerders, soos gepubliseer op die webtuiste weet.co.za.
Grootte:
247 621 woorde / 282 375 tekseenhede
'n Versameling van VivA se blogs, soos gepubliseer op viva-afrikaans.org.
Grootte:
321 601 woorde / 380 209 tekseenhede
Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra. Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".
Grootte:
363 756 woorde / 496 987 tekseenhede
'n Korpus van Afrikaanse kortverhale gepubliseer deur VivA-Uitgewers.
Grootte:
166 229 woorde / 197 216 tekseenhede
'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op einde Augustus 2022.
Grootte:
27 046 082 woorde / 33 199 825 tekseenhede
'n Versameling VOC-registers wat dateer uit die 17de en 18de eeu, en getranskribeer is deur die Tracing History Trust.
Grootte:
11 603 850 woorde / 13 127 187 tekseenhede
'n Versameling dagboekinskrywings van Rensche van der Walt, wat haar tydens die Anglo-Boereoorlog in 'n konsentrasiekamp bevind het. Die inskrywings is getranskribeer deur Prof Johanita Kirsten as deel van 'n inisiatief tussen die Afrikaanse Taalraad en die Oorlogsmuseum in Bloemfontein.
Grootte:
24 082 woorde / 25 792 tekseenhede
Naam | Aantal woorde | Aantal tekseenhede | Frekwensie: "die" | ||
---|---|---|---|---|---|
Korpusportaal: Oop 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Korpusportaal: Omvattend 2.5 | 228 021 316 | 259 648 723 | 14 854 077 | ||
Afrikaanse Leipzig-korpus 1.5 | 122 213 769 | 137 362 752 | 7 292 720 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Taalkommissiekorpus 1.1 | 47 321 344 | 53 683 890 | 3 198 933 | ||
VivA/ATKV-Taalgenootkorpus 1.1 | 466 511 | 531 594 | 26 685 | ||
VivA/ATKV-Tienertoneelkorpus 1.2 | 4 579 490 | 5 595 860 | 174 883 | ||
VivA/FAK-korpus 1.1 | 421 914 | 476 800 | 28 452 | ||
VivA/Maroela Media-korpus 1.3 | 6 609 751 | 7 510 969 | 460 774 | ||
VivA/RSG-nuuskorpus 1.3 | 16 034 034 | 17 433 561 | 1 598 634 | ||
VivA/weet.co.za-korpus 1.0 | 247 621 | 282 375 | 18 994 | ||
VivA-Blogkorpus 1.2 | 321 601 | 380 209 | 20 343 | ||
VivA-Spraakkorpus 1.0 | 363 756 | 496 987 | 16 795 | ||
VivA-Uitgewerskorpus 1.2 | 166 229 | 197 216 | 8 577 | ||
Wikipedia-Afrikaanse korpus 1.6 | 27 046 082 | 33 199 825 | 1 851 583 | ||
Korpusportaal: Eksklusief 2.0 | 11 627 932 | 13 152 979 | 55 178 | ||
VivA/Bethulie-dagboekkorpus 1.0 | 24 082 | 25 792 | 355 | ||
VivA/THT-korpus 1.0 | 11 603 850 | 13 127 187 | 54 823 | ||
241 878 462 | 275 298 387 | 15 065 959 |