Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.
Alle korpora is outomaties gelemmatiseer en van woordsoortetikette voorsien. Geen kwaliteitskontrole is toegepas nie.
Daar is drie vlakke van toegang tot VivA se korpusportaal:
OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.
OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.
Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.
'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans tot en met 2020. © 2020 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.
Grootte:
122 213 769 woorde / 137 362 752 tekseenhede
'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regering.
Grootte:
2 229 214 woorde / 2 496 685 tekseenhede
'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.
Grootte:
47 321 344 woorde / 53 683 890 tekseenhede
'n Versameling tydskrifartikels van die ATKV se spogpublikasie – Taalgenoot – vanaf 2021-2023.
Grootte:
343 777 woorde / 391 124 tekseenhede
'n Versameling toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Huidige versameling sluit 2024 se inskrywings in.
Grootte:
4 579 490 woorde / 5 595 860 tekseenhede
'n Korpus van die FAK se spogpublikasie – Flink – vanaf 2017-2023
Grootte:
421 914 woorde / 476 800 tekseenhede
'n Versameling nuusartikels en blogs soos gepubliseer op die mediahuis, Maroela Media, se webtuiste vanaf Oktober 2023 tot Oktober 2024. Historiese data word ook mettertyd bygewerk.
Grootte:
4 653 950 woorde / 5 290 803 tekseenhede
'n Versameling nuusbulletins vanaf 13 April 2011 tot en met 31 Oktober 2024 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.
Grootte:
15 256 961 woorde / 16 580 313 tekseenhede
'n Versameling van VivA se blogs, soos gepubliseer op viva-afrikaans.org.
Grootte:
312 129 woorde / 368 743 tekseenhede
Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra. Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".
Grootte:
363 756 woorde / 496 987 tekseenhede
'n Korpus van Afrikaanse kortverhale gepubliseer deur VivA-Uitgewers.
Grootte:
86 785 woorde / 102 436 tekseenhede
'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op einde Augustus 2022.
Grootte:
27 046 082 woorde / 33 199 825 tekseenhede
'n Versameling van historiese korpora wat deur die Tracing History Trust getranskribeer is.
Grootte:
11 603 850 woorde / 13 127 187 tekseenhede
'n Versameling van dagboekinskrywings wat deur die Oorlogsmuseum in Bloemfontein getranskribeer is.
Grootte:
24 082 woorde / 25 792 tekseenhede
Naam | Aantal woorde | Aantal tekseenhede | Frekwensie: "die" | ||
---|---|---|---|---|---|
Korpusportaal: Oop 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Korpusportaal: Omvattend 2.4 | 224 829 171 | 256 046 218 | 14 610 945 | ||
Afrikaanse Leipzig-korpus 1.5 | 122 213 769 | 137 362 752 | 7 292 720 | ||
NCHLT-Afrikaanse korpus 1.1 | 2 229 214 | 2 496 685 | 156 704 | ||
Taalkommissiekorpus 1.1 | 47 321 344 | 53 683 890 | 3 198 933 | ||
VivA/ATKV-Taalgenootkorpus 1.0 | 343 777 | 391 124 | 19 785 | ||
VivA/ATKV-Tienertoneelkorpus 1.2 | 4 579 490 | 5 595 860 | 174 883 | ||
VivA/FAK-korpus 1.1 | 421 914 | 476 800 | 28 452 | ||
VivA/Maroela Media-korpus 1.2 | 4 653 950 | 5 290 803 | 324 569 | ||
VivA/RSG-nuuskorpus 1.2 | 15 256 961 | 16 580 313 | 1 522 084 | ||
VivA-Blogkorpus 1.1 | 312 129 | 368 743 | 19 663 | ||
VivA-Spraakkorpus 1.0 | 363 756 | 496 987 | 16 795 | ||
VivA-Uitgewerskorpus 1.1 | 86 785 | 102 436 | 4 774 | ||
Wikipedia-Afrikaanse korpus 1.6 | 27 046 082 | 33 199 825 | 1 851 583 | ||
Korpusportaal: Eksklusief 2.0 | 11 627 932 | 13 152 979 | 55 178 | ||
VivA/Bethuli-dagboek-korpus 1.0 | 24 082 | 25 792 | 355 | ||
VivA/THT-korpus 1.0 | 11 603 850 | 13 127 187 | 54 823 | ||
238 686 317 | 271 695 882 | 14 822 827 |