Hierdie webblad gebruik koekies om jou gebruikerservaring te verbeter. (Klik op "JA" om 'n koekie op jou rekenaar te laai wat die opwipvenster wegsteek. Die koekie bevat geen persoonlike inligting nie.)

Gebruiksvoorwaardes

Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.

Annotasie

Alle korpora is outomaties gelemmatiseer (~90% akkuraat) en van woordsoortetikette voorsien (~75% akkuraat). Geen kwaliteitskontrole toegepas nie.

Beskikbaarheid

Daar is drie vlakke van toegang tot VivA se korpusportaal:

OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.

OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

Verwysing

Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.

Handleiding

'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.

KORPUSPORTAAL: OOP 1.0

NCHLT- Afrikaanse korpus 1.0

'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regerering.

Grootte

2 229 214 woorde / 2 489 716 tekseenhede

KORPUSPORTAAL: OMVATTEND 1.9

Afrikaanse Leipzig-korpus 1.2

'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans. © 2017 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.

Grootte

94 566 520 woorde / 106 166 327 tekseenhede

NCHLT-Afrikaanse korpus 1.0

'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regerering.

Grootte

2 229 214 woorde / 2 489 716 tekseenhede

NWU/ATKV-Taalgenootkorpus 1.0

Versameling artikels gepubliseer in die Taalgenoot tydskrif van 2006 tot 2012.

Grootte

1 271 467 woorde / 1 449 237 tekseenhede

NWU/ATKV-Tienertoneelkorpus 1.1

Versameling nuutgeskrewe toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Die korpus sal mettertyd uitgebrei word.

Huidige versameling: Inskrywings van 2017, 2018 en 2019 se kompetisies.

Grootte

2 408 806 woorde / 3 001 294 tekseenhede

NWU/Lapa-korpus 1.3

Korpus van Afrikaanse boeke (meestal fiksie) gepubliseer deur Lapa Uitgewers.

Grootte

19 989 190 woorde / 23 669 778 tekseenhede

NWU/Maroela Media-korpus 1.8

Versameling nuusartikels en blogs soos gepubliseer op die mediahuis Maroela Media se webtuiste tot en met 30 November 2020.

Grootte

24 902 508 woorde / 28 048 770 tekseenhede

PUK/Protea Boekhuis-korpus 2.2

Korpus van Afrikaanse boeke (fiksie en nie-fiksie) gepubliseer deur die uitgewer Protea Boekhuis.

Grootte

10 475 499 woorde / 12 084 329 tekseenhede

RSG-nuuskorpus 2.5

Versameling nuusbulletins van 1 Januarie 2005 tot en met 28 Februarie 2021 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.

Grootte

20 498 461 woorde / 22 328 767 tekseenhede

Taalkommissie-korpus 1.1

'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.

Grootte

47 321 344 woorde / 53 622 677 tekseenhede

VivA Spraakkorpus 1.0

Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra.

Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".

Grootte

363 756 woorde / 495 901 tekseenhede

Wikipedia- Afrikaanse korpus 1.4

'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op 28 Februarie 2021.

Grootte

26 038 804 woorde / 32 081 909 tekseenhede

KORPUSPORTAAL: EKSKLUSIEF 1.10

WAARSKUWING!

Hierdie korpora bevat materiaal (onderwerpe én taalgebruik) wat sommige gebruikers aanstoot kan gee. Jy gebruik materiaal uit hierdie korpora op eie risiko: VivA kan onder geen omstandighede verantwoordelik gehou word vir enige verleentheid of skade wat uit jou gebruik van die korpora kan voortspruit nie. Insgelyks onderskryf VivA nie noodwendig die opinies en taalgebruik in die korpora nie.

NWU/Kommentaarkorpus 1.5

Versameling ongeredigeerde gebruikerskommentaar op webblaaie, gerangskik in subkorpusse per webblad.

Huidige versameling: Kommentaar van twee verskillende webtuistes (anoniem).

Grootte

24 717 080 woorde / 28 113 771 tekseenhede

NWU/THT-korpus 1.4

Versameling historiese Afrikaanse dokumente, gerangskik per subkorpus.

Huidige versameling: VOC-dokumente van 1662 tot 1791, soos dit deur die Tracing History Trust gedigitiseer is.

Grootte

19 343 422 / 22 647 357 tekseenhede

Watkykjy.co.za-korpus 1.8

Versameling informele blogs soos gepubliseer op watkykjy.co.za. tot en met 31 Augustus 2020.

Grootte

1 754 050 woorde / 1 987 976 tekseenhede

SAMEVATTING
Naam Aantal woorde Aantal tekseenhede Frekwensie: "die"
Korpusportaal: Oop 1.0 2 229 214 2 489 716 180 300
  NCHLT-Afrikaanse korpus 1.0 2 229 214 2 489 716 180 300
Korpusportaal: Omvattend 1.9 250 065 569 285 438 705 18 052 932
  Afrikaanse Leipzig-korpus 1.2 94 566 520 106 166 327 6 452 336
  NCHLT-Afrikaanse korpus 1.0 2 229 214 2 489 716 180 300
  NWU/ATKV-Taalgenootkorpus 1.0 1 271 467 1 449 237 72 830
  NWU/ATKV-Tienertoneelkorpus 1.1 2 408 806 3 001 294 91 141‬
  NWU/Lapa-korpus 1.3 19 989 190 23 669 778 908 185
  NWU/Maroela Media-korpus 1.8 24 902 508 28 048 770 1 821 556
  PUK/Protea Boekhuis-korpus 2.2 10 475 499 12 084 329 714 074
  RSG-nuuskorpus 2.5 20 498 461 22 328 767 2 002 282
  Taalkommissie-korpus 1.1 47 321 344 53 622 677 3 622 416
  VivA Spraakkorpus 1.0 363 756 495 901 16 798
  Wikipedia-Afrikaanse korpus 1.4 26 038 804 32 081 909 2 092 360
Korpusportaal: Eksklusief 1.10 45 814 552 52 749 104 1 531 270
  NWU/Kommentaarkorpus 1.5 24 717 080 28 113 771 1 241 378
  NWU/THT-korpus 1.4 19 343 422 22 647 357 74 028
  Watkykjy.co.za-korpus 1.8 1 754 050 1 987 976 215 864
298 109 335 340 677 525 19 764 502