Hierdie webblad gebruik koekies om jou gebruikerservaring te verbeter. (Klik op "JA" om 'n koekie op jou rekenaar te laai wat die opwipvenster wegsteek. Die koekie bevat geen persoonlike inligting nie.)

Gebruiksvoorwaardes

Alle korpora is uitsluitlik in VivA se Korpusportaal vir navorsingsdoeleindes beskikbaar. Kontak VivA vir navrae oor ander lisensieopsies.

Annotasie

Alle korpora is outomaties gelemmatiseer (~90% akkuraat) en van woordsoortetikette voorsien (~75% akkuraat). Geen kwaliteitskontrole toegepas nie.

Beskikbaarheid

Daar is drie vlakke van toegang tot VivA se korpusportaal:

OOP: Die korpora in hierdie groep is vrylik aan alle VivA-gebruikers vir navorsingsdoeleindes beskikbaar.

OMVATTEND: Die korpora in hierdie groep sluit ook die korpora in die OOP-vlak in. Toegang is beperk tot bona fide-navorsers. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

EKSKLUSIEF: Die korpora in hierdie groep is slegs beskikbaar aan bona fide-navorsers wat kan aantoon dat die korpora vir 'n spesifieke projek benodig word. Verkry toegang tot hierdie korpora deur die aanlyn aansoekvorm te voltooi.

Verwysing

Gebruik die "Kopieer verwysing"-knoppies in die Samevattingstabel onderaan die bladsy om 'n korpusverwysing te kopieer.

Handleiding

'n Volledige handleiding vir Korpusportaal is beskikbaar in Afrikaans en Engels.

KORPUSPORTAAL: OOP 1.0

NCHLT- Afrikaanse korpus 1.0

'n Versameling regeringsdokumente van die onderskeie webblaaie en elektroniese publikasies van die Suid-Afrikaanse regerering.

Grootte

2 229 214 woorde / 2 489 716 tekseenhede

KORPUSPORTAAL: OMVATTEND 1.5

Afrikaanse Leipzig-korpus 1.1

'n Subversameling van die Leipzig-korpus (Leipzig Corpora Collection) vir Afrikaans. © 2017 Abteilung Automatische Sprachverarbeitung, Universität Leipzig.

Grootte

86 612 330 woorde / 97 189 416 tekseenhede

NWU/ATKV-Tienertoneelkorpus 1.0

Versameling nuutgeskrewe toneelstukke wat vir die ATKV-Tienertoneelkompetisie ingeskryf is. Die korpus sal mettertyd uitgebrei word.

Huidige versameling: Inskrywings van 2017-kompetisie.

Grootte

816 172 woorde / 1 021 125 tekseenhede

NWU/Maroela Media-korpus 1.4

Versameling nuusartikels en blogs soos gepubliseer op die mediahuis Maroela Media se webtuiste tot en met 31 Maart 2019.

Grootte

17 607 795 woorde / 19 876 373 tekseenhede

NWU/Lapa-korpus 1.2

Korpus van Afrikaanse boeke (meestal fiksie) gepubliseer deur Lapa Uitgewers.

Grootte

14 765 318 woorde / 17 497 511 tekseenhede

NWU/ATKV-Taalgenootkorpus 1.0

Versameling artikels gepubliseer in die Taalgenoot tydskrif van 2006 tot 2012.

Grootte

1 271 467 woorde / 1 449 237 tekseenhede

PUK/Protea Boekhuis-korpus 2.2

Korpus van Afrikaanse boeke (fiksie en nie-fiksie) gepubliseer deur die uitgewer Protea Boekhuis.

Grootte

10 475 499 woorde / 12 084 329 tekseenhede

RSG-nuuskorpus 2.2

Versameling nuusbulletins van 2005-2017 soos uitgesaai op Radio Sonder Grense en gepubliseer op hulle webtuiste.

Grootte

16 230 082 woorde / 17 683 941 tekseenhede

Taalkommissie-korpus 1.1

'n Gestratifiseerde korpus soos gebruik deur die Afrikaanse Taalkommissie bestaande uit 'n verskeidenheid genres en domeine, insluitend: wetenskaplike tydskrifte, koerante, letterkundige werke, informele en formele skryfstukke.

Grootte

47 321 344 woorde / 53 622 677 tekseenhede

VivA Spraakkorpus 1.0

Transkripsies van uittreksels uit 'n verskeidenheid nagelate spraakkorpusse, gerangskik in subkorpusse per projek. Die korpus sal uitgebrei word wanneer meer finansiering beskikbaar word, of soos wat korpusverskaffers hulle data bydra.

Huidige versameling: 50 uur se transkripsies van die projek "Die Afrikaans van die Griekwas van die tagtigerjare".

Grootte

289 704 woorde / 395 274 tekseenhede

Wikipedia- Afrikaanse korpus 1.2

'n Versameling dokumente van die onderskeie webblaaie beskikbaar op die Afrikaanse weergawe van Wikipedia soos op 1 Desember 2018.

Grootte

17 408 073 woorde / 20 579 393 tekseenhede

KORPUSPORTAAL: EKSKLUSIEF 1.6

WAARSKUWING!

Hierdie korpora bevat materiaal (onderwerpe én taalgebruik) wat sommige gebruikers aanstoot kan gee. Jy gebruik materiaal uit hierdie korpora op eie risiko: VivA kan onder geen omstandighede verantwoordelik gehou word vir enige verleentheid of skade wat uit jou gebruik van die korpora kan voortspruit nie. Insgelyks onderskryf VivA nie noodwendig die opinies en taalgebruik in die korpora nie.

NWU/Kommentaarkorpus 1.1

Versameling ongeredigeerde gebruikerskommentaar op webblaaie, gerangskik in subkorpusse per webblad.

Huidige versameling: Kommentaar van twee verskillende webtuistes (anoniem).

Grootte

21 880 154 woorde / 24 881 728 tekseenhede

NWU/THT-korpus 1.2

Versameling historiese Afrikaanse dokumente, gerangskik per subkorpus.

Huidige versameling: VOC-dokumente van 1680 tot 1789, soos dit deur die Tracing History Trust gedigitiseer is.

Grootte

15 046 641 / 17 671 068 tekseenhede

Watkykjy.co.za-korpus 1.4

Versameling informele blogs soos gepubliseer op watkykjy.co.za. tot en met 31 Desember 2018.

Grootte

1 517 726 woorde / 1 726 246 tekseenhede

SAMEVATTING
Naam Aantal woorde Aantal tekseenhede Frekwensie: "die"
Korpusportaal: Oop 1.0 2 229 214 2 489 716 180 300
  NCHLT-Afrikaanse korpus 1.0 2 229 214 2 489 716 180 300
Korpusportaal: Omvattend 1.5 212 871 836 241 499 903 15 378 345
  Afrikaanse Leipzig-korpus 1.1 86 612 330 97 189 416 5 922 522
  NWU/ATKV-Tienertoneelkorpus 1.0 816 172 1 021 125 31 016
  NWU/Maroela Media-korpus 1.4 17 607 795 19 876 373 1 296 439
  NWU/Lapa-korpus 1.2 14 765 318 17 497 511 676 155
  NWU/ATKV-Taalgenootkorpus 1.0 1 271 467 1 449 237 72 830
  PUK/Protea Boekhuis-korpus 2.2 10 475 499 12 084 329 714 074
  RSG-nuuskorpus 2.2 16 230 082 17 683 941 1 575 558
  Taalkommissie-korpus 1.1 47 321 344 53 622 677 3 622 416
  VivA Spraakkorpus 1.0 363 756 495 901 16 798
  Wikipedia-Afrikaanse korpus 1.2 17 408 073 20 579 393 1 450 537
Korpusportaal: Eksklusief 1.6 38 444 521 44 279 042 1 212 971
  NWU/Kommentaarkorpus 1.1 21 880 154 24 881 728 1 088 262
  NWU/THT-korpus 1.2 15 046 641 17 671 068 59 287
  Watkykjy.co.za-korpus 1.4 1 517 726 1 726 246 65 422
253 545 571 288 268 661 16 771 616