Solche Daten enthalten eine Reihe sprachlicher Strukturen und Phänomene, die von gängigen Guidelines nicht abgedeckt werden.
Das genehmigte Kurationsprojekt wird in einer Pilotstudie gängige Annotationsschemata für drei Annotationsebenen (Dependenzanalyse, Named Entity Recognition, Koreferenz) evaluieren und gegebenenfalls erweitern.
Dazu wird ein Testkorpus nichtstandardsprachlicher Varietäten erstellt und annotiert.
de.clarin.euSuch data comprise a variety of linguistic structures and phenomena which are not covered by current guidelines
In a pilot study the granted curation project will evaluate established annotation schemes for three annotation layers (dependency analysis, named entity recognition and coreference) and where necessary extend them.
For that reason a test corpus of non-standard varieties will be compiled and annotated with the goal to produce guidelines and best practices for the annotation of those varieties.
de.clarin.euOvde možete ostaviti obaveštenje o greškama u ovom unosu ili predloge za poboljšanja:
Kako funkcioniše izvoz u trener vokabulara?
Lista sa vokabularom nalazi se samo u veb-brauzeru. Nakon izvoza vokabulara u trener, ona će biti svuda dostupna.