Dit artikel richt zich op de mogelijkheden van het spraakcorpus Corpus Gesproken Nederlands (CGN) als hulpmiddel voor het onderzoek naar de sociale taalvariatie in het Nederlands. Het CGN, dat in de vorm van een webapplicatie beschikbaar is, omvat ongeveer duizend uur spraakopnames van sprekers uit Nederland en Vlaanderen, met een totaal van circa tien miljoen taalelementen, ook wel bekend als tokens (waaronder woordvormen, leestekens, aanduidingen van non-verbale uitingen en onverstaanbare spraak). Het corpus beschikt over een orthografische transcriptie en een fonetische transcriptie van de teksten, evenals annotaties — zowel linguïstische (morfologische) als extralinguïstische (informatie over de opgenomen fragmenten en de sprekers). Ondanks de aanzienlijke hoeveelheid taalmateriaal en de mogelijkheid om gebruik te maken van een reeks parameters, zoals sociale (leeftijd, geslacht, opleidingsniveau, sociale rol) en situationele (het CGN is onderverdeeld in veertien categorieën, die elk overeenkomen met een specifieke communicatieve situatie) parameters, zijn er fouten en onvolkomenheden in de morfologische en extralinguïstische annotatie. Ten eerste hebben we geconcludeerd dat niet alle linguïstische (morfologische) data van het CGN handmatig werden geverifieerd na de automatische verwerking, wat de onderzoeker dwingt de zoekresultaten extra te controleren. Ten tweede zijn de fragmenten waarin twee of meer sprekers voorkomen, voorzien van informatie alleen over één spreker, wat leidt tot onbetrouwbare resultaten met betrekking tot de verdeling van taalelementen over bepaalde sociale parameters, evenals tot de noodzaak om ons te beperken tot fragmenten die alleen monologische en, wat nog belangrijker is voor een dergelijk onderzoek, spontane spraak bevatten
Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.
Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.
Все права на товарные знаки принадлежат их законным владельцам!
Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.
Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.
Спасибо, понятно.