Digital Repository of Ostroh Academy

Corpora creation in contrastive linguistics (Cтворення корпусів у дослідженнях з зіставного мовознавства)

Belyaeva, Anastasiia (Анастасія Бєляєва) (2018) Corpora creation in contrastive linguistics (Cтворення корпусів у дослідженнях з зіставного мовознавства). Наукові записки Національного університету «Острозька академія»: серія «Філологія» (4(72)). pp. 69-73. ISSN 2519-2558

[img] PDF - Published Version
Download (539kB)

Abstract

Universal and specific features of language usage can become more evident if tested against the non-elicited language data on large scale. This requirement can be met by using corpora that provide ample data to test research hypotheses in contrastive language studies in objective and falsifiable manner. However, criteria in corpora creation and comparability measures in the evaluation of available corpora present a separate problem in contrastive linguistics. The article presents an overview of the types of corpora used in Contrastive Linguistics research and describes their characteristic features. The study proceeds to look into the sources of data used in corpora creation both in (commercially) available corpora and data collections compiled to answer a particular research question. The article describes the techniques used in creating comparable corpora for contrastive studies and presents the comparability measures to evaluate the corpora. The study examines the case of building a topic-specific comparable corpus in English and Ukrainian. The corpus focuses on education-related vocabulary in the languages under analysis. The corpus comparability is measured using translation equivalence and word frequency similarity. The article used the procedures outlined above to collect a quasi-comparable (non-aligned) corpus focusing on the topic of education with the English and Ukrainian languages in contrast. Using frequency comparability measure it was established that both components of the corpus (in the English and Ukrainian languages) contain keywords related to the topic of education. (У статті проаналізовано типи корпусів, які використовуються у дослідженнях з зіставного мовознавства з метою виявлення універсальних та специфічних особливостей мов. Встановлено основні джерела матеріалів для укладання корпусів, критерії відбору текстів, етапи укладання корпусів, моделі оцінки та характеристики корпусів для контрастивних студій. У статті розглянуто методи, що використовуються у створенні корпусів для зіставних досліджень, описано досвід укладання корпусів для зіставних досліджень на матеріалі англійської та української мов. Критерії відбору матеріалу, етапи побудови корпусів та перспектив їх використання розглянуто на прикладі корпусів лексики сфери освіти в аналізованих мовах.)

Item Type: Article
Corporate Creators: Запорізький національний університет (Zaporizhzhya National University)
Uncontrolled Keywords: monolingual corpus, parallel corpus, contrastive linguistics, comparability measure (одномовнй корпус, паралельний корпус, контрастивна лінгвістика)
Subjects: by fields of science > General issues of linguistics and literature
Divisions: UNSPECIFIED
Depositing User: Галина Цеп'юк
Date Deposited: 25 Jul 2019 12:24
Last Modified: 25 Jul 2019 12:24
URI: http://eprints.oa.edu.ua/id/eprint/7768

Actions (login required)

View Item View Item