Класифікаційна парадигма корпусу текстів за особли-востями його дизайну, структури та способами використання, а також способом фіксації та індексації текстових даних (Classificational paradigm of a text corpus by its design, structure and use, as well as by the fixation and indexation methods of its text data)

Коцюк, Л. М. (L. Kotsiuk) and Коцюк, Ю. А. (Yu. Kotsiuk) (2020) Класифікаційна парадигма корпусу текстів за особли-востями його дизайну, структури та способами використання, а також способом фіксації та індексації текстових даних (Classificational paradigm of a text corpus by its design, structure and use, as well as by the fixation and indexation methods of its text data). Наукові записки Національного університету «Острозька академія». Серія «Філологія» (9(77)). pp. 106-110. ISSN 25192558

[thumbnail of Classificational paradigm.pdf] PDF - Published Version
Download (302kB)

Анотація

У статті робиться спроба доповнити класифікацію корпусів текстів. Представлено класифікаційну парадигму текстових корпусів з огляду на те, яка його структура та дизайн, зокрема за цим параметром виділено збалансований / репрезентативний корпус, корпус з гнучкою структурою, завершений, повнотекстовий корпус, фрагментарний, паралельний та порівнянний кор-пуси, а також cтатичний та динамічний / моніторинговий корпуси. Виявлено, що парадигму за параметром «спосіб фіксації та індексації текстових даних у корпусі» складають друкований корпус, корпус електронних текстів, корпус транскрибованого мовлення, аудіо/відео корпус, мультимедійний корпус, а також простий / нерозмічений / неіндексований / нетегований корпуси та анотований / розмічений / індексований / тегований корпус. Корпуси, в залежності від того, як ними користуються, поділено на категорії “за метою” (як, наприклад, дослідницький та ілюстративний корпуси) та “за доступністю” (корпуси у вільному до-ступі, закриті корпуси, а також, комерційні корпуси). Також представлено приклади згаданих типів корпусів текстів. У статті представлено термінологічні еквіваленти назв корпусів за типом мовних даних в українській та англійській мовах.Ключові слова: корпус, текстові дані, тип корпусу, типологічні характеристики.
(The article attempts to analyze the typological characteristics of text corpora. The author proposes to classify corpora with consideration of different aspects of this modern linguistic notion, namely the design and structural features of the corpus (balanced / representative corpus, opportunistic corpus, complete corpus, full-text corpus, fragmentary corpus, parallel corpus and comparable corpus, static / sample corpus, dynamic / monitor corpus), the method of fixing and indexing text data in the corpus (printed corpus, electronic text corpus, transcribed speech corpus, audio/video corpus, multimodal corpus, plain corpus, annotated corpus), as well as the way of how the corpus can be used. According to the aim of the corpus use one can distinguish between a linguistic and illustrative corpus. Due to the access possibilities, there can be identified an open-access corpus, closed-access corpus and the commercial one. Examples of these types of text corpora are also presented. The article presents terminological equivalents of corpus names by the type of text data in Ukrainian and English.)

Тип файлу: Стаття
Ключові слова: корпус, текстові дані, тип корпусу, типологічні характеристики (corpus, text data, corpus type, typological characteristics)
Теми: За напрямами > Загальні питання лінгвістики та літератури > Лінгвістика. Мовознавство
Підрозділи: Економічний факультет > Кафедра економіко-математичного моделювання та інформаційних технологій
Навчально-науковий інститут лінгвістики > Кафедра англійської мови та літератури
Розмістив/ла: заввідділу Наталя Денисенко
Дата розміщення: 21 Січ 2025 09:04
Остання зміна: 21 Січ 2025 09:04
URI: https://eprints.oa.edu.ua/id/eprint/9556

Actions (login required)

Переглянути елемент Переглянути елемент