Mērķhipotēžu izvirzīšana latviešu valodas apguvēju korpusā

No Thumbnail Available

Date

2020

Authors

Auziņa, Ilze
Levāne-Petrova, Kristīne
Kaija, Inga

Journal Title

Journal ISSN

Volume Title

Publisher

LU Akadēmiskais apgāds

Abstract

Apguvēju korpuss ir sistemātiski datorizētu valodas apguvēju (gan svešvalodas, gan otrās valodas) veidotu tekstu datubāze. Tas ir ārvalstnieku valodas apguvēju īpatnību izpētes un datos balstītu latviešu valodas mācību materiālu un metodisko līdzekļu izstrādes pamats. Apguvēju korpusu, tāpat kā citus valodas korpusus, var marķēt dažādos valodas līmeņos (morfoloģiski, sintaktiski), bet īpaši nozīmīgs apguvēju valodas izpētē ir kļūdu marķējums un tajā balstītā kļūdu analīze. Kļūdu analīzi ietekmē divi faktori: 1) izraudzītie kļūdu tipi jeb kļūdu tipoloģija un 2) izvirzītās mērķhipotēzes, t. i., labotais teksts. Tādēļ pirms kļūdu marķēšanas ir būtiski vienoties, kas tiks marķēts un kā tas tiks darīts. Raksta ievadā ir īsi raksturots veidojamais „Latviešu valodas apguvēju korpuss” (LaVA), aplūkots mērķhipotēzes jēdziens un mērķhipotēzes nozīme valodas apguvēju korpusa izveides procesā. Rakstā ir izklāstīti galvenie mērķhipotēzes izvirzīšanas principi korpusā LaVA, kā arī minēti konkrēti piemēri, kā valodas apguvēju izteikumi tiek laboti atbilstoši latviešu valodas normām un kādas ir būtiskākās atkāpes, kas tiek pieļautas A learner corpus is a computerized textual database of the language produced by foreign language learners. Such corpus enables researchers to create more efficient learning materials and teaching methodology for language learners by using the corpus-driven error analysis. The learner's corpus, like other language corpora, can be annotated at different language levels (morphologically, syntactically); however, corpus-based error annotation and the corpus-based error analysis are especially important in the learner's language research. Error analysis is influenced by certain factors: 1) the error types setup or error typology; and 2) target hypothesis setup, e. g., corrected text. Therefore, it is crucial to have special guidelines indicating the subject of annotation and the methods how the annotation is performed. The article begins with description of “The Latvian Learner corpus” (LaVA) and its initial development strategies, the term of target hypothesis and its role in the creation of the learner corpus. The main target hypothesis setup criteria in the LaVa corpus is also provided with the examples showing how the language learners' utterances are being corrected according to the language norms, and the main deviations from the rules allowed.

Description

Funding Information: This work has received financial support from the Latvian Council of Science under the grant agreement No. lzp-2018/1-0527 (“Development of Learner Corpus of Latvian: methods, tools and applications”) in synergy with the Latvian State Research Programme “Latvian Language”, agreement No. VPP-IZM-2018/2-0002 (subproject “Acquisition of Latvian Language”). Keywords: corpus; learner corpus; target hypothesis; language acquisition; error annotation; corpus linguistics. Publisher Copyright: © 2020 University of Latvia. All rights reserved.

Keywords

Corpus, Corpus linguistics, Error annotation, Language acquisition, Learner corpus, Target hypothesis, 6.2 Languages and Literature, 3.1. Articles or chapters in proceedings/scientific books indexed in Web of Science and/or Scopus database, Language and Linguistics, Linguistics and Language

Citation

Auziņa, I, Levāne-Petrova, K & Kaija, I 2020, Mērķhipotēžu izvirzīšana latviešu valodas apguvēju korpusā. in A Kalnača & I Lokmane (eds), Valoda: nozīme un forma: 11 = Language: Meaning and Form: 11. vol. 11: Gramatika un valodas normēšana, Valoda: nozime un forma, LU Akadēmiskais apgāds, Rīga, pp. 7-26. https://doi.org/10.22364/vnf.11.01