Korpus języka mówionego mieszkańców Spisza

Autor

DOI:

https://doi.org/10.12797/LV.14.2019.27.11

Słowa kluczowe:

korpus, język mówiony, dialektologia, gwara spiska

Abstrakt

A Spoken Corpus of Inhabitants of Polish Spisz
The article describes a dialect corpus project that documents the dialect of Polish Spisz. In contrast to the majority of dialectological research in Poland, our corpus also includes the speech of the youngest and middle generations, as its aim is also to document the sociolinguistic situation of the dialect of the region. Recordings have been transcribed into standard Polish orthography, not phonetically, which makes it possible not only to easily search the corpus but also to use existing tools to lemmatize and add morphosyntactic annotation to the texts. Users interested in the phonetic layer can access the recordings on a per-utterance basis. The article describes the stages of compiling the corpus and discusses its potential applications. The authors argue that a large corpus which covers a small, homogeneous area is a more valuable resource for dialectologists than a series of small corpora documenting a larger region.

Pobrania

Brak dostęþnych danych do wyświetlenia.

Bibliografia

AJPP: M. Małecki, K. Nitsch, 1934, Atlas językowy polskiego Podkarpacia, cz. I: Mapy, cz. II: Wstęp, objaśnienia, wykazy wyrazów, Kraków.

Brugman H., Russel A., 2004, Annotating Multimedia/Multi-modal Resources with ELAN, [w:] M.T. Lino, M.F. Xavier, F. Ferreira, R. Costa, R. Silva (red.), Proceedings of LREC 2004, Fourth International Conference on Language Resources and Evaluation, Paris, s. 2065–2068, [on-line:] http://www.lrec-conf.org/proceedings/lrec2004/pdf/480.pdf (dostęp: 2 XI 2018).

Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R., 2014, Współczesne narzędzia leksykograficzne a analiza tekstów dawniejszych, „Polonica” XXXIV, s. 21–27.

Dunaj B., 1986, Dialektologia a socjolingwistyka, „Acta Universitatis Lodziensis. Folia Linguistica” t. 12, s. 15−23.

Garczyńska J. (red.), 2013–2017, Akustyczna baza danych gwar mazowieckich. Wokalizm, [on-line:] http://ec2-34-217-145-151.us-west-2.compute.amazonaws.com:8000/ (dostęp: 2 XI 2018).

Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, [w:] A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–36.

Grochola-Szczepanek H., 2013, Badanie języka mieszkańców wsi w kontekście przemian społecznych, „Socjolingwistyka” XXVII, s. 43–53.

Grochola-Szczepanek H., 2017, Nowe badania języka mieszkańców wsi regionu polskiego Spisza, [w:] B. Osowski, P. Michalska-Górecka, J. Kobus, A. Piotrowska-Wojaczyk (red.), Język w regionie, region w języku 2, Poznań, s. 103–119.

Grochola-Szczepanek H., Woźniak M., 2018, Transkrypcja języka mieszkańców wsi w aplikacji ELAN w Korpusie Spiskim, [w:] R. Przybylska, M. Rak, A. Kwaśnicka-Janowicz (red.), Historia języka, dialektologia i onomastyka w nowych kontekstach interpretacyjnych, Kraków, s. 267–278.

Gruszczyński W., Adamiec D., Ogrodniczuk M., 2013, Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) – prezentacja projektu badawczego, „Polonica” XXXIII, s. 311–318.

Karaś H. (red.), 2010, Dialekty i gwary polskie. Kompendium internetowe, [on-line:] http://www.dialektologia.uw.edu.pl/index.php (dostęp: 2 XI 2018).

Karaś H., Kresa M., Krawczyk-Wieczorek A., 2012, Towards a Corpus of Polish Dialect Texts, „Prace Filologiczne” LXIII, s. 129–145.

KąśSGO: J. Kąś, Słownik gwary orawskiej, t. I–II, wyd. II, Kraków 2011.

KorBa: Elektroniczny korpus tekstów polskich z XVII I XVIII w. (do 1772 r.), [on-line:] http://korba.edu.pl/ (dostęp: 4 II 2019).

Krawczyk-Wieczorek A., 2012, Automatyczna lematyzacja tekstu w zapisie fonetycznym.

Korpus polskiej gwary południowokresowej, „Język Polski” XCII, s. 11–19.

Lubaś W., 1979, Społeczne uwarunkowania współczesnej polszczyzny. Szkice socjolingwistyczne, Kraków.

Narodowy Korpus Języka Polskiego, praca zbiorowa, red. A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk, Warszawa 2012.

NKJP: Narodowy Korpus Języka Polskiego, [on-line:] https://www.nkjp.pl.

Przepiórkowski A., 2004, Korpus IPI PAN. Wersja wstępna, Warszawa.

Waldenfels R. von, Woźniak M., 2016, SpoCo – A Simple and Adaptable Web Interface for Dialect Corpora, „Journal for Language Technology and Computational Linguistics” 31, s. 155–170.

Wyderka B., 2014, Problemy teoretyczne współczesnej dialektologii, [w:] M. Rak, K. Sikora (red.), Badania dialektologiczne. Stan, perspektywy, metodologia, „Biblioteka LingVariów”, t. 17, Kraków, s. 13–21.

Pobrania

Opublikowane

2019-05-31

Jak cytować

Grochola-Szczepanek, H., Górski, R. L., von Waldenfels, R. i Woźniak, M. (2019) „Korpus języka mówionego mieszkańców Spisza”, LingVaria, 14(27), s. 165–180. doi: 10.12797/LV.14.2019.27.11.

Numer

Dział

Dialektologia

Informacje o finansowaniu