Korpus języka mówionego mieszkańców Spisza

  • Helena Grochola-Szczepanek Instytut Języka Polskiego Polskiej Akademii Nauk, Kraków
  • Rafał L. Górski Instytut Języka Polskiego Polskiej Akademii Nauk, Kraków
  • Ruprecht von Waldenfels Friedrich-Schiller-Universität, Jena
  • Michał Woźniak Instytut Języka Polskiego Polskiej Akademii Nauk, Kraków
Słowa kluczowe: korpus, język mówiony, dialektologia, gwara spiska

Abstrakt

A Spoken Corpus of Inhabitants of Polish Spisz
The article describes a dialect corpus project that documents the dialect of Polish Spisz. In contrast to the majority of dialectological research in Poland, our corpus also includes the speech of the youngest and middle generations, as its aim is also to document the sociolinguistic situation of the dialect of the region. Recordings have been transcribed into standard Polish orthography, not phonetically, which makes it possible not only to easily search the corpus but also to use existing tools to lemmatize and add morphosyntactic annotation to the texts. Users interested in the phonetic layer can access the recordings on a per-utterance basis. The article describes the stages of compiling the corpus and discusses its potential applications. The authors argue that a large corpus which covers a small, homogeneous area is a more valuable resource for dialectologists than a series of small corpora documenting a larger region.

Pobrania

Dane pobrania nie są jeszcze dostepne

Bibliografia

AJPP: M. Małecki, K. Nitsch, 1934, Atlas językowy polskiego Podkarpacia, cz. I: Mapy, cz. II: Wstęp, objaśnienia, wykazy wyrazów, Kraków.

Brugman H., Russel A., 2004, Annotating Multimedia/Multi-modal Resources with ELAN, [w:] M.T. Lino, M.F. Xavier, F. Ferreira, R. Costa, R. Silva (red.), Proceedings of LREC 2004, Fourth International Conference on Language Resources and Evaluation, Paris, s. 2065–2068, [on-line:] http://www.lrec-conf.org/proceedings/lrec2004/pdf/480.pdf (dostęp: 2 XI 2018).

Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R., 2014, Współczesne narzędzia leksykograficzne a analiza tekstów dawniejszych, „Polonica” XXXIV, s. 21–27.

Dunaj B., 1986, Dialektologia a socjolingwistyka, „Acta Universitatis Lodziensis. Folia Linguistica” t. 12, s. 15−23.

Garczyńska J. (red.), 2013–2017, Akustyczna baza danych gwar mazowieckich. Wokalizm, [on-line:] http://ec2-34-217-145-151.us-west-2.compute.amazonaws.com:8000/ (dostęp: 2 XI 2018).

Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, [w:] A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–36.

Grochola-Szczepanek H., 2013, Badanie języka mieszkańców wsi w kontekście przemian społecznych, „Socjolingwistyka” XXVII, s. 43–53.

Grochola-Szczepanek H., 2017, Nowe badania języka mieszkańców wsi regionu polskiego Spisza, [w:] B. Osowski, P. Michalska-Górecka, J. Kobus, A. Piotrowska-Wojaczyk (red.), Język w regionie, region w języku 2, Poznań, s. 103–119.

Grochola-Szczepanek H., Woźniak M., 2018, Transkrypcja języka mieszkańców wsi w aplikacji ELAN w Korpusie Spiskim, [w:] R. Przybylska, M. Rak, A. Kwaśnicka-Janowicz (red.), Historia języka, dialektologia i onomastyka w nowych kontekstach interpretacyjnych, Kraków, s. 267–278.

Gruszczyński W., Adamiec D., Ogrodniczuk M., 2013, Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) – prezentacja projektu badawczego, „Polonica” XXXIII, s. 311–318.

Karaś H. (red.), 2010, Dialekty i gwary polskie. Kompendium internetowe, [on-line:] http://www.dialektologia.uw.edu.pl/index.php (dostęp: 2 XI 2018).

Karaś H., Kresa M., Krawczyk-Wieczorek A., 2012, Towards a Corpus of Polish Dialect Texts, „Prace Filologiczne” LXIII, s. 129–145.

KąśSGO: J. Kąś, Słownik gwary orawskiej, t. I–II, wyd. II, Kraków 2011.

KorBa: Elektroniczny korpus tekstów polskich z XVII I XVIII w. (do 1772 r.), [on-line:] http://korba.edu.pl/ (dostęp: 4 II 2019).

Krawczyk-Wieczorek A., 2012, Automatyczna lematyzacja tekstu w zapisie fonetycznym.

Korpus polskiej gwary południowokresowej, „Język Polski” XCII, s. 11–19.

Lubaś W., 1979, Społeczne uwarunkowania współczesnej polszczyzny. Szkice socjolingwistyczne, Kraków.

Narodowy Korpus Języka Polskiego, praca zbiorowa, red. A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk, Warszawa 2012.

NKJP: Narodowy Korpus Języka Polskiego, [on-line:] https://www.nkjp.pl.

Przepiórkowski A., 2004, Korpus IPI PAN. Wersja wstępna, Warszawa.

Waldenfels R. von, Woźniak M., 2016, SpoCo – A Simple and Adaptable Web Interface for Dialect Corpora, „Journal for Language Technology and Computational Linguistics” 31, s. 155–170.

Wyderka B., 2014, Problemy teoretyczne współczesnej dialektologii, [w:] M. Rak, K. Sikora (red.), Badania dialektologiczne. Stan, perspektywy, metodologia, „Biblioteka LingVariów”, t. 17, Kraków, s. 13–21.

Opublikowane
2019-05-31
Jak cytować
Grochola-Szczepanek, H., Górski, R. L., von Waldenfels, R. i Woźniak, M. (2019) „Korpus języka mówionego mieszkańców Spisza”, LingVaria, 14(27), s. 165-180. doi: 10.12797/LV.14.2019.27.11.
Dział
Dialektologia