Korpus XIX w. Uniwersytetu Warszawskiego i IJP PAN

Autor

  • Marek Łaziński Uniwersytet Warszawski, Warszawa
  • Rafał L. Górski Instytut Języka Polskiego Polskiej Akademii Nauk, Kraków https://orcid.org/0000-0003-4727-2639
  • Michał Woźniak Instytut Języka Polskiego Polskiej Akademii Nauk, Kraków

DOI:

https://doi.org/10.12797/LV.18.2023.35.09

Słowa kluczowe:

korpus językowy, polszczyzna historyczna, okres nowopolski, językoznawstwo korpusowe

Abstrakt

CORPUS OF THE 19TH CENTURY OF THE WARSAW UNIVERSITY AND IJP PAN

The article describes a historical corpus which documents the 19th and early 20th century. The corpus was created as part of a research grant whose objective was to investigate the development of the aspectual system of Polish in the last 250 years against the background of Czech and Russian. An important resource for this investigation was a database of aspectual triplets, which, in turn, was based on materials such as text corpora. Since there was no large corpus of the 19th and early 20th century available, there was a need to bridge this gap. In the course of the project, such corpus was made and it is now publicly accessible with no restrictions. This comprehensive corpus contains over 12 million contemporary words. Its texts originate from major Polish virtual libraries. It is POS-tagged with a tagger dedicated for 19th century texts. A web-based concordancer, an adjusted version of ParaVoz, allows for querying the corpus. The queries may be constrained by metadata.

Pobrania

Brak dostęþnych danych do wyświetlenia.

Bibliografia

Bajerowa I., 1964, Kształtowanie się systemu polskiego języka literackiego w XVIII wieku, Wrocław.

Bilińska J., Derwojedowa M., Kieraś W., Kwiecień M., 2016, Mikrokorpus polszczyzny 1830–1918, „Komunikacja Specjalistyczna” nr 11, s. 149–161.

Campbell L., 1999, Historical Linguistics. An Introduction, Cambridge, Mass.

CLMET: The Corpus of Late Modern English Texts, [on-line:] https://perswww.kuleuven.be/~u0044428/clmet.htm (dostęp: 20 III 2023).

Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R., 2014, Korpus polszczyzny XIX wieku – od mikrokorpusu do korpusu średniej wielkości, „Prace Filologiczne” LXV, s. 249–254.

De Smet, 2005, A Corpus of Late Modern English Texts, „Icame Journal” 29, s. 69–82.

Gruszczyński W., Adamiec D., Bronikowska R., Kieraś W., Modrzejewski E., Wieczorek A., Woliński M., 2022, The Electronic Corpus of 17th- and 18th-century Polish Texts, „Language Resources and Evaluation” 56, s. 309–332, https://doi.org/10.1007/s10579-021-09549-1. DOI: https://doi.org/10.1007/s10579-021-09549-1

Gruszczyński W., Adamiec D., Ogrodniczuk M., 2013, Elektroniczny korpus tekstów polskich z XVII i XVIII wieku (do 1772 roku) – prezentacja projektu badawczego, „Polonica” XXXIII, s. 309–316.

Halliday M.A.K., Teubert W., Yallop C., Čermáková A., 2004, Lexicology and Corpus Linguistics: An Introduction, London – New York.

KorBa: Elektroniczny Korpus Tekstów Polskich z XVII i XVIII w. (do 1772 r.), [on-line:] https://korba.edu.pl.

Król M., Derwojedowa M., Górski R.L., Gruszczyński W., Opaliński K.W., Potoniec P., Woliński M., Kieraś W., Eder M., 2019, Narodowy Korpus Diachroniczny Polszczyzny. Projekt, „Język Polski” IC, s. 92–101. DOI: https://doi.org/10.31286/JP.99.1.8

Łazinski M., Meger A., Woźniak M., 2022, Korpus Polsko-Niemiecki Uniwersytetu Warszawskiego i Uniwersytetu Gutenberga (PolGerCorp), „Tekst i Dyskurs – Text und Dyskurs” 16, s. 379–390, https://doi.org/ 10.7311/tid.16.2022.18. DOI: https://doi.org/10.7311/tid.16.2022.18

NKJP: Narodowy Korpus Języka Polskiego, [on-line:] http://nkjp.pl/.

Pastuch M., Duda B., Lisczyk K., Mitrenga B., Przyklenk K., Sujkowska-Sobisz K., 2018, Digital Humanities in Poland from the Perspective of the Historical Linguist of the Polish Language: Achievements, Needs, Demands, „Digital Scholarship in the Humanities” 33/4, s. 857–873, https://doi.org/10.1093/llc/fqy008. DOI: https://doi.org/10.1093/llc/fqy008

Przepiórkowski A., 2004, Korpus IPI PAN. Wersja wstępna, Warszawa.

Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.), 2012, Narodowy Korpus Języka Polskiego, Warszawa.

Rissanen M., 1992, The Diachronic Corpus as a Window to the History of English, [w:] J. Svartvik (red.), Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82 Stockholm, 4–8 August 1991, Berlin – New York, s. 185–210, https://doi.org/10.1515/9783110867275.185. DOI: https://doi.org/10.1515/9783110867275.185

Twardzik W.B., Górski R.L., 2003, Korpus staropolski Instytutu Języka Polskiego PAN w Krakowie, [w:] S. Gajda (red.), Językoznawstwo w Polsce. Stan i perspektywy, s. 155–157.

von Waldenfels R., 2015, ParaViz: A Vizualization Tool for Crosslinguistic Functional Comparisons Based on a Parallel Corpus. [w:] G. Grigonytė, S. Clematide, A. Utka, M. Volk (red.), Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, May 11–13, 2015, Vilnius, Lithuania, Linköping, s. 32–36.

Wiemer B., Wrzesień-Kwiatkowska J., Łaziński M., 2020, Badania aspektu w językach polskim, czeskim i rosyjskim za pomocą korpusów i baz danych (pierwsze podsumowanie tematu), „Forum Lingwistyczne” nr 7, s. 45–58, https://doi.org/10.31261/FL.2020.07.04. DOI: https://doi.org/10.31261/FL.2020.07.04

Wierzbicka A., 1966, System składniowo-stylistyczny prozy polskiego renesansu, Warszawa.

Pobrania

Opublikowane

2023-05-16

Jak cytować

Łaziński, M., Górski, R. L. i Woźniak, M. (2023) „Korpus XIX w. Uniwersytetu Warszawskiego i IJP PAN”, LingVaria, 18(1(35), s. 125–134. doi: 10.12797/LV.18.2023.35.09.

Numer

Dział

Polszczyzna historyczna

Informacje o finansowaniu