Korpus XIX w. Uniwersytetu Warszawskiego i IJP PAN
DOI:
https://doi.org/10.12797/LV.18.2023.35.09Słowa kluczowe:
korpus językowy, polszczyzna historyczna, okres nowopolski, językoznawstwo korpusoweAbstrakt
CORPUS OF THE 19TH CENTURY OF THE WARSAW UNIVERSITY AND IJP PAN
The article describes a historical corpus which documents the 19th and early 20th century. The corpus was created as part of a research grant whose objective was to investigate the development of the aspectual system of Polish in the last 250 years against the background of Czech and Russian. An important resource for this investigation was a database of aspectual triplets, which, in turn, was based on materials such as text corpora. Since there was no large corpus of the 19th and early 20th century available, there was a need to bridge this gap. In the course of the project, such corpus was made and it is now publicly accessible with no restrictions. This comprehensive corpus contains over 12 million contemporary words. Its texts originate from major Polish virtual libraries. It is POS-tagged with a tagger dedicated for 19th century texts. A web-based concordancer, an adjusted version of ParaVoz, allows for querying the corpus. The queries may be constrained by metadata.
Pobrania
Bibliografia
Bajerowa I., 1964, Kształtowanie się systemu polskiego języka literackiego w XVIII wieku, Wrocław.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Bilińska J., Derwojedowa M., Kieraś W., Kwiecień M., 2016, Mikrokorpus polszczyzny 1830–1918, „Komunikacja Specjalistyczna” nr 11, s. 149–161.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Campbell L., 1999, Historical Linguistics. An Introduction, Cambridge, Mass.
##plugins.generic.googleScholarLinks.settings.viewInGS##
CLMET: The Corpus of Late Modern English Texts, [on-line:] https://perswww.kuleuven.be/~u0044428/clmet.htm (dostęp: 20 III 2023).
##plugins.generic.googleScholarLinks.settings.viewInGS##
Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R., 2014, Korpus polszczyzny XIX wieku – od mikrokorpusu do korpusu średniej wielkości, „Prace Filologiczne” LXV, s. 249–254.
##plugins.generic.googleScholarLinks.settings.viewInGS##
De Smet, 2005, A Corpus of Late Modern English Texts, „Icame Journal” 29, s. 69–82.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Gruszczyński W., Adamiec D., Bronikowska R., Kieraś W., Modrzejewski E., Wieczorek A., Woliński M., 2022, The Electronic Corpus of 17th- and 18th-century Polish Texts, „Language Resources and Evaluation” 56, s. 309–332, https://doi.org/10.1007/s10579-021-09549-1.
DOI: https://doi.org/10.1007/s10579-021-09549-1
##plugins.generic.googleScholarLinks.settings.viewInGS##
Gruszczyński W., Adamiec D., Ogrodniczuk M., 2013, Elektroniczny korpus tekstów polskich z XVII i XVIII wieku (do 1772 roku) – prezentacja projektu badawczego, „Polonica” XXXIII, s. 309–316.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Halliday M.A.K., Teubert W., Yallop C., Čermáková A., 2004, Lexicology and Corpus Linguistics: An Introduction, London – New York.
##plugins.generic.googleScholarLinks.settings.viewInGS##
KorBa: Elektroniczny Korpus Tekstów Polskich z XVII i XVIII w. (do 1772 r.), [on-line:] https://korba.edu.pl.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Król M., Derwojedowa M., Górski R.L., Gruszczyński W., Opaliński K.W., Potoniec P., Woliński M., Kieraś W., Eder M., 2019, Narodowy Korpus Diachroniczny Polszczyzny. Projekt, „Język Polski” IC, s. 92–101.
DOI: https://doi.org/10.31286/JP.99.1.8
##plugins.generic.googleScholarLinks.settings.viewInGS##
Łazinski M., Meger A., Woźniak M., 2022, Korpus Polsko-Niemiecki Uniwersytetu Warszawskiego i Uniwersytetu Gutenberga (PolGerCorp), „Tekst i Dyskurs – Text und Dyskurs” 16, s. 379–390, https://doi.org/ 10.7311/tid.16.2022.18.
DOI: https://doi.org/10.7311/tid.16.2022.18
##plugins.generic.googleScholarLinks.settings.viewInGS##
NKJP: Narodowy Korpus Języka Polskiego, [on-line:] http://nkjp.pl/.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Pastuch M., Duda B., Lisczyk K., Mitrenga B., Przyklenk K., Sujkowska-Sobisz K., 2018, Digital Humanities in Poland from the Perspective of the Historical Linguist of the Polish Language: Achievements, Needs, Demands, „Digital Scholarship in the Humanities” 33/4, s. 857–873, https://doi.org/10.1093/llc/fqy008.
DOI: https://doi.org/10.1093/llc/fqy008
##plugins.generic.googleScholarLinks.settings.viewInGS##
Przepiórkowski A., 2004, Korpus IPI PAN. Wersja wstępna, Warszawa.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.), 2012, Narodowy Korpus Języka Polskiego, Warszawa.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Rissanen M., 1992, The Diachronic Corpus as a Window to the History of English, [w:] J. Svartvik (red.), Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82 Stockholm, 4–8 August 1991, Berlin – New York, s. 185–210, https://doi.org/10.1515/9783110867275.185.
DOI: https://doi.org/10.1515/9783110867275.185
##plugins.generic.googleScholarLinks.settings.viewInGS##
Twardzik W.B., Górski R.L., 2003, Korpus staropolski Instytutu Języka Polskiego PAN w Krakowie, [w:] S. Gajda (red.), Językoznawstwo w Polsce. Stan i perspektywy, s. 155–157.
##plugins.generic.googleScholarLinks.settings.viewInGS##
von Waldenfels R., 2015, ParaViz: A Vizualization Tool for Crosslinguistic Functional Comparisons Based on a Parallel Corpus. [w:] G. Grigonytė, S. Clematide, A. Utka, M. Volk (red.), Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, May 11–13, 2015, Vilnius, Lithuania, Linköping, s. 32–36.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Wiemer B., Wrzesień-Kwiatkowska J., Łaziński M., 2020, Badania aspektu w językach polskim, czeskim i rosyjskim za pomocą korpusów i baz danych (pierwsze podsumowanie tematu), „Forum Lingwistyczne” nr 7, s. 45–58, https://doi.org/10.31261/FL.2020.07.04.
DOI: https://doi.org/10.31261/FL.2020.07.04
##plugins.generic.googleScholarLinks.settings.viewInGS##
Wierzbicka A., 1966, System składniowo-stylistyczny prozy polskiego renesansu, Warszawa.
##plugins.generic.googleScholarLinks.settings.viewInGS##
Pobrania
Opublikowane
Jak cytować
Numer
Dział
Licencja
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe.
Informacje o finansowaniu
-
Narodowe Centrum Nauki
Numer grantu 2016/23/G/HS2/00922