Bevendorff, Janek, Berta Chulvi, Elisabetta Fersini, Annina Heini, Mike Kestemont, Krzysztof Kredens, Maximilian Mayerl,
Piotr Pęzik et al. ‘Overview of PAN 2022: Authorship Verification, Profiling Irony and Stereotype Spreaders, Style Change Detection, and Trigger Detection: Extended Abstract’. In Advances in Information Retrieval: 44th European Conference on IR Research, ECIR 2022, Stavanger, Norway, April 10–14, 2022, Proceedings, Part II, 331–38. Berlin, Heidelberg: Springer-Verlag, 2022.
https://doi.org/10.1007/978-3-030-99739-7_42.
Váradi, Tamás, Bence Nyéki, Svetla Koeva, Marko Tadić, Vanja Štefanec, Maciej Ogrodniczuk, Bartłomiej Nitoń,
Piotr Pęzik et al. ‘Introducing the CURLICAT Corpora: Seven-Language Domain Specific Annotated Corpora from Curated Sources’. In Proceedings of the Language Resources and Evaluation Conference, 100–108. Marseille, France: European Language Resources Association, 2022.
http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.11.pdf.
Pęzik, Piotr, Gosia Krawentek, Sylwia Karasińska, Paweł Wilk, Paulina Rybińska, Anna Cichosz, Angelika Peljak-Łapińska, Mikołaj Deckert, and Michał Adamczyk. ‘DiaBiz – an Annotated Corpus of Polish Call Center Dialogs’. In Proceedings of the Language Resources and Evaluation Conference, 723–26. Marseille, France: European Language Resources Association, 2022.
http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.76.pdf.
-
-
Mikołajczyk, Agnieszka, Adam Wawrzyński,
Piotr Pęzik, Michał Adamczyk, Adam Kaczmarek, and Wojciech Janowski. ‘Punctuation Restoration from Read Text’. In Proceedings of the PolEval 2021 Workshop, 21–31. Institute of Computer Science, Polish Academy of Sciences, 2021.
http://poleval.pl/files/poleval2021.pdf.
Pappagari, Raghavendra, Piotr Żelasko, Agnieszka Mikołajczyk,
Piotr Pęzik, and Najim Dehak. ‘Joint Prediction of Truecasing and Punctuation for Conversational Speech in Low-Resource Scenarios’, 2021.
https://arxiv.org/abs/2109.06103.
Pęzik, Piotr. ‘Exploring the Valency of Collocational Chains’. In Formulaic Language. Theories and Methods. Phraseology and Multiword Expressions 5. Language Science Press, 2021.
https://doi.org/10.5281/ZENODO.4727665.
Piotr Pęzik. 'Budowa i zastosowania korpusu monitorującego MoncoPL'. Forum Lingwistyczne (7). 2020. Pp. 133-150. doi: 10.31261/fl.2020.07.11
Download.
-
Majewska-Tworek, Anna, Monika Zaśko-Zielińska, and
Piotr Pęzik. ‘„Polszczyzna Mówiona Miast” – Kontynuacja Badań z Lat 80. XX Wieku z Wykorzystaniem Narzędzi Lingwistyki Cyfrowej’. Forum Lingwistyczne, no. 7 (20 November 2020): 71–87.
https://doi.org/10.31261/FL.2020.07.06.
Ogrodniczuk, Maciej, Rafał L. Górski, Marek Łaziński, and
Piotr Pęzik. ‘From the National Corpus of Polish to the Polish Corpus Infrastructure’. Jazykovedný Časopis, no. 2 (2019): 315–323.
https://doi.org/10.2478/jazcas-2019-0061.
Piotrowski, Mateusz, Wojciech Janowski, and
Piotr Pęzik. “A Bidirectional LSTM-CRF Network with Subword Representations, Character Convolutions and Morphosyntactic Features for Named Entity Recognition in Polish.” Proceedings of the PolEval 2018 Workshop, 2018, 93.
Download
-
-
-
Lew, Michał, and
Piotr Pęzik. “A Sequential Child-Combination Tree-LSTM Network for Sentiment Analysis.” In Human Language Technologies as a Challenge for Computer Science and Linguistics, 397–401. Poznań, 2017.
http://ltc.amu.edu.pl/book/papers/PolEval2-2.pdf.
Molenda, Marek, Piotr Pęzik, and John Osborne. “Self-Repetitions in Learners’ Spoken Language: A Corpus-Based Study.” In Learner Corpus Research, New Perspectives and Applications, 1st ed. Bloomsbury Academic, 2017.
-
-
Pęzik, Piotr. “Exploring Phraseological Equivalence with Paralela.” In Polish-Language Parallel Corpora, edited by Ewa Gruszczyńska and Agnieszka Leńko-Szymańska, 67–81. Warsaw: Instytut Lingwistyki Stosowanej UW, 2016.
Download.
Pęzik, Piotr, and Mikołaj Deckert. “Time-Discretising Adverbials. Distributional Evidence of Conceptualisation Patterns.” In Conceptualizations of Time, edited by Barbara Lewandowska-Tomaszczyk, 295–316. Human Cognitive Processing 52. Amsterdam ; Philadelphia: John Benjamins Publishing Company, 2016.
-
-
Molenda, Marek, and Piotr Pęzik. “Extending the Definition of Confluence. A Corpus-Based Study of Advanced Learners’ Spoken Language.” In Insights into Technology Enhanced Language Pedagogy, 2015.
-
-
Rehm, Georg, Hans Uszkoreit, Sophia Ananiadou, Núria Bel, Audronė Bielevičienė, Lars Borin, António Branco, (…) Piotr Pęzik (…) et al. “The Strategic Impact of META-NET on the Regional, National and International Level.” In LREC 2014 Proceedings, 1517–24, 2014.
Pęzik, Piotr. “Wybrane aspekty reprezentatywności małych i średnich korpusów.” In Na Tropach Korpusów. W Poszukiwaniu Optymalnych Zbiorów Tekstów, edited by Wojciech Chlebda, 45–58. Opole, 2013.
Pęzik, Piotr. “Paradygmat Dystrybucyjny W Badaniach Frazeologicznych. Powtarzalność, Reprodukcja I Idiomatyzacja.” In Metodologie Językoznawstwa. Ewolucja Języka, Ewolucja Teorii Językoznawczych., edited by Piotr Stalmaszczyk, 141–60. Wydawnictwo Uniwersytetu Łódzkiego, 2013.
Lewandowska-Tomaszczyk, Barbara, Mirosław Bańko, Rafał L. Górski, Marek Łazinski, Piotr Pęzik, and Adam Przepiórkowski. “Narodowy Korpus Języka Polskiego: Geneza I Dzień Dzisiejszy.” In Narodowy Korpus Języka Polskiego: Geneza I Dzień Dzisiejszy, edited by Aadam Przepiórkowski, Mirosław Bańko, R. L. Górski, and Barbara Lewandowska-Tomaszczyk, 3–10, 2012.
-
Ogrodniczuk, Maciej, Piotr Pęzik, and Adam Przepiórkowski. “Towards a Comprehensive Open Repository of Polish Language Resources.” In Proceedings of the Eighth International Conference on Language Resources and Evaluation, LREC 2012, 3593–97. Istanbul: ELRA, 2012.
Pęzik, Piotr. “Towards the PELCRA Learner English Corpus.” In Corpus Data across Languages and Disciplines, edited by Piotr Pęzik, 28:33–42. Łódź Studies in Language. Peter Lang, 2012.
Przepiórkowski, Adam, Mirosław Bańko, Marek Łaziński, Rafał Górski, Barbara Lewandowska-Tomaszczyk, and Piotr Pęzik. “Practical Applications of the National Corpus of Polish.” Prace Filologiczne LXIII (2012): 231–39.
-
Pęzik, Piotr. “Język mówiony w NKJP.” In Narodowy Korpus Języka Polskiego, edited by Adam Przepiórkowski, Mirosław Bańko, Rafał Górski, and Barbara Lewandowska-Tomaszczyk, 37–47. Warszawa: Wydawnictwo Naukowe PWN, 2012.
http://nkjp.pl/settings/papers/NKJP_ksiazka.pdf.
Pęzik, Piotr. “NKJP w warsztacie tłumacza.” In Narodowy Korpus Języka Polskiego, edited by Adam Przepiórkowski, Mirosław Bańko, Rafał Górski, and Barbara Lewandowska-Tomaszczyk, 301–11. Warszawa: Wydawnictwo Naukowe PWN, 2012.
http://nkjp.pl/settings/papers/NKJP_ksiazka.pdf.
Pęzik, Piotr. “Wyszukiwarka PELCRA dla danych NKJP.” In Narodowy Korpus Języka Polskiego, edited by Adam Przepiórkowski, Mirosław Bańko, Rafał Górski, and Barbara Lewandowska-Tomaszczyk, 253–79. Warszawa: Wydawnictwo Naukowe PWN, 2012.
http://nkjp.pl/settings/papers/NKJP_ksiazka.pdf.
Pęzik, Piotr. “Providing Corpus Feedback for Translators with the PELCRA Search Engine for NKJP.” In Explorations across Languages and Corpora : PALC 2009, edited by Stanislaw Gozdz-Roszkowski, 135–44. Łódź Studies in Linguistics. Frankfurt am Main; New York: Peter Lang, 2011.
Pęzik, Piotr, Maciej Ogrodniczuk, and Adam Przepiórkowski. “Parallel and Spoken Corpora in an Open Repository of Polish Language Resources.” In Proceedings of the 5th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, edited by Zygmunt Vetulani, 511–15, 2011.
Przepiórkowski, Adam, Mirosław Bańko, Rafał Górski, Barbara Lewandowska-Tomaszczyk, and Piotr Pęzik. “National Corpus of Polish.” In Proceedings of the 5th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, edited by Zygmunt Vetulani, 259–63, 2011.
Thompson, Paul, John McNaught, Simonetta Montemagni, Nicoletta Calzolari, Riccardo del Gratta, Vivian Lee, Simone Marchi, Piotr Pęzik et al. “The BioLexicon: A Large-Scale Terminological Resource for Biomedical Text Mining.” BMC Bioinformatics 12 (2011): 397. doi:10.1186/1471-2105-12-397.
Pęzik, Piotr. “Computational and Corpus Linguistics.” In New Ways to Language, edited by Barbara Lewandowska-Tomaszczyk, 433–60. Łódź: Wydawnictwo Uniwersytetu Łódzkiego, 2010.
Rebholz-Schuhmann, D, S Kavaliauskas, and Piotr Pęzik. “PaperMaker: Validation of Biomedical Scientific Publications.” Bioinformatics (Oxford, England) 26, no. 7 (April 1, 2010): 982–84. doi:10.1093/bioinformatics/btq060.
Grego, Tiago,
Piotr Pęzik, Francisco M. Couto, and Dietrich Rebholz-Schuhmann. “Identification of Chemical Entities in Patent Documents.” In Distributed Computing, Artificial Intelligence, Bioinformatics, Soft Computing, and Ambient Assisted Living, edited by Sigeru Omatu, Miguel P. Rocha, José Bravo, Florentino Fernández, Emilio Corchado, Andrés Bustillo, and Juan M. Corchado, 5518:942–49. Berlin, Heidelberg: Springer Berlin Heidelberg, 2009.
http://www.springerlink.com/index/10.1007/978-3-642-02481-8_144.
Pęzik, Piotr. “Extraction of Multiword Expressions for Corpus-Based Discourse Analysis.” In Studies in Cognitive Corpus Linguistics, edited by Barbara Lewandowska-Tomaszczyk and Katarzyna Dziwirek. Frankfurt am Main; New York: P. Lang, 2009.
-
Przepiórkowski, Adam, Rafał L. Górski, Marek Łaziński, and
Piotr Pęzik. “Recent Developments in the National Corpus of Polish.” In NLP, Corpus Linguistics, Corpus Based Grammar Research: Proceedings of the Fifth International Conference, Smolenice, Slovakia, 25–27 November 2009, edited by Jana Levická and Radovan Garabík, 302–9. Brno: Tribun, 2009.
http://nlp.ipipan.waw.pl/ adamp/Papers/2009-slovko-nkjp/.
Trieschnigg, Dolf, Piotr Pęzik, Vivian Lee, Franciska de Jong, Wessel Kraaij, and Dietrich Rebholz-Schuhmann. “MeSH Up: Effective MeSH Text Classification for Improved Document Retrieval.” Bioinformatics (Oxford, England) 25, no. 11 (June 1, 2009): 1412–18. doi:10.1093/bioinformatics/btp249.
Trieschnigg, D., P. Pezik, V. Lee, F. de Jong, W. Kraaij, and D. Rebholz-Schuhmann. “Response to Comment on ‘MeSH-up: Effective MeSH Text Classification for Improved Document Retrieval.’” Bioinformatics 25, no. 20 (August 24, 2009): 2772–2772. doi:10.1093/bioinformatics/btp484.
Waagmeester, Andra, Piotr Pęzik, Susan Coort, Franck Tourniaire, Chris Evelo, and Dietrich Rebholz-Schuhmann. “Pathway Enrichment Based on Text Mining and Its Validation on Carotenoid and Vitamin A Metabolism.” Omics: A Journal of Integrative Biology 13, no. 5 (2009): 367–79. doi:10.1089/omi.2009.0029.
Kim, Jung-Jae, Piotr Pęzik, and Dietrich Rebholz-Schuhmann. “MedEvi: Retrieving Textual Evidence of Relations between Biomedical Concepts from Medline.” Bioinformatics (Oxford, England) 24, no. 11 (June 1, 2008): 1410–12. doi:10.1093/bioinformatics/btn117.
Pęzik, P., A. Jimeno-Yepes, V. Lee, and D. Rebholz-Schuhmann. “Static Dictionary Features for Term Polysemy Identification.” In Building and Evaluating Resources for Biomedical Text Mining, LREC Workshop, 2008.
Rebholz-Schuhmann, D., P. Pezik, V. Lee, J.J. Kim, R. del Gratta, Y. Sasaki, J. McNaught, et al. “BioLexicon: Towards a Reference Terminological Resource in the Biomedical Domain.” The 16th Annual International Conference on Intelligent Systems for Molecular Biology (ISMB-2008), 2008.
Jimeno, A., P. Pezik, and D. Rebholz-Schuhmann. “Information Retrieval and Information Extraction in Trec Genomics 2007.” The Sixteenth Text REtrieval Conference (TREC 2007) Proceedings. NIST Special Publication: SP, 2007, 274–274.
Pęzik, Piotr. “Lexis, the Lexicon, Terms, Idioms and Co-Occurrence Statistics - a Case Study.” edited by Jacek Walinski, Krzysztof Kredens, and Stanislaw Gozdz-Roszkowski. Lang, 2007.
Waliński, Jacek, and Piotr Pęzik. “Web Access Interface to the PELCRA Referential Corpus of Polish.” edited by Jacek Walinski, Krzysztof Kredens, and Stanislaw Gozdz-Roszkowski, 65–86. Lang, 2007.
Hardie, A., E. Levin, and P. Pezik. “Analiza Morfologiczno-Składniowa Korpusów.” In Podstawy Językoznawsta Korpusowego, edited by B. Lewandowska-Tomaszczyk, 75–94. Wydawnictwo Uniwersytetu Łódzkiego, 2005.
Wilson, Andrew, and P. Pęzik. “Systemy Anotacji Korpusów Jezykowych, Korpusów Równoleglych i Porównywalnych.” In Podstawy Jezykoznawstwa Korpusowego, edited by B. Lewandowska-Tomaszczyk, 61–74. Wydawnictwo Uniwersytetu Łódzkiego, 2005.
Uzar, Rafał, Piotr Pęzik, and Eric Levin. “Developing Relational Databases for Corpus Linguistics.” In Practical Applications in Language and Computers, edited by Barbara Lewandowska-Tomaszczyk. Frankfurt am Main; New York: Peter Lang, 2004.
Abiteboul, Serge, Peter Buneman, and Dan Suciu. Dane W Sieci Www: Od Relacji Do Modelu Semistrukturalnego i XML. Translated by Paweł Brągoszewski, Piotr Pęzik, and Sławomir Dzieniszewski, 2001.