Czasownik wchodzi w następujące relacje leksykalno-semantyczne:

 

1. Relacje konstytutywne:

  • hiponimia / hiperonimia (iść → przemieszczać się);
  • meronima / holonimia czasownikowa (jeść → przełykać):
  • stanowość (bieleć się → biały);
  • procesywność (pobrudzić się →  brudny);
  • kauzatywność (poić → pić);
  • inchoatywność (zasnąć → spać);
  • presupozycja (umrzeć → żyć);
  • uprzedniość (siąść → leżeć | stać);
  • wielokrotność:

- dystrybutywność (pozabijać →  zabić),
- iteratywność (jadać → jeść).

2. Relacje jednostek leksykalnych:

  • aspektowość:

- czysta (budować wybudować),

- wtórna (pozabijać zabijać);

  • antonimia:

- komplementarna (wrócić z tarczą wrócić na tarczy),

- właściwa (wchodzić wychodzić);

  • konwersja (sprzedawać kupować);
  • derywacyjność (odwadniać ← woda);
  • zawieranie roli (V N):

- obiekt | pacjens (kartkować kartka),

- instrument (solić sól),

- rezultat (portretować portret),

- miejsce i czas (garażować garaż),

- czas (nocować noc).

 

3. Pozostałe relacje

  • bliskoznaczność (syninimia między jednostkami o istotnie różnych rejestrach stylistycznych: kochać sięobcować (cieleśnie)),
  • obiekt
  • subiekt
  • sposób
  • okoliczność
  • fuzzynimia synsetów (służyć ↔ cel).

 

Narzędzia

NazwaOpisOpiekun
Inforex Webowy system do zarządzania i anotacji korpusów tekstowych Michał Marcińczuk
Liner2 Narzędzie do rozpoznawania jednostek identyfikacyjnych i wyrażeń temporalnych w tekście dla j. polskim Michał Marcińczuk
SpatialPL Narzędzie do rozpoznawania wyrażeń przestrzennych w tekście dla j. polskim Michał Marcińczuk

Zasoby

NazwaOpisOpiekun
KPWr Korpus plików tekstowych anotowanych na różnych poziomiach (frazy, słowa kluczowe, jednostki identyfikacyjne, wyrażenia temporalne i przestrzenne, sytuacje, anafora, WSD) Michał Marcińczuk
Marcin Oleksy
Słowosieć Słownik semantyczny, który odzwierciedla system leksykalny języka polskiego. Obecnie zawiera 176 000 rzeczowników, czasowników i przymiotników, 255 000 znaczeń oraz 600 000 relacji. Jest już największym wordnetem na świecie i nieustannie się rozrasta. Maciej Piasecki
Acoustic Data Building Toolset

Acoustic Data Building Toolset for Easy Experimentation with Neural Network-based Speech Recognition in Polish and English

Jerzy Sas
CLARIN_PRECOMB Data set for experimenting with phoneme recognition using a combination of CNN for Polish Jerzy Sas


Keyword extraction framework

Keyword extraction framework for Polish which allows analyzing various methods of extraction with KPWr corpus transformed to meet framework requirements Jerzy Sas

Wytyczne

 

maciej [dot] piasecki [at] pwr [dot] wroc [dot] pl

Projects

  1. plWordNet 1.0 (Słowosieć 1.0)
    Name Automatic methods of constructing semantic network of Polish lexems for the purposes of natural language processing.
    Period from 2005-10-30 to 2008-10-30 Number 3 T11C 018 29
    Budget 366 900,00 PLN Leader Maciej Piasecki, PhD
  2. plWordNet 2.0 (Słowosieć 2.0)
    Name Construction of lexical resources with the help of recognition of semantic relations in text corpora on the basis of morpho-syntactic and semantic data.
    Period from 2009-10-30 to 2012-10-30 Number N N516 068637
    Budget 406 960,00 PLN Leader Maciej Piasecki, PhD
  3. NEKST
    Name Adaptive system supporting solving problems on the basis of content analysis of electronic documents.
    Period from 2010-01-01 to 2014-07-01 Number POIG.01.01.02-14-013/09
    Budget 4 110 743,00 PLN (dla PWr) Leader Maciej Piasecki, PhD
  4. SyNaT
    Name SyNaT: Research Task: “Construction of an open, repository hosting and communication platform for the network knowledge resources for science, education and open knowledge society”
    Period from 2010-08-16 to 2014-07-31 Number POIG.01.01.02-14-013/09
    Budget 2 800 000,00 PLN (for PWr) Leader Maciej Piasecki, PhD
  5. CLARIN-PL
    Name CLARIN-PL: Polish part of the CLARIN ERIC research infrastructure Common Language Resources and Technology Infrastructure
    Period from 2013-01-01 to 2015-04-30 Number 6358/IA/119/2013
    Budget 16 500 000,00 PLN Leader Maciej Piasecki, PhD
    (Polish National Coordinator nominated by MNiSW)
  6. CLARIN-PL support
    Name Designing research methodology for the development of CLARIN language technology infrastructure and disseminating CLARIN research infrastructure.
    Period from 2015-02-16 to 2016-04-30 Number 3255/CLARIN ERIC/2015/0
    Budget 1 000 000,00 PLN Leader Maciej Piasecki, PhD

About us

We are an academic research group gathering people interested in the areas of linguistics, computational linguistics and natural language engineering including language technologies. G4.19 group consists of researchers, Phd students and students. Our team functions mainly within Artificial Intelligence Department at the Institute of Informatics, Wrocław University of Technology, but some of its members have different affiliations and work in Ottawa, Warsaw and Gdańsk. We are involved both in research as well as in the development and implementation of tools designed for the computer-based natural language processing. We are specially interested in the development of basic tools and resources for the Polish language.

Our interests include:

  • the construction of wordnet — a kind of an electronic thesaurus — for the Polish language (Słowosieć - plWordNet) on the basis of the semi-automatic method applied to very big Polish language corpora (collections of documents written in Polish); the developed method is applied under the supervision of a team of linguists and with the help of the tools designed by us for the editing of wordnet (WordnetLoom) and the semi-automatic wordnet extension (WordnetWeaver),
  • automatic lexical semantics knowledge extraction from text corpora — including algorithms for the automatic extraction of semantic relations linking words with big text corpora,
  • morpho-syntactic analysis — including especially the so called tagging that is disambiguating of the morpho-syntactic description of words in the text  — we have constructed and we are constantly developing a tagger for Polish called TaKIPI,
  • shallow syntactic analysis — the development of tools for shallow syntactic analysis for Polish,
  • word sense disambiguation,
  • information extraction — recognizing identification units, relations and events in domain documents,
  • hand-writing recognition — on the level of picture analysis and on the level of the further correction of the results of recognition relying on different types of language models based text corpora.


We have carried out and we are currently working on a number of research projects financed by the Ministry of Science and Higher Education as well as by the European Union, for instance:

  • "Półautomatyczna konstrukcja zasobów leksykalnych przez rozpoznawanie relacji semantycznych na podstawie danych morfo-syntaktycznych i semantycznych w korpusach tekstu" – 'Semi-automatic construction of lexical resources via semantic relations recognition based on morpho-syntactic and semantic data in text corpora'
  • "Adaptacyjny system wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych" – 'An adaptation system fostering problem-solving on the basis of content analysis of the available electronic sources'


We offer access to a number of tools and language resources for the Polish language:

We are the part of the European research network CLARIN and we are coordinating the activities of the Polish sub-network of CLARIN.

Our mission

  • research in the area of computational linguistics and natural language engineering with a special emphasis put on the pecularity of Polish language,
  • the development and implementation of tools for the computer-based Polish language processing,
  • construction and dissemination of language resources for Polish,
  • wide scientific cooperation in the construction of basic tools and resources for Polish,
  • the popularization of knowledge about the applications of computational linguistics and natural language engineering methods in different science areas.