polska wersja English version
Słowosieć
wordnet języka polskiego

O Słowosieci

Słowosieć (z ang. wordnet) to sieć semantyczna, która odzwierciedla system leksykalny języka polskiego. Węzłami Słowosieci są jednostki leksykalne, czyli wyrazy i ich znaczenia, różnorako połączone relacjami semantycznymi ze ściśle określonego repertuaru. Na przykład kot jest hiponimem (podklasą) zwierzęcia, pazur i łapa są w relacji meronimii (część/całość), a wchodzić i wychodzić są antonimami. Jednostka leksykalna uzyskuje znaczenie przez odniesienie do innych jednostek leksykalnych w obrębie systemu, a możemy o niej wnioskować na podstawie przypisanych jej relacji. Na przykład kota definiuje się jako rodzaj zwierzęcia, łapę jako całość, której częścią jest pazur, a czynności wchodzenia i wychodzenia jako przeciwieństwa.

Struktura wordnetu jest dostosowana do potrzeb automatycznej analizy tekstów. Jest to w istocie podstawowy zasób językowy, ważny w badaniach nad sztuczną inteligencją. Dzięki Słowosieci będzie łatwiej uczyć komputery rozumieć polszczyznę i Polaków.

Pierwszy na świecie wordnet (WordNet) powstał w końcu lat 80. na Uniwersytecie Princeton. W ostatnim dwudziestoleciu w ślady twórców WordNetu poszły setki zespołów badawczych. Jest wśród nich Grupa Naukowa G4.19 Politechniki Wrocławskiej. Nietypowo, Słowosieć jest budowana nie metodą tłumaczenia princetońskiego WordNetu, tylko od podstaw, wspólnym wysiłkiem leksykografów i informatyków. W roku 2009 udostępniona została w Internecie pierwsza wersja, licząca około 27000 jednostek leksykalnych. Obecnie Słowosieć opisuje 178000 rzeczowników, czasowników, przymiotników i przysłówków, zawiera niemal 259000 unikatowych znaczeń i ponad 600000 instancji relacji. Jest największym wordnetem na świecie. Decyzją władz Politechniki Wrocławskiej Słowosieć jest udostępniana nieodpłatnie do wszelkich zastosowań (również komercyjnych) w oparciu o licencję wzorowaną na licencji Princeton WordNet.

Aby otrzymać pliki źródłowe Słowosieci, należy zarejestrować się poprzez formularz rejestracyjny poniżej. Użytkownicy mogą przeglądać Słowosieć również za pomocą aplikacji mobilnej oraz WordNetlLoom-Viewera. (aplikacji umożliwiającej podgląd siatki znaczeń Słowosieci). Programiści mają także dostęp do Słowosieci na poziomie usługi sieciowej.

Słowosieć rozbudowywana jest dzięki grantom Ministerstwa Nauki i Szkolnictwa Wyższego i Funduszom Unijnym (pełna lista – poniżej). Dążymy do zbudowania słownika pojęciowego w pełni reprezentatywnego dla współczesnego języka polskiego, porównywalnego z największymi wordnetami na świecie. Oznacza to jednak, że Słowosieć w kształcie na dzisiaj nie jest jeszcze ukończona; nie jest ani kompletna, ani wolna od usterek i błędów. Dużo pracy jeszcze przed nami. Dołożyliśmy jednak wszelkich starań, by udostępniana obecnie wersja 3.0 jakością nie ustępowała wielkim wordnetom światowym – WordNetowi Uniwersytetu Princeton, EuroWordNetowi (wspólna inicjatywa kilkunastu państw członkowskich Unii Europejskiej) czy GermaNetowi (Uniwersytet w Tybindze).

Projekty, w ramach których była lub jest rozwijana Słowosieć:

Autorzy

Kierownik projektu:

  • dr inż Maciej Piasecki

Koncepcja Słowosieci i koordynacja prac lingwistycznych:

  • dr Magdalena Derwojedowa
  • dr Bożena Hojka
  • dr Marek Maziarz
  • dr inż. Maciej Piasecki
  • dr Joanna Rabiega-Wiśniewska
  • dr Ewa Rudnicka
  • prof. Stanisław Szpakowicz
  • dr Magdalena Zawisławska

Leksykografowie:

  • mgr Jan Bieda
  • mgr Joanna Bilińska
  • mgr Marta Dobrowolska
  • mgr Agnieszka Dziob
  • mgr Maria Głąbska
  • dr Ewa Gwiazdecka
  • mgr Amelia Kiełbawska
  • mgr Dorota Lewandowska
  • mgr Aleksandra Pawlikowska
  • Natalia Podbielska
  • mgr Anna Romańska
  • mgr Urszula Rezler
  • mgr Joanna Stankiewicz
  • mgr Tomasz Stępień
  • mgr Jan Wieczorek
  • lic. Justyna Wieczorek
  • dr Paulina Witkowska
  • dr Beata Wójtowicz

Główni wykonawcy części informatycznej

  • mgr inż. Jacek Bochenek
  • dr inż. Bartosz Broda
  • inż. Łukasz Burdka
  • mgr inż. Łukasz Jastrzębski
  • mgr inż. Michał Kaliński
  • mgr inż. Paweł Kędzia
  • mgr inż. Paweł Koczan
  • mgr inż. Roman Kurc
  • dr inż. Michał Marcińczuk
  • mgr inż. Wojciech Mazur
  • mgr inż. Adam Musiał
  • mgr inż. Tomasz Naskręt
  • inż. Adam Pawlaczek
  • dr inż. Maciej Piasecki
  • mgr inż. Radosław Ramocki
  • mgr inż. Michał Stanek
  • prof. Stanisław Szpakowicz
  • mgr inż. Tomasz Śniatowski
  • mgr inż. Michał Wendelberger
  • Podziękowania

    Specjalne podziękowania za krytyczne uwagi składamy Pani Profesor Elżbiecie Hajnicz z IPI PAN.

    Kontakt

    e-mail: plwordnet_at_pwr_dot_wroc_dot_pl (adres zmieniony)

    Cytowanie

    Rudnicka E., Maziarz M., Piasecki M., Szpakowicz S. (2012) Mapping plWordNet onto Princeton WordNet. (doc)

    Maziarz M., Piasecki M., Szpakowicz S. (2012) Approaching plWordNet 2.0. Proceedings of the 6th Global Wordnet Conference, Matsue, 9-13th January, 2012, Japan (Accepted for publishing). (pdf)

    Piasecki M., Szpakowicz S., Broda B. A Wordnet from the Ground Up. Wroclaw : Oficyna Wydawnicza Politechniki Wroclawskiej, 2009. (pdf)

    Publikacje

    Pozostałe publikacje związane ze Słowosiecią znajdują się na stronie grupy G4.19.

    Pobranie aktualnej wersji 3.0

    Uprzejmie prosimy o wypełnienie poniższego formularza, co pozwoli nam na wysyłanie informacji o zmianach i uaktualnieniach. Wiedza o sposobach wykorzystania Słowosieci ułatwi nam jej dalszy rozwój. Na podany adres e-mail zostanie wysłany link do pobrania aplikacji.

    Imię i nazwisko:
    E-mail:
    Organizacja:
    Cel użycia Słowosieci:
    chcę otrzymywać powiadomienia o nowych wersjach.

    Wersje archiwalne