Zadanie #4698

Reimplementacja cech wordnetowych

Added by Michał Marcińczuk almost 10 years ago. Updated almost 10 years ago.

Status:ZamkniętyStart date:18 Apr 2013
Priority:NormalnyDue date:
Assignee:Michał Krautforst% Done:

100%

Category:-
Target version:Liner 2.3

Description

Należy zaimplementować dwa generatory dla cech opartych o wordnet:
  • synonym (odpowiednik obecnego syn)
  • hyperonym:n (odpowiednik obecnego hypn), gdzie n to liczba poziomów w górę po relacji hiperonimi.

Zasada ustalenia wartości dla cechy synonym

Ze Słowosieci wybierane są wszystkie synsety zawierające formę bazową słowa x. W zależności, ile synsetów zostało znalezionych, wykonywane są następujące operacje:
  • 0 synsetów --- wartość równa formie bazowej,
  • 1 synset --- pierwsza jednostka w kolejności alfabetycznej,
  • 2 lub więcej --- należy wybrać wszystkie jednostki, której pojawiają się we wszystkich synsetach. Jeżeli nie istnieje ani jedna taka jednostka, to wartością jest forma bazowa. W przeciwnym wypadku wybrana zostaje pierwsza jednostka w porządku alfabetycznym.

Zasady ustalenia wartości dla cechy hyperonym:n

Analogicznie do synonym, z tą różnicą, że wybierane są wszystkie synsety w odległości n od synsetów zawierających formę bazową słowa x. Dalsza procedura wyznaczenia jednostki jest taka sama jak w przypadku synonym.

Struktura Słowosieci powinna być wczytana z plików w formacie PWN (https://wordnet.princeton.edu/wordnet/documentation/). Słowosieć w formacie PWN jest do pobrania ze strony: http://www.nlp.pwr.wroc.pl/plwordnet/download/

extjwnl_kod_z_bledami.tar.gz (1.56 MB) Michał Krautforst, 29 Apr 2013 11:17

kpwr-1.1-nam-output-synhyp.iob - cechy wygenerowane przez obecną wersję linera (11.1 MB) Michał Krautforst, 06 May 2013 09:56

History

#1 Updated by Michał Krautforst almost 10 years ago

Jest problem z bibliteką extjwnl (http://extjwnl.sourceforge.net/), w załączniku kod który się wysypuje i biblioteka.
(Przed użyciem biblioteki, w pliku extjwnl-1.6.10/src/extjwnl/src/main/resources/net/sf/extjwnl/file_properties.xml, nalezy pod wartosc parametru dictionary_path wpisac sciezke do katalogu z wordnetem)
Przykłady wykorzystania API znajdują się w pliku extjwnl-1.6.10/src/utilities/src/main/java/net/sf/extjwnl/utilities/Examples.java

#2 Updated by Michał Marcińczuk almost 10 years ago

  • Target version changed from Liner 2.4 to Liner 2.3

#4 Updated by Michał Krautforst almost 10 years ago

  • % Done changed from 0 to 100

zrobione, wyniki wygenerowane z użyciem nerda korzystają jednak z innej wersji slowosieci więc są rozbieżnosci, lecz nowe wyniki zgadzają się z relacjami występującymi w słowosieci

#5 Updated by Michał Krautforst almost 10 years ago

  • Status changed from Przypisany to Rozwiązany

#6 Updated by Michał Marcińczuk almost 10 years ago

  • Status changed from Rozwiązany to Zamknięty

Also available in: Atom PDF