Zadanie #4833

Analiza morfologiczna Polimorfem danych z NKJP 1.1

Added by Adam Radziszewski almost 9 years ago. Updated almost 9 years ago.

Status:ZamkniętyStart date:09 Jul 2013
Priority:NormalnyDue date:
Assignee:Anna Gut% Done:

100%

Category:-
Target version:-

Description

Zadanie wygląda analogiczne do poprzedniego, tym razem używamy Polimorfa. W systemie chwilowo go zainstalowałem (na miejsce poprzedniego Morfeusza — SGJP). Maca obsługuje Polimorfa przy pomocy konfiguracji polimorf-nkjp. Wszędzie tam, gdzie dotychczas była wpisana konfiguracja morfeusz-nkjp-official należy użyć tej nowej.

Pliki plaintextowe już są w folds/test##.txt. Należy je przeanalizować Macą w konfiguracji morfeusz-nkjp-official do katalogu testana-polimorf (nazwy jak wcześniej — test##.xml). Możesz zrobić kopię poprzedniego skryptu i zmienić nazwę konfiguracji Macy i katalogu docelowego.

Dane uczące i reanalyse. Poprzednio wystarczyło uruchomić skrypt reanalyse i przerobić wszystkie pliki folds/train##.xml. Teraz sytuacja jest podobna, ale w skrypcie reanalyse trzeba zmienić nazwę konfiguracji Macy na polimorf-nkjp. Możesz skopiować ten skrypt tutaj (wraz z towarzyszącym mu skryptem pytonowym). Tym razem reanalyse (zmienione) uruchamiasz tak, by brało też z folds/train##.xml, ale generowało wyniki do reana-polimorf/train##.xml.

Podobnie jak ostatnio, na końcu też rzuć okiem, czy pliki wyglądają zdrowo.

History

#1 Updated by Anna Gut almost 9 years ago

  • Status changed from Nowy to Przypisany
  • % Done changed from 0 to 50

#2 Updated by Anna Gut almost 9 years ago

  • Status changed from Przypisany to Rozwiązany
  • % Done changed from 50 to 100

Rzuć okiem, czy wszystko jest ok, z tego co sprawdzałam, to wydaje mi się, że tak.

#3 Updated by Adam Radziszewski almost 9 years ago

  • Status changed from Rozwiązany to Przypisany

Nowe dane podzielone już na foldy są w pliku NKJP-11.7z w katalogu NKJP-11. Zanim to rozpakujesz, wyrzuć wszystkie dane z wszystkich podkatalogów (skrypty zostaw), by upewnić się, że nie będzie pomyłki. W sumie wszystkie pliki XML.

#4 Updated by Anna Gut almost 9 years ago

  • Status changed from Przypisany to Rozwiązany

#5 Updated by Adam Radziszewski almost 9 years ago

  • Status changed from Rozwiązany to Zamknięty

Przywróciłem na spocku Morfeusza SGJP

Also available in: Atom PDF