Zadanie #4832

Przetestować WCRFT na danych z NKJP 1.1

Added by Adam Radziszewski about 10 years ago. Updated about 10 years ago.

Status:ZamkniętyStart date:06 Jul 2013
Priority:NormalnyDue date:06 Jul 2013
Assignee:Anna Gut% Done:

100%

Category:-
Target version:-

Description

U mnie na spocku znajdziesz skrypty do uczenia i testowania tagera: ../eliasz/train_wcrft_s2 i ../eliasz/tag_wcrft_s2. Skopiuj te skrypty do swojego NKJP-11.

W pierwszej kolejności trzeba wyuczyć tager na wszystkich dziesięciu foldach skryptem train_wcrft_s2. Niewykluczone, że trzeba będzie zrobić jakieś drobne zmiany w skrypcie (ścieżki), ale chyba nie będzie to konieczne. Uczenie koniecznie puść w screenie, to potrwa długo (być może nawet tydzień). Potem trzeba będzie puścić tagowanie (tag_wcrft_s2). To potrwa krócej, pewnie ze dwie godziny, nie pamiętam dokładnie. Gdy wszystko się skończy, w utworzonym podkatalogu wcrft_reana powinno być dziesięć plików o nazwach tagd##.xml z wynikami. Na tym należy puścić skrypt tagger-eval z repo corpus2. Jego wywołanie jest napisane w komentarzu do skryptu tag_wcrft_s2. Wyniki skryptu zapisz do pliku.


Related issues

Follows WCRFT - Zadanie #4830: Ponowna analiza morfologiczna danych z NKJP 1.1 Zamknięty 05 Jul 2013 05 Jul 2013

History

#1 Updated by Anna Gut about 10 years ago

  • Status changed from Nowy to Przypisany

Trwa uczenie...

#2 Updated by Anna Gut about 10 years ago

  • % Done changed from 0 to 50

Nauczył się już. Przeinstaluj proszę Morfeusza, bo potrzebuję jeszcze raz przetworzyć pliki do testana, aby odpalić testowanie tagera.

#3 Updated by Anna Gut about 10 years ago

Uczy się. Sprawdzałam wszystkie pliki czy się dobrze utworzyły - wydawały się ok. Sprawdź je proszę, jeśli coś będzie źle to zastopuję, poprawię i puszczę jeszcze raz.

#4 Updated by Anna Gut about 10 years ago

  • Status changed from Przypisany to Rozwiązany
  • % Done changed from 50 to 100

#5 Updated by Adam Radziszewski about 10 years ago

  • Status changed from Rozwiązany to Zamknięty

Główne wyniki spisałem na stronie Evaluation

Also available in: Atom PDF