Zadanie #4650

Reimplementacja prostych cech ortograficzny i morfologicznych

Added by Michał Marcińczuk over 10 years ago. Updated over 10 years ago.

Status:ZamkniętyStart date:19 Mar 2013
Priority:WysokiDue date:
Assignee:Michał Krautforst% Done:

100%

Category:-
Target version:Liner 2.3

Description

-feature orth
-feature base
-feature ctag
-feature class
-feature case
-feature number
-feature gender
-feature pattern
-feature prefix-1
-feature prefix-2
-feature prefix-3
-feature prefix-4
-feature suffix-1
-feature suffix-2
-feature suffix-3
-feature suffix-4
-feature starts_with_upper_case
-feature starts_with_lower_case
-feature starts_with_symbol
-feature starts_with_digit
-feature has_upper_case
-feature has_lower_case
-feature has_symbol
-feature has_digit

W celu sprawdzenia poprawności generowanych reguł, należy przekonwertować plik kpwr-1.1-nam.iob (http://www.nlp.pwr.wroc.pl/redmine/projects/infinitycorpus/files) przy pomocy poniższego polecenia i porównać z plikiem kpwr-1.1-nam-simple.iob:

./liner2.sh convert -ini features-cicling-simple.ini -i iob -f kpwr-1.1-nam.iob -t kpwr-1.1-nam-output.iob -o iob

Czas konwersji pliku przy użyciu NerdFeatureGenerator:

real    0m45.978s
user    0m48.467s
sys    0m1.216s

kpwr-1.1-nam-simple.iob.7z - Korpus KPWr 1.1 w formacie IOB z cechami (1.18 MB) Michał Marcińczuk, 20 Mar 2013 08:47

features-cicling-simple.ini Magnifier - Pliki ini z cechami (491 Bytes) Michał Marcińczuk, 20 Mar 2013 08:47

mm-synat-liner2.pdf (889 KB) Michał Marcińczuk, 20 Mar 2013 14:44


Related issues

Related to Liner2 — jednostki identyfikacyjne, TImeX, wyznaczniki sytuacji - Zadanie #4649: Reimplementacja generatora cech dla tokenów w Javie Zamknięty 19 Mar 2013

History

#1 Updated by Michał Marcińczuk over 10 years ago

  • Subject changed from Reimplementacja prosty cech ortograficzny i morfologicznych to Reimplementacja prostych cech ortograficzny i morfologicznych

#3 Updated by Michał Marcińczuk over 10 years ago

  • Status changed from Nowy to Przypisany
  • Assignee set to Michał Krautforst

#4 Updated by Michał Marcińczuk over 10 years ago

  • Priority changed from Normalny to Wysoki

#6 Updated by Michał Marcińczuk over 10 years ago

  • Target version changed from Liner 2.4 to Liner 2.3

#7 Updated by Michał Krautforst over 10 years ago

  • Status changed from Przypisany to Rozwiązany
  • % Done changed from 0 to 100

#8 Updated by Michał Marcińczuk over 10 years ago

  • Status changed from Rozwiązany to Zamknięty

Also available in: Atom PDF