Zadanie #1496

Zapis i odczyt formatu IOB

Added by Adam Radziszewski over 8 years ago. Updated over 8 years ago.

Status:RozwiązanyStart date:05 May 2011
Priority:NormalnyDue date:
Assignee:Tomasz Śniatowski% Done:

100%

Category:-
Target version:-

Description

Wariant formatu CCL, gdzie zamiast ann jest iob

History

#1 Updated by Tomasz Śniatowski over 8 years ago

Potrzebna jest jakas specyfikacja tego formatu

#2 Updated by Adam Radziszewski over 8 years ago

Proponuję format podobny do rft,colon. Konkretniej:
  • format kolumnowy, niexmlowy,
  • granicą zdań jest pusty wiersz,
  • każdy wiersz składa się z kolumn orth, lemma, tag, iob_tags (tych nazw nigdzie nie ma w pliku)
  • kolumna iob_tags zawiera oddzielone przecinkami zapisy '%s-%s' % (channel_name, iob_tag), np. 'NP-B', 'VP-O'; zapisy te są posortowane alfabetycznie wg nazw kanałów
  • kolumny oddzielane są tabulatorami i tylko tabulatory pełnią tę funkcję (spacje mogą się pojawić w orthach w razie czego)

#3 Updated by Tomasz Śniatowski over 8 years ago

  • Status changed from Nowy to Rozwiązany
  • % Done changed from 0 to 100

Funkcjonuje to jako iob-chan

Also available in: Atom PDF