Zadanie #1496
Zapis i odczyt formatu IOB
Status: | Rozwiązany | Start date: | 05 May 2011 | |
---|---|---|---|---|
Priority: | Normalny | Due date: | ||
Assignee: | Tomasz Śniatowski | % Done: | 100% | |
Category: | - | |||
Target version: | - |
Description
Wariant formatu CCL, gdzie zamiast ann jest iob
History
#1 Updated by Tomasz Śniatowski over 12 years ago
Potrzebna jest jakas specyfikacja tego formatu
#2 Updated by Adam Radziszewski over 12 years ago
Proponuję format podobny do rft,colon. Konkretniej:
- format kolumnowy, niexmlowy,
- granicą zdań jest pusty wiersz,
- każdy wiersz składa się z kolumn orth, lemma, tag, iob_tags (tych nazw nigdzie nie ma w pliku)
- kolumna iob_tags zawiera oddzielone przecinkami zapisy '%s-%s' % (channel_name, iob_tag), np. 'NP-B', 'VP-O'; zapisy te są posortowane alfabetycznie wg nazw kanałów
- kolumny oddzielane są tabulatorami i tylko tabulatory pełnią tę funkcję (spacje mogą się pojawić w orthach w razie czego)
#3 Updated by Tomasz Śniatowski over 12 years ago
- Status changed from Nowy to Rozwiązany
- % Done changed from 0 to 100
Funkcjonuje to jako iob-chan