Zadanie #541
Czytanie i zapis plików XML
Status: | Zamknięty | Start date: | 21 Jul 2010 | |
---|---|---|---|---|
Priority: | Normalny | Due date: | ||
Assignee: | Tomasz Śniatowski | % Done: | 0% | |
Category: | - | |||
Target version: | - |
Description
Narzędzie powinno umożliwiać odczyt i zapis w formacie XML-owym korpusu (XCES). Sprawa jest o tyle ważna, że bez tego nie można nawet przetestować konwersji tagsetu w obie strony. TaKIPI oraz Disaster mają liche implementacje readera (getline, regex itp.), ale można tam zajrzeć.
Stworzenie tego będzie wymagać przyjęcia jakieś reprezentacji zdania: #540.
http://nlp.pwr.wroc.pl/trac/private/disaster/browser/trunk/disaster/io/reader.py (ten moduł dawno temu pisałem, więc jest straszny)
http://nlp.pwr.wroc.pl/trac/private/disaster/browser/trunk/disaster/io/writer.py (j.w., ciut mniejsze zło, bo to zapis)
http://nlp.pwr.wroc.pl/trac/takipi/browser/trunk/Corpus/Corpus/XmlWriter.cpp (tu jest jeszcze bardziej rozproszone po plikach i obsługa niejednoznaczności segmentacji jest wszysta w zapis, więc też koszmar)
History
#1 Updated by Tomasz Śniatowski about 13 years ago
Przydałyby się małe sample tych XMLi
#2 Updated by Tomasz Śniatowski about 13 years ago
- Status changed from Nowy to Zamknięty
Jest to zrobione. Ewentualne zmiany reprezentacji zdania nie powinny duzo zmienic w samej koncepcji czytnikow / zapisywaczy xcesa.