Zadanie #541

Czytanie i zapis plików XML

Added by Adam Radziszewski about 13 years ago. Updated about 13 years ago.

Status:ZamkniętyStart date:21 Jul 2010
Priority:NormalnyDue date:
Assignee:Tomasz Śniatowski% Done:

0%

Category:-
Target version:-

Description

Narzędzie powinno umożliwiać odczyt i zapis w formacie XML-owym korpusu (XCES). Sprawa jest o tyle ważna, że bez tego nie można nawet przetestować konwersji tagsetu w obie strony. TaKIPI oraz Disaster mają liche implementacje readera (getline, regex itp.), ale można tam zajrzeć.

Stworzenie tego będzie wymagać przyjęcia jakieś reprezentacji zdania: #540.

http://nlp.pwr.wroc.pl/trac/private/disaster/browser/trunk/disaster/io/reader.py (ten moduł dawno temu pisałem, więc jest straszny)

http://nlp.pwr.wroc.pl/trac/private/disaster/browser/trunk/disaster/io/writer.py (j.w., ciut mniejsze zło, bo to zapis)

http://nlp.pwr.wroc.pl/trac/takipi/browser/trunk/Corpus/Corpus/XmlWriter.cpp (tu jest jeszcze bardziej rozproszone po plikach i obsługa niejednoznaczności segmentacji jest wszysta w zapis, więc też koszmar)

History

#1 Updated by Tomasz Śniatowski about 13 years ago

Przydałyby się małe sample tych XMLi

#2 Updated by Tomasz Śniatowski about 13 years ago

  • Status changed from Nowy to Zamknięty

Jest to zrobione. Ewentualne zmiany reprezentacji zdania nie powinny duzo zmienic w samej koncepcji czytnikow / zapisywaczy xcesa.

Also available in: Atom PDF