Zadanie #8798
Brak obsługi XCES
Status: | Nowy | Start date: | 31 Dec 2019 | |
---|---|---|---|---|
Priority: | Normalny | Due date: | ||
Assignee: | - | % Done: | 0% | |
Category: | - | |||
Target version: | - |
Description
maca-analyser nie przetwarza danych tekstowych na XCES - wyrzuca puste tagi, np.:
- input
echo "Jeśli poświęcisz wolność, by zyskać bezpieczeństwo, stracisz oba." | maca-analyse -qs morfeusz-nkjp-official -o xces > out.xml
- output
<!DOCTYPE cesAna SYSTEM "xcesAnaIPI.dtd"> <cesAna xmlns:xlink="http://www.w3.org/1999/xlink" version="1.0" type="lex disamb"> <chunkList> <chunk type="s"> </chunk> </chunk> </chunkList> </cesAna>
Poprawnie działa przetwarzanie danych w formacie premorph, np.:
- input
maca-analyse -q morfeusz-nkjp-official -i text -o premorph < przedwiosnie.txt > out1.xml maca-analyse -q morfeusz-nkjp-official -i premorph-stream -o xces < out1.xml > out2.xml
- output
<tok> <orth>zbiedzonego</orth> <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m1:perf:aff</ctag></lex> <lex><base>zbiedzić</base><ctag>ppas:sg:acc:m1:perf:aff</ctag></lex> <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m2:perf:aff</ctag></lex> <lex><base>zbiedzić</base><ctag>ppas:sg:acc:m2:perf:aff</ctag></lex> <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m3:perf:aff</ctag></lex> <lex><base>zbiedzić</base><ctag>ppas:sg:gen:n:perf:aff</ctag></lex> </tok> <tok> <orth>tłumu</orth> <lex><base>tłum</base><ctag>subst:sg:gen:m3</ctag></lex> </tok>
Czy to problem z MAC-ą, czy może już coś na poziomie Corpus2Writerów? I jak sobie z tym poradzić?