Zadanie #8798

Brak obsługi XCES

Added by Anonimowy Użytkownik about 1 month ago.

Status:NowyStart date:31 Dec 2019
Priority:NormalnyDue date:
Assignee:-% Done:

0%

Category:-
Target version:-

Description

maca-analyser nie przetwarza danych tekstowych na XCES - wyrzuca puste tagi, np.:
- input

echo "Jeśli poświęcisz wolność, by zyskać bezpieczeństwo, stracisz oba." | maca-analyse -qs morfeusz-nkjp-official -o xces > out.xml

- output
<!DOCTYPE cesAna SYSTEM "xcesAnaIPI.dtd">
<cesAna xmlns:xlink="http://www.w3.org/1999/xlink" version="1.0" type="lex disamb">
<chunkList>
  <chunk type="s">
  </chunk>
 </chunk>
</chunkList>
</cesAna>

Poprawnie działa przetwarzanie danych w formacie premorph, np.:
- input

maca-analyse -q morfeusz-nkjp-official -i text -o premorph < przedwiosnie.txt > out1.xml
maca-analyse -q morfeusz-nkjp-official -i premorph-stream -o xces < out1.xml > out2.xml

- output
 <tok>
  <orth>zbiedzonego</orth>
  <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m1:perf:aff</ctag></lex>
  <lex><base>zbiedzić</base><ctag>ppas:sg:acc:m1:perf:aff</ctag></lex>
  <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m2:perf:aff</ctag></lex>
  <lex><base>zbiedzić</base><ctag>ppas:sg:acc:m2:perf:aff</ctag></lex>
  <lex><base>zbiedzić</base><ctag>ppas:sg:gen:m3:perf:aff</ctag></lex>
  <lex><base>zbiedzić</base><ctag>ppas:sg:gen:n:perf:aff</ctag></lex>
 </tok>
 <tok>
  <orth>tłumu</orth>
  <lex><base>tłum</base><ctag>subst:sg:gen:m3</ctag></lex>
 </tok>

Czy to problem z MAC-ą, czy może już coś na poziomie Corpus2Writerów? I jak sobie z tym poradzić?

Also available in: Atom PDF