Fextor2 przykłady¶
Plik wejściowy:
Filozoficzne inspiracje literatury Organizatorzy zapraszają do udziału w sesji doktorantów wszystkich nowożytnych filologii oraz filozofii Celem konferencji jest zaprezentowanie tego w jaki sposób idee filozoficzne wkraczają do literatury przy czym organizatorom zależy na zbadaniu zarówno tego w jaki sposób aktualizują się związki w konkretnych utworach literackich jak i w określonych teoriach badań literackich i koncepcjach dzieła literackiego
fragment tekstu otagowanego znacznikami NKJP:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE chunkList SYSTEM "ccl.dtd"> <chunkList> <chunk id="ch1" type="p"> <sentence id="s1"> <tok> <orth>Filozoficzne</orth> <lex disamb="1"><base>filozoficzny</base><ctag>adj:sg:nom:n:pos</ctag></lex> </tok> <tok> <orth>inspiracje</orth> <lex disamb="1"><base>inspiracja</base><ctag>subst:pl:nom:f</ctag></lex> </tok> <tok> <orth>literatury</orth> <lex disamb="1"><base>literatura</base><ctag>subst:sg:gen:f</ctag></lex> </tok> <tok> <orth>Organizatorzy</orth> <lex disamb="1"><base>organizator</base><ctag>subst:pl:nom:m1</ctag></lex> </tok> <tok> <orth>zapraszają</orth> <lex disamb="1"><base>zapraszać</base><ctag>fin:pl:ter:imperf</ctag></lex> </tok>
Plik wynikowy fextor dla polecenia:
fextor({"features":"base orth subst_count"})
(analiza lematów (base), form gramatycznych (orth) oraz liczby rzeczowników (subst_count):
{"base": {"filologia": 1, "filozofia": 1, "utwór": 1, "idea": 1, "wszyscy": 1, "zapraszać": 1, "sesja": 1, "teoria": 1, "dzieło": 1, "zbadanie": 1, "przy": 1, "zależeć": 1, "udział": 1, "to": 2, "jak": 3, "aktualizować": 1, "inspiracja": 1, "do": 2, "literatura": 2, "zaprezentować": 1, "określony": 1, "się": 1, "cel": 1, "nowożytny": 1, "filozoficzny": 2, "organizator": 2, "konkretny": 1, "być": 1, "konferencja": 1, "badanie": 1, "zarówno": 1, "koncepcja": 1, "i": 2, "czym": 1, "oraz": 1, "doktorant": 1, "literacki": 3, "w": 5, "na": 1, "związek": 1, "wkraczać": 1, "sposób": 2}, "lex_classes": {"subst": 25}, "orth": {"literackiego": 1, "filologii": 1, "filozofii": 1, "utworach": 1, "sesji": 1, "jest": 1, "badań": 1, "związki": 1, "doktorantów": 1, "na": 1, "dzieła": 1, "Filozoficzne": 1, "nowożytnych": 1, "Organizatorzy": 1, "jak": 1, "idee": 1, "zbadaniu": 1, "się": 1, "Celem": 1, "do": 2, "inspiracje": 1, "teoriach": 1, "aktualizują": 1, "udziału": 1, "określonych": 1, "wszystkich": 1, "filozoficzne": 1, "tego": 2, "literackich": 2, "konferencji": 1, "konkretnych": 1, "koncepcjach": 1, "jaki": 2, "literatury": 2, "wkraczają": 1, "zarówno": 1, "i": 2, "czym": 1, "oraz": 1, "zaprezentowanie": 1, "zależy": 1, "w": 5, "przy": 1, "zapraszają": 1, "sposób": 2, "organizatorom": 1}}
powyższy wynik przy zastosowaniu filtracji dla cech orth:
fextor({"features":"base orth subst_count", "filters": {"orth": {"type": "lemma_stoplist", "args": {"stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno" ], "excluding": true}}}})
będzie wyglądał następująco:
"orth": {"filologii": 1, "filozofii": 1, "utworach": 1, "sesji": 1, "jest": 1, "badań": 1, "związki": 1, "doktorantów": 1, "na": 1, "dzieła": 1, "nowożytnych": 1, "zbadaniu": 1, "idee": 1, "się": 1, "do": 2, "inspiracje": 1, "teoriach": 1, "aktualizują": 1, "udziału": 1, "określonych": 1, "wszystkich": 1, "zależy": 1, "konkretnych": 1, "koncepcjach": 1, "wkraczają": 1, "i": 2, "czym": 1, "oraz": 1, "zaprezentowanie": 1, "przy": 1, "konferencji": 1, "zapraszają": 1, "sposób": 2, "Celem": 1}
zgodnie z poleceniem: "stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno"]
w zestawieniu dla form gramatycznych (orth) nie zostały uwzględnione lematy (oraz ich formy gramatyczne) - w nawiasach podano formy pominięte, w porównaniu do wyników wywołania polecenia bez użycia opcji "filters") :
- jak ("jak": 3)
- literacki ("literackiego": 1, "literackich": 2)
- literatura ("literatury": 2)
- w ("w": 5)
- to ("tego": 2)
- organizator ("Organizatorzy": 1, "organizatorom": 1)
- filozoficzny ("Filozoficzne": 1, "filozoficzne": 1)
- zarówno ("zarówno": 1)
Z kolei, jeśli parametr "exclude" przyjmie wartość "false"
fextor({"features":"base orth subst_count", "filters": {"orth": {"type": "lemma_stoplist", "args": {"stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno" ], "excluding": false}}}})
w zestawieniu uwzględnione zostaną wyłącznie lematy (i ich formy gramatyczne), wymienione w stoplist
"orth": {"zarówno": 1, "literackiego": 1, "literatury": 2, "Filozoficzne": 1, "jaki": 2, "literackich": 2, "Organizatorzy": 1, "filozoficzne": 1, "w": 5, "tego": 2, "jak": 1, "organizatorom": 1}