Fextor2 przykłady

Plik wejściowy:

Filozoficzne inspiracje literatury Organizatorzy zapraszają do udziału w sesji doktorantów wszystkich nowożytnych filologii oraz filozofii 
Celem konferencji jest zaprezentowanie tego w jaki sposób idee filozoficzne wkraczają do literatury przy czym organizatorom zależy 
na zbadaniu zarówno tego w jaki sposób aktualizują się związki w konkretnych utworach literackich jak i w określonych teoriach badań literackich 
i koncepcjach dzieła literackiego

fragment tekstu otagowanego znacznikami NKJP:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE chunkList SYSTEM "ccl.dtd">
<chunkList>
 <chunk id="ch1" type="p">
  <sentence id="s1">
   <tok>
    <orth>Filozoficzne</orth>
    <lex disamb="1"><base>filozoficzny</base><ctag>adj:sg:nom:n:pos</ctag></lex>
   </tok>
   <tok>
    <orth>inspiracje</orth>
    <lex disamb="1"><base>inspiracja</base><ctag>subst:pl:nom:f</ctag></lex>
   </tok>
   <tok>
    <orth>literatury</orth>
    <lex disamb="1"><base>literatura</base><ctag>subst:sg:gen:f</ctag></lex>
   </tok>
   <tok>
    <orth>Organizatorzy</orth>
    <lex disamb="1"><base>organizator</base><ctag>subst:pl:nom:m1</ctag></lex>
   </tok>
   <tok>
    <orth>zapraszają</orth>
    <lex disamb="1"><base>zapraszać</base><ctag>fin:pl:ter:imperf</ctag></lex>
   </tok>

Plik wynikowy fextor dla polecenia:
fextor({"features":"base orth subst_count"})

(analiza lematów (base), form gramatycznych (orth) oraz liczby rzeczowników (subst_count):

{"base": {"filologia": 1, "filozofia": 1, "utwór": 1, "idea": 1, "wszyscy": 1, "zapraszać": 1, "sesja": 1, "teoria": 1, "dzieło": 1, "zbadanie": 1, 
"przy": 1, "zależeć": 1, "udział": 1, "to": 2, "jak": 3, "aktualizować": 1, "inspiracja": 1, "do": 2, "literatura": 2, "zaprezentować": 1, "określony": 1, 
"się": 1, "cel": 1, "nowożytny": 1, "filozoficzny": 2, "organizator": 2, "konkretny": 1, "być": 1, "konferencja": 1, "badanie": 1, "zarówno": 1, "koncepcja": 1, 
"i": 2, "czym": 1, "oraz": 1, "doktorant": 1, "literacki": 3, "w": 5, "na": 1, "związek": 1, "wkraczać": 1, "sposób": 2}, 
"lex_classes": {"subst": 25}, 
"orth": {"literackiego": 1, "filologii": 1, "filozofii": 1, "utworach": 1, "sesji": 1, "jest": 1, "badań": 1, "związki": 1, "doktorantów": 1, 
"na": 1, "dzieła": 1, "Filozoficzne": 1, "nowożytnych": 1, "Organizatorzy": 1, "jak": 1, "idee": 1, "zbadaniu": 1, "się": 1, "Celem": 1, "do": 2, 
"inspiracje": 1, "teoriach": 1, "aktualizują": 1, "udziału": 1, "określonych": 1, "wszystkich": 1, "filozoficzne": 1, "tego": 2, "literackich": 2, 
"konferencji": 1, "konkretnych": 1, "koncepcjach": 1, "jaki": 2, "literatury": 2, "wkraczają": 1, "zarówno": 1, "i": 2, "czym": 1, "oraz": 1, 
"zaprezentowanie": 1, "zależy": 1, "w": 5, "przy": 1, "zapraszają": 1, "sposób": 2, "organizatorom": 1}}

powyższy wynik przy zastosowaniu filtracji dla cech orth:

fextor({"features":"base orth subst_count", "filters": {"orth": {"type": "lemma_stoplist", "args": 
{"stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno" ], "excluding": true}}}})

będzie wyglądał następująco:

"orth": {"filologii": 1, "filozofii": 1, "utworach": 1, "sesji": 1, "jest": 1, "badań": 1, "związki": 1, "doktorantów": 1, 
"na": 1, "dzieła": 1, "nowożytnych": 1, "zbadaniu": 1, "idee": 1, "się": 1, "do": 2, 
"inspiracje": 1, "teoriach": 1, "aktualizują": 1, "udziału": 1, "określonych": 1, "wszystkich": 1, "zależy": 1, "konkretnych": 1, 
"koncepcjach": 1, "wkraczają": 1, "i": 2, "czym": 1, "oraz": 1, "zaprezentowanie": 1, "przy": 1, "konferencji": 1, "zapraszają": 1, "sposób": 2, "Celem": 1}

zgodnie z poleceniem: "stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno"]

w zestawieniu dla form gramatycznych (orth) nie zostały uwzględnione lematy (oraz ich formy gramatyczne) - w nawiasach podano formy pominięte, w porównaniu do wyników wywołania polecenia bez użycia opcji "filters") :

  • jak ("jak": 3)
  • literacki ("literackiego": 1, "literackich": 2)
  • literatura ("literatury": 2)
  • w ("w": 5)
  • to ("tego": 2)
  • organizator ("Organizatorzy": 1, "organizatorom": 1)
  • filozoficzny ("Filozoficzne": 1, "filozoficzne": 1)
  • zarówno ("zarówno": 1)

 

Z kolei, jeśli parametr "exclude" przyjmie wartość "false"

fextor({"features":"base orth subst_count", "filters": {"orth": {"type": "lemma_stoplist", "args": 
{"stoplist": ["jak","literacki","w","to","organizator", "filozoficzny", "literatura", "zarówno" ], "excluding": false}}}})

w zestawieniu uwzględnione zostaną wyłącznie lematy (i ich formy gramatyczne), wymienione w stoplist

"orth": {"zarówno": 1, "literackiego": 1, "literatury": 2, "Filozoficzne": 1, "jaki": 2, "literackich": 2, "Organizatorzy": 1, "filozoficzne": 1, 
"w": 5, "tego": 2, "jak": 1, "organizatorom": 1}

 

 


O_1.txt_pos.ccl - przykładowy plik otagowany znacznikami POS z NKJP (6.65 KB) Piotr Malak, 13 Jan 2017 00:24

O_1_base_orth_subst_count.ccl - plik z wynikami analizy dla cech: base,orth i subst_count (1.3 KB) Piotr Malak, 13 Jan 2017 00:36

O_1.txt_filter.ccl - plik z wynikami analizy dla cech: base,orth i subst_count i z użyciem opcji "filters" (1.11 KB) Piotr Malak, 13 Jan 2017 01:43

O_1.txt_filter_fls.ccl - plik z wynikami analizy dla cech: base,orth i subst_count i z użyciem opcji "filters" i parametrem "exclude":false (831 Bytes) Piotr Malak, 13 Jan 2017 01:54