Zadanie #3852

[fextor2lexcsd] różne dziedziny dla różnych generatorów cech

Added by Paweł Kędzia over 11 years ago. Updated over 11 years ago.

Status:OdpowiedźStart date:15 Mar 2012
Priority:NormalnyDue date:
Assignee:Adam Wardyński% Done:

0%

Category:-
Target version:1.0

Description

Każdy generator cech powinien mieć swoją dziedzinę (zwrócić uwagę na komentarze).


Related issues

Related to fextor - Zadanie #3789: [fextor2lexcsd.py] Konwersja wielowartościowa dla cechy Zamknięty 20 Feb 2012

History

#1 Updated by Paweł Kędzia over 11 years ago

Czyli jeszcze aby była ścisłość, mając wygenerowane cechy:
F1    F2
---------
"a"  "b" 
"b"  "c" 
"c"  "a" 

oraz wybraną konwersję NUMERIC dla obu cech, powinniśmy otrzymać dwa odwzorowania:
  • dla F1 np.: a->1, b->2, c->3
  • dla F2 np.: b->1, c->2, a->3

I w ostateczności, powinniśmy mieć coś na zasadzie mapy map:

{F1: {a:1, b:2, c:3}, F2: {b:1, c:2, a:3}}

tak?

#2 Updated by Bartosz Broda over 11 years ago

  • Status changed from Przypisany to Odpowiedź
  • Assignee changed from Paweł Kędzia to Adam Wardyński

Wg mnie tak. Ale jeszcze potwierdzamy u Adama W.

#3 Updated by Adam Wardyński over 11 years ago

Hmm de facto tak, mapa map.

Oryginalna decyzja jednej dziedziny na wszystko była chyba na zasadzie, że jeśli jedna cecha ma wartość "foo" i druga cecha ma wartość "foo", to żeby po konwersji też miały te same wartości numeryczne, choć chyba chodziło bardziej o to, by człowiek był w stanie przeczytać, że to ta sama wartość, mimo, że numeryczna, niż o cokolwiek innego.

Myślę, że dałoby się coś sprytnego w tym temacie wymyśleć, aby wilk był syty i owca cała (tzn. aby dziedziny różnych cech były oddzielne, ale jeśli się częściowo pokrywają, by była zachowana pewna spójność)... Ale wydaje mi się, że to może być więcej zachodu niż pożytku, a trzymanie dziedziny i udostępnienie jej narzędziom złagodzi oryginalny problem braku możliwości zrozumienia, które wartości numeryczne czego się tyczą.

#4 Updated by Bartosz Broda over 11 years ago

Dla ludzi: do tej pory było to tak rozwiązane, że wszystko było numeryczne, ale była zachowana konwersja (pole attributes) dla tych grup kolumn (grupa kolumn = ekstaktor, pole boundaries), dla których było to wymagane. Gdy człowiek chciał się dowiedzieć się co oznaczają poszczególne wartości, to albo mógł zajrzeć do attributes, albo wywołać metodę explain_row, która dla danego wiersza macierzy zwracała listę z typami oryginalnymi.

Also available in: Atom PDF