Błąd #3869

[fextor2lexcsd] Brak uzgadniania klasy decyzyjnej

Added by Adam Wardyński over 11 years ago. Updated over 9 years ago.

Status:ZamkniętyStart date:16 Mar 2012
Priority:NormalnyDue date:
Assignee:Paweł Kędzia% Done:

0%

Category:-
Target version:1.0

Description

Nie wiem jak Wy to rozwiązujecie, ale mi osobiście kolejna rzecz wyskoczyła do naprawiania ręcznego przeze mnie samego w scenariuszu "rzeczywistym" a nie "kroswalidacyjnym".

Jeśli mam klasę decyzyjną o wartościach np. [False, True] i w danych uczących ładnie obie odpowiedzi występują (co jest normalne), no to tworzona macierz ma ładnie [False, True] jako możliwe labels. Ale teraz jak tworzę dane "rzeczywiste" to w ogólności cokolwiek tej jednej kolumnie jest przypisywane, nie powinno mieć znaczenia, w trakcie klasyfikacji powinno być ignorowane.. Dla ułatwienia korzystam z tego samego fextorowego ini no i zawsze mam False jako decyzję, i niestety utworzona przez fextor2lexcsd macierz w tym momencie też tylko będzie miała [False] i np. taka weka rzuca w twarz "java.lang.Exception: training and test set are not compatible".

Jest to problem w ogólności tej samej kategorii, co było mówione już o konwersji 'numeric' (do naprawienia) i konwersjach kolumnowych, które wymagają na użytkowniku aligna.

Podejrzewam, że ta kwestia klasy decyzyjnej to jest kolejna rzecz, którą jakoś łatacie ręcznie na tej samej zasadzie, co robienie ręcznie tego całego align, zamiast posiadania podobnych funkcjonalności od razu wbudowanych w fextor2lexcsd i samo lexcsd..

Póki co sam to jakoś muszę załatać razem z łataniem zwanym "align_to_first_matrix", ale mam mocne wewnętrzne przekonanie, że takie rzeczy od razu powinny być w systemie fextor+lexcsd, a nie żeby każdy, kto używa tego systemu do rzeczywistej klasyfikacji, musiał się tego typu sprawami przejmować kodując jakieś dedykowane rozwiązania.

History

#1 Updated by Bartosz Broda over 11 years ago

  • Status changed from Nowy to Odpowiedź
  • Assignee changed from Bartosz Broda to Paweł Kędzia
  • Target version set to 1.0

Ostatnio o tym rozmawialiśmy. Z tego co pamiętam z ustaleń, to kluczem do sedna sprawy jest pole possible_classes, które chyba musi zostać uzupełnione przez fextor2lexcsd (albo jakąś inną metodę podczas zapisu do arff).

#2 Updated by Paweł Kędzia over 9 years ago

  • Status changed from Odpowiedź to Zamknięty

Also available in: Atom PDF