Wsparcie #3586
Co chcemy docelowo zrobić z wyjściem klasyfikacji?
Status: | Nowy | Start date: | 03 Jan 2012 | |
---|---|---|---|---|
Priority: | Normalny | Due date: | ||
Assignee: | - | % Done: | 0% | |
Category: | - | |||
Target version: | - |
Description
Nasze moduły powinno dać się złączyć w potok przetwarzania, więc zakładam, że każdy z nas zamierza zrobić narzędzie, które czyta wejście (najlepiej w formacie CCL + opcjonalnie relacje), ładuje swoje zasoby i generuje wyjście w formacie CCL + opcjonalnie relacje. Pytanie, ile potrzebujemy wspólnych elementów poza formatem we, wy, użyciem fextora i klasyfikatorów. Warto sprawdzić, w jakim stopniu wszyscy zamierzamy zrobić to samo. Proponuję opisać przewidywane scenariusze użycia klasyfikatora (oczywiście to może się potem zmienić).
Rozpoznawacz relacji składniowych — dość naiwna wersja.¶
Wejście: plik CCL oznakowany chunkami i ich headami (przynajmniej NP, VP, AdjP).- Z iteratora dostajemy wszystkie pary fraz VP–NP i VP–AdjP występujące w każdym zdaniu.
- Klasyfikator klasyfikuje każdą z osobna — jaka to relacja albo dla każdej relacji R — czy zachodzi ona między (któryś wariant trza wybrać); wersja ciut lepsza zakłada klasyfikację probabilistyczną (klasa + prawdop. na wyjściu klasyfikatora)
- Odpalamy proste reguły, które odrzucają niektóre odpowiedzi klasyfikatora (np. że relacje OBJ nie może zachodzić odnośnie NP, którego head jest w mianowniku)
- Odpalamy reguły rozwiązywania konfliktów, które odrzucają niektóre odpowiedzi, jeśli miałyby zachodzić sprzeczne ze sobą relacje (np. poza szczególnymi przypadkami VP nie może mieć dwóch podmiotów). Gdyby użyć klasyfikatorów z prawdopodobieństwem, tutaj by się ono przydało.
- Znakujemy pozostałe jako prawidłowe relacje.
History
#1 Updated by Michał Marcińczuk almost 12 years ago
Rozpoznawanie relacji semantycznych¶
Będzie przebiegało bardzo podobnie do rozpoznawania relacji składniowych, z drobnymi różnicami.
- Iterator przechodzi po wszystkich parach nazw własnych występujących w obrębie zdania. Opcja definiowania wszystkich możliwych par nazw własnych zdecydowanie odpada.
- Tak samo, tj. każda para jest klasyfikowana.
- Reguły filtrujące/uzupełniające --- być może, ale na poziomie wszystkich relacji rozpoznanych w zdaniu. Reguły do relacji będą w stylu, jeżeli zachodzi LOCATION (A,B) i LOCATION (B,C) to musi też być LOCATION (A,C). Jeszcze nie wiem, co dokładnie w takich sytuacjach robić, ale zakładam, że jakieś proste reguły wejdą w użycie.
- Znakowanie.
#2 Updated by Bartosz Broda almost 12 years ago
Adam Radziszewski wrote:
zakładam, że każdy z nas zamierza zrobić narzędzie, które czyta wejście
Najlepiej używając po drodze Fextora :)
Ujednoznacznienia znaczeń¶
- Iterator skacze po wszystkich słowach do ujednoznaczniania (identyfikowane po formach podstawowych)
- Dla każdego znalezionego miejsca podejmowana jest decyzja o klasie
- Brak reguł, a jeżeli będą to ukryje je jako klasyfikator (e.g., tablice decyzyjne)
- Zapis decyzji klasyfikatora (ów) do pliku CCL.
#3 Updated by Bartosz Broda almost 12 years ago
Bartosz Broda wrote:
- Zapis decyzji klasyfikatora (ów) do pliku.
-> do pliku CCL