Zadanie #6604

Narzędzie tworzące słownik nazw własnych na podstawie zadanych tekstów

Added by Michał Krautforst over 7 years ago. Updated over 7 years ago.

Status:NowyStart date:13 Jan 2015
Priority:NormalnyDue date:
Assignee:-% Done:

0%

Category:-
Target version:-

Description

Zbiór testowy: Książki z serii "Świat Dysku" Terrego Pratchettaa

  • Etap 1
    Policzenie częstotliwości nazw własnych w zbiorze

czestotliwosc_nazw.7z (291 KB) Michał Krautforst, 13 Jan 2015 14:27

pratchett-utf8.7z (4.6 MB) Michał Krautforst, 23 Jan 2015 14:52

czestotliwosc_nazw_v2.7z (368 KB) Michał Krautforst, 28 Jan 2015 15:21

czestotliwosc_nazw_v3.7z (386 KB) Michał Krautforst, 02 Feb 2015 09:53

sentences.7z (2.92 MB) Michał Krautforst, 03 Feb 2015 16:48

nodict_top9.7z (161 KB) Michał Krautforst, 10 Feb 2015 17:29

History

#1 Updated by Michał Krautforst over 7 years ago

wyniki w formacie nazwa/tkategoria/czestotliwosc dla 3 modeli - names, n82 i top9
zliczone na podstawie formy orth oraz base

#2 Updated by Michał Krautforst over 7 years ago

książki przekonwertowane do kodowania utf-8

#3 Updated by Michał Krautforst over 7 years ago

Poprawione statystki po usunięciu znaku '¬" z tekstow.
Dodatkowo statystyki dotyczace liczby książek w których wystepuje dana nazwa.

#4 Updated by Michał Krautforst over 7 years ago

nowe wyniki
-poprawione zliczanie ilości książek z pominięciem kategorii
-nazwy kategorii i wynik oddzielone tabulacją

#5 Updated by Michał Krautforst over 7 years ago

wykaz znalezionych nazw wraz z kategoriami i zdaniami

#6 Updated by Michał Krautforst over 7 years ago

wyniki dla modleu top9 bez cech słownikowych

Also available in: Atom PDF