Zadanie #2356
Oszacowanie szybkości działania
Status: | Zamknięty | Start date: | 28 Sep 2011 | |
---|---|---|---|---|
Priority: | Normalny | Due date: | ||
Assignee: | Maciej Janicki | % Done: | 100% | |
Category: | - | |||
Target version: | - |
Description
- czas inicjalizacji linera --- może to być czas otagowania jednego słowa,
- czas inicjalizacji nerda --- wygenerowanie atrybutów dla jednego słowa,
- liczba tokenów przetwarzanych na sekundę (z pominięciem czasu inicjalizacji) policzone dla 2 korpusów (gpw4d-maca.iob i wikinews4-maca.iob).
chunker c1:crfpp-load:=xxx --wyuczony na korpusie gpw4d-maca i wikinews4-maca i konfiguracji ini_features38_window2_names4_agr.ini (w information_extraction/liner2-models),chunker c2:dict-load:xxx:types=COUNTRY_NAM,CITY_NAM --chunker słownikowy skompilowany na podstawie pliku db_proper_names_plain.txt- -chunker c3:heuristic:road-prefix
- -use c1+c2+c3
History
#1 Updated by Maciej Janicki almost 12 years ago
- % Done changed from 0 to 100
Wyniki:
jedno słowo:
Chunking time: 0.0015 s
NERD time: 7.9553 s
Tokens processed: 1
Tokens per second: 689.4621
Liner2 total time: 12.9580 s
gpw4c-maca:
Chunking time: 67.5030 s
NERD time: 124.5426 s
Tokens processed: 316154
Tokens per second: 4683.5549
Liner2 total time: 216.3088 s
wikinews-gospodarka-nam2:
Chunking time: 14.4718 s
NERD time: 70.4374 s
Tokens processed: 144004
Tokens per second: 9950.6560
Liner2 total time: 99.7241 s
#2 Updated by Michał Marcińczuk almost 12 years ago
- words: 244676
- words/second: 1133
#3 Updated by Maciej Janicki almost 12 years ago
Z wliczaniem generowania cech do czasu przetwarzania tokenów:
jedno słowo:
Processing time: 0.0034 s
NERD time: 8.2007 s
Tokens processed: 1
Tokens per second: 289.9773
Liner2 total time: 13.6036 s
gpw4d-maca.iob:
Processing time: 221.1549 s
NERD time: 126.4545 s
Tokens processed: 316154
Tokens per second: 1429.5594
Liner2 total time: 232.6384 s
wikinews4-maca.iob:
Processing time: 103.3680 s
NERD time: 85.4682 s
Tokens processed: 147734
Tokens per second: 1429.2047
Liner2 total time: 120.1654 s
#4 Updated by Maciej Janicki almost 12 years ago
Jak wyżej, ale bez cech słownikowych i chunkera słownikowego:
jedno słowo:
Processing time: 0.0031 s
NERD time: 3.6781 s
Tokens processed: 1
Tokens per second: 318.4534
Liner2 total time: 3.6893 s
gpw4d-maca.iob:
Processing time: 128.5026 s
NERD time: 93.2652 s
Tokens processed: 316154
Tokens per second: 2460.2931
Liner2 total time: 131.7822 s
wikinews4-maca.iob:
Processing time: 58.9195 s
NERD time: 43.8603 s
Tokens processed: 147734
Tokens per second: 2507.3862
Liner2 total time: 62.1729 s
#5 Updated by Maciej Janicki almost 12 years ago
- Status changed from Przypisany to Zamknięty