NamEnSim (Named Entity Similarity Function, funkcja podobieństwa nazw własnych) jest narzędziem do wyznaczania podobieństwa par słów, wykorzystujące heterogeniczną funkcję podobieństwa nazw własnych. Umożliwia ocenę podobieństwa słowa do elementów słowników nazw własnych z wielu kategorii (m.in. imiona, nazwiska, nazwy miast, nazwy państw) oraz wydobywanie z tekstu wielowyrazowych nazw własnych w oparciu o funkcję podobieństwa. Narzędzie wspomaga zadanie rozpoznawania i znakowania nazw własnych w tekście. W zadaniu dopasowania form odmienionych nazw własnych do ich lematów znajdujących się w słowniku nazw własnych osiąga dokładność rzędu 81-96% dla funkcji podobieństwa opartej o regresję logistyczną oraz 84-98% dla funkcji podobieństwa opartej o reguły fleksyjne (w zależności od kategorii nazw własnych).

Licencja

Obecnie NamEnSim jest dostępny na licencji akademickiej i udostępniany jest po wcześniejszym kontakcie mailowym. W przyszłości planowane jest udostępnienie narzędzia na licencji GPL.