WCRFT to tager morfo-syntaktyczny dla języka polskiego. Tager łączy technikę warunkowych pól losowych (CRF) ze znakowaniem warstwowym (tiered tagging).
Tager został napisany w Pythonie, ale korzysta z modułów napisanych w języku C++:
- klasyfikator CRF++
- formalizm opisu cech morfo-syntaktycznych WCCL,
- biblioteka corpus2 do obsługi korpusów oznakowanych i tagsetów.
Do tagowania czystego tekstu konieczne jest użycie analizatora morfologicznego, polecamy w tym celu system MACA.
Szczegółowy opis, dostęp do kodów źródłowych oraz instrukcja instalacji znajdują się na stronie projektu.