IOBBER to płytki parser (chunker) języka polskiego. Rozpoznaje granice fraz w tekście oraz nadrzędniki składniowe fraz. Przykładowo, IOBBER może przypisać następującą strukturę:
[Dziennikarka]NP [zarzucała]VP [Rutkowskiemu]NP [to]NP, że [całe jego działanie ws. zaginięcia]NP [to]VP [„show”]NP
IOBBER działa w oparciu o maszynowe uczenie (CRF) i może nauczyć się różnych definicji fraz. Parser rozprowadzany jest wraz z modelem nauczonym na korpusie KPWr. Na stronie projektu (link poniżej) dostępny jest też model nauczony na Narodowym Korpusie Języka Polskiego. Konfiguracje dostosowane do obu korpusów rozprowadzane są wraz z kodami źródłowymi.
IOBBER jest wysoce konfigurowalny, dzięki czemu z powodzeniem zastosowano go również do rozpoznawania fraz w języku czeskim.
Więcej informacji oraz dostęp do kodów źródłowych i konfiguracji (GNU LGPL) można znaleźć na stronie projektu.