IOBBER to płytki parser (chunker) języka polskiego. Rozpoznaje granice fraz w tekście oraz nadrzędniki składniowe fraz. Przykładowo, IOBBER może przypisać następującą strukturę:

[Dziennikarka]NP [zarzucała]VP [Rutkowskiemu]NP [to]NP, że [całe jego działanie ws. zaginięcia]NP [to]VP [show]NP

IOBBER działa w oparciu o maszynowe uczenie (CRF) i może nauczyć się różnych definicji fraz. Parser rozprowadzany jest wraz z modelem nauczonym na korpusie KPWr. Na stronie projektu (link poniżej) dostępny jest też model nauczony na Narodowym Korpusie Języka Polskiego. Konfiguracje dostosowane do obu korpusów rozprowadzane są wraz z kodami źródłowymi.

IOBBER jest wysoce konfigurowalny, dzięki czemu z powodzeniem zastosowano go również do rozpoznawania fraz w języku czeskim.

Więcej informacji oraz dostęp do kodów źródłowych i konfiguracji (GNU LGPL) można znaleźć na stronie projektu.