* Grupowanie/klasyfikacja tekstu za pomoca różnych algorytmów dostępnych w R (pakiet tm). * Porównanie jakości grupowania/klasyfikacji tekstu dla rónych reprezentacji dokumentów (pakiet tm). * Ograniczanie wymiarowości zbiorów danych w zadaniach klasyfikacji/aproksymacji. * Porównanie grupowania na podstawie gęstości (algorytm DBSCAN z pakietu RWeka) z algorytmami grupowania dostępnymi w R. * Hybrydowe drzewa decyzyjne (proste algorytmy klasyfikacji zamiast liści).