Statystyka matematyczna to potężne narzędzie. Potrafi przewidywać na podstawie zmiennych czy zajdzie dany warunek, czy nie. Weźmy na przykład dane klientów sieci komórkowych. Znamy o nich podstawowe informacje takie jak wiek, płeć, wykształcenie, stan cywilny, obecną taryfę jak również ich chęć zmiany abonenta (bądź nie). Możemy przewidzieć jakie nowy klient, o którym mamy pewne informacje będzie chciał otrzymać usługi i przygotować je specjalnie dla niego. Dzięki potędze statystyki potrafimy pogrupować np. klientów sieci komórkowej na kategorie, powiedzmy: osoby często korzystające z Internetu, klienci premium, osoby preferujące rozmawiać bądź pisać smsy. Gdy mamy kilka tysięcy obserwacji, złożoność takiego procesu wydawałaby się bardzo duża. Z pomocą przychodzą statystykom programy komputerowe, które podobne zależności liczą w kilka sekund! My postaramy się na prostym przykładzie zastosować algorytm k-średnich, który ze zbioru danych wyodrębni kilka grup o podobnych własnościach.