Znajdowanie i liczenie najczęstszych wartości

Spis treści

Konieczność znalezienia najwyższych i najniższych wartości w każdym biznesie jest oczywista: najbardziej dochodowe produkty lub wartościowi klienci, największe przesyłki lub przesyłki i tak dalej.

Ale wraz z tym czasami trzeba szukać w danych nie szczytu, ale najczęściej występujących wartości, które choć brzmi podobnie, w rzeczywistości wcale nie są takie same. W odniesieniu na przykład do sklepu może to być poszukiwanie najczęściej kupowanych towarów, a nie tych najbardziej dochodowych, najczęściej występującej liczby pozycji w zamówieniu, minut w rozmowie itp.

W takiej sytuacji problem trzeba będzie rozwiązać trochę inaczej, w zależności od tego, z czym mamy do czynienia – liczbami czy tekstem.

Znajdowanie najczęstszych liczb

Załóżmy, że stajemy przed zadaniem przeanalizowania dostępnych danych o sprzedaży w sklepie w celu określenia najczęściej występującej liczby kupowanych przedmiotów. Aby określić najczęstszą liczbę w zakresie, możesz użyć funkcji FASHION (TRYB):

Oznacza to, że według naszych statystyk najczęściej kupujący kupują 3 sztuki. dobra.

Jeśli nie jest jedna, ale kilka wartości naraz, które występują tę samą maksymalną liczbę razy (kilka trybów), to do ich identyfikacji można użyć funkcji MODA.NSK (TRYB.MULT). Należy ją wpisać jako formułę tablicową, tzn. zaznaczyć kilka pustych komórek naraz, aby wystarczyło na wszystkie tryby z marginesem i w pasku formuły wpisać =MODA.NSK(B2:B16) i nacisnąć skrót klawiaturowy Ctrl + Shift + Enter.

Na wyjściu otrzymamy listę wszystkich modów z naszych danych:

Oznacza to, że sądząc po naszych danych, często zajmują nie tylko 3, ale także 16 sztuk. dobra. Należy pamiętać, że w naszych danych są tylko dwa tryby (3 i 16), więc pozostałe komórki zaalokowane „w rezerwie” będą z błędem #N/A.

Analiza częstotliwości według pasm z funkcją FREQUENCY

Jeśli konieczne jest analizowanie nie liczb całkowitych, ale liczb ułamkowych, to bardziej poprawne byłoby oszacowanie nie liczby identycznych wartości, ale ich mieszczących się w określonych zakresach. Na przykład musimy zrozumieć, jaką wagę najczęściej kupuje towar, aby wybrać odpowiednie wózki i torby do pakowania o odpowiednim rozmiarze do sklepu. Innymi słowy, musimy określić, ile liczb mieści się w przedziale 1..5 kg, ile w przedziale 5..10 kg itd.

Aby rozwiązać podobny problem, możesz użyć funkcji CZĘSTOTLIWOŚĆ (CZĘSTOTLIWOŚĆ). W tym celu należy wcześniej przygotować komórki z interesującymi nas interwałami (kieszeniami) a następnie wybrać pusty zakres komórek (G2:G5) o jedną komórkę większy niż zakres kieszeni (F2:F4) i wpisać go jako formułę tablicową, naciskając kombinację na końcu Ctrl + Shift + Enter:

Analiza częstotliwości z tabelą przestawną z grupowaniem

Alternatywne rozwiązanie problemu: utwórz tabelę przestawną, w której w polu wierszy wpiszesz wagę zakupów, a w polu wartości liczbę klientów, a następnie zastosuj grupowanie – kliknij prawym przyciskiem myszy na wartości wag i wybierz polecenie Zarządzanie (Grupa). W wyświetlonym oknie możesz ustawić limity i krok grupowania:

… i po kliknięciu w przycisk OK uzyskaj tabelę z liczbą trafień kupujących w każdym zakresie grupowania:

Wady tą drogą:

krok grupowania może być tylko stały, w przeciwieństwie do funkcji CZĘSTOTLIWOŚĆ, gdzie kieszenie można określić absolutnie dowolne
tabela przestawna musi być aktualizowana, gdy zmienią się dane źródłowe (klikając prawym przyciskiem myszy – Odśwież), a funkcja jest automatycznie przeliczana w locie

Wyszukaj najczęściej występujący tekst

Jeśli nie mamy do czynienia z liczbami, ale z tekstem, to podejście do rozwiązania będzie zasadniczo inne. Załóżmy, że mamy tabelę ze 100 rzędami artykułów sprzedawanych w sklepie i chcemy ustalić, które artykuły były kupowane najczęściej?

Najprostszym i najbardziej oczywistym rozwiązaniem byłoby dodanie kolumny obok funkcji COUNTIF (LICZ.JEŻELI)aby policzyć liczbę wystąpień każdej pozycji w kolumnie A:

Następnie oczywiście posortuj wynikową kolumnę w kolejności malejącej i spójrz na pierwsze wiersze.

Lub dodaj kolumnę z jedynkami do oryginalnej listy i zbuduj tabelę podsumowującą na podstawie tabeli wynikowej, licząc łączną liczbę jedynek dla każdego produktu:

Jeśli nie ma dużo danych źródłowych i zasadniczo nie chcesz używać tabel przestawnych, możesz użyć formuły tablicowej:

Podzielmy to kawałek po kawałku:

LICZ.JEŻELI(A2:A20;A2:A20) to formuła tablicowa, która z kolei wyszukuje liczbę wystąpień każdego produktu w zakresie A2:A100 i tworzy tablicę z liczbą powtórzeń na wyjściu, czyli w rzeczywistości zastępuje dodatkową kolumnę
MAX – znajduje największą liczbę w tablicy wystąpień, czyli najczęściej kupowany produkt
MATCH – oblicza liczbę porządkową wiersza w tabeli, w którym MAX znalazł największą liczbę
INDEX – zwraca z tabeli zawartość komórki z numerem znalezionym przez MATCH

Zliczanie liczby unikalnych wartości na liście
Wyodrębnianie unikalnych przedmiotów z listy duplikatów
Grupowanie w tabelach przestawnych

Znajdowanie najczęstszych liczb

Analiza częstotliwości według pasm z funkcją FREQUENCY

Analiza częstotliwości z tabelą przestawną z grupowaniem

Wyszukaj najczęściej występujący tekst

Dodaj komentarz