Метрика

Статистична достовірність даних

Метрика надає багато цифр за всіма аспектами роботи вашого сайту і всі ці цифри точні з точки зору методики їх розрахунку. Але з точки зору аналізу роботи сайту це не завжди так: наприклад, якщо на сайт заходив один відвідувач і дивився сторінки 20 хвилин, формально правильно, що середній час відвідування сайту — 20 хвилин. Але з точки зору здорового глузду це не так: робити якісь висновки про сайт на основі цього візиту не можна.

Інший приклад: необхідно визначити, з яких сторінок сайту найчастіше починаються візити, що завершилися конверсією. Здається, усе просто: відкриваємо звіт Сторінки входу, вибираємо потрібну ціль і сортуємо звіт за конверсією.

Звіт містить безліч сторінок, на яких був один відвідувач і при цьому досяг мети: конверсія візитів, що почалися з таких сторінок — 100%. При цьому очевидно, що такі сторінки цінності для аналізу не мають. Можна спробувати поставити обмеження на кількість переглядів сторінок — наприклад, понад 100 переглядів.

Бачимо, що 100 виявляється недостатньо — є сторінки, які дивилися понад 100 разів, але у рамках одного візиту (і при цьому візиту з досягненням цілі). Можливо, це оновлення сторінки або візити роботів. У будь-якому випадку ці рядки у звіті заважають бачити дані, що вас цікавлять, тож їх хотілося б позбутися. Задамо 1000 переглядів.

Це дозволило прибрати зі звіту зайву інформацію. Але межа кількості візитів буде залежати від вибраного періоду побудови звіту, і обмеження для кожного періоду потрібно буде підбирати нове.

Цей приклад показує, що для аналізу роботи сайту важлива не обчислена конверсія, а справжня — та, яку ми побачили б, якщо б візитів було дуже багато. Просто у разі 1000 візитів різниця істинної та обчисленої конверсії буде невелика. А під час одного візиту реальна конверсія може виявитися якою завгодно — від дуже малої величини до 100 %.

Методи математичної статистики дозволяють розрахувати, скільки ж необхідно візитів, щоб можна було впевнено стверджувати (наприклад, з імовірністю 95 %), що пораховане нами значення конверсії відрізняється від дійсного значення несуттєво (наприклад, не більше ніж на 5 %).

Метрика дає можливість робити такий розрахунок автоматично і приховувати ті рядки звіту, для яких не можна впевнено стверджувати, що відображене значення відрізняється від теоретичного істинного не дуже. Для цього використовується поле Приховувати статистично недостовірні дані.

Фільтрація застосовується до значення того стовпця, за яким на цей момент відсортовано дані. Також можна довільно змінити пороги фільтрації — ті самі 95 % ймовірності та 5 % відхилення: