Точність і швидкість. Семплування

Обчислення показників за великою кількістю (понад мільйон) візитів може потребувати багато часу. Для зменшення часу розрахунку показників можна використовувати семплування. У цьому випадку розрахунок проводиться не за всіма візитами, а за якоюсь частиною.

Припустимо, йдеться про прямі заходи на сайт. Порахувавши, скільки їх було в 1/10 від усіх візитів, можна помножити результат на 10 і отримати приблизну кількість прямих заходів. У результаті часу на отримання відповіді знадобиться в 10 разів менше, але відповідь буде приблизною. Семплування дозволяє вибирати необхідне співвідношення між швидкістю і точністю розрахунку.

Однак випадкова вибірка певної частки візитів має ряд недоліків. Метрика накопичує історію дій кожного відвідувача. У випадку вибірки за візитами, зв'язок між відвідувачем і візитом втрачається. Це, наприклад, робить неможливим сегментацію за параметрами відвідувачів. А розрахунок кількості унікальних відвідувачів практично завжди буде призводити до помилки у сторону збільшення їх кількості.

Метрика спочатку формує вибірку заданої частки унікальних відвідувачів, потім обчислює показники на основі параметрів їх візитів, рівномірно розподілених за часом.

Можливість семплування стає доступною, якщо у вибраний період часу потрапляє понад 1 000 000 візитів. У цьому випадку у звіті відображається додатковий елемент керування Точність:У разі завантаження звіту або зміни періоду часу Метрика автоматично вибирає точність таким чином, щоб час побудови звіту не перевищував кількох секунд. Після завантаження звіту співвідношення між швидкістю і точністю можна змінити.Зменшення точності може призвести до того, що у вибірку не потрапить жоден візит і, відповідно, звіт не буде містити даних. Це може статися, наприклад, у тому випадку, якщо вибрано дуже вузький сегмент та (або) дуже великий період часу. У цьому разі доцільно перевірити показники, виставивши точність 100 %.