Чому не варто вручну рахувати час першої відповіді (ЧПВ) за допомогою щоденних показників

Написано Konstantine
Оновлено 6 днів тому

Уявімо, що ви відкриваєте звіт Члени Команди за останній тиждень. На вкладці ЧПВ (час першої відповіді) вказано значення 2 хвилини.

Потім ви дивитесь на графік у тому ж звіті. Там показані медіанні значення за кожен день. Наприклад:

  • День 1 - 5 хв

  • День 2 - 3 хв

  • День 3 - 1 хв

  • День 4 - 6 хв

  • День 5 - 1 хв

  • День 6 - 3 хв

  • День 7 - 0 хв

Якщо впорядкувати ці значення за зростанням:

0, 1, 1, 3, 3, 5, 6

Медіана цих щоденних медіан3 хвилини.

Але звіт не рахує тижневий ЧПВ таким методом. Значення 2 хвилини, яке ви бачите на вкладці, розраховане на основі всіх чатів за весь тиждень, а не щоденних підсумків. Алгоритм сортує значення ЧПВ кожного окремого чату за цей період і визначає справжню медіану з повного набору даних.

Натомість графік агрегує дані по періодах (година/день/тиждень/місяць), залежно від обраного діапазону. Тобто кожна точка, яку ви бачите на графіку - це медіана окремого зрізу, а не всього періоду.

Отже, якщо вручну рахувати медіану з медіан - це завжди дасть хибний результат. Це як порівнювати підсумки підсумків з реальними "сирими" даними.

Більше прикладів:

Приклад 1: Скошений розподіл даних

Уявімо, що в один із днів було лише 2 чати:

  • Чат 1 - 1 хв

  • Чат 2 - 20 хв

Медіана за день: (1 + 20)/2 = 10,5 хв

В інший день було 100 чатів, усі з відповіддю за 2 хвилини.
Медіана за день: 2 хв

Якщо спробувати вручну обчислити тижневу медіану на основі цих щоденних медіан:

  • День 1 (мало чатів): 10,5 хв

  • День 2 (багато чатів): 2 хв

Середнє: 6,25 хв, що є хибним результатом, оскільки більшість чатів були оброблені швидко. Один виняток на день з малою кількістю чатів спотворює загальну картину.


Приклад 2: Нерівномірний обсяг чатів по днях

  • День 1 - 100 чатів, медіана: 2 хв

  • День 2 - 5 чатів, медіана: 6 хв

  • День 3 - 80 чатів, медіана: 1,5 хв

Якщо обчислювати медіану на основі цих щоденних медіан без урахування кількості чатів, ми ігноруємо той факт, що дні 1 і 3 мають набагато більший обсяг даних. І надаємо такий самий вплив Дню 2, хоч там було лише кілька чатів, але вища медіана. Саме так і формуються хибні враження.


Чи враховуються видалені чати в метриках ЧПВ?

При виведенні значення на вкладці ЧПВ (час першої відповіді) воно розраховується на основі доступних на момент запиту данихвидалені чати не враховуються в цьому обчисленні.

Однак, на графіку, де зображено підсумкові стовпчики, видалені чати включені. Це може призводити до незначних розбіжностей між графіком і значенням на вкладці ЧПВ, особливо якщо чати було видалено після завершення періоду, але до перегляду звіту.


Підсумок:

  • Вкладка ЧПВ використовує усі "сирі" дані чатів для обчислення справжньої медіани за обраний період.

  • Графік показує медіани по періодах, що корисно для відстеження тенденцій, але не підходить для ручного усереднення чи порівняння з даними вкладки.

Чи була наша стаття корисною?