Какво е outlier?
Статистиката може да бъде както изключително полезна, така и изключително подвеждаща. Представи си, че се опитваш да разбереш средната възраст в една училищна класна стая. Всички деца са на възраст между 11 и 13 години, но ако към данните добавим и възрастта на учителя, който също е в стаята, средната възраст ще скочи доста бързо. Възрастта на учителя в случая е outlier, или отдалечаваща се стойност.
Отдалечаващите се стойности са такива, които значително се различават от останалите в един dataset – те са екстремно високи или ниски. Например в списъка с числа 2, 4, 5, 8, 11, 345 и 10 много ясно може да се досетим, че тук отдалечаващата се стойност е 345. Има много подобни примери и никак не е трудно да се досетиш за такива, но на практика не винаги е толкова елементарно да разбереш коя стойност е outlier и причината да е такава.
Защо е важно да разпознаваме outlier-и?
Най-логичната причина е да разполагаме с качествени данни, на които можем да разчитаме. Ако вземем примера с класната стая, би било доста съмнително да обявим, че средната възраст на 4-ти „Б“ клас е 27 години, защото сме забравили да извадим възрастта на учителя по домашен бит и техника. Много често данните могат да бъдат сгрешени, да бъдат изпуснати стойности и това да доведе до доста неприятно объркване в крайните резултати.
Google analytics
Отдалечаващите се стойности могат да помогнат много и при анализа ви на данните, които извличате с помощта на Google Analytics. Ако например искате да проследите как се справя дадена страница и да направите съпоставка между резултатите от тази и миналата година, би било добре да знаете кои стойности могат да ви заблудят. Ако тази година в рамките на седмица сте имали покачване на посещенията заради определено събитие (например сензационен пост, свързан с пандемията, който е привлякъл голямо количество хора, но за кратко), резултатите от тази година ще бъдат доста по-високи и това може да ви заблуди при изготвянето на стратегия. Тази седмица в случая е outlier и не трябва да бъде причислявана към финалните отчети.
Разбира се, Google Analytics разполага с нещо, наречено Anomaly Detection (детектор на аномалии), чиято цел е да идентифицира outlier-и и да докладва за съществуването им. Ако искаш да задълбочиш познанията си в платформата и функционалността ѝ, то предстоящият ни курс Google Analytics Advanced е точно за теб. В него ще научиш как да персонализираш отчети, да работиш с Google Tag Manager, да анализираш маркетинг и рекламни кампании, да работиш с Google Data Studio и още. Занятията са подходящи за всички с добри основни познания по Google Analytics, PPC и SEO. Побързай и се запиши сега!