Перцентили

Любой, кто когда-либо отслеживал или анализировал приложение, использует или использовал средние значения. Их легко понять и рассчитать. Мы склонны игнорировать, насколько неправильной является усредненная картина мира. Чтобы подчеркнуть эту мысль, позвольте мне привести вам пример из реальной жизни за пределами перформанса, который я недавно прочитал в газете.

В статье объяснялось, что средняя зарплата в определенном регионе Европы составляла 1900 евро (чтобы было ясно, это было бы неплохо для этого региона!). Однако, приглядевшись, они обнаружили, что большинство, а именно 9 из 10 человек, зарабатывают только около 1000 евро, а один получит 10.000 (я, конечно, упростил это, но вы поняли). Если вы посчитаете, вы увидите, что среднее из этого действительно 1900, но мы все можем согласиться с тем, что это не представляет собой «среднюю» зарплату, как мы использовали бы это слово в повседневной жизни. Итак, теперь давайте применим это мышление и например поймем, что такое 99 процентиль (персентиль).

Смысл 99-го перцентиля в том чтобы собрать всю совокупность данных (другими словами всю коллекцию измерений системы) и отсортировать их, затем откинуть 1% наибольших, и взять наибольшее значение из оставшихся (это и будет значение 99-го перцентиля). Полученное значение обладает двумя важными свойствами:

  1. Это наибольшее значение из значений, которые получаются в 99% случаев. Если это значение, например, является измерением времени загрузки веб-страницы, то оно отражает самый худший случай обслуживания, которое получается как минимум при 99% посещений вашего сервиса.
  2. Это значение устойчиво к действительно сильным выбросам, которые происходят по множеству причин, включая ошибки измерения.

Само собой, вы не обязаны выбирать именно 99%. Широко распространенными вариантами являются 90-й, 95-й и 99.9-й (или даже еще больше девяток) перцентили.

Источник: 1


23.11.2016 10:30