Просмотров: 27

При принятии решений по проекту статистический анализ используется для определения оптимальных форм и размеров резервирования и страхования. Все способы снижения рисков мы рассмотрим в следующих постах, а сейчас это нужно знать для понимания, что получаемые цифры нам точно пригодятся. Анализ не делается ради самого анализа. Разберём по порядку значения математического ожидания, дисперсии, среднеквадратического отклонения и коэффициента вариации. На самом деле, всё намного проще, чем кажется. А страшные – только сами слова ))).

Математическое ожидание – это среднее значение случайной величины при заданных параметрах вероятности. То есть, наиболее вероятное значение. Простой пример. Допустим, у нас есть некий набор чисел: 3 с вероятностью 0,4 (или 40%); 6 с вероятностью 0,15; 2 с вероятностью 0,2; 7 с вероятностью 0,25. Вычисляем математическое ожидание = 3*0,4 + 6*0,15 + 2*0,2 + 7*0,25 = 4,25. Это и есть наиболее вероятное число, которое в итоге «выпадет».

Зная среднее (или предполагаемое среднее) значение, теперь мы можем оценить риск. Или, выражаясь по-другому, понять, на какую величину фактическое значение может отклониться от среднего. В этом нам поможет дисперсия. Дисперсия показывает, насколько реальные значения сгруппированы или разбросаны вокруг среднего. Тут есть один нюанс. Так как значения могут отклоняться как в одну, так и в другую сторону, то используется возведение в квадрат, которое «убирает» отрицательные значения и показывает просто величину отклонения. Иначе положительные и отрицательные отклонения при суммировании друг друга бы «съели». Формулу дисперсии можно посмотреть ниже. Для нашего ряда из расчёта математического ожидания значение дисперсии будет равно 3,99. Есть лайфхак для лентяев: в Excel дисперсию можно посчитать функцией ДИСПР, но только она не учитывает вероятности….

Проблема дисперсии в том, что она выражается в «оквадраченных» значениях. Например, если мы считали метры, то это будут квадратные метры. Если рубли, то рубли в квадрате. Чтобы вернуться к «нормальным» понятиям разброса, выраженным в тех же величинах, что исходные значения, нужно посчитать среднеквадратическое отклонение. Это не что иное, как обычный корень из дисперсии. В итоге мы получаем, насколько широк разброс значений от их среднего. Для нашего ряда это будет квадратный корень из 3,99, или, как это можно написать в Excel, 3,99^0,5 = почти 2. Для ленивых, опять же, лайфхак: в Excel среднеквадратическое отклонение сразу считается функцией СТАНДОТКЛОН.

Мы почти у цели. Теперь мы знаем, что для нашего ряда ожидаемое среднее будет равно 4,25. А разброс от него – почти 2. Осталось понять, а много это или мало, и в этом нам поможет коэффициент вариации. Он рассчитывается как отношение среднеквадратического отклонения к средней величине. Если умножить на 100, то получим проценты. Что получается у нас? Коэффициент вариации для заданного ряда = 2/4,25 = 0,47, или 47%. 

Для бизнес-проектов такие значения неприемлемы. Считается, что после 20% всё плохо. Так что если вы построили несколько сценариев, где разлёт между результатами больше 20%, где-то что-то вы не учли. И нужно заняться снижением рисков. Что мы и продолжим делать.

Нужен взгляд со стороны, чтобы найти решение?

Спрашивайте напрямую или прочитайте мою статью по теме.