Как нормализовать данные между 0 и 1
Редакция Кодкампа
читать 2 мин
Чтобы нормализовать значения в наборе данных между 0 и 1, вы можете использовать следующую формулу:
z i = (x i – мин(х)) / (макс(х) – мин(х))
куда:
- z i : i -е нормализованное значение в наборе данных
- x i : i -е значение в наборе данных
- min(x) : минимальное значение в наборе данных.
- max(x): максимальное значение в наборе данных
Например, предположим, что у нас есть следующий набор данных:
Минимальное значение в наборе данных — 13, максимальное — 71.
Чтобы нормализовать первое значение 13 , мы должны применить формулу, которую использовали ранее:
- z i = (x i – min(x)) / (max(x) – min(x))
Чтобы нормализовать второе значение 16 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517
Чтобы нормализовать третье значение 19 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034
Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных между 0 и 1:
При использовании этого метода нормализации следующие утверждения всегда будут истинными:
- Нормализованное значение для минимального значения в наборе данных всегда будет равно 0.
- Нормализованное значение максимального значения в наборе данных всегда будет равно 1.
- Нормализованные значения для всех остальных значений в наборе данных будут находиться в диапазоне от 0 до 1.
Часто мы нормализуем переменные при выполнении некоторого типа анализа, в котором у нас есть несколько переменных, измеряемых в разных масштабах, и мы хотим, чтобы каждая из переменных имела одинаковый диапазон.
Это предотвращает чрезмерное влияние одной переменной, особенно если она измеряется в разных единицах (например, если одна переменная измеряется в дюймах, а другая — в ярдах).
Также стоит отметить, что в этом руководстве мы использовали метод, известный как минимальная-максимальная нормализация , для нормализации значений данных.
Двумя наиболее распространенными методами нормализации являются следующие:
1. Мин-макс нормализация
- Цель: Преобразует каждое значение данных в значение от 0 до 100.