Билет 12 - LunexCoding/Basics-of-data-analysis GitHub Wiki
-
Задача бинарной классификации.
Классификация с бинарной переменной класса, т.е. категориальной выходной переменной, которая может принимать только два значения. Очевидно, что в таких задачах решается вопрос о принадлежности объекта к одному из двух классов. Чаще всего используют состояния
0и1, но могут быть и другие, например,ДаилиНет,YилиN, и т.д. -
Логистическая регрессия. Алгоритм применения логистической регрессии.
Логистическая регрессия или логит-модель (англ. logit model) — статистическая модель, используемая для прогнозирования вероятности возникновения некоторого события путём его сравнения с логистической кривой. Эта регрессия выдаёт ответ в виде вероятности бинарного события (
1или0).Логистическая регрессия – это разновидность множественной регрессии, предназначенная для классификации записей на основании значений входных полей. При этом выходная переменная является категориальной или бинарной (т.е. может принимать только два значения).
В бинарной классификации каждый объект или наблюдение должны быть отнесены к одному из двух классов (например,
АиБ). Тогда с каждым исходом связано событие:- Объект принадлежит к классу
Аи объект принадлежит к классуБ. - Результатом будет оценка вероятности соответствующего исхода.
Если в процессе анализа будет установлено, что вероятность принадлежности объекта с заданным набором значений признаков (входных переменных) к классу
Абольше, чем вероятность его принадлежности к классуБ, то он будет классифицирован, как объект классаА.Например, если рассматривается исход по займу, задается переменная
yсо значениями1и0, где1означает, что соответствующий заемщик расплатился по кредиту, а0, что имел место дефолт.Несомненным преимуществом логистической регрессии является наличие эффективного инструмента оценки качества моделей - ROC-анализа.
- Объект принадлежит к классу
class DataAnalysis:
'''
Дано вещественное число – цена 1 кг конфет.
Вывести стоимость 1, 2, … 10 кг конфет.
Решить задачу используя циклическую конструкцию for.
'''
def __init__(self, cost=None):
self._cost = cost
self._costPerKilogram = {}
self._calcCosts()
def _calcCosts(self):
for i in range(1, 11):
self._costPerKilogram[i] = i * self._cost
def showCost(self):
for key, value in self._costPerKilogram.items():
print(f'Стоимость за {key} кг - {value}')
task = DataAnalysis(10)
task.showCost()