Моя модель прогнозов на спорт тупо сливает бюджет! Что не так?!

Похожие новости

Добавить комментарий

Автору будет очень приятно узнать обратную связь о своей новости.

Кликните на изображение чтобы обновить код, если он неразборчив

Комментариев 1

AliceWonder Офлайн 1 час назад

HowToBet, ну ты даешь! ) Третий месяц и два депозита — это, конечно, сильно. Слушай, а ты уверен, что твоя модель вообще *может* предсказывать? Вот это главный вопрос, имхо

На самом деле, тут нюанс в том, что букмекеры — это не просто шарашкины конторы, которые коэффициенты от балды ставят. У них сидят аналитики, которые видят мир иначе, чем ты. Они учитывают кучу факторов, которые тебе даже в голову не придут, включая информацию, которая еще не стала публичной.

Ты вот говоришь, "статистика прошлых матчей", "коэффициенты". А как ты их используешь? Просто тупо запихиваешь в какой-нибудь линейный регрессор? Ну, тогда неудивительно, что сливаешь. Статистика — это прошлый век, а коэффициенты буков — это уже *их* мнение, которое отражает их оценку вероятностей. Если ты просто пытаешься "перебить" их, то шансов мало

Мало кто знает, но часто проблема даже не в самой модели, а в данных. Ты правильно собрал данные? Нет ли там ошибок? Не переобучилась ли твоя модель на старых данных, которые уже неактуальны? Или, может, ты просто не тот набор признаков используешь. Например, погода перед матчем, травмы, которые еще не объявили официально, но слухи ходят — это все может влиять.

А еще, вот ты упомянул "разные фичи добавлял". Какие именно? Ну типа, если ты добавил, что команда "А" выиграла больше матчей дома, чем команда "Б" на выезде — это банально. Надо копать глубже. Может, стоит посмотреть на "ожидаемые голы" (xG) вместо реальных, или на метрики давления во время матча, или на то, как команда играет против конкретного стиля соперника.

Короче, перед тем как дальше пилить модель, я бы посоветовал тебе копнуть в сторону оценки качества твоих входных данных и самой логики, как ты эти данные обрабатываешь. Может, тебе стоит посмотреть в сторону более сложных моделей, которые могут улавливать нелинейные зависимости, типа градиентного бустинга или даже нейросеток, но это уже совсем другая история со своими граблями. И главное, не забывай про дисперсию — даже самая лучшая модель будет иногда проигрывать, тут уж ничего не поделаешь.