Закрыть






«Покер для начинающих»бесплатно
Оставьте свой e-mail и
получите в подарок
легендарную аудиокнигу
Романа Шапошникова
«Покер для начинающих».





100% гарантия отсутствия спама





АктивностьНа форуме / В комментариях



    Не паникуйте. Покер еще долго не смогут «решить».

    22 февраля 2015 в 14:47
    2955 0
        Несколько месяцев назад, команда программистов заявила, что у неё есть программа, которая «решила» Limit Hold’em. Простейший вариант покера, всего два игрока, всего 2 карты и лимитированные ставки. Это был невероятный объем работы, и мы их поздравляем с успешным решением этой тяжелой задачи.
        Когда я читал о том, что они должны были сделать, чтобы разобрать по кирпичикам эту достаточно простую версию игры, я понял, что более сложные варианты покера не смогут «решить» в ближайшее время. Количество информации, которое было нужно  — 260 терабайт. Я, как правило, использую около ¼ терабайта на моем домашнем компьютере, и это много информации. При использовании обычного широкополосного доступа в интернет загрузка данного объема информации заняла бы более пяти лет.
        Если мы будем рассматривать 3макс, а не хедз-ап, это станет сложнее не в 2 раза, а усложнится, как минимум, на 1 порядок. А когда попытаемся разобрать игру за полным столом – это выйдет за рамки нашего понимания. Я пытался посчитать, но мне понадобился специальный калькулятор, чтобы отобразить столь огромные числа… Ну вы меня поняли.

        Если заменить Limit Hold’em игру за полным столом, которая уже за пределами компьютерных возможностей, на No-Limit Hold’em – дела пойдут ужасно. Один лишь бетсайзинг очень сложно решить. Что уже говорить об объемах памяти и испытаниях, которые нужно провести. Таковых возможностей просто не существует.
        Но что, если игру все же «решат»? Мы прекратим играть? И о каком определении понятия «решение» мы говорим?
        Давайте посмотрим на сверх-простую игру – Война Казино, в которой возможно принимать множественные решение и почему одни лучше других.
        В эту игру играл каждый маленький ребенок в разных её модификациях. Каждый игрок вслепую переворачивает карту из колоды. Побеждает тот, у кого карта будет старше. Мы добавим небольшое отличие. На каждой из карт игроки пишут сумму от 1 до 5 долларов. Проигравший должен заплатить самую меньшую из этих ставок.
        Если умный Стив и тупой Дуг будут играть в эту игру, каждый из них сделает ставку на определенную карту. Стив поставил 4$, а Дуг – 2$. Стив перевернул короля, а Дуг – валета. В результате этой игры Дуг должен заплатить Стиву 2$.
        Задумайтесь на минуту о том, как выигрывать в этой игре. Я использовал эту игру, чтобы научить моих студентов базовым принципам теории игр. Поскольку это частично похоже на покер, я уверен, что существует 2 неэксплуатируемых решения, известных как «решение Нэша». Они предоставляют нам Равновесие по Нэшу, то есть, они не могут быть обыграны.
        Первое решение – всегда ставить 1$. Независимо от того, что будет делать ваш оппонент, каждая игра вам будет стоить 1$. В долгосрочной перспективе игра будет безубыточной для обоих игроков. Это самое простое решение, и компьютер найдет его очень быстро. Вы также не сможете выиграть, только соблюдать равновесие. Эта стратегия не эксплуатируемая, но также и не эксплуатационная [никто не сможет вас обыграть, но и вы ничего не выиграете – ред.].
        Не знаю как вы, но я не играю в покер, что бы избежать потерь, я играю, чтобы выиграть. У меня есть счета, по которым я должен платить, и я не смогу этого сделать, играя «безубыточно». Что мне нужно – это решение, которое также неэксплуатируемое, но будет побеждать более слабые стратегии. Теперь задумайтесь на секунду. Существует ли решение, при котором мы не будет проигрывать, но иногда сможем выиграть?
        Как выяснилось, есть. Если вы будете ставить по 5$на всех тузов, а на другие карты по 1$ — вы получите прибыль от большинства стратегий для этой игры. Если умный Стив поймет это, а глупый Дуг будет писать случайные числа на своих картах – Стив будет выигрывать деньги в долгосрочной перспективе. Но существует ли лучшее решение?
        «Решение» Limit Hold’em’a сродни стратегии 5$/1$. Программа играет хорошо, и её невозможно обыграть, но она не зарабатывает столько денег, сколько хороший игрок смог бы выиграть у плохого. Эта программа никогда не эксплуатирует лики своего оппонента.

        Как много денег вы выиграете у противника, который никогда не рейзит и не выбрасывает? Вы будете ставить лишь тогда, когда ваша рука будет иметь более 50% эквити против случайного диапазона. У вас будет невероятно низкий, но уверенный доход.
        Вы будете смеяться, когда компьютер попытается заблефовать игрока, который никогда не выкидывает. Но компьютер обязан это делать, поскольку его игра основана на заложенных внутри стратегических принципах. Это будет продолжаться до тех пор, пока программисты не изменят его стратегию. Но после этого его игра станет эксплуатируемой. Она более не будет «идеальной».
        Способность подстраивать свою игру и использовать лики противников – вот что, в настоящее время, нас отделяет от машины. Если ваша цель – быть непревзойденный в хедз-апе, то компьютер является совершенным. Если вашей целью является заработок денег, тогда машинный интеллект не совсем то, что вам нужно.
        Вчера я играл со своим другом. Мы попадали в такие ситуации, где могли с огромной вероятностью сказать карты друг друга. Я ставил на ривере, уже зная, что мой друг выбросит, хотя у меня на руках была просто старшая карта. Мы не знаем, как заставить программу мыслить на таком уровне. Как мне кажется, единственный способ – использовать такой же метод, который был разработан для хедз-ап бота «Cepheus». Но существует вероятность, что на всей планете не хватит вычислительных ресурсов, чтобы решить подобную задачу в ближайшие несколько десятилетий.
        Эти ученые сотворили удивительную вещь. Мне нравиться читать об этом, но я не паникую, когда слышу, что игру «решили». Они достигли чего-то, что абсолютно не представляет угрозы играм, в которые мы играем. Покер – самая сложная игра, которую изобрело человечество. Покер будет держать свою корону в качестве последней нерешенной игры еще долгие годы. Напишите мне, когда компьютер научится играть в ПЛО в стэках от 40 до 300 блайндов. 

    Автор: Крис Уоллас
    Источник: www.bluff.com
    Перевод: Антон «Grodgar» Парадовский, специально для pokermoscow.ru

    Комментировать могут только зарегистрированные и авторизованные пользователи. Хотите зарегистрироваться?

    Еще посты от Grodgar