![]() |
|
加拿大与捷克研究人员开发了扑克机器人,它已经在一对一比赛和无限下注德州扑克比赛中打败了人类职业玩家,扑克机器人的胜利标志着AI取得了新的突破。
研究人员称,程序用“逼近法”打败了人类对手,“逼近法”与直觉有点相似。密歇根大学游戏理论与AI教授迈克尔·韦尔曼(Michael Wellman)认为:“如果真是这样,意味着游戏AI取得了明显进步。首先,它是一个里程碑,AI在游戏中打败了扑克职业玩家。其次,它将一些新创意结合在一起,开创了激动人心的新方法,我们可以用这种方法应付信息不完全的游戏。”
扑克软件DeepStack曾经打败过职业玩家,它是加拿大阿尔伯塔大学计算机教授迈克尔·保林(Michael Bowling)领导开发的,查尔斯特大学和捷克理工大学的研究人员也参与了研发。网上刊发了一份研究报告,研究人员在报告中表示,DeepStack与几名人类玩家比赛,打了4.5万手扑克,轻松获胜。
人类也曾与AI在其它游戏中对决,相比而言扑克更加复杂。扑克不确定因素很多,比如对手可能会欺骗,在现实世界中到处都是欺骗,AI还不懂得怎样欺骗。扑克玩家看不到对手的牌,但在西洋棋、国际象棋和围棋中,大家可以看清对方的棋子。今年年初时,Alphabet子公司DeepMind开发的 AI程序打败了李世石,他是韩国知名职业围棋高手。
对于机器来说,不限注德州扑克太难了,每一手牌都有10的160次方种(10的后面跟160个0)可能。DeepStack通过自己与自己打扑克不断学习。每打完一局,系统就会修改优化策略,让技能更上层楼。由于不限注扑克很复杂,系统通过玩限注扑克来提高技巧。为了处理复杂性问题,研究人员使用了快速逼近技术,他们将之前的扑克比赛资料输入深度学习算法,不断优化精炼。
密歇根大学韦尔曼认为,扑克是一种复杂的游戏,采用新技术之后,系统碰到各种情况都可以有效应对,这是新的突破;以前要绘制整个树,将各种可能性找出来。
研究人员将DeepStack的逼近技术与人类玩家的直觉类比,当对手欺骗或者拿到一手可以获胜的牌时,人类会用直觉判断,比如根据对手的语言来判断,机器不同,它根据对手的下注模式来判断。研究人员称:“我们可以将这种估计看成是DeepStack的直觉。”
通过观察扑克玩家在多次对决中赢得的金额,系统可以评估玩家的表现,而不是根据桌面上的下注额判断。与优秀的职业选手相比,DeepStack的胜率高了大约9倍。
2015年,保林与阿尔伯塔大学的同事找到了解决方案,他们开发的扑克机器可以玩限注德州扑克,表现很完美。参加匹兹堡锦标赛的机器人名叫 “Libratus”,它是图奥马斯·桑德赫尔(Tuomas Sandholm)与学生诺姆·布朗(Noam Brown)合作开发的,Libratus用匹兹堡超级计算中心的强大硬件运行。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 中国痛失140亿美金超大订单 |
2 | 中国经济再传重大利空信号 |
3 | 直击上海南京路世茂广场 冷清景象令人震惊 |
4 | 何卫东最新消息流出,习前景不妙 |
5 | 惊叹!这则“谣言”又兑现了 |
48小时新闻排行榜 | 更多>> |
1 | “我不在乎中国如何反应,会让他们夜不成眠 |
2 | 中国痛失140亿美金超大订单 |
3 | 中国经济再传重大利空信号 |
4 | 直击上海南京路世茂广场 冷清景象令人震惊 |
5 | 何卫东最新消息流出,习前景不妙 |
6 | 习失军权公开化?中共军方现六大异常 |
7 | 惊叹!这则“谣言”又兑现了 |
8 | 突发!传火箭军新司令王厚斌被抓 |
9 | 中国经济永久衰退?美女经济学家:大错特错 |
10 | 习自曝要退位 或已身不由已 |
一周博客排行 | 更多>> |
一周博文回复排行榜 | 更多>> |