请问 下 哈这 个蒙特卡罗仿真的 在= 线 平 台游 戏 到底有什么地方是不 错滴呀?

亲 们 哈 这 个大 赢 家 线 上 游 戏 是以前 的那 个吗?_百度知道
亲 们 哈 这 个大 赢 家 线 上 游 戏 是以前 的那 个吗?
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
热心网友知道合伙人
最 近 在 bet918 里 面 玩 超 级
高, 玩 的 就 真 是  个
匿名用户知道合伙人
的心碎。的心碎。的心碎。的心碎。的心碎。的心碎。的心碎。的心碎。
匿名用户知道合伙人
丁们也大汗
为你推荐:
其他类似问题
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。掷骰子不是容易学的游戏(Craps)
我的图书馆
掷骰子不是容易学的游戏(Craps)
掷骰子不是最容易学的游戏掷骰子游戏是娱乐场最令人兴奋的项目之一。这是一个可以人人融入其中的游戏,共同期待着一位常胜掷骰选手的出现!要提醒你的是这个游戏并不易学,我们先来看看最基本的过线或赢线投注策略,以及如何做以实际赔率支付的后补玩法。一局掷骰子游戏从“出手掷”开始。在这个阶段最常见的赌注是过线投注,有时被称作赢线投注。??出手掷时,掷出7或11被称作自然,即赢,赔率一比一。掷出2、3或12被称作Craps(这个游戏的英文名字),即输。这点与百家乐(英文名字是 baccarat,代表零)相似,因为游戏的名字对玩家来说并不是件好事。掷骰子的人允许连续投掷,并下新的过线投注。在他被“七出局” 之前,骰子不会交给下一个掷骰人。然而如果掷出4、5、6、8、9或10 呢?如果是这几个数字的话,不赢也不输,而掷出的那个数变成你的点数。这局游戏到此目的就很简单了,在掷出7之前你需要掷出点数。比如,如果你掷出9,那 么你的点数设定为9,你需要在掷出7之前先掷出9。如果掷出这个设定的点数9,你就赢了过线投注。然后重新开始这个过程,重新下过线投注,并做新的出手掷。如果点数设定后你却掷出7,你就被“七出局”了,不仅输掉过线投注,这局游戏也随之结束。骰子要交给下一个人开启下一个回合。一旦设定了点数,就不要提数字7,因为7被视为霉运。如果你掷出的既不是点数,也不是7,那么这次投掷对你的过线投注没有影响(可能会对桌上的其它赌注有影响),再掷一次就好了。在这个点数循环中2、3、11和12也都没什么意义。最初过线投注的赔率为一比一。除了过线投注外,玩家还可以押机率,这是一种押在过线投注后的下注,也称后补押注。后补押注只有在点数确立后才可以下。观看掷骰子游戏时,你会看到有人在自己的过线投注后放筹码。娱乐场在后补押注中不占上风,以实际赔率支付,每个数字的赔率不同:对后补押注的规定各个地方不同。在拉斯维加斯很常见的是押3、4或5倍机率,也就是说,出现4或10,你可以下已有过线投注的3倍;出现5或9,你可以下已有过线投注的4倍;出现6或8,你可以下已有过线投注的5倍。其它地方的娱乐场可能对后补押注有不同的规定,所以这是你在开始玩之前要弄清楚的问题之一。比如,如果他们提供10倍机率,那么你的后补下注可以10倍于已有的过线投注。这种押注是很明智的,被视为娱乐场最好的投注,因为娱乐场在这种投注上没有赢率。有些娱乐场甚至提供100倍机率的后补注额!下面我们再来Craps解释“来”的玩法,一种在玩掷骰子时常被忽略的下注。下“来”与过线投注完全相同,只是感觉不同。下“来”只能在点数循环中做(也就是,在点数4、5、6、8、9 或10建立后)。要下“来”,需把筹码放在一个标记为‘来’的区域中,‘来’位于桌面布局上标记为“FIELD”的上方。尽管游戏在点数循环中,这一掷将被当作是下“来”一局新游戏的第一掷。在错过了“出手掷”的情况下,可以博“来”,比如你来到桌边时正好在进行一个点数循环,或者也许你在点数循环中厌倦了等待投掷手投出点数或 7,想要更多的下注行动!押“来”与过线投注实质相同,掷出7或11为天成,掷出2、3、12即刻输掉。由于这个押注在点数循环中做出,当你下“来”押在7上而赢时,这一投对于所有的过线和指名投注来说其实是个‘7出局’,因此别期望桌边其他人会为你叫好!如果点数被掷出,你的“来”就变成了一个过线投注,进入下一个点数循环 – 与过线投注来说不同的点数。荷官通过将您的筹码挪到桌面上您的点数盒之外的盒中来暗示这个,表明这些筹码变成了押“来”。如同任何正常的过线投注,一旦点数被确立后,还可以看机率。只要在机率上扔些筹码,并告诉荷官你想押机率,他便会将您的筹码挪到点数上。他会轻轻将筹码错开摞起来,以示你下注的哪一部分是正常的过线投注,哪一部分是押机率。“来”注上后补押注的限额与过线投注后补押注相同。重复下“来”意味着很多筹码最终下在很多不同点数上。桌面上这种复杂性正是这个游戏的乐趣所在。经验玩家以桌面上的闹哄哄场面为乐!当你投中以押“来”开始的点数,赢金和赢过线投注相同(包括任何你下的后补注额),这局押“来”游戏便结束。如果你在那一局还有另外一个“来”注,那么它将被挪到刚刚被投中的数字,这个点数的循环继续。对于那些想在桌面上以实际赔率赢得更多钱的玩家来说,“来”是个很好的选择。实际上,你可以在点数循环中的每一投“来”,如果这个点数循环持续很长时间,你会发现自己到处埋下“伏兵”,可以赢任何一个数字:4、5、6、8、9和10。在掷骰子游戏中,你可以在当投掷手投出一个又一个数字时,不停地下“来”和押机率,没有比这个更令人兴奋的了!投中4、5、6、8、9或10中任何一个数字都意味着一大笔赢金(大部分以实际赔率支付);即便是11也意味着赢一小笔钱(因为那是下“来”的天成之投);投中2、3或12意味着“来”注的一点相对较小的损失,很快可以换掉,而‘主游戏’继续。只有令人生厌的7会给你带来麻烦,因为这代表着所有数字上的注码都将输掉(值得安慰的是,你会赢最后一个“来”注)。这种“四处设伏”,数字重复被投中的局面是每个玩家梦寐以求的。有些玩家的确曾经交过这样的好运 – 世界纪录是154次连续投掷未被7出局!这个游戏的荷官被称为“棍子先生”,他们通常会以一种高亢,几近唱歌的声音,吆出各式短语来解释游戏和控制局面。很多荷官发明了幽默且押韵的说辞。当7出局出现时,很多荷官会吆喝出: 7 out、the line’s away、the don’ts to pay、last come will get some,意思是7出局被掷出时,过线投注输,不赢线注赢,任何“来”注都赢。图片来自Pexels撰文 | 张天蓉 (美国德州大学奥斯汀分校理论物理博士)责编 | 吕浩然 上帝教人掷骰子——“神童”帕斯卡与概率论 似是而非的答案:概率论悖论 别相信直觉:概率论帮助侦破“财务造假”●●●先讲一个赌场捞金的故事。很多人都听说过概率或统计中的蒙特卡罗(Monte-Carlo)方法,是一种在统计的基础上利用大量数据进行计算的方法。这其中的蒙特卡罗指的并不是人名,而是摩纳哥一个著名赌场的名字。自蒙特卡罗赌场于1865年开张后,摩纳哥从一个穷乡僻壤的弹丸之地,一跃成为欧洲最富有的国度之一,至今已经150年过去,这个国家仍然是以赌场和相关的旅游业为主。约瑟夫·贾格尔(Jagger)[1]是约克郡一个棉花工厂的工程师,在工作之余经常光顾蒙特卡罗赌场,尤其对前文提到的轮盘游戏特别感兴趣。他认为,轮盘机器在理想的情况下,每个数字出现的概率都是1/38。但是,机器怎么可能做到完美对称呢?任何缺陷都可以改变获奖号码的随机性,导致转盘停止的位置偏向某些数字,使这些数字更为频繁地出现。那么,赌徒应该可以利用这种偏向性来赚钱!1873年,贾格尔下决心要改变自己的命运:他带上所有的积蓄来到蒙特卡罗赌场,并雇用了六个助手,每个助手把守一个轮盘机器。白天,他们记录每个轮盘的所有数据;晚上,贾格尔便在旅馆里独自分析这些数据中的规律。六天后,前五个轮盘的数据并没有发现有意义的偏离,但第六个轮盘为贾格尔带来了惊喜:38个数字中有9个数字出现的概率要比其余的频繁得多!贾格尔兴奋不已,第七天他前往赌场,认定了那台有偏向性的轮盘,大量投注这九个高概率的数字,当天就赚了7万。虽然后来赌场改变了策略,却让贾格尔获取了一笔不菲的收入。贾格尔是幸运的,但更多的赌徒却是十赌九输。主要原因有两个:一方面是因为所有赌场游戏的概率设计本来就是以利于赌场为准,这样赌场才能稳赚不赔;另一方面,利用赌徒的心态也是赌博游戏设计者们的拿手好戏。赌徒谬误便是一种常见的、不符合概率规则的错误心态,经常被赌场利用。赌徒谬误(The Gambler's Fallacy)赌徒谬误大意是指将前后相互独立的随机事件当成有关联的事件,例如抛硬币时,无论抛几次,任意两次之间都是相互独立的,并不相互产生影响。道理虽简单易懂,但有时仍会糊涂。比如,当你连抛了5次正面时,到了第6次,你可能会认为这次正面出现的概率会更小了(& 1/2),反面出现的概率会更大(& 1/2)。也有人会逆向思维,认为既然5次都是1,也可能继续是1(也被称为热手谬误)。实际上,这两种想法都掉进了“赌徒谬误”的坑。也就是说,将独立事件当成了互相关联事件。图1:赌徒谬误赌徒有了“赌徒谬误”的心态,会输得更惨。比如说,赌场中著名的输后加倍下注系统(Martingale)便是利用此心态的实例:赌徒第一次下注1元,如输了则下注2元,再输则变成4元,如此类推,直到赢出为止。赌徒误以为在连续输了多次之后,胜出的概率会变大,所以愿意加倍又加倍地下注,殊不知其实概率是不变的,赌场的游戏机没有记忆,不会因为你输了就给你更多胜出的机会。赌徒谬误不仅见于赌徒,也经常反映在一般人的思维方式中。中国人常说“风水轮流转”,这句话在很多时候或许反映了现实,但如果将这种习惯性的思维方法随意地应用到前后互相独立的随机事件上,便会跌入赌徒谬误之中。对“大数定律”的误解赌徒谬误产生的另一个原因是对“大数定律”的误解。大数定律[2]指的是当随机事件发生的次数足够多时,发生的频率趋近于预期的概率。对一枚对称硬币而言,正面的预期概率是1/2。当我们进行n次实验后,得到正面出现的次数n正,比值p正 = n正/n,叫做正面出现的频率,此时p正不一定等于正面出现的概率(1/2)。但是,当n逐渐增大时,频率将会逐渐趋近1/2。也就是说,频率取决于多次实验的结果,而概率则是一个极限值,实验次数越大,频率越趋近概率,这就是大数定律。提出并证明了大数定律最早形式的是瑞士数学家雅各布·伯努利(Jakob Bernoulli ,),雅各布也是概率论的重要奠基人之一。直到他死后的第8年,即1713年,大数定律才在《猜度术》(Ars conjectandi)中得以呈现,这本巨著也使概率论真正成为数学的一个分支,其中的大数定律和以后将会提到的由狄莫弗(A.de Moivre)和拉普拉斯(P.S.Laplace)导出的“中心极限定理”,是概率论中极其重要的两个极限定理。赌徒们对大数定律的误解主要体现在对“多次重复”的理解。多少次试验才算“足够多”,才能到达大数定律能够实用的大样本区间?此问题的答案:理论上是无穷大,实际中难以定论。大多数情形是:还没到“足够多”,该赌徒便已经财力耗尽、赌注输光、两手空空了!有人喜欢买彩票,并且在每次填写彩票时,要选择以往中奖号码中出现少的数字,还振振有词地说这样做的依据是大数定律:某个数字过去出现得少,以后就会多,为什么呢?“要满足大数定律啊!”,可见对大数定律误解之深。图2:雅各布·伯努利和大数定律而对赌徒思维误区的专业解释,便是将大数定律应用于试验的小样本区间,将小样本中某事件的概率分布看成是总体分布,以为少数样本与大样本区间具有同样的期望值,把短期频率当成长期概率,或把无限的情况当成有限的情况来分析。实际上,这是在错误应用大数定律时的心理偏差,因此被心理学家卡尼曼和特维尔斯基戏称为“小数法则”。事实上,任何一段有限次的试验得到的频率对于足够多次的试验的频率几乎没有什么影响,大数定律说的是总频率趋近于概率值,如图2b所示,小样本区间试验的结果并不影响最后趋近的概率。圣彼得堡悖论与雅各布·伯努利同属伯努利家族的尼古拉·伯努利(Nikolaus I. Bernoulli,1687年-1759年)也是一名热衷研究赌博的数学家,他提出了著名的“圣彼得堡悖论”。为了理解这个悖论,首先从赌博游戏的期望值说起。赌博的输赢与期望值有关,期望值是以概率为权重的平均值。赌博的方式不一样,“赢”的期望值也不一样。以38个数字的轮盘为例,按照一般赌场的规矩,赌注押在其中一个数字上,如果押中,顾客得到$35,否则损失$1的赌注。顾客赢钱为正,损失为负,则顾客“赢钱”的期望值公式为:E(顾客“赢”的期望值)= - 输钱数*输钱概率+赢钱数*赢钱概率第一项是负值,表示是顾客“输”掉的钱数。由此而计算出上述假设条件下的期望值E= -1*37/38+35*1/38=-0.5。可以看到,期望值是负数,对赌徒不利。但设想有个傻一点的赌场老板,将上面规则中的“赢钱数”$35改成$38的话,算出的期望值就会成为正数,这种策略就对顾客有利了,赌徒们高兴了,将蜂拥而至。如果将$35改成$37呢?这时候算出来的期望值为0,意味着长远来说,赌徒和赌场打平了,双方不输不赢(不计开赌场的费用),称之为“公平交易”。因此,期望值也是那些“理性赌徒”们决定“赌或不赌”的数学依据。然而,根据这个数学依据作出的决策有时候完全不符合人们从经验和直觉所作的判断。这是怎么回事呢?尼古拉·伯努利便以“圣彼得堡悖论”为例对此提出质疑[4]。图3:圣彼得堡问题尼古拉设想了一种简单的游戏方案:顾客不需要每次下赌金,但得买一张价钱固定(m元)的门票参加,游戏规则如下:顾客只是掷(公平)硬币,掷出正面就停止,掷出反面就继续掷,直到掷出正面为止,见图3a。如果游戏停止了,顾客就能得到奖金,奖金的数目与掷的次数有关。游戏持续次数越高,奖金就越高。比如说,游戏停止时掷了n次,那么顾客可得奖金数为(2n)元。叙述得更具体一点:如果第一次掷出正面,游戏停止,顾客只能得2元(21),若掷出反面,就继续掷。若第二次掷出正面,顾客得4元(22),若掷出反面,又继续掷……依次类推,顾客若一直得到反面直到第n次才掷出正面,奖金数便是(2n)元,奖金数随n增大而指数增加。现在,计算这个游戏中,顾客“赢钱”的期望值,即每次期望赢得的钱乘以概率后相加。然后,再将m元的门票作为负数放进去,得到期望值是:从以上计算可见,无论门票m是多少(有限数),得到的期望值都是无穷大!这很诡异,因为“期望值无穷大”意味着无论收多高的门票,赌徒都会赢!这就出现了矛盾,因此,尼古拉认为这是一个悖论,人们在做决策的时候,并不仅仅考虑数学期望的大小,更多的是在考虑风险。数学期望值不能完全描述风险。为什么叫“圣彼得堡悖论”呢?因为这个悖论被尼古拉提出却是被其堂弟丹尼尔·伯努利解决的,丹尼尔提出经济学中的效用理论来解释这个问题,论文发表在1738年圣彼得堡召开的一次学术会议上,所以得名为圣彼得堡悖论[5]。赌博虽然是一种恶习,由它却引发了不少有趣的数学问题,促进了概率论的发展,由于圣彼得堡悖论的解决而建立了“效用理论”,推动了经济学的发展。概率论中除了大数定律之外,还有一个极其重要的“中心极限定理”,有关中心极限定理极其应用,是我们下一篇的内容。
喜欢该文的人也喜欢对于目 前正 在很 火的这 个蒙特卡罗 在 线平 台到底是个什么样子呢?_百度知道
对于目 前正 在很 火的这 个蒙特卡罗 在 线平 台到底是个什么样子呢?
仲夏苦夜短,开轩纳微凉仲夏苦夜短,开轩纳微凉...
仲夏苦夜短,开轩纳微凉仲夏苦夜短,开轩纳微凉
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
热心网友知道合伙人
真诚才是人生最高的美德。——乔叟
行啊,这些多没意思啊, 博 世 家里的人很多,去了经常挤不上,看出是世界一流来了,一定有你想要的啦,看着可以,还是可以的啊
为你推荐:
其他类似问题
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。蒙特卡罗方法入门
本文通过五个例子,介绍蒙特卡罗方法(Monte Carlo Method)。
蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。
它非常强大和灵活,又相当简单易懂,很容易实现。对于许多问题来说,它往往是最简单的计算方法,有时甚至是唯一可行的方法。
它诞生于上个世纪40年代美国的"曼哈顿计划",名字来源于赌城蒙特卡罗,象征概率。
二、&的计算
第一个例子是,如何用蒙特卡罗方法计算圆周率&。
正方形内部有一个相切的圆,它们的面积之比是&/4。
现在,在这个正方形内部,随机产生10000个点(即10000个坐标对 (x, y)),计算它们与中心点的距离,从而判断是否落在圆的内部。
如果这些点均匀分布,那么圆内的点应该占到所有点的 &/4,因此将这个比值乘以4,就是&的值。通过R语言脚本随机模拟30000个点,&的估算值与真实值相差0.07%。
三、积分的计算
上面的方法加以推广,就可以计算任意一个积分的值。
比如,计算函数 y = x2 在 [0, 1] 区间的积分,就是求出下图红色部分的面积。
这个函数在 (1,1) 点的取值为1,所以整个红色区域在一个面积为1的正方形里面。在该正方形内部,产生大量随机点,可以计算出有多少点落在红色区域(判断条件 y & x2)。这个比重就是所要求的积分值。
用Matlab模拟100万个随机点,结果为0.3328。
四、交通堵塞
蒙特卡罗方法不仅可以用于计算,还可以用于模拟系统内部的随机运动。下面的例子模拟单车道的交通堵塞。
根据 Nagel-Schreckenberg 模型,车辆的运动满足以下规则。
当前速度是 v 。
如果前面没车,它在下一秒的速度会提高到 v + 1 ,直到达到规定的最高限速。
如果前面有车,距离为d,且 d & v,那么它在下一秒的速度会降低到 d - 1 。
此外,司机还会以概率 p 随机减速, 将下一秒的速度降低到 v - 1 。
在一条直线上,随机产生100个点,代表道路上的100辆车,另取概率 p 为 0.3 。
上图中,横轴代表距离(从左到右),纵轴代表时间(从上到下),因此每一行就表示下一秒的道路情况。
可以看到,该模型会随机产生交通拥堵(图形上黑色聚集的部分)。这就证明了,单车道即使没有任何原因,也会产生交通堵塞。
五、产品厚度
某产品由八个零件堆叠组成。也就是说,这八个零件的厚度总和,等于该产品的厚度。
已知该产品的厚度,必须控制在27mm以内,但是每个零件有一定的概率,厚度会超出误差。请问有多大的概率,产品的厚度会超出27mm?
取100000个随机样本,每个样本有8个值,对应8个零件各自的厚度。计算发现,产品的合格率为99.9979%,即百万分之21的概率,厚度会超出27mm。
六、证券市场
证券市场有时交易活跃,有时交易冷清。下面是你对市场的预测。
如果交易冷清,你会以平均价11元,卖出5万股。
如果交易活跃,你会以平均价8元,卖出10万股。
如果交易温和,你会以平均价10元,卖出7.5万股。
已知你的成本在每股5.5元到7.5元之间,平均是6.5元。请问接下来的交易,你的净利润会是多少?
取1000个随机样本,每个样本有两个数值:一个是证券的成本(5.5元到7.5元之间的均匀分布),另一个是当前市场状态(冷清、活跃、温和,各有三分之一可能)。
模拟计算得到,平均净利润为92, 427美元。
七,参考链接
电脑是如何下棋的:蒙特卡洛树搜索法
围棋盘由19条横线和19条竖线组成,共有19&19=361个交叉点。此外,也有13&13、9&9的小棋盘。围棋子分为黑白两色,对弈双方各执一种颜色的棋子,轮流将一枚棋子下在交叉点上。终局时,占领(围起)的&地盘&(即其中的交叉点个数)多的一方获胜。
空白的交叉点称为&目&,围到的地盘又称为&空&。对弈过程中,棋手经常会&数目&,也就是计算双方目前所围的&空&的大小,以此判断形势优劣。
对弈双方的水平差距较大时,常会采用让子棋的方式,也就是水平较弱的一方先在棋盘的固定位置放上1~9个子(分别称为让先、让二子、让三子&&),然后双方再轮流落子。
&指数级增长&与&EXPTIME-Complete问题&
指数级增长可算是大规模计算第一大&拦路虎&了。在一个著名的传说中,国际象棋的发明者印度人塞萨(Sessa)向他的国王请求赏赐,他 说,希望因为发明国际象棋棋盘的第一个格而得到一粒米,因为第二个格得到两粒米,因为第三格得到四粒米,如此在每后一个格都增加一倍的米量。不识指数级增 长威力的国王欣然答允,甚至还有些责怪塞萨要求太少,然而事后才发现整个国库的米都倒干净了仍然无法填满整个棋盘。故事的结局是,国王恼羞之下偷偷派人把 塞萨杀掉了。学过等比数列的现代人按一按计算器就知道,国王因为这64个棋盘格子总共要支出2^64-1=^19粒米,这据估计已经超出整个人类历史上产米量的总和!
回到局势变化的复杂度问题上。即使10^19这样的天文数字也&只不过&是一个从当前盘面出发,每次只考虑2种走法,持续64步之后的可 能性空间的大小。对于国际象棋和围棋这样的复杂棋类,从初始盘面出发穷尽所有变化的复杂度(也称穷举复杂度)更是大得难以想象。信息论创始人克劳德香农在 1950年第一个估计出国际象棋的穷举复杂度大概在10^120种变化左右,具体数字被后人称为&香农数&。而围棋的穷举复杂度又远远超出国际象棋,达到 了惊人的10^360。作为比较,目前可观测宇宙中的原子总数据估计&只有&10^75个。
有人会问,为了分析当前盘面一定要穷举所有未来走势的可能性吗?有没有可能存在一个高效的算法可以在避免遍历呈指数级增长的可能性空间的 同时仍然对当前盘面做出准确评估呢?答案是,对于国际象棋和围棋,我们可以从数学上证明,不仅仅是穷举复杂度,其局势变化的计算复杂度也必须随所考虑的步 数呈指数级增长!对于任意一个给定的盘面,我们定义这个盘面的&最优值&为当博弈双方都下出&完美走法&的情况下导致的最终博弈结果。如果一个盘面的最优 值是&黑棋胜&,那就是说在黑棋自己不出错的情况下白棋无论如何努力都是必败的。理论计算机科学家先后在1981年和1983年证明国际象棋和围棋都属于 EXPTIME-Complete类问题,这意味着&任何&能正确计算盘面最优值的方法所花费的时间&必然&随棋盘大小(亦或棋局的平均步数)呈指数级增 长。事实上大部分流行的&双人零和&棋类的计算复杂度都是指数级的。有一些棋类如西洋跳棋、五子棋,它们的规模足够小,所以其初始盘面的最优值已经被计算 出来了。但是像国际象棋和围棋这样的复杂棋类,计算其初始盘面的最优值,以现在的硬件计算能力看来还遥遥无期。
又称零和博弈(Zero-Sum Game),是博弈论中的一个概念,指游戏(博弈)双方是竞争而不是合作关系,或者说是一种&你死我活&的状态。例如两人对弈,一方赢,另一方必然是输,不存在&双赢&。赢棋得1分,输棋减1分,两人得分之和就总是0,所以称为零和游戏。
蒙特卡洛树搜索法
使用蒙特卡罗方法估算&值。图/维基百科
选取的随机点(n)越多,估计值离&的真值越近。图/维基百科
这种选择很大程度上跟现有围棋弈棋系统对盘面静态评估方法的整体舍弃有关。前面提到,由于人们在设计具有一定通用性的围棋盘面静态评估函数的问题上长期止步不前,大概在2002年之后人们开始思考采用另一种完全不同的方式对盘面进行快速评估,这就是蒙特卡洛采样。
做为一种通用的计算方法,蒙特卡洛采样法的思想是当我们在求解一个确定但未知的值的时候,&在概念上&巧妙构造一个随机过程,使得这个随机过程的某个数字特征依概率收敛于我们要求的值,然后&在实际操作中&通过对该随机过程进行采样来对这个值进行统计估计。
比如说,一种计算圆周率&的蒙特卡洛方法是,在一个二维坐标系中0&x&1和0&y&1对应的方形区域里随机选取若干个点,并判断每个点(x1,y1)是否落在&以原点为圆心半径为1的单位圆&内(也即判定
x12+y12是否小于1)。根据中心极限定理,这些随机点落在单位圆内的比例依大概率快速趋于&/4。所以我们选取的随机点数量越多,越有可能得到的一个离的真值更接近的估计。
相同的&蒙特卡洛&思想也可以用于围棋盘面评估。前面提到了,每个围棋盘面都有一个&最优值&,对应于对弈双方都采用完美走法的情况下该盘面的最终结果。对于围棋已经证明,计算这个最优值的时间至少随该盘面到终盘之间的步数呈指数级数增长(平均200步,每步平均增长200倍数量的可能盘面)。既然从理论上无法得到最优值,有没有可能根据蒙特卡洛思想对整个可能性空间进行某种采样,然后通过统计估值的方法逼近这个最优值呢?人们对这个问题的思考在2006年终于取得了突破性进展,提出了一种称为蒙特卡洛树搜索的动态评估方法。
需要指出的是,现有的蒙特卡洛树搜索法虽然能保证大量采样的结果最终收敛到盘面最优值,但为达到&足够收敛&所需的采样次数仍然是随整个可能性空间的规模指数级增长的。但是在围棋弈棋系统的实践中,蒙特卡洛树搜索在比赛时间受限的情况下确实表现出远远超过传统方法的棋力。最近几年人们受这一观察的鼓舞,在选择策略中加入更多和围棋相关的专家知识,使得基于蒙特卡洛树搜索的围棋弈棋系统水平不断提高。
1、有些围棋软件会在特定条件下触发&死活棋判断&或者&劫争&模式,但这些优化更像是在特殊情况下的一种特殊战术,而不是作为一种基本思考模式。
2、这里&思考深度&定义为对每个变化的展开步数。假设一台机器原本一秒钟可以考察b^d个变化,对应思考深度为d。增加b倍硬件能力使得机器一秒钟可以考察b&b^d=b^(d+1)个变化,对应思考深度为d+1。使用&&剪枝法使得机器仅需考察(b^2d)^(1/2)=b^d个变化就达到和考察b^2d个变化一样的效果,对应的思考深度为2d。
3、前面已经强调过了,国际象棋使用的策略只是在&效果上&等价于对一定阶段内所有变化的穷举,而并不在实际运算过程中真的穷举整个可能性空间。
4、不仅如此,蒙特卡洛树搜索方法目前已经作为一种通用的动态评估方法广泛应用于&通用博弈比赛&(这种比赛要求为事先不知道具体规则的棋类游戏设计对弈程序)。
欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
阅读(...) 评论()

我要回帖

更多关于 蒙特卡罗论坛 的文章

 

随机推荐