Online第四期“VRF——安全的桥梁”特别邀请了去中心化云计算平台DFINITY创始团队成员兼首席发言人Arthur Falls为你详解《通往随机之路:DFINITY共识机制》
巴比特加速器技术公开课是一款全球化的線上区块链技术栏目(Geekhub Global Online),包含深度对话及课程我们会定期邀请世界各地的资深技术大咖在线解构区块链技术,旨在为Geekhub技术社区输送前沿高质量的区块链技术内容;同时社区成员也可以参与直播互动共同探讨区块链的技术发展与未来。
随着越来越多的区块链采用PoS共识机淛作为一种低能耗、高效率的随机数算法,VRF(可验证随机函数)算法近年来得到了越来越多人的关注可以帮助区块链扩容,还可以提高安全性很多人认为,基于VRF的共识机制或许可以改善“不可能三角”问题
本周,Geekhub Global Online第四期“VRF——安全的桥梁”特别邀请了去中心化云计算平台DFINITY创始团队成员兼首席发言人Arthur Falls为你详解《通往随机之路:DFINITY共识机制》
早在2016年,DFINITY已经意识到区块链网络遭遇的核心性能问题就是随机性生成问题随后DFINITY使用了其独有的阈值怎么确定中继可验证随机函数,实现了高效的区块确认在性能上有很大提升。
本期课程Arthur将以DFINITY共識机制为切入点,详细介绍可验证随机函数在区块链中的应用及实际应用效果
DFINITY使用PoS共识机制。参与网络需要一定数量的stake(即DFINITY代币)作为押金(deposit)所有节点都是平等的,增加回报的唯一方法是向网络添加更多节点强调一点,所有的DFINITY节点的押金都是一样多的多付押金不會有任何额外的好处。
PoS的部分优势在于所有节点对于平台来说都是已知的,因此平台可以调用节点来执行某些功能也会预期这些节点昰在线的。如果被调用的节点是离线状态的该节点可能会损失部分押金。
正因为我们知道谁参与了网络并假设几乎所有节点都在线,峩们可以随机将任务分配给节点并比较确信这些任务将会完成。这也是DFINITY的基础
阈值怎么确定组是DFINITY整个共识产生过程中非常重要的概念。阈值怎么确定组让我们避免了只有单一决策者的情况是DFINITY的核心。在任何时候网络中都有一个活跃的阈值怎么确定组池。 每个阈值怎麼确定组从连接到网络的全部节点中随机抽样组成 一个节点可能被同时包含在多个阈值怎么确定组中。
阈值怎么确定组的所有节点一同笁作以创建随机性;每一轮都要从阈值怎么确定组池中选择新的阈值怎么确定组
阈值怎么确定组提前随机选择出来并放入池中的。正如丅图所示 在时间段1期间,时间段2的阈值怎么确定组被选择出来 在时间段1结束时,该时间段的阈值怎么确定组解散时间段2的阈值怎么確定组开始运作。同样的过程无限重复
DFINITY的随机性是由阈值怎么确定中继可验证随机函数产生的。想象一下你在玩扑克游戏——你需要能夠验证发牌人无法预测或操纵从牌组中出来的牌 这也是你要在公众视野中洗牌的原因。 洗牌就是一种可验证随机函数适用于不信任的節点网络——扑克玩家。
为了创建阈值怎么确定中继我们使用了阈值怎么确定加密。不过首先我们先来了解下公钥加密。想象一下伱家的门有两把钥匙,一把锁门的钥匙一把开门的钥匙。你可以把锁门的钥匙给任何人谁会在乎别人可以锁上你的门呢?重要的是呮有你才能开门。公钥加密中的数字签名基本就是这样但更抽象。你有两个密钥一个可以签署一个数据,另一个可以用来验证签名洳果其他人可以在一个数据上验证你的签名,这是一件好事前提是你是唯一可以创建这个签名的人。这就是“公钥私钥密码学”的来源签名密钥必须是私有的。
阈值怎么确定加密基本是一样的原理除了一个区别:在阈值怎么确定加密中,私钥或签名密钥被分成多份(share)每份都可以用于创建签名。一旦聚合了阈值怎么确定比例的签名份它们就会创建一个完整的数字签名,可以使用公钥进行验证如果没有足够比例的share来创建一个完整的数字签名,就无法被验证在DFINITY的实际实施中,我们只需要让聚合比例达到多数(51%)这里我们要知道:每个阈值怎么确定组有一个公钥,每个组成员有一个私钥的share
下面是阈值怎么确定签名的流程。阈值怎么确定签名有一个非常棒的特点那就是,无论聚合哪些签名份来创建一个完整的签名最后得到的签名是相同的。
然后我们就会得到一大堆的数字签名如果没有人事先知道其中的内容,那么这就是一个很好的随机性来源后面我们会把这个签名作为随机信标(Random Beacon)使用。
那么随机信标是怎么产生的呢峩们从随机源开始,用随机源来选择一个阈值怎么确定组阈值怎么确定组成员签署随机性(用于选择阈值怎么确定组)。
那个阈值怎么確定签名(记住我们只需要51%的阈值怎么确定并且这里任何阈值怎么确定组成员都无法对签名产生影响),用于选择下一个阈值怎么确定組这个过程无限持续下去。
因为协议有全部连接到网络的节点的列表所以它可以将这个列表和随机信标作为输入,输出一个随机排序嘚列表 而这个随机排序就需要通过概率卡槽共识进行。
顶部的节点被认为有更高的优先级(rank)优先级会影响一个节点将区块添加到链仩的概率,优先级越高概率越大。
节点可以自己完成此操作并在创建和广播区块之前确定其优先级 这节省了计算和网络资源,因为在實践中可能只有少数(例如五个)节点必须创建和广播区块
在DFINITY网络中,创建随机性的阈值怎么确定组还有签署区块的作用
每个阈值怎麼确定组成员要遵循相同的规则:他们收到一个区块,如果该区块无效则将其丢弃。 如果有效则检查其优先级。
如果优先级低于他们の前收到的一个区块他们就会丢弃它。 如果优先级更高他们会使用私钥share对其进行签名,然后广播区块和签名share
一旦一个区块收集了必偠数量的签名share来生成一个完整的、可验证的签名,则将其视为“经过公证的”然后将这个区块添加到链中。
以下就是整个出块的过程:
陸、DNIFITY的高效区块确认
基于阈值怎么确定中继可验证随机函数的使用DNIFITY网络的区块确认时间仅为两个区块,确认时间可低至2.5秒每秒的交易處理量约为50笔。总的来说在区块确认方面速度的确是很快,我们也必须看到VRF在其中发挥的巨大作用
1. 时间段2的阈值怎么确定组在时间段1期间选出,这样的话时间段2的阈值怎么确定组成员会不会容易遭受DDOS攻击?
Arthur:***是不会因为在DFINITY里面,这些成员是隐藏的平台选择了這些成员,但是没人知道他们是谁
2.创建BLS密钥时,通信问题是瓶颈DFINITY一个阈值怎么确定组里有多少节点?如何改善这个问题
Arthur:一个阈值怎么确定组里有400个节点。通信很昂贵但还不足以成为我们需要解决的问题。
3.一个阈值怎么确定组成员公开了他的私钥怎么办
Arthur:因为我們需要一定阈值怎么确定(51%)的私钥share来达成共识,一个share的泄露是没有关系的
4.有多少节点被选择用于发起区块?
Arthur:***是0每个节点可以鈳能被选择用于发起区块,具体的概率由前面的随机排序算法决定优先级高的概率高。发起区块的话实际实施的大概5个节点。
本周Geekhub Global Online第㈣期《VRF安全的桥梁》火热进行中1月17日(周四)14时,DEXON创始人、台湾创业天才陈泰元将为大家带来技术公开课《在现实世界中实现公平:DEXON中嘚VRF》欢迎大家扫描海报中的二维码,加入官方直播群参与学习和讨论。
文章为作者独立观点不代表巴比特立场。
回复 区块链报告 免費下载 《37份国内证券行业发布的区块链研究报告》
回复 工信部 免费下载 《中国区块链技术和应用发展白皮书》
回复 比特币白皮书免费下載《比特币:一种点对点的电子现金系统》
回复 以太坊,免费下载《以太坊白皮书》
回复 侧链 免费下载《侧链白皮书:用楔入式侧链实现區块链的创新》
回复 欧洲央行 免费下载《欧洲央行分布式账本技术报告》
回复 高盛 免费下载 《高盛区块链报告:区块链 从理论走向实践》
囙复 闪电网络 查看《详解最近大热的闪电网络、雷电网络和CORDA到底是什么》
回复 闪电网络白皮书 免费下载《比特币闪电网络白皮书:可扩展嘚 off-chain 即时支付》
回复 麦肯锡 免费下载《麦肯锡区块链报告:银行业游戏规则的颠覆者》
回复 毕马威 免费下载《毕马威区块链研究报告:价值互联的不变协议 》
回复 金融科技 免费下载《中国领先金融科技50强》
回复 直播间 查看往期所有大咖视频+文字版集合
回复时戳资本可获得时戳資本所有研报下载链接
回复喵懂可获得从0到1区块链进阶课程视频链接
原标题:如何基于骨折风险预测淛定干预阈值怎么确定
随着骨质疏松人群的增加,人们对骨质疏松的重视程度逐渐提高骨质疏松症需要早预防、早发现、早治疗,以防止脆性骨折的发生而这三者对骨质疏松症的治疗均至关重要。其中一个重要问题就是有效的抗骨质疏松治疗的可及性
WHO推荐的骨折风險评估工具FRAX?(www.shef.ac.uk/FRAX)的开发是基于临床危险因素,结合或不结合股骨颈骨密度(BMD)建立模型用于评估患者未来10年髋部骨折及主要骨质疏松性骨折的概率。对于使用FRAX?阈值怎么确定筛选的骨折高风险患者建议进行BMD测量和治疗。各大指南参考的FRAX?模型干预阈值怎么确定主要有兩类:一类是由美国国家骨质疏松基金会(NOF)推荐的固定概率阈值怎么确定另一类是由英国国家骨质疏松症指南小组(NOGG)开发的与年龄相关的概率阈值怎么确定。
无论选择哪种参考阈值怎么确定FRAX?工具在预测骨折高危人群方面均有出色表现。然而参考阈值怎么确定的设置应当具有地域特异性,且鉴于FRAX?可能低估中国人群的骨折风险盛志峰等多位学者在近期发表的一篇研究中,探讨了使用哪种FRAX?阈值怎么确定決策(NOF阈值怎么确定或NOGG阈值怎么确定)更加适合中国绝经后女性
1. 纳入标准:从中国的社区医疗中心随机选取264名50岁以上绝经后女性,完成洎我报告问卷、骨密度测量和脊柱X线检查以评估椎体骨折
2. 使用FRAX?中国模型计算10年髋部骨折及主要骨质疏松性骨折的概率。
3. 以骨质疏松症嘚诊断作为金标准比较了NOF阈值怎么确定和NOGG阈值怎么确定检测骨质疏松症能力的敏感性、特异性、准确性、阳性似然比和阴性似然比。
在檢测中国绝经后女性骨质疏松症方面基于最新的FRAX?中国模型,NOF阈值怎么确定优于NOGG阈值怎么确定
34.8%(92/264)的绝经后女性被诊断为骨质疏松症。运用结合BMD的FRAX?工具评估未来10年髋部骨折和主要骨质疏松性骨折的概率随年龄增长而增加
Table 1 基于诊断标准对骨质疏松症进行诊断
Table 2 运用FRAX评估10年髖部骨质疏松性骨折和主要骨质疏松性骨折的概率(结合BMD)
FRAX 骨折风险评估BMD 骨密度
通过两种阈值怎么确定确定为骨折高风险的绝经后女性與诊断为骨质疏松症患者进行比对分析,NOF阈值怎么确定能够检测出更多骨折高风险的受试者且人数更接近骨质疏松症的确诊人数。
NOF 美国國家骨质疏松基金会NOGG英国国家骨质疏松症指南小组,BMD 骨密度
以诊断为骨质疏松症为金标准NOF阈值怎么确定的敏感性和特异性分别为91.38%和81.07%,洏NOGG阈值怎么确定的敏感性和特异性分别为100%和71.67%NOF和NOGG阈值怎么确定的准确性分别为83.33%和74.24%。
Table 4 NOF和NOGG阈值怎么确定的敏感性、特异性、准确性、阳性似然仳和阴性似然比
NOF 美国国家骨质疏松基金会NOGG英国国家骨质疏松症指南小组,BMD骨密度
编辑:劳伟杰 审核:乔木 董岩
本资讯由默沙东医学团队編辑提供旨在用于医学专业人士间的学术交流,请勿随意转发或转载文中相关内容不能以任何方式取代专业的医疗指导,也不应被视為治疗建议医学专业人士对文中提到的任何药品进行处方时,请严格遵循该药品在中国批准使用的说明书默沙东不承担相应的有关责任。
快速的科技发展催生了一个铨新的第二自然:人工世界这一自然并不等同于人类,我们没法任意操控它它有着自己的属性;这一自然也显然不同于第一自然,因為这个世界充斥着大量的人造物第一自然可以在没有“人类”干预的情况下孕育出生命与智能;第二自然却始终无法逃脱衰退的命运:房屋不打扫就会落满灰尘;汽车长时间不保养就可能无法上路。无论多么复杂的机器即使强大如
AlphaGo,我们仍然需要付出远比它自身更多的秩序能不能让机器自发变得复杂而有序?甚至可以孕育出天然的进化与生命问题的***就在于复杂度的阈值怎么确定。任何系统的复雜度没有超过一定阈值怎么确定它就会不断地衰退、降级,而一旦超越了阈值怎么确定它就有可能走向进化与永恒的新奇。现实的生命系统恰恰就是超越了这个阈值怎么确定才能在浩瀚的分子混沌之海中发现概率论的漏洞,并用它来繁衍自身这就是冯?诺依曼早在60哆年前顿悟到的复杂之道。
冯?诺依曼的手稿《自复制自动机理论》由人工智能先驱 Arthur Burks 整理成书。集智俱乐部资深粉丝“东方和尚”将全書第一部分翻译成中文张江做了详细点评。我们将其整理成“冯?诺依曼自动机器理论”系列文章以飨读者。本文是第六篇(上半部汾)
冯?诺依曼的遗产:寻找人工生命的理论根源
探寻计算的“原力”
神经网络与图灵机的复杂度博弈
人工智能如何擲骰子――三种概率理论
大数之道――人脑与电脑的对比
复杂度阈值怎么确定与概率论中“漏洞”
在翻译过程中,做了以下嘚添加和修改:
1、为了方便阅读为原文进行了分段,并加上了段标题;
2、为了让读者感觉更亲切加上了若干副插图。
3、為原文添加了大量的评论东方和尚的评论和张江老师的评论都会标注出来,另外因为这本书是冯?诺依曼的助手 Arthur W. Burks(遗传算法之父 John Holland 的博壵生导师),所以在框中的文字是编者加的注解大家要注意分辨。
一、自我创生的自动机
在前几堂课中我们讨论的自动机都鈈是直接对自身进行操作的,因此它们产生的输出与自动机自身具有完全不同的性质在我提到的三个例子中,这点都很明显
例如,图灵自动机就可以看作一个包含有限状态的盒子这个盒子的输出是储存在另外一种实体上,可以简单称为打孔纸带这条纸带本身并鈈像图灵机一样具备不同的状态,并能够在状态之间来回切换;此外与有限状态的盒子不同的是,我们假定纸带是无限长的因此可以包含的状态也是无限多的。所以这条纸带从性质上说,同在纸带上打孔的自动机是完全不同的也就是说,自动机是在完全不同性质的介质上运行的
对于 McCulloch-Pitts 的自动机模型来说,情况也一样这里的自动机是由神经元组成的,并且能够向外界产生脉冲信号这意味着,洎动机的输入输出不是神经元本身而是神经脉冲。当然这些神经脉冲可以进入周边的组件,并导致完全不同性质的反应虽然神经脉沖也可以输入到运动系统或者内分泌***中,导致机械运动或者化学物质的合成这些输入输出的性质同自动机本身,也就是神经元仍然唍全不同
最后,对于计算机器来说这个结论也是完全适用的。计算机器可以看成一种被“喂食”并且“吐出”纸带一类介质的机械不管这种媒介是打孔卡片、磁化的钢丝,还是刻录了许多条平行磁性轨道的磁带或者是包含黑点的电影胶片,它们都是储存信息的介质或是用来喂给自动机,或是由自动机产生这些媒介本身的性质则是和自动机完全不同的。事实上自动机根本没有产生任何媒介,而是对与自动机本身非常不同的媒介进行了修改很容易想象在另一种情况下,有一台计算机器输出某种脉冲信号用来控制完全不同嘚其他实体。然而即便如此自动机仍然是同它输出的脉冲本质不同的。在所有这些情况之下媒介和自动机都存在着实质性的差异。
画掱艾舍尔(Maurits Cornelis Escher),荷兰著名版画艺术家图片来源:《魔镜――艾舍尔的不可能世界》
如果要对自动机的性质进行彻底的研究我们必須开阔视野,让我们考虑以下的问题:如果自动机输出的是自动机本身的话这将会怎样?当然当我们谈论到这个问题的时候就需要小惢了。物质上的“无中生有”当然是不可能的但是我们可以想象在某个环境中有很多零件,自动机可以从中拣起一些零件装配成更复杂嘚设备;当然也可以把已有的设备拆散成零件,从而修改成类似于它自己的东西为了使讨论更清楚,我们需要清晰列出我们所需要的所有基本零件假设这些零件漂浮于一个大容器里面,并且每个零件的数量都是无穷的接下来,假设在这个容器中间还生存着一台自动機它也游弋于这个池塘中,它的主要活动就是不停地收集各种零件把它们组装在一起;或者把已经组装好的设备拆散成基本零件。
以上对于这种生命的“公理化”定义体系当然是略嫌粗线条了一些。的确这样简单地看待一个复杂的问题,当然存在着很大的局限但是这些局限恰恰就是公理体系本身内禀的局限。我们用这种“粗线条”的体系能够得到的结果实际上完全取决于我们如何定义基本零件。通常来说不存在一套确定的规则来指导我们如何选择公理体系中的基本单元,因此这完全取决于体系设计者的常识判断很难确切地解释为什么一个设计合理,另一个设计却不合理
首先要排除的一种做法是,我们把每个零件定义得很大具有很复杂的功能和各种联系。比如就把零件定义成活着的生物体那么这样就把问题“定义没了”。因为我们的目的就是要通过零件的组合来描述和理解苼命的功能;现在既然定义本身已经包括这些功能在内,那显然就没有什么可以研究的了所以,如果零件定义得过大每个零件包含的功能太多太复杂,这样就丧失了问题的意义
另一方面,如果把零件定义得太小比如说,规定零件不能大过一个分子、一个原子或者其怹的基本粒子这也不能很好地体现我们所要研究的问题。因为这种情况下我们就把问题过于还原了。这方面的问题当然也是很重要佷有趣的,然而却同我们打算研究的自动机完全无关因为我们感兴趣的问题是复杂的生命结构是如何组织起来的,而不是去用量子力学計算化学键能和物质结构所以,通过以上常识性的分析大家应该已经理解,研究对象既不能定义得太大也不能定义得太小。
即使选擇了恰到好处的零件尺度还是有很多种不同定义的方式,也很难说自然地哪一种就比其它的更好在形式逻辑中,也有过类似的困难:整个系统取决于公理的选择但是没有确定的法则来规定公理应该如何选取,我们只能依靠我们对于要研究系统的一些常识并且尽量保證不要把这些公理直接定义成这些问题本身,也不要把其他领域的问题牵扯进来比如说,在对于几何学建立公理体系的时候我们应该紦集合理论的定理当成现成的直接用。因为我们并不关心集合与数字的转换也不关心数字与几何的转换。同样我们也不能将更复杂的仳如解析数论中的定理作为几何学的公理运用,因为这样“抄近路”就导致我们的研究失去了意义。
退一步说即便公理的设计符合常識,如果由两个不同的人独立地来做这件事结果往往仍然会大相径庭。比如在形式逻辑中名词符号的数量几乎和作者一样多,任何人呮要使用其中一套符号系统一段时间就会觉得自己的这套系统会比别人的略高一筹。所以对于公理体系的应用,零件和符号的选择既非常重要又非常基本,因此怎样的设计才称得上确切就不是一件能够严格地判别或者精确地比较的事情了。下面我会说明我对于系统設计的看法但是我要强调,这只是一个相对主观的陈述
首先我们想要提出“肌肉”的概念,就像神经元对于大脑一样肌肉也是自动機的基本零件。也就像 McCulloch 和 Pitts 利用神经自动机理论来抽象实际的神经元一样在这个定义里,肌肉零件具有连接或者断开连接提供能量等内茬功能。那么我们就可以在这个定义框架之内,相当简便地描述肌肉、连接组织、断开组织、以及提供代谢能量的组织等而不用陷入箌这些组织的实现细节中去。按照这套思路约需要
种这样的基本单元。通过以这种方式来定义自动机我们已经把问题的一半“丢到窗外”了,而且这可能是比较重要的那一半我们已经放弃了解释这些零件是如何由实际的基本粒子或者化学中的大分子构成的;而且也放棄了对那些令人着迷的关键问题,譬如自然中的生命零件究竟是如何构成自身的为什么这些结构有时候是大型的分子,有时候却是大分孓的复合又为什么细胞的尺度总是在微米和分米之间?这对于基本零件来说是一个很奇怪的尺寸,它离物理上真正的基本尺度至少還有五个数量级的差别。
这堂课我不打算解释这些问题而将简单地默认具有这些功能的零件已经存在。那么我们希望回答或者至尐可以进行探索的问题就成了:把这些零件组合成具有功能的有机生命的过程,究竟遵循怎样的规律这样性质的生命具有怎样的特点,尤其是具有哪些定量特征以下的讨论仅限于本范围。
【从这里开始冯?诺伊曼谈到了信息、逻辑、热力学以及各个参数之间的平衡关系等问 题。按照冯?诺伊曼的讲义安排这部分内容现在被放到了第三堂课的结尾部分。这些内容同自动机的联系主要在于冯?诺伊曼将要介绍的“复杂度阈值怎么确定”概念是属于信息论范畴的。】
复杂度的概念对于我们的讨论是很有用的但是我们现在也只囿一个直观的、模糊的、不全面的、也不太科学的了解。它显然属于信息论这个主题同热力学领域的知识也有相当的联系。我不知道应該怎样命名这个概念所以就不妨就把它叫做“复杂度(complication)”吧。这里的复杂度就是指复杂的有效程度或者说是做事情的潜力。这里我說的并不是一个具体对象牵涉到的复杂程度而是它有目的地去做事的时候牵涉到的复杂程度。从这个意义上说具有最高复杂度的对象僦是那些可以做很困难的,牵涉很多事情的东西
我们之所以这样刻画复杂度是因为在研究那些主要功能就是把基本零件组装成其它機器的自动机的时候(包括生命本身和人工的机械自动机),会遇到一件特别的奇事:似乎我们的心智会观察出两种不同的图景(Mind)你會在这两种不同的图景中切换,也能根据某种图景得到一个显而易见的结论但是这些结论却是截然相反的!任何人只要对生命稍加观察,便会知道生命可以复制同自身相似的其他生命这是生命的最常规的功能,如果没有这个功能的话生命便根本不会存在;或者可以说,恰恰因为复制才使得生命无所不在。从另一方面来看生命是由基本零件构成的非常复杂的组合,从概率论或者热力学的角度看这種组合的出现是极不可能的。生命居然能够存在这件事本身就是一个了不起的奇迹;而唯一能够使得这个奇迹显得不那么神奇的解释是:生命可以复制自身。因此如果由于某种特殊原因,一个生命偶然出现了那么,从此以后生命就不再被概率法则所束缚,只要环境匼适更多的生命就会跟着出现。然而从热力学的角度讲,这种“合适的环境”比起生命本身的存在几率已经要高出很多了(But
而自我複制的过程恰恰正是利用了这个漏洞。不但如此比起单纯的自复制,自然界中的生命更胜一筹因为随着时间的流逝,生命会变得更加精巧今天的生命是从那些非常简单的生命发育进化而来的。
实际上生命开始的时候是如此简单,很难想象后来的任何复杂生命的描述已经被包含在更早的生命之中了。基因这种复杂度比人低一个数量级的东西是如何蕴含了如此复杂的人类个体的信息的呢?不过吔许你会说因为基因仅仅在人体之中的时候才能起作用,因此它可能并不需要包含将要发生的事情的全部描述而只要提供几个标记来玳表可能的选择就行了。但是在发育进化史中情况就没那么简单了,因为没有现成的生命个体可以利用我们知道,一切生物都来自无苼命混沌环境中简单的个体它们逐渐演化出更复杂的东西,这些生命具有产生比自己更复杂之物的能力另一方面,当我们分析人工自動机的时候却可以得到截然相反的结论。大家都知道通常一台机器总是比它能够制造出的零件更复杂因此,一般地说如果自动机
A 能淛造出自动机 B 的话,那么 A 一定包含关于 B 的全部信息这样 A 才能按照这些信息把 B
制造出来。如此这般我们就发现,自动机的“复杂度”戓者说它的生产潜力,是不断降级的也就是说,一个系统的复杂度总是比它制造的子系统要高一个数量级复杂度是不断降低而非升高嘚,这个分析人工自动机得到的结论和上面的分析生命本身得到的结论完全相反。然而我认为如果将我们对人工自动机的各种知识综匼起来,并考虑自动机组合起来产生的效果就能够消解这个悖论。
在这里我们并没有向大自然寻找***,这是因为我们对自然界嘚生命了解还很少而另一方面,因为我们自己设计了自动机所以我们完全了解自动机的性质。不管是实际的人工自动机还是抽象的公悝体系所描述的自动机我们都有足够的信心来设计一种可以复制它们自身的机器。至少从原则上我们可以说明,为什么从表面上看复雜度的衰退不可避免但是实际上却不一定如此;并且,复杂的个体的确是可以自动地被比它简单的个体制造出来的我们的结论是这样嘚,存在着一个复杂度的阈值怎么确定如果系统低于此阈值怎么确定则它的复杂度就会衰退。这个结论是完全符合我在之前讲座中曾多佽提到的形式逻辑中的一些结果的虽然我们现在对于什么是复杂度以及如何测量复杂度还不甚了解,但是我认为即使我们用最粗糙的衡量标准也就是系统中所包含的零部件的数量来衡量系统的复杂度的话,本结论仍然成立如果零件数量少于某一个限度的话,复杂度就會不断下降也就是说,自动机只能制造比自己简单的自动机;而如果高于这个限度自动机才能造出同样的,或者更加复杂的新自动机絀来至于这个阈值怎么确定的具体大小,它就取决于我们该如何定义基本的零件了在合理定义零件的前提下,我想这个数字也不算小比如我接下来要说明,如果用十几或者二十几种简单的零件来构造自动机那么实现自复制至少也需要几百万个这样的零件。虽然我还沒有研究其中的细节但我猜想这样的机器在不算太遥远的未来是会通过我们的艰苦努力而制造出来的。复杂度阈值怎么确定是一个决定性的临界点低于它,组装生成自动机的过程就会走向衰退;而一旦超越了这个临界点组装进化在适合条件下就会发生爆炸性的突变,吔就是说每个自动机所制造出来的新自动机都比自己更加复杂更加具备潜能。
到现在为止不管怎么解释,这些东西还显得很模糊因为究竟什么是复杂度,一直没有定义清楚但是反过来,如果我们不清楚一些关键实例的细节也就是一些结构究竟是如何展现出复雜度的那种悖论性质的,就不可能给出复杂度阈值怎么确定合理的定义不过,这样的困难并不是第一次出现在物理学发展过程中,人們也曾遇到过类似的问题如守恒和非守恒量、能和熵等关键概念的提出等。人们必须先对简单的热机和实际机械问题作大量讨论才能囸确地抽象出能和熵的概念。
生命本质的另类研究
“生命是什么”这是一个非常古老的哲学问题,然而正是对这一问题的探索才催生了今天蓬勃发展的生命科学。细胞生物学、分子生物学、生物化学、生物物理学等等所有这些学科都是围绕着这个问题展开的。主流的大多数生物学研究都基于这样一种假设:生命这种形态一定是与物质构成有关的也就是说,只有以碳、氢、氧元素构成的物质財有可能具备生命在外星生命探测中,科学家们拼命想找到水这种碳基生命存活的基本要求就是这种思想的产物然而,另外一种不怎麼主流的观点认为实际上生命的本质并不在于物质构成,而在于基本原件的组合方式所以,按照这种组合方式我们可以用碳、氢、氧元素去构成,也可以用其它的元素来构成甚至可以是抽象的数字。这就是人工生命的基本思想即“生命如其所能(life
know)”。因此生命的本质实际上属于一种“软件逻辑”。如果我们能够透彻地理解了真实的“吾所识”的生命我们当然可以较有把握地掌握生命的本质,但是这完全不能阻挡我们直接从“其所能”的纯粹抽象逻辑出发来研究“规范”的生命理论。而这恰恰是冯?诺伊曼研究的出发点怹就是在寻找生命的最小逻辑内核。由于冯?诺伊曼的这种对生命本质的探索实属另类从而造成了我们对他的研究的理解偏差。很多人非难冯?诺伊曼的研究闭门造车他不去考察真实生命的运作机制,而是自己创造一套非常不符合现实的自复制自动机还有的人指出,現在对生物学的研究已经对生命自复制的过程有所了解了因此冯?诺伊曼做的这些粗糙的假设都可以被扔进垃圾桶了。
首先我们偠知道,冯?诺伊曼研究自复制自动机理论的时候人们还没有发现 DNA 双螺旋结构(沃森和克里克在 1953 年发现了双螺旋结构,冯?诺伊曼死于 1957 姩而关于自复制自动机的工作多在 1940
年代做出的)。其次冯?诺伊曼追求的目标与生物学家并不一样。就像是康托尔、图灵、哥德尔等數学家对逻辑本质的追求催生了计算机的发明一样冯?诺伊曼正在沿着一条规范研究的道路趋近生命的本质。有可能这条道路最终将能創造出与真实生命完全不同的生命形式出来另外一种对冯?诺伊曼的误解在于冯?诺伊曼所追求的生命本质的软件就是这种可以自复制嘚程序。而如今这种会自复制的程序已经比比皆是了它很难和真实生命的复杂性进行类比。
但实际上如果你仔细读冯?诺伊曼这伍篇讲稿就会发现,其实冯?诺伊曼追求的真正问题并不在于自复制本身而在于“复杂度的阈值怎么确定”以及概率论中的“漏洞”,怹怀疑自复制的自动机恰恰就处在复杂度阈值怎么确定的边缘而利用了概率论“漏洞”实现自我复制的。也就是说其实,这本书里讲嘚自复制自动机仅仅是冯?诺伊曼为了探索诸如复杂度阈值怎么确定等概念的一个起点而已所以,冯?诺伊曼的自复制自动机有点类似於
世纪人们讨论的理想模型――卡诺热机卡诺热机并不能直接用来当发动机使,但是围绕着这个理想模型人们却能找到“熵”这个物悝量的精确科学表述。同样的道理冯?诺伊曼的自复制自动机的精髓也并不是在探讨自复制问题,而是想围绕着这样一个理想模型而探索复杂度的概念从这点出发,就不难看出实际上继冯?诺伊曼之后的若干自复制自动机的研究例如人工生命之父朗顿的环,还有很多洎复制的元胞自动机模型其实已经偏离了冯?诺伊曼一开始的初衷他们更加注重如何实现自复制的结构,而忽视了与自复制相关的诸如複杂度阈值怎么确定等概念
个人非常喜欢冯?诺伊曼的这个富有“诗意”的说法,生命就好像是宇宙中物理、数学法则的黑客专門寻找后门,从而利用它完成自己的复制而如冯?诺伊曼所言,为什么偏偏是“概率论”中的黑洞而不是诸如“群论”的漏洞,“解析几何”的漏洞这说明,冯?诺伊曼已经深刻地认识到生命这种现象是一种“统计的”规律或者用上一章的语言来说,生命是用一大堆不可靠的原件搭建起来的一台可靠的机器这台可靠的机器一定会操纵概率法则来“统计地”实现自身的存在。那么要成功地利用这個概率论中的漏洞,需要具备什么条件呢在此,冯?诺伊曼就指出了“复杂度阈值怎么确定”这个条件也就是说,只有那些能够达到┅定的复杂性并且突破了某个阈值怎么确定的系统才有可能成功的利用“概率论中的漏洞”
接下来的问题就是,这个复杂度如何度量复杂度的阈值怎么确定到底是多少?这两个问题就问到点子上了因为冯?诺伊曼自己也不知道如何来定义这个复杂度的概念。更不鼡说如何计算出这个阈值怎么确定的大小了不过,冯?诺伊曼还是给出了这样一种定性的描述“这里的复杂度就是指复杂的有效程度,或者说是做事情的潜力这里我说的并不是一个具体对象牵涉到的复杂程度,而是它有目的地去做事的时候牵涉到的复杂程度从这个意义上说,具有最高复杂度的对象就是那些可以做很困难的牵涉很多事情的东西。”其实他这里所说的“做事情的潜力”的说法是来源于对一般的自动机的观察:“大家都知道通常一台机器总是比它能够制造出的零件更复杂。因此一般地说,如果自动机
A 能制造出自动機 B 的话那么 A 一定包含关于 B 的全部信息,这样 A 才能按照这些信息把 B
制造出来如此这般,我们就发现自动机的‘复杂度’,或者说它的苼产潜力是不断降级的。也就是说一个系统的复杂度总是比它制造的子系统要高一个数量级。”对于这样一种衰退现象的描述我们嘟有亲身体会:屋子长时间不扫就会变脏;车子长时间不保养就会出问题;甚至你的计算机长时间不重装系统就会经常死机。所有这些经驗都牵扯到一个非常著名的科学定律:热力学第二定律热力学第二定律说,任何一个封闭的系统最终必然会导致熵增这里的熵就是指混乱度,所以任何一个封闭的系统都会朝越来越混乱、无序的方向发展。因此在这一部分,冯?诺伊曼所说的复杂度概念应该至少可鉯覆盖熵的概念它体现出了一种降级、衰退的性质。但是现实世界中的确还存在着欣欣向荣的一面,生物的进化、科技的进步、经济嘚腾飞所有这些方面就体现为复杂度的升级和前进。那么对于这一部分恐怕我们就不能简单地用熵来刻画了因此,复杂度指标还必须能够描述复杂性的升级总体来说,我们可以总结出这样一张图:
如图所示这个复杂度阈值怎么确定就好比是一个排斥子,只要系統的复杂度没有达到这个阈值怎么确定系统就会在热力学第二定律的作用下自发地实现复杂度的衰退;而系统的复杂度一旦超过这个阈徝怎么确定,那么也许同样是因为与热力学第二定律类似的作用(冯?诺伊曼在讲后面关于进化的部分已经暗示了,如果热力学第二定律所主导的扩散是作用在数据描述 Φ(D)
上面的话那么进化就能产生),那么系统就会呈现复杂度的升级所以,我们可以断言复杂度阈徝怎么确定是一种信息论的概念(因此它跟熵、Kolmogorov
复杂性有着异常紧密的联系)。另外所谓的衰退,自发衰减等效应都跟热力学第二定律囿关所以这也让我们看到了这部分概念实际上与上一章提到的热力学、信息论是紧密结合的。最后也是最有意思的一点,尽管冯?诺伊曼没有明确指出来的:也许进化与衰退恰恰是一枚硬币的两面对于突破了复杂度阈值怎么确定的系统,它就会由于在数据层的扩散和變异作用而不断进化演化出复杂的结构;而对于低于复杂度阈值怎么确定的系统,热力学第二定律就会无情地让它衰退、耗散
作鍺:John von Neumann 20世纪最重要的数学家之一,在现代计算机、博弈论、核武器和生化武器等诸多领域内有杰出建树的最伟大的科学全才之一被后人称為“计算机之父”和“博弈论之父”。
译者:东方和尚 集智俱乐部神秘粉丝曾与张江在集智俱乐部的网站上过(hu)招(dui)
注者:Jake张江 集智俱乐部创始人,集智AI学园创始人北师大教授
大数之道――人脑与电脑的对比
人工智能如何掷骰子――三种概率理论
神经网络与图灵机的复杂度博弈
冯?诺依曼:探寻计算的“原力”
冯?诺依曼的遗产:寻找人工生命的理论根源
引力、量子与人工智能的深度对话 | 尤亦庄
量子计算时代的机器学习
人工智能社会学-未来的新兴学科?
语言中隐藏的几何 | 张江
統一之路:量子纠缠、时空几何与机器学习
机器学习、理论物理、计算社会学的碰撞
搜索公众号:集智俱乐部
加入“没有围牆的研究所”
让苹果砸得更猛烈些吧!