复杂系统 - yufree/yufree.cn GitHub Wiki

复杂系统的特征

  • 组成部分或个体相对简单
  • 各部分非线性相互作用
  • 没有中心控制
  • 涌现行为,例如层级结构、信息处理、动态、进化学习
  • 缺少数学工具统一整合理论

动力学

  • 系统随时间的变化
  • 混沌系统,初始条件与运行规则已知,长期预测不可知,对初始值敏感但存在可预测的全局特性
  • Logistic Map

分形

  • 自我相似性,整体与局部相似
  • 分形的维度,D维对象的边被反复切割为M个部分,每一切割水平有$M^D$个副本,假如副本个数为N,也就是说$N=M^D$,其维度$D = logN/logM$
  • 数盒子测维度,计算有多少盒子与盒子的边长,改变盒子的边长,计算盒子的个数 $log[NumberOfBoxes] = D log[1/BoxSize]$

信息论

  • 麦克斯韦妖
  • 热动力学的墒测量做功时的热损失,热损失就是无序;统计学的墒测量能出现宏观状态的微观状态的数量,微观状态越少墒越低,越混合越无序。统计意义上热力学第二定律本质是宏观状态下微观状态数目趋向于最大
  • 玻尔兹曼认为宏观状态的墒S是微观状态数W的自然对数的k倍,k是玻尔兹曼常数。更多的微观状态会提高宏观状态出现的可能,墒提高。
  • 香农认为信息含量表示让人吃惊的程度
  • 信息量$H = log_2 M$ M 表示以字节传递信息的可能性
  • 信息整体$H = - \sum_{i=1}^{M}p_ilog_{2}p_i$ p 表示出现的概率
  • Hffman编码可节省信息传递字节,进行压缩

进化

  • 遗传算法,首先生成随机策略,对于随机策略计算适应性,然后对策略进行杂交与突变,重复这个过程直到足够好的策略产生
  • 难预测,会产生过度适应,但会有新东西产生
  • 编程上用if-else生成的树来进行突变

细胞自动机

  • Conway的game of life
  • Stanislaw Ulam 和 John von Neumann的细胞自动机,机器中的繁殖
  • 元细胞自动机,一维仅考虑左右邻居,两个状态,共计256种模式,用二进制编码(Wolfram编码)
  • 规则30被用作伪随机数生成器
  • 四种分类:固定的,周期的,混沌的,局部的
  • 作为动态系统考察,与 logistic map 同构
  • 控制参数lambda,规则里黑色的比例,从固定到周期到混沌到周期到固定,存在混沌的边缘
  • 第四种可以用来进行通用计算,但第四类很难定义,规则110可以作为通用计算机
  • 细胞自动机可以用遗传算法来筛选规则演进
  • 细胞自动机也可以用来理解信息交换,通过定义模式来进行

自组织

  • 系统内部分组分的局部去中心交流产生的有组织模式

  • 群聚(flocking),存在进化意义上的解释,个体规则为避免碰撞,与周围人同速,保持在一起

  • 同步包括萤火虫同步、蟋蟀鸣叫、蝉鸣、神经放电、心脏跳、月经同步,存在进化上解释,个体规则为只对周围的行为进行模仿

  • 蚁群觅食,随机寻找食物,当找到食物源返巢时留下信息素,其他蚂蚁得到信息素就会跟随,没有加强信息素会挥发,这会适应环境

  • 工蚁只对环境变化及同类多数行为采取行动,如果蚁巢被破坏,觅食工蚁数量就会减少,个体交流用信息素或触角

  • 较大的蚁巢自组织化更高,有可能是经验产生更好的统计信息与信息交换速率

  • 生物行为也是一种分布去中心的编程方法,考虑了随机性与适应

  • 囚徒悖论:没有中心控制的条件下如何促进合作?以牙还牙,不首先作恶、可原谅、有报复且规则清晰

  • 复杂经济学:自私个体存在有限理性且策略有限,不可分析,没有平衡,需要个体适应

  • 酒馆问题:100个人阈值60以下舒适,每个人根据之前的历史判断,该模型认为自组织合作可以实现整体有效而不用完全理性知识及演绎法

网络

  • 基本结构是节点和连接,有方向的话要考虑连入和连出度
  • 连接度分布与联通路径是考察网络的基本视角
  • 网络中的聚类用节点的邻居之间的联系占理论所有连接的比例来定义
  • 小世界理论(六度分割):网络中很少有长距离连接,但节点间短连接比例很高
  • 现实世界中网络结构既不是长距离高聚类的齐整网络,也不是低距离低聚类的随机网络,而是有较低距离但高聚类的网络
  • 现实网络的形成过程可以用齐整网络间部分节点的随机连接度来模拟
  • 无尺度网络,网络中节点的连接度分布近似于幂律分布
  • 形成原因是偏好依附
  • 大节点出问题出现的系统崩溃或级联效应是值得关注的,对网络的随机攻击则不会产生太大的问题

《爆发》

  • 事情出现爆发是因为优先级,高优先级总是被执行,有些总是拖后,短时间活跃,长时间沉默
  • 幂律分布
  • 大部分人行为可预测,可以量化人类行为

历史

  • Graph theory: 1735, Euler
  • 19世纪,哲学家孔德曾提出社会物理学
  • 五十年后社会学家涂尔干认为社会组成就像生物系统一样,需要关注结构而不是个体
  • 1932年,哈德逊女校出现女生逃跑的流行趋势,两周跑了14个,精神病学家 Jacob Moreno 认为这与个人关系不大而是女生间社交关系导致,社交网络中的位置会决定她们是否以及合适跑路。
  • 1930s Moreno 认为这是一种由社交原子与社交重力组成的物理学 Social Network Research
  • 1940s-1950s 矩阵代数与图论被用来研究网络中的群组
  • Alex Bavelas 在MIT开始用实验手段研究不同结构的社交网络对群组解决问题能力的影响,中心结构效果最好
  • 1950s 数学家Kochen与政治学家 de Sola Pool 提出了小世界问题
  • Stanley Milgram 提出六度分隔
  • 社会学家研究了1050生活在50个不同城市化北卡社区的社会关系,让他们指定相关的人然后告诉他们与自己关系,发现城市化减少网络密度,对幸福感与满意度负相关
  • 对13-19岁的369个男生与366个女生研究发现青少年会被小团体影响
  • 1960s 网络研究进入人类学,社会被看作社会角色扮演者间关系网或模式,亲缘关系也开始计算入关系网络,家庭社交网络越大,男女分工趋势越明显 Communication networks/internet
  • 1970s 网络研究回归社会学,通过折叠结构相似的部分,社交网络可以更好地反映社会结构,结构相似的部分人群对外界反应也相似
  • 1979 Ecological Networks
  • Mark Granovetter 提出弱连接理论(SWT),强连接的群组信息相对一致,弱连接更可能成为新信息来源
  • 1980s 出现社交网络会议、组织、期刊、软件
  • 1990s 社交网路进入物理、生物、管理咨询、公共健康、打击犯罪等领域

社交网络理论

  • 连接类型 
  • 概念
    • cohesion 高密度、短距离及多个独立路径
    • shape 连接分布状况
    • centrality 节点中心化 Freeman’s betweenness 节点在通路中的枢纽作用 美第奇家族的权利是高中心化的表现
    • dyadic cohesion 二元密度 节点对的社会紧密度
    • dyadic equivalence 二元等价度 节点对的相似结构功能
  • 研究问题
    • 物理学:无尺度分布
    • 解释网络关系形成并预测网络特性
    • 两个节点形成联系的机会解释与利益解释
    • 社交网络的结果,参与者的同质性与性能,有更多结构分支的自我网络有好主意
  • 理论机制
    • 因果机制,主要包括传递性、适应性、附和(共价结合)、排外
    • 基础隐喻,包括流模型与构筑模型
  • 批评与挑战
    • 理论更多是方法学或描述性的
    • 缺少个人能动性
    • 网络的动态变化
    • 个人认知反馈
    • 双向解释,概念本身会产生影响

《链接》

  • 还原论(reductionism):高级运动形式还原为低级运动形式,理解细节来理解整体,重组其实很困难

  • 随机网络:通过随机连接节点搭建起来的网络,当添加链接数超过临界值,网络将发生剧烈变化

  • 当平均链接数超过1,游离在节点簇外的节点数呈指数下降

  • 随机网络模型的直方图服从泊松分布,偏离平均值的人数随偏离程度指数下降

  • 六度分隔:社交网络上任意一对节点之间平均相隔6个链接;任意两个网页之间平均相隔19次点击;食物链中物种间平均间隔2;细胞中分子间平均间隔3个化学反应;科学家合作网络中不同领域科学间之间的间隔4-6个;线虫大脑神经元之间间隔14个突触

  • 节点间间隔(d)和网络中节点个数(N)的对数成正比:d = 0.35 + 2LogN

  • 社会链接现在可以保持很长时间,世界不断缩小,降低了人与人间的间隔程度

  • 弱关系的团聚效应:团聚系数,团体间除某个体外实际链接数与最多形成的朋友链接数,1表示朋友互联,0表示该个体是唯一链接人

  • 埃尔德什数&贝肯数:科学家的合作关系网,小网络

  • 添加少量链接会大大降低节点间平均间隔但并不改变团聚系数,起桥梁作用

  • 枢纽节点十分重要,连接度非常高,表示万维网并不平等,存在高度集中个体,平均意义不大

  • 枢纽节点的存在是随机网络与团聚模型不能解释的,属于无尺度网络,遵守幂律分布,允许大量微小事件与少量重大事件,在正态分布中,极端事件出现概率指数下降,不允许枢纽节点存在。随机网络代表是公路路网,无尺度网络代表是航空网。

  • 无尺度网络

  • 物理相变过程一些物理量遵守幂律分布,威尔逊重整化理论

  • 无尺度模型出现的两个要素:生长机制与偏好链接,早期的点更多时间上存在更多的机会,节点连接时倾向于连接已经有更多节点的枢纽节点

  • 后发制人:解释枢纽节点变迁的适应度模型,有更高适应度的节点被连接概率高,这样后来者就可以成功。同样适应度的节点,老的胜出;同样连接度的节点,适应度高的胜出

  • 玻色-爱因斯坦凝聚(绝对零度之上的最低能态,可降低光速):胜者通吃的量子力学原理,胜者获得绝大多数的连接而不是幂律分布中层级结构,节点对应能级,适应度越高,能级越低,最高适应度的节点能级最低,吸收绝大多数节点,此时无尺度网络消失,不再是幂律分布,而是胜者为王,windows系统

  • 无尺度网络存在鲁棒性,消除80%节点依然可以工作,因为故障一般影响小节点,但低于某个阈值后网络会破碎,度指数小于等于3的无尺度网络不存在这个阈值

  • 攻击枢纽节点可让无尺度网络迅速崩溃,无尺度网络可以防御随机攻击但不能防御蓄意攻击,会发生级联崩溃,但如果降低发生概率可能导致更严重的级联崩溃

  • 创新传播率低于某个阈值会很快消亡,但如果高于某个值会出现指数增长,在无尺度网络上传播阈值会消失,无论如何控制,都会因为不均匀拓扑传播,这是病毒低频传播的原理,性伴侣网络也是无尺度网络,艾滋病很难消除

  • 控制疾病传播的方法是寻找枢纽节点或有偏向的治疗连接度高的人,这样最低限度保障安全,存在伦理问题

  • 互联网(有向无尺度网络)四块大陆:

    • 中央核心:易导航,两两互联,门户网站
    • in 网络:可以到达中央核心,但无法返回
    • out 网络:可以被中央核心连接,但无法返回,公司内网
    • 分散网络:不连接中央,也不被连接
  • 互联网不是均质的,像城市与乡村,不同社区的组织拓扑结构不同

  • 细胞网络的无尺度拓扑,少数分子参与多数化学反应,多数分子参与一两个反应,ATP ADP 水参与多数反应,连接度最高的最古老,可以研究进化,基因与蛋白质相互作用存在网络无尺度效应,少数蛋白控制多数基本功能

  • 经济社会中少数跨界董事连接了整个经济系统,网状管理模式形成精英阶层,熟人的介绍更为可靠,市场是加权有向网络,枢纽节点容易导致级联崩溃与传播

  • 网络是自组织的,枢纽节点维持信息通信

  • 群体智慧可视化

  • 哈密顿环与de Bruijn graphs

尺度《规模》

  • 很多现象在不同尺度上等比例放大/缩小
  • 多数尺度效应符合幂律分布 $attribute = c(size)^\alpha$
  • 幂律分布可写成对数线性方程
  • 动物的代谢速率与体积:考虑代谢散热,代谢率应该跟体表面积成正比,则代谢率是体积的2/3次方;然而实际数据是3/4次方,更高,60年无解,新理论认为代谢率应该跟能量分布有关,也就是分形维度,人体结果近似4维,体积越大,能量越小,规模经济,克莱伯定律
  • 城市人口密度与犯罪率/收入
  • 2006年城市人口超过农村,世界人口扩张
  • 城市规模收益递增,规模越大,人均越多,超线性缩放
  • 规模经济是亚线性缩放,规模越大,人均数量越少
  • 规模与尺寸相关,体型小强度大,体型大,需要能量就会特别多而超出物理限制
  • 地震的震级与发生频率,震级也是对数
  • 药物作用随体重2/3变化而不是线性
  • 轮船阻力与长度正比,越大燃料越少,伊桑巴德设计大轮船来促进全球贸易
  • 无量纲数是尺度研究的核心
  • 哺乳动物的血压都是相同的,分形维度,优化与空间填充,血液物理规律限制不会出现大体型哺乳动物
  • 生长被能量传递过程决定,出生时能量用于生长,成熟后用于维护
  • ATP的0.65eV与1/4决定了生物的代谢,温度变化两度,生长率与死亡率上升20%-30%
  • 消除心血管并延长7年,癌症消除延长3.36年,其余的都不到1年
  • 发动机寿命跟哺乳动物心跳总次数差不多,体型大,节食,代谢率低,损伤低,寿命延长
  • 扩张是指数的,经济、人口都曾经指数增长,借助创新
  • 城市规模越大,基建人均越少,越节能,亚线性
  • 城市社会经济量斜率1.15,规模越大,工资越高,GDP越高,犯罪越多,流感越多,专利越多,餐厅越多
  • 城市也存在空间填充与能量供应,城市是六边形而不是分形,但自发扩张会出现分形
  • 城市中邓巴数与胖尾分布,利己主义与社会空间最大填充
  • 大城市与小城市每个人的双向联系人人数是基本一致的,但多样性有差异
  • 全球尺度访问城市的距离与频次反比,越近,访问次数越多
  • 城市发展具有先发优势,领先会持续很久
  • 城市资源浪费与可持续性,纽约分级供水优势,干净
  • 社会经济在城市里存在多样性与正反馈
  • 城市的亚线性与经济超线性需要物质能量供应,创新是源泉
  • 公司收入与人数正比
  • 开放式增长中上市公司半衰期10年,5%公司存活超过30年
  • 全球1亿公司,估计只有4500幸存100年,长寿公司往往业务单一人数少专精
  • 公司是规模经济而不是创新与创意胜出的体现,城市则超线性发展
  • 可持续性的大一统,亚线性与超线性存在崩溃点,需要循环重复范式转移的创新,且时间间隔短
  • 科学是精英的而不是民主的,信噪比永远存在

路径依赖