日期:2023-01-12 阅读量:0次 所属栏目:社会论文
Key words: human dynamics;scale feature;email;time interval distribution;power-law distribution
中图分类号:C91 文献标识码:A 文章编号:1006-4311(2013)08-0298-03
0 引言
随着科学技术的发展,人类活动及信息交换由口口相传变成了一个由社会网络、电信网络、互联网、可视监控网络、交通网络等物理载体相互融合形成的混合体,这种相互混合带来了人类活动的复杂性与不可预测性,这种复杂性加剧了社会系统与经济系统的脆弱性。许多物理学家致力于对人类复杂的动力学行为进行分析研究,研究人类活动的规律,理解人类活动的本质特征,有助于对经济领域中金融危机的传播渠道进行控制、对社会领域中突发性的群体事件进行控制与演化等,具有现实意义。
电子邮件在各项商务活动、办公系统、朋友交流、友谊传递等方方面面代替了传统的通信方式,发挥着重要的作用。国内外许多研究学者对电子邮件的通信行为进行研究,Barabási研究用户电子邮件通信行为时间间隔分布的幂律分布现象[1]。Eckmann等人提出用熵来刻画网络中包含长期通信模式和临时通信模式[2];上海交通大学王科,汪小帆等利用日志数据分析国内某高校电子邮件网络的特性,提取了两种网络:非交互网络和交互网络,利用加权适应度算法划分了加权网络的社团结构,发现社团规模累积分布满足幂律分布[3];郑紫元等研究了国内某高校电子邮件网络中高校人员收发电子邮件的行为规律,提出了基于时间序列聚类分析的分段连贯非齐次泊松过程模型[4]。
在复杂系统与复杂性科学研究领域,人类行为动力学的研究结果,验证了很多真实世界网络的无标度性和小世界性[5-9]。社会关系网络中人类行为标度特征是否具有普遍性?本论文利用某大型社区社会关系网络中人们之间商业活动、社区活动、友谊圈等电子邮件通信实证数据库,对人类动力学行为的标度特性进行分析研究。
1 数据统计
本论文探究的社会关系网络数据源是某大型社区成员接收及发送电子邮件的通信地址和时间统计。研究了社区150个用户三年时间发送、接收电子邮件的数目是178378条,数据量足够大,时间以秒为单位足够长。由于个体在社区中的角色、地位不同,发送、接收电子邮件的数目有很大差别,发送电子邮件的数目是非均匀的,如下图1,展示了A、B两用户在同一年内每月发送邮件的数目统计。
三年时间个体发送邮件数目最大的是6381封,接收邮件最多的数目是2565封,个体发送和接收电子邮件总数目最多的是7555封,本论文研究讨论了不同个体接收、回复电子邮件的时间均具有标度特性,并对群体标度特性进行展望研究。
2 基于电子邮件的社会关系网络中个体标度特征分析
对人类动力学的实证工作研究,主要体现在对于人类的时间、空间运动行为的研究两大方向,同类事件之间的时间间隔分布是人类动力学研究重点关注的对象之一。本论文在课题组成员研究了社区个体连续两次发送电子邮件的时间间隔分布满足幂律分布特性的基础上,主要是研究分析社区电子邮件用户个体连续两次接收和回复电子邮件的时间间隔分布,每部分各以四位比较典型的个体用户为例分析。
2.1 接收电子邮件时间间隔分布 分析C、D、E、F四个个体用户接收电子邮件的实证数据,提取个体接收每封邮件的详细记录,精确到秒,分析个体用户接收电子邮件的时间间隔τ',定义为同一个用户连续接收两封邮件的时间差。对每用户的接收邮件时间间隔进行计算,并做了频次统计。如图2。 由统计特征可知,个体用户在社区范围接收电子邮件的时间间隔分布满足p(τ')~τ'(-α)幂律分布,不同用户的分布指数α各不相同,介于-0.40277到-3.17148之间。其中幂函数使用对数最大似然估计法拟合,并采用了K-S检验来判断[10-12],均通过了检验,可以认为是比较好的幂律。
该分布体现了社区人类的宏观动力学行为的阵发现象,显示了人类行为对泊松过程的明显偏离。社区个体接收电子邮件的频繁程度体现了个体在社区团队中的受重视程度和在社区中的地位和价值。每一个个体在不同专业领域必有其所长,所以在社区不同性质的活动中所承担的角色、轻重必有区别,假设个体职业特征是一位音乐家,那么他在社区的某一次卡拉OK大赛中必将担当重要的角色,而此时间段人们发送给他的有关策划、咨询等邮件往来必会比较频繁,而如是一次社区体检活动,他所接收的社区邮件必会衰减,而此时社区医生的邮件必会进入阵发性的高峰期。这与本论文所研究的个体接收电子邮件的标度特征较好的吻合。
2.2 回复电子邮件时间分布 对个体回复电子邮件的时间分布进行统计分析,能对人类动力学标度行为有更深刻的认识。回复时间τw定义为个体收到某用户电子邮件的时间与他回复这个用户电子邮件的时间之差。对个体用户G、H、I、J回复时间的统计分析如图3。
从图中可以看出,分布曲线不遵从泊松分布,与接收电子邮件时间间隔分布类似,在尾部出现胖尾,除去尾部满足幂律分布。对于不同的用户,幂律分布指数α各不相同。其中幂函数使用对数最大似然估计法拟合,并采用了K-S检验来判断[10-12],它们均通过了检验。
个体回复电子邮件时间分布的幂律现象解释为:人类作为高智商的群体,在成长学习的过程中,积淀了对自己所将从事的事情区别轻重缓急才去完成的能力,事件处理从工作任务的角度或从朋友友谊圈权重的角度衡量区别对待,重要工作或友谊权重人物或感兴趣的事情,相关邮件会定义为优先级高的项目及时回复,而少数项目因兴趣所失或无足轻重或疲惫或资源不足等原因被定义为优先级低的项目在他的任务列表中需漫长等待回复。这与Albert Barabási、Vázquez等学者解释人类活动的阵发现象是源于由认知决策机制驱动的排队过程,优先级最高个体会先执行,而低优先级的任务却需要排队等侯[1.13]是一致的。
3 结语及展望
现代社会,信息以各种网络作为媒介在社会中传播,这些网络远非平常的物理接触,而是包括互联网、电话、手机通信、交谈等各种形式的信息传递方式,电子邮件作为一种常用的通信方式在人类的信息交流中担任着重要的角色。本论文通过对人们电子邮件通信数据库的时间运动行为进行挖掘分析,通过实证数据证实了社会关系网络中人类行为标度特征的普遍性,并根据社区人类行为规律对分析结果进行了较好的解释,发现个体层面的幂律指数并非传统的具有离散指数的普适类。幂律指数满足何种分布特征,个体层面的标度特性是否映证群体层面标度特性的普遍性,利用实证研究结果进行建模研究,将是笔者下一步的研究方向。研究分析人类信息传递活动规律,有助于对可能发生的社会突发事件、金融危机风暴进行监控、进行信息传递的预警和干预,力图把不良影响和损失降到最低,制定相应的信息传递公共安全策略,维护社会的和谐安全稳定。
本文链接:http://www.qk112.com/lwfw/sklw/shehuiqita/158139.html上一篇:社会转型背景下的行政价值构建