社会网络分析与UCINET 学习(三):数据的预处理

整体网数据的处理办法取决于要研究的问题。换句话说,整体网数据的处理方法因问题不同而不同。对数据进行预处理的目的在于,使得数据满足进一步分析的需要。
需要数据预处理和转换的情况比较多,大概可以分为三种情况 :

  • 数据收集过程中存在缺陷,需要弥补。
  • 不同的程序要求不同的数据处理(data processing)和转换计算。
  • 创建新变量,从而更便于分析。

1.抽取子图和子矩阵

把一个点或者多个点从一个网络中移出去,这个对应于从一个邻接矩阵中转移出一行(列)或者多行(列)。从data>Extract>SubMatrix命令中可得。

Exract subMatrix命令

  • which rows:例如输入1 To 10,12 To 24
  • which cloumns:如果指令相同,只需要输入same即可。

2.数据的合并

join界面

有时候我们需要在不同的文件夹中保存同一群行动者的多类关系数据,有时候有需要把它们合并(merging)在一个文件夹中。从data>join命令中可得。

  • 如果是行合并的话,点击join>join rows
  • 如果是列合并的话,点击join>join columns
  • 如果是矩阵合并的话,点击join>join matrix

3.数据的置换与排序

对矩阵行和列的排列,可以使得同一群体的成员相互邻接,进而容易把握矩阵的整体结构。UCINET给出了两种排序方式:置换(permutation)与排序(sort)。


置换与排序界面

4.转置与转型

4.1矩阵的转置(transpose)

举例说明对数据的预处理-转置的必要性:
在有关世界体系研究的文献中,一般约定网络数据中的X(i,j)代表从国家j向国家i输出的货物。对于网络分析者来说,这可能令人疑惑,因为在网络文献中X(i,j)总是代表从i指向j。因此就需要对数据进行转置。可通过data>transpose得到。

4.2数据的转型

有时候需要对矩阵的行、列、层次进行转换。

例如一个矩阵的行、列、层次分别为“个体”、“其他人”、“周”。为了表示出每个个体在每一周对每个他者的评价变化。需要将矩阵的列“他者”与层次“周”进行变化。可通过Tools>Matrix Algebra
完成,如下:

tnewcl=transp(newcombl columns levels)

该语句的含义是,对数据库newcombl中的列和层次进行互换,将结果保存在tnewcl中。

5.重新编码

recode界面

大致分为三类命令:

  • trandform>Recode重新编码,如图
  • trandform>Dichotomize命令,将自动把每个元素与你提供的切割值进行对比,然后进行二值化处理。
  • trandform>Reverse命令:全部取相反数。

6.线性转换

为了执行更一般的转换,如下,就有必要利用矩阵代数程序。
Y(i,j)=bX(i,j)+m,其中b和m是常数项

例如,为了把一个矩阵DAVIS中的全部值都乘以7,应该点击Tools>Matrix algebra,在出现的对话框中输入:

davis7=linear(davis 7 0)

7.对称化处理

把一个矩阵进行对称化处理(symmetrizing),就是对于全部ij来说,要求X(i,j)等于X(j,i)。很多情况下需要进行对称化处理:

一种情况是关于关系本身具有对称性,如“和谁吃饭”,但有时候由于测量的误差,实际的数据可能不对称。
另一种情况是,有时候要把一些非对称关系(如借钱给某人)可能扩展为“金钱关系”这一个对称关系。

UCINET提供多种多种对称化处理的程序,包括用均值、最小值或者最大值代替矩阵元素之值。

8.捷径距离与可达性

8.1捷径距离

捷径距离矩阵(geodesic distance matrix)表述的是各个点之间的捷径距离。捷径距离可以看成是一种影响(凝聚)指数。可以通过Network>cohesion>geodesic命令得到。

捷径就是两点之间最短的路径

8.2可达性(reachability)

在图论中,可达性是指在图中从一个顶点到另一个顶点的容易程度。

9.矩阵的组合

利用组合(aggregation命令)可以把同一群体行动者之间的多种关系组合在一起。如何测量两个行动者在多种关系上的属性?有两种方式:
第一种方式是利用前面介绍的data>CSSCSS程序中有多种加总的算法。
第二种方式是矩阵代数算法Tools>Matrix algebra

10.标准化处理(Normalize)

由于有时候每一个数据矩阵的每一行或者每一列的数据单位不同时,就非常有必要进行标准化处理,从而便于比较

标准化处理界面

Transform>Normalize程序可以用来标准化,可利用的标准很多,如针对均值、边缘值、标准值、z-值。

11.改变模态

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,911评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,014评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 142,129评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,283评论 1 264
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,159评论 4 357
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,161评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,565评论 3 382
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,251评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,531评论 1 292
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,619评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,383评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,255评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,624评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,916评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,199评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,553评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,756评论 2 335

推荐阅读更多精彩内容