experiment-5

https://github.com/hanxianglouis/experiment-5

Science Score: 31.0%

This score indicates how likely this project is to be science-related based on various indicators:

✓
CITATION.cff file
Found CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
○
.zenodo.json file
○
DOI references
○
Academic publication links
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (1.7%) to scientific vocabulary

Last synced: 10 months ago · JSON representation ·

Repository

Basic Info

Host: GitHub
Owner: hanxianglouis
Language: C++
Default Branch: master
Size: 216 KB

Statistics

Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Releases: 0

Created over 1 year ago · Last pushed over 1 year ago

Metadata Files

Readme Citation

注意

由于作者使用的是MacOS，所以默认版本适用于Mac系统，其中“实验五win.cpp"为Windows版本，区别仅在于将system("clear"); 改为system("cls");

实验思路

Step 1:图的构建与遍历

图的存储方式或为邻接表，或为邻接矩阵，我在这里觉得邻接表是一维的顺序表，更方便理解一些，于是选择了邻接表。本题中的两个文件非常简洁明了，从"patent.csv"中读取每个结点的信息，从"citation.csv"中读取每条边的信息。邻接表在这里我选择使用vector类型变量存储，并且存储的是结点的地址。在这里我觉得有必要说明一下为什么存地址而不是直接存结点本身：试想一下，由于在后续过程中我们时常需要从顺序表中调取某个结点出来，除了读取它的信息之外可能还要进行修改，那么在我不想改变原vector的结构的情况下，我如果存的是结点，提取出来到一个patent类型的变量p之后，如果对p直接修改，并不会对vector中的结点有任何修改作用，因为提取过程是复制传参；但是我如果存的是指针，那么提取出来一个结点到patent*类型的变量q，我不仅可以获得q中的信息，我对q->（q指向）的内容进行修改的时候，就是直接对结点的内容在修改， vector中存的也是这个结点的指针。除此之外，指针占用空间较小，在提取过程中减少了不必要的复制操作，有效减小空间复杂度。

遍历

DFS和BFS遍历相对而言比较简单，需要注意的是与树的遍历区别。DFS中，同样是递归结构，但是在树的遍历中，无论左（右）子树空不空，都会对左（右）子树做一次深度优先遍历，停止递归的条件是函数接收到的指针为空。在图的DFS遍历中，我们对某个结点的后继结点是否执行DFS函数的判断条件是在visited数组中表明该结点未被访问，并没有空不空一说，因为邻接表中存下来的边当然是存在的。还有一点需要注意，因为在DFS遍历中涉及对同一个visited数组的调用和更改，所以我们并不能在函数中去建立这个visited数组，否则递归过程中会建立出一堆不一样的visited，毫无意义。解决方案是在调用函数前建立好一个全部是false的visited数组，设计函数的时候加一个参数visited数组，并且要带上复制符号“&”，保证在都在对同一个visited数组进行更改，调用函数的时候把在函数外建立好的visited数组传进去就好了。相比之下BFS就非常简单了，调用一个队列就好，不过多赘述。

Step 2:Prim算法找最小生成树

这一步非常复杂，原因在于这个算法本身有一定的复杂性，并且在人操作的时候，对于lowcost数组，我们每一次都要找新加的点对这个数组有什么影响，如果对于某个还未加入的顶点来说最小权重有改变，我们不仅仅要记录下来这个最小权重变成了什么，还要记录下来这个最小权重的边是从哪里来的，否则我们在取出这个点的时候不知道连到树的哪个节点上。除此之外，对于已经加入的顶点，它依然会在lowcost数组上，但是这个时候我们并不希望再重复取出该结点，于是我们还需要记录下来我们已经取出了哪些顶点，并且每次在准备取下一个顶点之前，把lowcost的该结点的权重改为10000，用于表示 $\infty$ 。这段相关代码比较复杂，在这里三言两语很难讲清楚，这里只解释其中的lowcost数组的维护方式。首先我这里选用了map类型来存储lowcost的数组，它的键（可以理解为索引）为每个结点的地址，它的值是一个新建的组合类型，其中包含了int类型的权重和patent*类型记录这个权重对应的边的起始点。在每一次取最小值之前需要做两件事，一是对上一次新加的结点的出度进行遍历，看看会不会影响lowcost数组，具体操作就是在lowcost中用每一个的出度的边的终点patent作为键，看这个边的weight是否小于lowcost这个位置之前存的weight，如果小于就要对这个位置的值进行更改。二是把已经加入树中的结点的lowcost数组的weight改成10000，这需要我们在每次取出顶点时不仅把它加入树中，还加入一个顺序表中用于记录这个结点已经加入，之所以要用这个顺序表，是因为每次遍历树是不方便的，但是遍历顺序表很方便。注意：对于map的相关操作这里不加赘述，如果不清楚可以搜索相关帖子，这里说明map类型变量在遍历的时候不能使用for(int i=0;i < size;i++)的结构，因为map类型变量无法通过“第几号位”来找出，只能用for(patent* temp:lowcost)这种c++独有的遍历方式来写，其中 patent*可以改为auto，让编译器自己识别类型，temp充当了lowcost当中的每一个元素，取出它的键用temp.first，取出它的值用temp.second。

Step 3:Dijkstra算法求最短路径

这一算法的思想和Prim算法有很大的相似性，我在这里相当于把lowcost数组换成了一个assist数组（程序中用vector类型变量存储），assist当中的每个元素包含路径终点（其实就是每个顶点）、路径长度和具体路径（用string类型存储）。那么在循环的过程当中，依然是要根据上次新加的顶点来看assist数组的变化。在每一次循环前我先调去了上一次新加顶点的路径长度和路径，然后在维护assist数组的过程当中，如果发现由新加顶点出发到这个点的距离+新加顶点最短路径< 原来记录的这个点的最短路径，那么就要进行更改了。“取出”这一操作我是把assist数组里面的路径最小点取出来放到result数组里面去。同样的，在维护assist数组的过程中，也需要每次取出最小值前把已经加入result中的点的最短路径设置为10000，避免重复取出。其实这一步在人做的时候很简单只需要不管这个点，把这个点叉掉就好了，但是编程让计算机找的时候就没有这么简单了。

Step 4:拓扑排序

相比前两个算法拓扑排序的过程就会简单很多。由于小测也写过相关题目，这里思路上不再过多解释。具体编程的时候，在这里我的indegree数组采用了map形式，好处是可以直接通过结点的地址来找到对应的出度，坏处是每次循环的时候判断indegree数组中还有没有为零的就会比较困难。在这里就是每次循环前先遍历indegree数组，看看还有没有为零的，没有就可以退出循环了。需要说明的是，前面我说过map类型变量不能用for(int i=0;i< size;i+=)的结构遍历，但是这里却使用了，因为这里我本质上是在遍历图的邻接表，毕竟邻接表里面的每一个结点的地址正好就是map当中每一个的键，那就可以把map里面的每一个结点对应的入度遍历到了。

另外，由于Step 3和Step 4均为对图本身信息的调用，他们的函数就写在图的class里面了。但是Step 2由于要新建一个树的类型，我就把相关内容放在了一个新的class（MST）中，包含树的根结点和总权重，构造树的过程写在构造函数里，输出采用中序遍历。

使用说明

不推荐的使用方式

将我的代码丢给各种AI，进行C++与C语言之间的多次翻译，然后对于翻译中丢失的功能再让AI补全

禁止的使用方式

直接把我的代码交给老师，或不加来源说明地使用

Owner

Login: hanxianglouis
Kind: user

Repositories: 1
Profile: https://github.com/hanxianglouis

Citation (citation.csv)

citing_patent,cited_patent,weight,tech_transfer_cost
P1,P2,3,5
P1,P3,2,4
P2,P4,4,3
P3,P4,5,6
P3,P5,1,2
P4,P6,3,4
P5,P6,2,3
P5,P7,4,5
P6,P8,3,4
P7,P8,2,3

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Open Source Science