【深度学习基础模型】图神经网络(Graph Neural Networks, GNNs)详细理解并附实现代码。

【深度学习基础模型】图神经网络(Graph Neural Networks, GNNs)详细理解并附实现代码。

【深度学习基础模型】图神经网络(Graph Neural Networks, GNNs)详细理解并附实现代码。


文章目录

  • 【深度学习基础模型】图神经网络(Graph Neural Networks, GNNs)详细理解并附实现代码。
  • 1. 起源与提出
  • 2. 发展
  • 3. 优缺点
  • 4. 应用场景
  • 5. Python代码实现示例


参考地址:https://www.asimovinstitute.org/neural-network-zoo/
论文地址:https://arxiv.org/pdf/1412.3555v1

欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!

1. 起源与提出

图神经网络的起源可以追溯到图数据的处理需求。传统的神经网络在处理结构化数据(如图、树等)时,常常面临着局限性。GNN的提出旨在解决这一问题,使神经网络能够有效地学习图结构数据中的信息。

  • 早期研究:最早的图模型和算法如图卷积网络(GCN)和图递归神经网络(Graph RNN)在2017年左右被提出。
  • GCN的提出:Thomas Kipf和Max Welling于2017年提出了图卷积网络(GCN),为GNN的发展奠定了基础。他们提出通过卷积操作在图上进行特征学习,推动了图神经网络的研究。

2. 发展

图神经网络的发展经历了以下几个阶段:

  • 图卷积网络(GCN):GCN采用了谱图理论来进行图数据的学习,成为GNN领域的基石。通过图的邻接矩阵和特征矩阵来进行节点表示学习。
  • 图注意力网络(GAT):2018年,Velickovic等人提出了图注意力网络(GAT),引入了自注意力机制,使得模型能够自适应地关注邻居节点的不同重要性。
  • 动态图神经网络(DGN):近年来,随着动态图(Dynamic Graph)的研究兴起,动态图神经网络也逐渐受到关注,允许图结构随时间变化。
  • 多层图神经网络:研究者们开始探索多层GNN的架构,解决深层图神经网络在训练时可能遇到的过平滑和信息丢失问题。

3. 优缺点

优点:

  • 有效处理图结构数据:GNN能够直接在图结构上进行学习,适合社交网络、化学分子、推荐系统等领域。
  • 捕捉节点间关系:通过聚合邻居节点的信息,GNN能够捕捉到节点之间的复杂关系。
  • 扩展性:可以扩展到大规模图数据的处理。

缺点:

  • 计算复杂度:图的结构可能导致GNN在处理大规模图时计算复杂度较高。
  • 过平滑问题:在多层GNN中,信息的聚合可能导致节点表示趋同,丧失辨别能力。
  • 依赖于邻接矩阵:GNN的性能往往依赖于邻接矩阵的构造和图的稀疏性。

4. 应用场景

图神经网络广泛应用于多个领域,包括但不限于:

  • 社交网络分析:节点分类、社区检测和链接预测。
  • 推荐系统:通过用户和项目之间的关系进行推荐。
  • 分子图学习:在化学领域,通过分子结构图进行性质预测。
  • 自然语言处理:用于知识图谱的构建与推理。

5. Python代码实现示例

以下是一个简单的图卷积网络(GCN)实现示例,使用Python的PyTorch和PyTorch Geometric库。

代码示例:节点分类

import torch
import torch.nn.functional as F
from torch_geometric.datasets import Planetoid
from torch_geometric.nn import GCNConv

# 1. 数据准备
dataset = Planetoid(root='/tmp/Cora', name='Cora')
data = dataset[0]

# 2. 定义图卷积网络(GCN)
class GCN(torch.nn.Module):
    def __init__(self, in_channels, hidden_channels, out_channels):
        super(GCN, self).__init__()
        self.conv1 = GCNConv(in_channels, hidden_channels)
        self.conv2 = GCNConv(hidden_channels, out_channels)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index
        x = self.conv1(x, edge_index)
        x = F.relu(x)
        x = F.dropout(x, training=self.training)
        x = self.conv2(x, edge_index)
        return F.log_softmax(x, dim=1)

# 3. 实例化模型、优化器和损失函数
model = GCN(in_channels=dataset.num_node_features, hidden_channels=16, out_channels=dataset.num_classes)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
criterion = torch.nn.CrossEntropyLoss()

# 4. 训练模型
def train():
    model.train()
    optimizer.zero_grad()
    out = model(data)
    loss = criterion(out[data.train_mask], data.y[data.train_mask])
    loss.backward()
    optimizer.step()
    return loss.item()

# 5. 测试模型
def test():
    model.eval()
    with torch.no_grad():
        out = model(data)
        pred = out.argmax(dim=1)
        test_correct = pred[data.test_mask] == data.y[data.test_mask]
        test_acc = int(test_correct.sum()) / int(data.test_mask.sum())
    return test_acc

# 6. 运行训练和测试
for epoch in range(200):
    loss = train()
    if epoch % 20 == 0:
        test_acc = test()
        print(f'Epoch: {epoch}, Loss: {loss:.4f}, Test Accuracy: {test_acc:.4f}')

代码解释:

1. 数据准备:

  • 使用Planetoid数据集(如Cora)作为输入数据,自动下载并准备图数据。

2. 定义GCN类:

  • GCN类继承自torch.nn.Module,包含两个图卷积层(GCNConv)。
  • 在forward方法中,先通过第一个卷积层进行特征提取,接着使用ReLU激活函数和dropout,再通过第二个卷积层输出结果,最后使用log_softmax进行归一化。

3. 实例化模型:

  • 创建GCN模型,定义优化器为Adam,并设定损失函数为交叉熵损失。

4. 训练模型:

  • train函数用于模型训练,计算损失并反向传播。

5. 测试模型:

  • test函数用于在测试集上评估模型性能,计算准确率。

6. 运行训练和测试:

  • 循环进行200个epoch的训练,每20个epoch输出一次损失和测试准确率。

该示例展示了图神经网络的基本用法,体现了如何通过图卷积网络对图数据进行节点分类任务。通过训练,模型能够有效学习图结构中的节点关系,从而在测试集上进行准确分类。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/887858.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

认知战认知作战:认知战与安全挑战中方企业在海外的应对策略分析

认知战认知作战:认知战与安全挑战中方企业在海外的应对策略分析 关键词:认知战, 中方企业, 恐怖袭击, 安全挑战, 信息传播, 社会责任, 风险管理, 国际合作,认知作战,新质生产力,人类命运共同体,认知战,认知域,认知战研究中心,认知战争,认知战战术,认知战…

MATLAB中lsqminnorm函数用法

目录 语法 说明 示例 求解具有无限个解的线性系统 指定容差以减少含噪数据的影响 切换显示低秩矩阵警告 lsqminnorm函数的功能是线性方程的最小范数最小二乘解。 语法 X lsqminnorm(A,B) X lsqminnorm(A,B,tol) X lsqminnorm(___,rankWarn) 说明 X lsqminnorm(A,B…

Ansible学习之ansible-pull命令

想要知道ansible-pull是用来做什么的,就需要了解Ansible的工作模,Ansible的工作模式有两种: push模式 push推送,这是Ansible的默认模式,在主控机上编排好playbook文件,push到远程主机上来执行。pull模式 p…

QT系统学习篇(2)- Qt跨平台GUI原理机制

一、Qt工程管理 1、新建项目: 我们程序员新建项目对话框所有5类项目模板 Application: Qt的应用程序,包含Qt Quick和普通窗口程序。 Library: 它可以创建动态库、静态库、Qt Creator自身插件、Qt Quick扩展插件。 其他项目: 创建单元测试项目、子目录项…

数据分析之Spark框架介绍

文章目录 概述一、发展历程与背景二、核心特点三、生态系统与组件四、应用场景五、与其他大数据技术的比较 核心概念1. 弹性分布式数据集(RDD, Resilient Distributed Dataset)2. 转换(Transformations)和动作(Actions…

Redis主从复制(replica)、哨兵

一、Redis主从复制介绍: 主从复制,master主机以写为主,slave从机以读为主,当主机数据变化的时候自动将新的数据异步同步到其他从机数据库;能够实现读写分离, 容灾恢复、 数据备份以及水平扩容支撑高并发 二、实现方法…

【stm32】ADC的介绍与使用

ADC的介绍与使用 1、ADC介绍2、逐次逼近型ADC3、ADC电路4、ADC基本结构程序代码编写:ADC 通道和引脚复用的关系 5、转换模式(1)单次转换,非扫描模式转换流程:程序编写: (2)连续转换&…

基于 springboot vue中学生日常行为评分管理系统设计与实现

博主介绍:专注于Java(springboot ssm 等开发框架) vue .net php python(flask Django) 小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设,从业十五余年开发设计教学工作☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不然下次找…

​通用代码生成器典型应用场景​

​通用代码生成器典型应用场景​ 1. 通用代码生成器简介 通用代码生成器或称动词算子式通用代码生成器,是一系列各种语言的易用的整站式代码生成器。其根本原理是把方法分解成动词算子和域对象的笛卡儿积。根据动词算子式代码生成器的基本原理。所有方法&#xff…

网 络 安 全

网络安全是指保护网络系统及其所存储或传输的数据免遭未经授权访问、使用、揭露、破坏、修改或破坏的实践和技术措施。网络安全涉及多个方面,包括但不限于以下几个方面: 1. 数据保护:确保数据在传输和存储过程中的完整性和保密性,…

[Python] 《人生重开模拟器》游戏实现

文章目录 优化点一:多元化的天赋系统示例天赋:天赋选择代码: 优化点二:更加多样化的随机事件年龄阶段划分:随机事件代码: 优化点三:设定人生目标人生目标示例:人生目标代码&#xff…

python爬虫 - 初识requests模块

🌈个人主页:https://blog.csdn.net/2401_86688088?typeblog 🔥 系列专栏:https://blog.csdn.net/2401_86688088/category_12797772.html 前言 requests 是一个用于发送 HTTP 请求的 Python 库,设计简单且功能强大&am…

如何创建虚拟环境并实现目标检测及验证能否GPU加速

创建虚拟环境: 先创建一个虚拟python环境,敲如下代码 然后再到该虚拟环境里面安装自己想要的包 激活虚拟环境 然后再聚类训练这些 验证GPU加速 阿里源 pip install torch torchvision -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mir…

B树系列解析

我最近开了几个专栏,诚信互三! > |||《算法专栏》::刷题教程来自网站《代码随想录》。||| > |||《C专栏》::记录我学习C的经历,看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

YOLO11改进|卷积篇|引入线性可变形卷积LDConv

目录 一、【LDConv】卷积1.1【LDConv】卷积介绍1.2【LDConv】核心代码 二、添加【LDConv】卷积2.1STEP12.2STEP22.3STEP32.4STEP4 三、yaml文件与运行3.1yaml文件3.2运行成功截图 一、【LDConv】卷积 1.1【LDConv】卷积介绍 下图是【LDCNV】的结构图,让我们简单分析…

鸿蒙HarmonyOS开发生态

1、官网 华为开发者联盟-HarmonyOS开发者官网,共建鸿蒙生态 2、开发工具IDE下载及使用 https://developer.huawei.com/consumer/cn/ 3、使用帮助文档 4、发布到华为应用商店 文档中心

多模态大语言模型(MLLM)-Blip2深度解读

前言 Blip2是一个多模态大语言模型,因其提出时间较早(2023年),且效果较好,很快成为一个标杆性工作。Blip2中提出的Q-former也成为衔接多模态和文本的重要桥梁。 Blip2发表时间是2023年,现在引用已经3288了…

事件抽取(Event Extraction, EE)

一、引言 事件抽取(Event Extraction, EE)是信息抽取领域中的一个重要任务,旨在从非结构化文本中识别和抽取事件相关的信息。事件抽取通常包括识别事件触发词、事件类型以及事件中的参与者、时间、地点等元素,最终将这些信息结构…

常见的基础系统

权限管理系统支付系统搜索系统报表系统API网关系统待定。。。 Java 优质开源系统设计项目 来源:Java 优质开源系统设计项目 | JavaGuide 备注:github和gitee上可以搜索到相关项目

【含文档】基于Springboot+Android的房屋租赁App(含源码+数据库+lw)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 系统定…