青少年科学研究论文(科学方法研究报告2000字)

动态网络上的链路预测和断链预测;早鸟 GCN:通过绘制早鸟彩票实现更高效的 GCN 训练和推理的图网络协同优化;促进合作:会议中规定的互动决定了团队的组建;轨迹数据的随机最短路径的最大似然估计;本体句法语义质量评估框架;YouTube 中的 Clickbait 使用集成学习预防、检测和分析诱饵;具有时间转换器的基于知识增强的基于会话的推荐;当代物理学中的引文不平等和性别化引文实践;在线市场买家-卖家网络的宏观特性;SanMove:通过自注意力网络推荐下一个位置;

动态网络上的链路预测和断链预测

原文标题: Link Prediction and Unlink Prediction on Dynamic Networks

地址: http://arxiv.org/abs/2101.06919

作者: Christina Muro, Boyu Li, Kun He

青少年科学研究论文(科学方法研究报告2000字)

摘要: 动态网络的链路预测已被广泛研究并广泛应用于各种应用。然而,在社会网络的演化中也扮演着重要角色的时间解链预测并没有受到太多关注。准确预测未来网络上的链接和取消链接极大地有助于发现节点之间更多潜在关系的网络分析。在这项工作中,我们假设节点之间存在两种关系,即长期关系和短期关系,我们提出了一种称为 LULS 的有效算法,用于基于这种关系的时间链路预测和非链路预测。具体来说,对于动态网络的每个快照,LULS 首先通过应用短随机游走将高阶结构收集为两个拓扑矩阵。然后,LULS 使用基于拓扑矩阵的非负矩阵分解 (NMF) 为所有快照初始化和优化全局矩阵和一系列临时矩阵,其中全局矩阵表示长期关系,临时矩阵表示短期关系。 – 快照的期限关系。最后,LULS 计算未来快照的相似度矩阵并预测未来网络的链接和取消链接。此外,我们通过使用图正则化约束来增强全局矩阵来进一步改进预测结果,导致全局矩阵包含丰富的拓扑信息和时间信息。在真实世界网络上进行的实验表明,LULS 在链路预测和取消链路预测任务方面都优于其他基线。

早鸟 GCN:通过绘制早鸟彩票实现更高效的 GCN 训练和推理的图网络协同优化

原文标题: Early-Bird GCNs: Graph-Network Co-Optimization Towards More Efficient GCN Training and Inference via Drawing Early-Bird Lottery Tickets

地址: http://arxiv.org/abs/2103.00794

作者: Haoran You, Zhihan Lu, Zijian Zhou, Yonggan Fu, Yingyan Lin

青少年科学研究论文(科学方法研究报告2000字)

摘要: 图卷积网络 (GCN) 已成为用于图表示学习的最先进的深度学习模型。然而,众所周知,在大型图数据集上训练和推理 GCN 仍然具有挑战性,将它们的应用限制在大型现实世界图上,并阻碍了对更深入、更复杂的 GCN 图的探索。这是因为随着图大小的增长,节点特征的数量和庞大的邻接矩阵很容易使所需的内存和数据移动爆炸。为了应对上述挑战,我们探索了在稀疏 GCN 图时绘制彩票的可能性,即,在很大程度上缩小邻接矩阵但能够实现与完整图相当甚至更好的准确度的子图。具体来说,我们首次发现了在稀疏 GCN 图时出现在早期阶段的图早鸟 (GEB) 票的存在,并提出了一种简单而有效的检测器来自动识别此类 GEB 票的出现。此外,我们提倡图模型协同优化并开发一个通用的高效 GCN 早鸟训练框架,称为 GEBT,它可以通过(1)在 GCN 图和模型之间绘制联合早鸟票和( 2)同时实现 GCN 图和模型的稀疏化。在各种 GCN 模型和数据集上的实验一致地验证了我们的 GEB 发现和我们的 GEBT 的有效性,例如,我们的 GEBT 实现了高达 80.2% ~ 85.6% 和 84.6% ~ 87.5% 的 GCN 训练和推理成本的节省,同时提供了可比的甚至与最先进的方法相比具有更好的准确性。我们的源代码和补充附录可在 https://github.com/RICE-EIC/Early-Bird-GCN 获得。

促进合作:会议中规定的互动决定了团队的组建

原文标题: Catalyzing collaborations: Prescribed interactions at conferences determine team formation

地址: http://arxiv.org/abs/2112.08468

作者: Emma R. Zajdela, Kimberly Huynh, Andy T. Wen, Andrew L. Feig, Richard J. Wiener, Daniel M. Abrams

青少年科学研究论文(科学方法研究报告2000字)

摘要: 协作在知识生产中起着关键作用。在这里,我们展示了会议期间的交互模式可用于预测谁将随后形成新的协作,即使交互是规定的而不是自由选择的。在为期 5 年的涵盖不同科学领域的多日会议期间,我们引入了一种新的纵向数据集跟踪模式,跟踪数百名科学家之间的互动模式。我们发现,与选择不组建新团队的参与者相比,组建新合作的参与者的互动平均高出 63%,而那些被分配到更高互动场景的参与者的合作几率增加了八倍多。我们为团队形成过程提出了一个简单的数学框架,该框架结合了这一观察以及超出交互时间的记忆效应。该模型准确地再现了所有会议之间形成的合作,并优于其他七个候选模型。这项工作不仅表明个人在会议上的相遇在塑造科学的未来方面发挥着重要作用,而且这些相遇可以被设计为更好地促进合作。

轨迹数据的随机最短路径的最大似然估计

原文标题: Maximum likelihood estimation for randomized shortest paths with trajectory data

地址: http://arxiv.org/abs/2112.08481

作者: Ilkka Kivim?ki, Bram Van Moorter, Manuela Panzacchi, Jari Saram?ki, Marco Saerens

青少年科学研究论文(科学方法研究报告2000字)

摘要: 随机最短路径 (RSP) 是近年来针对不同图和网络分析应用开发的工具,例如对网络中的运动或流动进行建模。本质上,RSP 框架考虑了网络中路径上与温度相关的 Gibbs-Boltzmann 分布。在低温下,分布仅关注最短或成本最低的路径,而随着温度的升高,分布分布在网络上的随机游走上。许多相关的量可以从这个分布中方便地计算出来,这些通常以一种合理的方式概括了传统的网络测量。然而,当使用 RSP 对真实现象进行建模时,需要一种从数据中估计参数的原则性方法。在这项工作中,我们开发了计算模型参数的最大似然估计的方法,重点是温度参数,当对基于运动、流动或扩散过程的现象进行建模时。我们使用人工网络上生成的轨迹以及野生驯鹿在地理景观中运动的真实数据来测试派生方法的有效性,用于估计动物运动的随机程度。这些示例展示了 RSP 框架作为用于各种应用程序的通用模型的吸引力。

本体句法语义质量评估框架

原文标题: A framework for syntactic and semantic quality evaluation of ontologies

地址: http://arxiv.org/abs/2112.08543

作者: Vivek Iyer, Lalit Mohan Sanagavarapu, Raghu Reddy

青少年科学研究论文(科学方法研究报告2000字)

摘要: 对 Web 3.0 的日益关注导致本体和其他链接数据集的自动创建和丰富。除了自动化,丰富本体的质量评估也会影响软件的可靠性和重用性。当前的质量评估方法通常寻求在句法(遵循本体开发指南的程度)或语义(丰富概念/关系的语义有效性程度)方面评估本体。本文提出了一个本体质量评估框架,包括:(a)SynEvaluator 和(b)SemValidator,分别用于评估本体的句法和语义方面。 SynEvaluator 允许在运行时动态创建和更新特定于任务的语法规则,无需任何编程。 SemValidator 使用基于 Twitter 的验证器专业知识进行语义评估。该框架的有效性和有效性在多个本体上凭经验显示。

YouTube 中的 Clickbait 使用集成学习预防、检测和分析诱饵

原文标题: Clickbait in YouTube Prevention, Detection and Analysis of the Bait using Ensemble Learning

地址: http://arxiv.org/abs/2112.08611

作者: Peya Mowar, Mini Jain, Ruchika Goel, Dinesh Kumar Vishwakarma

青少年科学研究论文(科学方法研究报告2000字)

摘要: YouTube 上不择手段的内容创作者采用垃圾邮件和点击诱饵等欺骗性技术来覆盖广泛的受众,并诱使用户点击他们的视频以增加广告收入。 YouTube 上的 Clickbait 检测需要深入检查和分析视频内容与视频描述符标题和缩略图之间的复杂关系。然而,当前的解决方案主要围绕对视频描述符和其他元数据(如喜欢、标签、评论等)的研究,而未能利用视频内容,包括视频和音频。因此,我们引入了一种新颖的模型来检测 YouTube 上的点击诱饵,该模型考虑了视频内容与标题或缩略图之间的关系。所提出的模型由一个堆叠分类器框架组成,该框架由六个基本模型(K 最近邻、支持向量机、XGBoost、朴素贝叶斯、逻辑回归和多层感知器)和一个元分类器组成。开发的点击诱饵检测模型对新颖的 BollyBAIT 数据集实现了 92.89% 的高精度,对误导性视频数据集实现了 95.38% 的高精度。此外,所述分类器不使用元特征或其他依赖于用户与视频交互的统计数据(喜欢、关注者或评论的数量)进行分类,因此,可用于在上传之前检测潜在的点击诱饵视频,从而完全防止点击诱饵的滋扰并改善用户的流媒体体验。

具有时间转换器的基于知识增强的基于会话的推荐

原文标题: Knowledge-enhanced Session-based Recommendation with Temporal Transformer

地址: http://arxiv.org/abs/2112.08745

作者: Rongzhi Zhang, Yulong Gu, Xiaoyu Shen, Hui Su

青少年科学研究论文(科学方法研究报告2000字)

摘要: 最近的研究在基于会话的推荐方面取得了令人瞩目的进展。然而,诸如项目知识和点击时间间隔等可用于提高性能的信息在很大程度上仍未得到利用。在本文中,我们提出了一个称为具有时间变换器(KSTT)的基于知识增强的基于会话的推荐框架,以在学习项目和会话嵌入时合并此类信息。具体而言,提出了一种知识图,该知识图对会话中的项目之间的上下文及其相应属性进行建模,以通过图表示学习获得项目嵌入。我们引入时间间隔嵌入来表示需要预测的项目和历史点击之间的时间模式,并用它来代替原始变换器中的位置嵌入(称为时间变换器)。会话中的项目嵌入通过时间变换器网络获得会话嵌入,基于此进行最终推荐。大量实验表明,我们的模型在四个基准数据集上的表现优于最先进的基线。

当代物理学中的引文不平等和性别化引文实践

原文标题: citation inequity and gendered citation practices in contemporary physics

地址: http://arxiv.org/abs/2112.09047

作者: Erin G. Teich, Jason Z. Kim, Christopher W. Lynn, Samantha C. Simon, Andrei A. Klishin, Karol P. Szymula, Pragya Srivastava, Lee C. Bassett, Perry Zurn, Jordan D. Dworkin, Dani S. Bassett

青少年科学研究论文(科学方法研究报告2000字)

摘要: 历史和当代对女性对科学学术贡献的低估是众所周知的,也得到了充分的研究,今天的女科学家以无数种方式感受到了这种影响。这种归因不足的一个衡量标准是所谓的男性和女性之间的引用差距:女性撰写的论文相对于预期率的引用不足,以及男性撰写的论文相对于预期率的相应过度引用。我们探索当代物理学的引文缺口,分析过去 25 年发表在 35 种物理学期刊上的超过 100 万篇文章,涵盖广泛的子领域。使用根据一组独立于作者性别的特征来预测论文的预期引用率的模型,我们发现了一种全局偏差,其中女性撰写的论文被显著低估,而男性撰写的论文被显著高引用。此外,我们发现引用行为在几个维度上有所不同,因此不平衡因引用的人、引用的位置以及引用的方式而异。具体而言,对于男性撰写的论文、发表在一般物理学期刊上的论文以及引用作者可能不太熟悉的论文,偏向于人工撰写的论文的引用失衡最高。我们的结果表明,虽然决定引用哪些论文是个人的选择,但这些选择的累积效应不必要地伤害了一部分学者。我们讨论了减轻这些影响的几种策略,包括个人、期刊和社区层面的有意识的行为改变。

在线市场买家-卖家网络的宏观特性

原文标题: Macroscopic properties of buyer-seller networks in online marketplaces

地址: http://arxiv.org/abs/2112.09065

作者: Alberto Bracci, J?rn Boehnke, Abeer ElBahrawy, Nicola Perra, Alexander Teytelboym, Andrea Baronchelli

青少年科学研究论文(科学方法研究报告2000字)

摘要: 在线市场是合法和非法电子商务的主要引擎,但对其背后的买卖双方网络的总体属性知之甚少。我们分析了两个包含 2010 年至 2021 年在线市场上发生的 2.45 亿笔交易(16B 美元)的数据集。数据涵盖 28 个暗网市场,即主要货币为比特币的不受监管市场,以及一个受监管电子商务的 144 个产品市场平台。我们展示了在线市场中的交易如何表现出惊人相似的聚合行为模式,尽管在语言、可用产品的生命周期、监管、监督和技术方面存在显著差异。我们发现 (i) 交易金额、(ii) 交易数量、(iii) 事件间时间、(iv) 第一次和最后一次交易之间的时间分布具有显著的规律性。然后,我们展示了买家行为如何受到过去交互记忆的影响,并利用这些观察结果提出了一个网络形成模型,能够重现数据的主要风格化事实。我们的发现对理解在线市场的市场力量以及跨市场竞争具有重要意义。

SanMove:通过自注意力网络推荐下一个位置

原文标题: SanMove: Next Location Recommendation via Self-Attention Network

地址: http://arxiv.org/abs/2112.09076

作者: Huifeng Li, Bin Wang, Sulei Zhu, Yanyan Xu

青少年科学研究论文(科学方法研究报告2000字)

摘要: 目前,下一个位置推荐在基于位置的社会网络应用和服务中起着至关重要的作用。尽管已经提出了很多方法来解决这个问题,但迄今为止三个重要的挑战还没有得到很好的解决:(1)现有的大多数方法都是基于循环网络的,由于不允许完全并行,训练长序列很耗时; (2) 个性化偏好一般没有被合理考虑; (3) 现有方法很少系统地研究如何有效利用轨迹数据中的各种辅助信息(例如,用户 ID 和时间戳)以及非连续位置之间的时空关系。为理解决上述挑战,我们提出了一种名为 SanMove 的新方法,一种基于自注意力网络的模型,通过刻画用户的长期和短期移动模式来预测下一个位置。具体来说,SanMove 引入了一个长期偏好学习模块,它使用一个自注意力模块来捕捉用户的长期移动模式,可以代表用户的个性化位置偏好。同时,SanMove 使用时空引导的非侵入性自我注意(STNOVA)来利用辅助信息来学习短期偏好。我们使用两个真实世界的数据集评估 SanMove,并证明 SanMove 不仅比最先进的基于 RNN 的预测模型更快,而且在下一个位置预测方面也优于基线。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。

青少年科学研究论文(科学方法研究报告2000字)

本文链接:https://www.zhantian9.com/158561.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2000000@qq.com 举报,一经查实,本站将立刻删除。

发表回复

您的电子邮箱地址不会被公开。