查看原文
其他

网络嵌入综述 | 网络科学论文速递23篇

ComplexLY 集智俱乐部 2021-02-09


本文由机器翻译、人工微调,仅供参考,感兴趣请查阅论文原文

核心速递



  • 网络嵌入综述;

  • 一组新的聚类驱动的合成发展指标;
  • 从推文的句子嵌入追踪州级肥胖患病率:一个可行性研究:;
  • 两派社会网络中的意见分歧和极化;
  • 自阻尼动力系统的成本最低的网络估计的复杂性;
  • 大规模的动力系统的结构可控性最小驱动节点:节点分类;
  • 动态网络中的创新:发散性思维如何受到同伴选择的影响;
  • 无标度复杂网络的闭合系数;
  • 神经变分推理动态网络的统计模型;
  • 利用自符号化序列建模的生成性含时链路预测;
  • 利用被动收集的轨迹数据评估异常事件对旅行模式的影响;

  • 感知碳足迹的用户研究;

  • 协作驱动个人生产力;
  • 全速范围自适应巡航控制系统跟车模型的鲁棒性分析;
  • 高度集群复杂网络的结构模型:随机规则小世界网络;
  • 近因预测作者引用演化中的爆发;
  • 基于累计时间的排序方法评价信息网络声誉;
  • 图表示用于人脸分析图像集;
  • 2019欧洲议会选举期间Twitter假新闻的覆盖面有限;
  • 城市效率和运动的不可逆转;
  • 没有惯性的行人模型的相关噪声导致了停止和前进波;
  • 用事实欺骗:通过一个大型网络实验量化锚定偏置;
  • ComHapDet:单倍体装配空间社区检测算法;
 




网络嵌入综述


原文标题:
Network Embedding: An Overview
地址: 
http://arxiv.org/abs/1911.11726
作者: 
Nino Arsov, Georgina Mirceva

摘要: 网络是现实世界中的建模问题上最强大的结构之一。在网络上定义下游机器学习任务必须解决各种问题的潜力。随着链路预测,例如,可以预测两个人是否会成为社会网络上的朋友。许多机器学习算法,但是,需要的是每个输入例如是实数向量。网络嵌入包含各种方法无监督,有时监督,学习在网络中的节点和链路的特征表示。通常情况下,嵌入方法是基于网络中的节点之间的相似性,应在学习的特征陈述中反映的假设。在本文中,我们回顾了在过去十年中,以网络嵌入显著的贡献。特别是,我们看到四种方法:谱聚类,DeepWalk,大规模信息网络嵌入(LINE),和node2vec。我们描述每一种方法,并列出其优点和缺点。另外,我们给出网络中的嵌入是为了最大限度地提高机器学习任务的预测性能至关重要的现实世界的机器学习问题的例子。最后,我们在网络嵌入研究一下研究的趋势和国家的最先进的方法。




一组新的聚类驱动的合成发展指标


原文标题:
A new set of cluster driven composite development indicators
地址: 
http://arxiv.org/abs/1911.11226
作者: 
Anshul Verma, Orazio Angelini, Tiziana Di Matteo

摘要: 决策往往主观地使用复合发展的指标聚集有限的一组指标。我们发现,使用降维技术,包括主成分分析(PCA),并首次信息过滤和聚类,这些综合指标错过的不同指标之间的关系的关键信息。特别是,通过主题指标的分组并不反映在全球和地方层面的数据。我们使用的指标聚类建立一套新的集群带动复合发展的指标是客观的,数据驱动的,国家之间的可比性克服这些问题,并保留可解释性。我们讨论告知决策者关于国家的发展,他们与顶级的PageRank指标为基准,比较它们的后果。最后,我们证明了我们一套新的综合发展指数跑赢上的数据集或改建任务的基准。




从推文的句子嵌入追踪

州级肥胖患病率:一个可行性研究


原文标题: 
Tracing State-Level Obesity Prevalence from Sentence Embeddings of Tweets: A Feasibility Study
地址: 
http://arxiv.org/abs/1911.11324
作者: 
Xiaoyi Zhang, Rodoniki Athanasiadou, Narges Razavian

摘要: Twitter的数据已经显示出广泛适用于公共卫生监测。根据Twitter上的数据之前的公共卫生研究在很大程度上依赖于关键字匹配或集群相关的tweet主题模型。然而,这两种方法从文本的短长度和不可预知的噪音天然存在于用户生成的情境受到影响。对此,我们引入了深刻的学习方法,使用#标签作为监督的一种形式,并学会鸣叫用于提取信息文本特征的嵌入。在这个案例中,我们要解决的膳食有关的文字特征估计国家级肥胖的具体任务。我们的方法得到的估计是强相关的文字特征政府公布的数据,优于关键字匹配的基线。结果还表明发现使用文本特征危险因素的潜力。这种方法是通用的,可以适用于广泛的基于Twitter的公共健康研究的。




两派社会网络中的意见分歧和极化


原文标题: 
Disagreement and Polarization in Two-Party Social Networks
地址: 
http://arxiv.org/abs/1911.11338
作者: 
Yuhao Yi, Stacy Patterson

摘要: 我们调查与两个信息来源偏光板社会网络分歧和极化。首先,我们定义在舆论动态的两方领导者 - 追随者模型的分歧和极化指数。然后,我们给出的索引表达式图的拉普拉斯的条款。表达表明这些量和电阻距离和双调和距离的概念之间的关系。接下来,我们研究设计的网络的问题,以尽量减少分歧和极化。我们给出最佳分歧和极化条件,并且进一步地,我们表明,随动节点的分歧和偏振的线性组合是跟随者之间的边的权重的一个凸函数。我们提出的算法,解决了一些有趣的例子一些相关的连续和离散优化问题和也出席了分析结果。




自阻尼动力系统的成本

最低的网络估计的复杂性


原文标题: 
On the Complexity of Minimum-Cost Networked Estimation of Self-Damped Dynamical Systems
地址: 
http://arxiv.org/abs/1911.11381
作者: 
Mohammadreza Doostmohammadian, Usman Khan

摘要: 在本文中,我们考虑网络估计的优化设计,以尽量减少网络可观测性约束下的通信/测量成本。这个问题被称为最小成本联网估计问题,其通常声称是NP难题。这项工作的主要贡献是提供针对此问题的根本动力系统是自阻尼的约束下多项式级解决方案。使用结构分析,我们细分的主要问题为被称为(I)最优传感器选择,和(ii)最小成本通信网络中的两个NP-硬子问题。对于自阻尼动力系统,我们提供了子问题(我)一个多项式级解决方案。此外,我们表明,子问题(ii)中的多项式阶复杂如果通信网络中的链路是双向的。我们提供一个说明性的例子来解释的方法。




大规模的动力系统的结构

可控性最小驱动节点:节点分类


原文标题: 
Minimal Driver Nodes for Structural Controllability of Large-Scale Dynamical Systems: Node Classification
地址: 
http://arxiv.org/abs/1911.11388
作者: 
Mohammadreza Doostmohammadian

摘要: 本文考虑的最小控制输入以影响系统的问题指出,使得所得系统在结构上是可控的。这个问题和最小的可观测性的双重问题都声称没有多项式级精确解,因此,是NP难问题。在此,采用图论的方法,这个问题就解决了一般非线性(以及结构不变)系统和提出了一种P-顺序溶液。在这个方向上,所述动力系统被建模为一个有向图,称为 textit 系统有向图,并介绍了两种类型的图组分,它们被紧密地与结构的可控性有关。两种类型的需要被影响(或驱动)由输入节点,称为 textit 驱动器节点被定义,并且获得这些驱动器节点的最小数量。多项式阶的给定算法的复杂度来求解大型动力系统的分析溶液的问题确保适用性。相比于现有文献,其提供近似和计算效率低的,例如本文的结构的结果是显著Gramian矩阵为基础,对解决问题的办法,而这纸上,较低的计算复杂性和适用于非线性系统的可控性分析精确解。




动态网络中的创新:发散性

思维如何受到同伴选择的影响


原文标题: 
Creativity in dynamic networks: How divergent thinking is impacted by one’s choice of peers
地址: 
http://arxiv.org/abs/1911.11395
作者: 
Raiyan Abdul Baten, Daryl Bagley, Ashely Tenesaca, Famous Clark, James P. Bagrow, Gourab Ghoshal, Mohammed Ehsan Hoque

摘要: 创新被视为在未来的工作的情况下最重要的技能之一。在本文中,我们探索的真正的社会网络影响的动态(自组织)性质如何创意的培养。我们运行涉及发散思维任务提供了基于Web的实验的6个试验(N = 288)。我们发现,网络连接逐渐适应个人的创意表演,参加者主要是寻求遵循高性能同龄人的创意灵感。我们发掘机遇与通过这种自组织给予的瓶颈。虽然暴露于高执行同行与追随者更好的创意表演相关的,我们看到了反效果选择遵循同样的同行介绍了追随者的想法语义冗余。我们制定基于主体的仿真模型上列出了这些过程的影响。我们的研究结果可能有助于设计大规模的干预措施,以提高人们在社会网络互动的创作才能。




无标度复杂网络的闭合系数


原文标题: 
Closure coefficients in scale-free complex networks
地址: 
http://arxiv.org/abs/1911.11410
作者: 
Clara Stegehuis

摘要: 三角形的复杂网络的形成已经收到了巨大的关注的一个重要的网络性能。近日,被介绍给测量三元闭合的新方法:关闭系数。此统计数据测量从一个三角形的头节点聚类(而不是从中心节点,如在经常研究聚类系数)。我们分析地方封闭系数在创建简单的网络,幂律度随机图模型的行为:隐变量模型和双曲随机图。我们表明,封闭系数表现在这些简单的随机图模型比在其行为之前研究了多图模型显著不同。我们还表明,封闭系数可以与聚类系数和平均近邻度。




神经变分推理动态网络的统计模型


原文标题: 
A Statistical Model for Dynamic Networks with Neural Variational Inference
地址: 
http://arxiv.org/abs/1911.11455
作者: 
Shubham Gupta, Rui M. Castro, Ambedkar Dukkipati

摘要: 在本文中,我们提出了一个统计模型,动态发展的网络,具有变推理方法一起。我们的模型,我们称之为动态潜在属性交互模型(DLAIM),编码在不同的时间点快照边的依赖。它表示通过潜属性节点和使用属性相互作用矩阵来边的存在建模。两者都允许随时间演变,从而使我们能够捕捉到网络的动态。我们开发了一个基于神经网络的变分推理过程,提供学习模型参数的适当方式。 DLAIM的主要优点是:(i)它是灵活的,因为它没有对网络演进严格的假设条件不同于现有的方法,(ii)其适用于直接和无向网络,更重要的是,(III)了解到节点属性和相互作用基质可以是可解释的,并且因此提供在后面网络演进的机制的见解。相比于现有的方法对现实世界的网络做了链路预测任务的实验结果表明我们的模型的卓越性能。




利用自符号化序列建模

的生成性含时链路预测


原文标题: 
Generative Temporal Link Prediction via Self-tokenized Sequence Modeling
地址: 
http://arxiv.org/abs/1911.11486
作者: 
Yue Wang, Chenwei Zhang, Shen Wang, Philip S. Yu, Lu Bai, Lixin Cui, Guandong Xu

摘要: 我们正式网络不断发展的结构用作临时网络,提出了一种生成链路预测模型,剖成路段序列建模(GLSM),来预测时间网络未来的链接。 GLSM从与序列建模框架所观察到的链接捕获时间链接形成模体,并且具有由从上未来的潜在链接的概率分布推断来生成新兴链接的能力。为了避免被处理的各个环节作为一个独特的标记过拟合引起的,我们提出了一个自我符号化机制,网络中的每个原链路转换为自动令牌一个抽象的集合。自标记化无缝集成到序列建模框架,其允许所提出的模型GLSM有泛化能力发现超出原链路序列链路形成模体。我们比较GLSM有五个真实世界的数据集的存在状态的最先进的方法。实验结果表明,GLSM未来取得积极的生成方式有效链接,同时实现其他备选方案中的最佳性能(AUC上2-10 %提高)。




利用被动收集的轨迹数据

评估异常事件对旅行模式的影响


原文标题: 
Assessing Impacts of Abnormal Events on Travel Patterns Leveraging Passively Collected Trajectory Data
地址: 
http://arxiv.org/abs/1911.11633
作者: 
Feilong Wang, Xiangyang Guan, Cynthia Chen

摘要: 旅游模式可以通过异常事件受到影响。评估的影响已经为救援行动的重要意义和改进防备或规划未来事件。以往,在评估完成之后的数据收集从后事件的调查,这在经济上是昂贵的,痛苦的低响应速度,费时,通常延迟在灾难发生后几个月(甚至几年),导致低效和不可靠的评估并创造救援组织的障碍,达到需要的人。智能手机和服务的普及程度使他们不断产生大量的轨迹数据(例如,基于应用,呼叫记录数据,数据),含大量的用户。这些轨迹数据是被动的,及时收集,并没有额外的成本和包含个人的数量庞大的旅游模式的信息在一个区域的延长时间(例如,几个月到几年)。我们提出了一个框架,以评估对使用这些数据的旅行模式的影响。利用被动收集的轨迹数据,建议框架的目的是捕捉和理解的旅游格局变化的全部范围,这有助于评估谁,何时以及如何在一定区域内人们的影响。拟议的框架适用于含有约一百万匿名用户的半年度轨迹,以评估飓风哈维的影响(在美国历史上第二最昂贵飓风)的移动电话轨迹数据集。结果验证和表明,该框架可以提供旅游模式哈维的影响,这可能会引导到响应,并从影响经济复苏的一个全面的评估。




感知碳足迹的用户研究


原文标题: 
A User Study of Perceived Carbon Footprint
地址: 
http://arxiv.org/abs/1911.11658
作者: 
Victor Kristof, Valentin Quelquejay-Leclère, Robin Zbinden, Lucas Maystre, Matthias Grossglauser, Patrick Thiran

摘要: 我们提出了一个统计模型来理解人的碳足迹的看法。通过观察,很少有人想到在绝对数量CO2的影响带动下,我们从他们的行动相对碳足迹的简单配对比较设计一个系统来探测人们的看法。该模型的制定使我们能够采取积极的学习方法来选择对的是最大限度地提供信息对模型参数的动作。我们定义了一组18个行动和收集的来自176个用户2183和比较的数据集在大学校园内。早期的结果显示有前途的方向,以改善气候沟通,增进减缓气候变化。



协作驱动个人生产力


原文标题: 
Collaboration Drives Individual Productivity
地址: 
http://arxiv.org/abs/1911.11787
作者: 
Goran Muric, Andres Abeliuk, Kristina Lerman, Emilio Ferrara

摘要: 如何合作者的数量会影响个人的生产力?以前的研究结果已经发生冲突,一些研究报告在个人生产率增长作为合作者的数量增长,而其他的研究表明,在搭便车效应歪斜由个人投资的努力,使较大的群体生产力较低。这些学校的思想之间的差别是巨大的:如果一个超尺度效应的存在,由前研究的建议,然后根据小组长,他们的生产力将速度甚至比其规模增加,超线性提高其效率。我们解决通过研究两个行星大规模协作系统这样一个问题:GitHub上和维基百科。通过分析超过200万的用户在这些平台上的活动,我们发现,群体规模和生产率之间的相互影响呈现出复杂的,以前没有观察到动态:更小的群体规模与集团规模生产能力超线性的,但在大尺寸饱和。此效果并不生产率的异质性的人为现象:组尺寸和生产率之间的关系保持在个体水平上。人们往往会做更多更多的人合作的时候。我们建议个人生产力的生成模型,捕捉非线性的协作努力。该模型能够解释通过捕捉它们的最大信息行为特征预测的GitHub和维基百科集团工作力度,它铺平了合作的原则性,数据驱动的科学方式。




全速范围自适应巡航控制

系统跟车模型的鲁棒性分析


原文标题: 
Robustness analysis of car-following models for full speed range ACC systems
地址: 
http://arxiv.org/abs/1911.11805
作者: 
Antoine Tordeux, Jean-Patrick Lebacque, Sylvain Lassare

摘要: 自适应巡航控制系统驱动的自动化的基本组成部分。在上控制水平,ACC系统基于跟车模型根据所述距离间隙到前身和速度差的车辆的加速率。追求策略在于保持固定时间间隙与前作的建议,行业规范的自适应巡航控制系统。该系统的系统的主动安全是解决由于本地和字符串稳定性分析。一些经典的固定时间间隙的线性和非线性跟车模型进行了比较。我们审慎评估对时延,噪声和测量误差,异质性,或动力学限制在较低水平控制在动态操作模型的鲁棒稳定性。结果凸显,许多因素可能扰乱稳定和诱导停时走波的形成,甚至本质上是稳定跟车模型。




高度集群复杂网络的结构

模型:随机规则小世界网络


原文标题:
Highly Clustered Complex Networks in the Configuration Model: Random Regular Small-World Network
地址: 
http://arxiv.org/abs/1911.11910
作者: 
Wonhee Jeong, Hoseung Jang, Unjong Yu

摘要: 我们提出了一个方法,以使配置模型内的高度聚集的复杂网络。使用这种方法,我们产生高度聚集的随机规则网络并分析它们的属性。我们表明,适当的参数高度集群随机规则网络满足小世界网络的所有条件:连通性,高聚类系数和小世界效应。我们还研究集群如何影响随机规则网络渗透门槛。此外,囚徒困境博弈进行了研究和讨论集群和程度的异质的合作水平的影响。




近因预测作者引用演化中的爆发


原文标题: 
Recency predicts bursts in the evolution of author citations
地址: 
http://arxiv.org/abs/1911.11926
作者: 
Filipi Nascimento Silva, Aditya Tandon, Diego Raphael Amancio, Alessandro Flammini, Filippo Menczer, Staša Milojević, Santo Fortunato

摘要: 科技论文引文过程已被广泛研究。不过,虽然通过作者计提引文他们的论文的引文的总和,从纸张到笔者的水平转换引文积累的动态是不平凡的。在这里,我们进行笔者引用的演化的系统研究,尤其是其突发性的动态变化。我们发现他们在未来获得引用最近由作者应计的数量和引用的次数之间的相关性的实证证据。用一个简单的模型,其中一个作者接收新的引文的概率只取决于之前的12-24个月内收集的引用次数,我们可以重现两个引用并在多个几十年的作家的突发大小分布。




基于累计时间的排序

方法评价信息网络声誉


原文标题: 
Accumulative time-based ranking method to reputation evaluation in information networks
地址: 
http://arxiv.org/abs/1911.11930
作者: 
Hao Liao, Qi-xin Liu, Ze-cheng Huang, Chi Ho Yeung

摘要: 随着现代科技的飞速发展,网络已经成为用户结交朋友,获取信息的重要平台。然而,由于网络上的信息过于丰富,信息过滤成为在线用户获得相关建议的一项关键任务。由于大部分网站可以根据用户的评价和喜好,相关性查询,新旧程度,如何从过度丰富的信息中提取最相关的项目进行排名始终在各个领域的研究人员的重要课题。在本文中,我们采用了用于分析复杂的网络,以评估用户的信誉和项目质量的工具。在我们提出的基于累积时间排名(ATR)算法,我们纳入其中当用户选择或速率项更新两种行为的加权因子,以反映用户的信誉和项目质量随时间的变化。我们发现,我们的算法优于国家的最先进的从各种在线零售商和研究出版物中引用的数据集的数据集经验的精度和鲁棒性方面排名算法。




图表示用于人脸分析图像集


原文标题: 
Graph Representation for Face Analysis in Image Collections
地址:
http://arxiv.org/abs/1911.11970
作者: 
Domingo Mery, Florencia Valdes

摘要: 由于带有图片的数量庞大的一个社会事件的图像采集,这是非常有用的,可以用来分析的工具凹口 - 存在于彼此的相互作用collection—个人如何。在本文中,我们提出了基于他们的’连接”最佳的图表示。一对受试者的连通给出了表示如何`“连接它们的得分。它是基于共同出现,亲近,面部表情和头部的时候,他们正在寻找彼此的方位估计。在我们提出的图中,节点代表收集的对象,并且边对应的连通性。的节点的位置是根据其连接估计(越接近节点,越连接是受试者)。最后,我们开发了一种图用户界面,其中我们可以点击到节点(或边),显示集合,其中所述节点(或所连接的受试者)的主题是本的相应图像。我们通过分析一个婚礼庆典,情景喜剧视频,排球比赛,并从Twitter提取的图像给哈希标签呈现相关结果。我们相信,这个工具可以是非常有益的检测图像采集在现有的社会关系。




2019欧洲议会选举期间

Twitter假新闻的覆盖面有限


原文标题: 
The Limited Reach of Fake News on Twitter during 2019 European Elections
地址: 
http://arxiv.org/abs/1911.12039
作者: 
Matteo Cinelli, Stefano Cresci, Alessandro Galeazzi, Walter Quattrociocchi, Maurizio Tesconi

摘要: 社会化媒体的出现改变了我们消费内容偏袒脱媒访问和生产方式。这种情形一直关注其对社会的影响是至关重要的讨论问题。在放大阿拉伯之春的情况下,或巨资Brexit年和2016年美国大选的批评。在这项工作中,我们通过分析官方消息人士透露,假新闻的来源,政治家,人们从演艺圈和许多其他的交互模式探索上届欧洲竞选期间的Twitter信息消费。我们深入探讨的相互作用最后欧洲议会选举,2019年5月,23日和26日举行的与前面不同类别的几个月账户中我们收集了近40万微博发表具有公共社会不同角色863个帐户。通过彻底的定量分析,我们研究它们之间的信息流,还利用geolocalized信息。账目显示的趋势,同一个类中限制它们的相互作用和辩论很少跨越国界。此外,我们没有发现针对散布虚假账户的有组织的网络的任何证据。取而代之的是,虚假的出口在很大程度上是由其他演员忽略,因此在玩网络政治讨论的外围作用。




城市效率和运动的不可逆转


原文标题: 
Efficiency and irreversibility of movements in a city
地址: 
http://arxiv.org/abs/1911.12158
作者: 
Indaco Biazzo, Abolfazl Ramezanpour

摘要: 我们知道,在物理系统,其最大效率由可逆过程实现。它是那么有趣的不可逆转性如何影响效率,在其他系统中,例如,在一个城市。在这项研究中,我们在一个城市来研究上述问题,着眼于运动(在家工作,回到家里)的循环过程。为此,我们目前的运动的最小模型,与用于效率和过程的不可逆性合理定义沿着;更准确地说,我们采取每个行程效率和前向和后向气流分布的过程的不可逆性的相对熵的数量的总行程时间的倒数。我们执行模型的数值模拟人口分布,流动性法律,以及移动战略的合理选择。结果表明,运动的效率确实负不可逆转的上述量度相关。网络的结构并在旅行时间的流的影响在这里的主要因素影响到达目的地并返回到起源,这通常比偏离的时间间隔较大的时间间隔。这又引起了从前进一和结果的向后流的发散到熵(病症或不确定性)的生产在系统中。这项研究的结果可能会更准确地表征城市效率和更好地理解这些复杂系统的主要工作原理是有帮助的。




没有惯性的行人模型的

相关噪声导致了停止和前进波


原文标题: 
Stop-and-go waves induced by correlated noise in pedestrian models without inertia
地址: 
http://arxiv.org/abs/1911.12261
作者: 
Antoine Tordeux, Andreas Schadschneider, Sylvain Lassarre

摘要: 停止和去波交通普遍观察到的和行人流动。在大多数交通模型,他们通过时,该模型具有不稳定的齐次解参数微调后的相变发生。惯性作用被认为在这个机制中发挥了重要的作用。在这里,我们提出了基于在没有惯性随机效应停停停停波新的解释。在一个稳定的微观阶模型引入特定的色噪声的允许来描述现实停时走的行为,而不需要的不稳定性或相变。我们采用的办法行人单文件运动和仿真结果真实行人的轨迹进行比较。讨论用于模型参数合理值。




用事实欺骗:通过一个

大型网络实验量化锚定偏置


原文标题: 
Fooling with facts: Quantifying anchoring bias through a large-scale online experiment
地址: 
http://arxiv.org/abs/1911.12275
作者: 
Taha Yasseri, Jannie Reher

摘要: 生活在“信息时代”的手段,不仅获得信息变得更加容易,而且,信息的分布更加动态比以往任何时候。通过大规模的在线现场实验,我们由于在一块的信息,他们最初给定的不合理依赖,为人们判断锚固偏见的存在新的经验证据。锚定的刺激和不同的任务,各个响应的比较揭示了一个积极的,锚和参与者对未来事件的结果的预测偏差之间又复杂的关系。治疗组中的参与者也同样易受不论其接合,先前的性能,或性别的水平的锚。鉴于锚的强大和无处不在的影响力定量这里,大家应该非常谨慎地密切监控和调节的信息的分发网络,以促进较少偏见的决策。




ComHapDet:

单倍体装配空间社区检测算法


原文标题: 
ComHapDet: A Spatial Community Detection Algorithm for Haplotype Assembly
地址: 
http://arxiv.org/abs/1911.12285
作者: 
Abishek Sankararaman, Haris Vikalo, François Baccelli

摘要: 背景:单倍型,区分染色体序列从他们的同源对单核苷酸变异的有序列表,可以揭示一个人的易感性遗传性疾病和复杂疾病,影响如何,我们的身体对治疗药物响应。重构从短测序读数的个体的单倍型是成为甚至更多倍体的情况下具有挑战性的NP-hard问题。虽然提高测序的长度读取和插入大小 色黑有助于提高重建的准确性,这也加剧了计算单倍型装配任务的复杂性。这促使高通量测序数据能够单倍型的精确且高效组装算法框架的追求。结果:我们提出测序的新的图表示读取和姿势的单倍型组件的问题,因为社区检测的在空间随机图的实例。为此,我们构建了一个曲线图,其中每个读是一个未知的社会标签与单倍型是样品读关联的节点。然后重建的单倍型可认为是一个两步骤的过程:首先,一个恢复节点(即,读取)对社区的标签,然后使用所估计的标签来组装单倍型。基于这一观察,我们提出ComHapDet  - 二倍体和ployploid单倍型一种新的组装算法功能,这使bialleleic和多等位基因变异。结论:所提出的算法的性能进行基准上通过测序染色体 5 四倍体双等位基因 EMPH 茄-马铃薯(马铃薯)的模拟获得的,以及实验数据。结果证明了该方法的有效性,它与现有技术相比,毫不逊色。



来源:网络科学研究速递

编辑:张爽



声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。


近期网络科学论文速递


个体科研合作中的合著网络和劳动分工 | 网络科学论文速递21篇

对抗大众媒体的趋势:文化全球化下的少数族裔成长 | 网络科学论文速递23篇

迈向自动化的性暴力报告跟踪 | 网络科学论文速递27篇

单篇论文与期刊影响因子波动:11639种期刊综合分析 | 网络科学论文速递19篇

通过LSTM历史跟踪进行动力学图嵌入 | 网络科学论文速递19篇

复杂网络动态相变的机器学习 | 网络科学论文速递21篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存