GeoBurst+论文记录

it2023-10-09 138

本篇博客主要记录自己学习以及复现GeoBurst+论文的过程，持续记录更新…

该论文主要有三个模块：

产生候选事件基于嵌入学习和活动时间轴的归纳模型建立的二分类在线的更新

首先该论文认为将事件的发生地作为中心点，在周围会产生与之相关的推文。我们离中心点越近，越有可能观察到与之相关的推文，基于此使用了地理和语义相似性度量来赋予每个推文权重，，之后找出权重最大的推文作为中心推文，中心推文及其邻居推文就构成了一个候选事件。

地理相似性权重定义地理位置的影响可以用核函数刻画,两个推文

d^{'}

d

的地理相关性记为

G

(

d^{'}

\to

d

) 其中

h

是窗宽（光滑参数），

c

是

E p a n e c h n i k o v

核函数的度量常数语义相似性权重定义语义相似性度量是基于在共现图中的随机游走定义的，首先构建共现图，以关键词为节点，两个关键词共同出现的次数作为边的权重建图。之后使用重启随机游走算法（

r a n d o m w a l k w i t h r e s t a r t, R W R

）,从关键词

u

开始，当算法达到稳态分布时，单词

u

到

v

的权重表示为

r

(

e^{'}

\to

e

)。则设推文

d

的关键词集合为

E_d

\{

e_1

e_2

\cdots

e_m

\}

,推文

d^{'}

的关键词集合为

E_d'

\{

e'_1

e'_2

\cdots

e'_m

\}

,则推文

d

与

d^{'}

的语义相似性度量定义为：推文权重定义推文的权重由与之相关的所有推文

最新回复(0)