/* */

国内社会化搜索引擎发展状况分析

2019-10-18| 发布者: admin| 查看: |

0 引言

信息搜寻是指个体为了满足目标需求进而产生的寻找信息的活动,个体在寻找信息的过程中可以与人工信息系统(如图书馆)或计算机进行系统交互[1]。随着互联网应用的不断发展,信息搜寻已经成为人们日常获取信息的重要手段,并发展成为社会化信息搜寻。社会化信息搜寻是社会化与信息搜寻的结合物[2],用于描述一种与他人进行社会化交互的信息搜寻行为。这些交互行为可能是显性的或者是隐性的,是同地协作或者远程遥控,是同步的或者异步的。社会化搜索引擎是社会化信息搜寻行为赖以发生的平台之一,借助这类平台,用户可以便利地寻找到社会化媒体产生的用户生成内容[3]

国外关于社会化搜索引擎的研究与实践较为丰富,包括功能评估、算法设计、系统实现等多个方面。例如:Scale等[4]对Facebook的社会搜索引擎功能进行评估;Kwon等[5]提出一种新的社会化搜索引擎,利用基于位置的社交网络服务获取用户的位置查询;Horowitz等[6]对Aardvark这个社会化搜索引擎进行深度剖析;Buijs等[7]提出Social Score算法,基于任意数量的社交信号确定网页的相对重要性,并对Social Score在异步社会化搜索引擎中的潜在作用进行评估;已经推出Social Mention、Yoono、Social Searcher等比较专业的社会化搜索引擎。国内社会化搜索引擎建设目前处于起步阶段,相关研究略少,现有平台尚未充分发挥功能、凸显价值。

1 我国社会化搜索引擎建设状况

国内于2012年开始出现社会化搜索引擎,微博、微信等社交媒体也纷纷推出了平台内的搜索功能来满足用户日益增长的社会化信息需求。微信更是与传统搜索引擎巨头搜狗合作,将内部信息与外部平台打通,实现微信内容的平台外搜索。接下来,结合文章主题,笔者将介绍几个在国内社会化搜索引擎建设史上具有里程碑式意义的事件,以期加深读者对国内社会化搜索引擎建设的了解。

2012年12月18日,社会化搜索引擎云云网正式上线,区别于一般搜索引擎,注册用户在云云网搜索登录后,会获得一份与众不同的,与社交结合的个性化结果。云云网于2012年10月推出了“微博订阅”APP,可搜索新浪、腾讯、搜狐和网易四大微博的消息,但云云网搜索只运行近一年即关停。

2014年6月9日,搜狗推出微信搜索功能,引发热烈讨论。数亿/月活跃用户的微信孕育了数百万的微信公众号,其产出了大量有价信息,更成为一部分人获取信息的重要渠道。由于此前的种种限制,此信息库无法被外界利用,如今,通过搜狗微信的搜索功能,用户可方便地获取公众号中的信息并加以利用。其是将社会化媒体平台(微信)和传统搜索引擎(搜狗)结合起来的产物,是我国社会化信息搜寻建设中的又一次勇敢尝试。

2015年11月8号,搜狗与知乎达成了合作。搜狗全面接入知乎内容数据,搜索用户可在搜索结果中直接获取知乎两千万专业问答信息,同时上线的搜狗知乎搜索垂直频道,聚合知乎优质内容[8]。搜狗拥有了知乎的优质信息,知乎也获得了更佳的搜索体验,达到双赢结果。搜狗知乎是将社会化问答社区(知乎)和传统搜索引擎(搜狗)结合起来的产物,标志着我国在社会化信息引擎建设道路上的迈进。

2 搜狗微信与搜狗知乎的搜索功能分析

2.1 搜索功能比较

搜狗微信、搜狗知乎的信息来源分别为微信平台与知乎平台的用户生成内容。就搜索功能而言,社会化媒体平台与社会化搜索引擎存在差异,如表1所示。

表1 搜索功能比较     

表1 搜索功能比较

首先,搜索范围不一。搜狗微信上可搜索到的内容仅包括公众号及以公众号名义发布的文章,而微信除能搜索到前述内容,还能指定范围,通过关键字搜索到朋友圈信息、小说、音乐和表情等。搜狗知乎仅可搜索到话题、用户、专栏、圆桌、Live等内容,知乎平台所涵盖的电子书、私家课等内容则被排除在外。值得注意的是,搜狗微信与搜狗知乎都无个性化的反馈结果,这势必会对用户搜索体验产生消极影响。

其次,搜索结果的筛选或排序方式不同。搜狗微信能够按照指定的时间范围、类型(图集或含视频)及公众号筛选搜索结果。在微信平台,与文章有关的搜索结果可指定搜索范围和排序方式;与公众号有关的搜索结果未提供筛选排序功能。知乎搜索中仅有按时间范围的筛选功能,搜狗知乎无任何有关功能。

最后,搜索功能的健壮性存在差异。例如,通过输入错词“Micosoft”,搜狗知乎、搜狗微信和微信都可自动辨别并纠正错词,获得关于“Microsoft”的搜索结果,而知乎平台无输入纠错功能。

2.2 搜索结果分析

2.2.1 搜狗微信与微信的特定搜索结果的对比分析

由于搜索范围不一,在此只比较文章及公众号的搜索结果。对于前者,结合前文提到过的搜狗微信与微信的筛选排序方式可知搜狗微信较注重文章本身的性质,而微信注重个性化社会交互。由于两者采用的是两套完全不同的结果呈现方式,所以无法进行比较,用户可依据偏好选择不同的方式得出结果。对于后者,为了使分析结果更客观且具代表性,笔者选择了多个含义不同的关键词。以“社会化搜索引擎”“数据分析”“薛之谦”“茼蒿”“三只松鼠”“我不是药神”为检索词,分别在搜狗微信与微信平台上进行公众号的搜索,获得的结果出乎意料。如对于“社会化搜索引擎”,搜狗微信上无任何反馈结果,而微信上却输出了大量信息。究其原因,笔者分析发现搜狗微信对于公众号的搜索采取的是精确检索的方式,即公众号的名称必须包含被检索的关键词才会被检索出来,而微信上是模糊检索,即包含被检索词的任意字的公众号都会被搜索出来。因此,二者的反馈结果会天差地别,若用户不了解这一差别,将很难获取所需信息。

2.2.2 搜狗知乎与知乎的特定搜索结果的对比分析

为了利于比较,笔者将知乎时间搜索范围定为不限。

依次输入上述关键词,获得搜索结果。由于结果量大,仅是浏览难以比较,笔者利用网络爬虫,将搜狗知乎与知乎上的搜索结果爬取下来,包括标题、点赞数和评论数3个字段,整理后的结果如表2所示。第一个指标是搜索结果总数。第二个指标是直接关联数,即检索结果中完全包含关键词的检索结果数量,其数值越大,表示检索结果与关键词的关联度越高。二者结合可以发现,搜狗知乎的检索结果数量是与实际输入的关键词相关的,当与关键词关联密切的结果较少时,检索结果的数量会随之减少,而知乎平台由于对搜索结果的呈现采用的是下拉延时加载的方式,检索结果的数量稳定在200条左右,且当关键词被广泛讨论时,保证了搜出的结果都大多相关。第三个指标最高点赞数和第四个指标最高评论数是所有检索结果当中最高点赞和最多评论的数量,由于搜狗知乎与知乎平台对于检索结果的定义不同,笔者在此仅作横向比较。通过分析发现,在这6个关键词中,搜狗知乎最高点赞和最多评论所属的检索结果仅有“薛之谦”和“三只松鼠”的最高点赞数所属结果是与关键词直接关联的结果,而知乎平台除去“社会化搜索引擎”外所有的最高点赞数或评论数的所属结果都与关键词直接关联。

表2 各检索词搜索结果比较     

表2 各检索词搜索结果比较

总体上来看,由于搜索范围不一致,多类信息无法在搜狗微信与搜狗知乎平台上查到,当用户希望获取范围更广的信息时,只能选择微信或知乎平台。但若用户不要求获得全类信息时,搜狗微信与微信对于文章的筛选方式不同,用户可根据更习惯的方式进行平台的选择,至于公众号,当用户想使用模糊匹配可选择微信,精确匹配可选择搜狗微信;搜狗知乎与知乎,前者能够搜集到更多的信息,但若限定检索结果数量,后者能搜集到更相关的信息,所以当选择的关键词较热门且希望得到尽可能多的搜索结果时,可以使用搜狗知乎,而相关结果很多且对搜索结果有较高查准率的要求时,使用知乎平台似乎更为合适。

3 不足与建议

3.1 缺乏对搜索结果的分析统计

Ramirez[9]在构造社会化信息搜寻模型时,在介绍技术相关的影响因素部分指出,用户认为媒介能够帮助用户获取所需信息的程度对搜寻策略的选择会产生重要影响。同理,当用户在使用社会化搜索引擎时,有时会期望得到更多与搜寻结果相关的信息,例如国外社会化搜索引擎Social Mention,其搜索界面有些类似于传统搜索引擎,主界面是一个横条的搜索框。添加关键词进行搜索之后,除了显示UGC外,还提供了搜索结果按日期和资源排列的功能和限定时间范围筛选结果的功能。左侧是Socia Mention对搜索结果的Strength、Sentiment、Passion和Reach进行的比例统计情况,并能够对搜索结果的Top Keywords、Top Users、Top Hashtags和Sources进行排序,界面如图1所示。国内的社会化搜索引擎除了返回有关搜索结果,仅产生当日的搜索热词,缺乏对搜索结果的统计分析,这无疑会降低社会化搜索引擎的使用率。这一部分的改进方法目前只能依靠技术的不断发展与革新,毕竟国内的社会化搜索引擎产品还在建设阶段,有很多优秀的功能值得期待。相信随着科技的不断发展,国内的社会化搜索引擎能为我们提供更加优化的分析结果。

3.2 信息来源单一

国外的社会化搜索引擎Social Searcher,拥有Web、Twitter、Facebook、Googleplus、YouTube、Instagram、Reddit、Dailymotion、Tumblr、Vimeo、Vkontakte和Flickr来源的信息,并分为链接、图片、状态和视频这几大类反馈给用户。我国的社会化搜索引擎产品通常只能将单一信息来源的结果反馈给用户。国内各个社会化信息搜寻平台之间存在着复杂的合作与竞争关系,原创内容的版权保护问题、各平台的聚流盈利问题等都会对各个平台用户生成内容之间的分离与结合产生影响。如果用户想得到来自多平台的信息,可以自己通过搜索得到各个搜索引擎或平台的UGC,并将其结合起来得出有效的反馈结果。

图1 Social Mention搜索页面

图1 Social Mention搜索页面 

3.3 搜索结果缺乏个性化

搜索目标的差异可能会对策略选择产生影响,国外的社会化搜索引擎Yoono,可通过插件的方式嵌入用户的浏览器中使用,当用户成功安装后,并登录Facebook、Twitter、YouTube等一个或多个账号,Yoono可将好友的UGC反馈给用户。用户在搜索窗口搜索关键词,并按照个人的喜好选择搜索结果的排列方式,会得到个性化的反馈结果。国内的社会化搜索引擎,搜狗知乎无用户登录功能,而搜狗微信虽有登录功能,但登陆与否仅对搜索结果的显示数量产生影响。他们都无法给予用户与社会网络关系关联的信息,当用户对这部分的信息有所需求时,国内的社会化搜索引擎产品即在他们的备选之外。继续发展我国的社会化搜索引擎是解决问题的方法之一,除此,我们还可以将社会化搜索引擎的反馈结果与社会化媒体或社会化问答社区本身的内容结合起来,以社会化搜索引擎的反馈结果为入口,在原来的平台上找寻更深层次的信息。

4 结语

至今为止,中国还没有出现一个具有代表性的社会化搜索引擎。而纵观全球,国外已出现了许多优秀的社会化搜索引擎。国外知名的社会化搜索引擎大都是将搜索引擎与社会化媒体相结合,而国内还做到了将搜索引擎与社会化在线问答系统相结合———即“搜狗知乎”。当然,其实像百度知道,搜狗知道等一系列基于搜索引擎的社会化在线问答社区已经将自身平台所产生的用户生成内容纳入传统搜索引擎的索引库中,用户可以基于传统搜索引擎检索到这些内容,但是不能基于社会网络关系对这些内容进行筛选。国内的社会化搜索引擎还处在发展与建设的阶段,因为其独有的功能与价值,具有无限的发展潜力。相信未来,随着科技的不断发展,我国社会化搜索引擎的建设仍将稳步向前,我们拭目以待。


 
QQ在线咨询
售前咨询热线
13524991327
售后服务热线
13524991327
返回顶部