今天来分析一下摘要和文章结构
Opinion Mining and Sentiment Analysis
by Bo Pang and Lillian Lee
摘要
“人们怎么想”一直是信息搜集的重要一部分,随着充满舆论观点的在线评论网站和个人博客的发展与流行【译者按:这篇文章是2008年的,放在当下肯定是Facebook和Twitter什么的……】,新的挑战和机遇出现了:当今的人们可以也正在积极地利用信息技术工具寻找和了解别人的观点【译者按:就是在家里无聊逛网站的人多了,所以网络舆论的传播性急剧增强】。因此舆情挖掘与情感分析领域的发展突飞猛进,这一技术利用计算性的方法解决文字中舆论、感情和主观感受分析,因此在将舆论为第一分析目标的新技术系统中给予了直接的回应。【译者按:意思就是这是一种方法、进行了计算,而且直接回答了舆论分析的问题,不是文科生那种瞎来来】
本文包揽了能够直接进行舆论导向信息检索系统的技术与方法,我们的目标是提出解决由情感感知应用产生的问题的解决方案,并于已经存在的以事实为基础的传统分析进行比较。我们并进一步总结了分析性文字以及与隐私、舆论控制、经济影响等与舆论导向信息检索系统服务有关的内容。为了帮助今后的工作,我们对现有资源、性能数据集和评价方案进行了讨论。【译者按:这些就是实证性论文的必备Bullshit了……】
简介
舆情挖掘与情感分析的需求量
就是说研究这个问题很有必要……不具体翻译了
与什么相关?一个舆论/观点搜索引擎的结构分析
挑战非常巨大,所以我们举个栗子来分析一下。
主要有以下挑战:
1.如果应用要集成到广泛应用的搜索引擎中,我们首先要知道用户是不是要找主观评价材料。我们可以通过用户使用的搜索关键词,如“评论”、“观点”,或者选中框来简化这个问题。但请求分类本身是个很大的挑战,这个问题还是2005 KDD Cup challenge的主题【不知道是什么鬼】。
今天奔波大半天返校,所以就少些一点了,明天继续。
不过这篇文章好像和我最终方向有些偏离,这篇文章好像是想讲舆情搜索引擎技术(雅虎也是做搜索的嘛),而不是舆情分析本身。
明天把intro啃完再下结论吧,晚安。
That's all for today. See you tomorrow.
Kevin Ham@Wuhu
Department of Internet Engineering, Anhui Normal University, Wuhu, China
3.1.2015