在半年以前,我还是一个对知识图谱一无所知的人,但很荣幸能够参加一个从0开始立项的知识图谱项目。该项目落地场景是安防领域。关于项目的实施细节,由于部分涉密,这里我不会多说,因此本篇文章主要从产品的角度叙述在知识图谱项目前期有哪些工作内容需要产品跟进。
第一步 知识图谱基础学习
作为小白,最应该保持的就是学习的心态。在刚接触一个全新的项目时,需要做的就是在短时间内快速了解一个领域的基础。
什么是知识图谱?
知识图谱本质上是语义网络,是一种基于图的数据结构,有节点(point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的关系。【李文哲】
例如下图“人民的名义”关系图谱
当然,知识图谱的实体和关系不止仅仅指人相关,还有物体。例如房子、车子、手机。在安防的场景下,只要能确认某人身份,关于这个人所有事件都能够清楚一览。
知识图谱基本知识
关于知识图谱的基本知识的学习,这里有一些推荐
1.知识图谱的应用 ,作者李文哲【强烈推荐产品阅读】
2.《浅谈知识图谱基础》,作者我偏笑_NSNirvana
www.jianshu.com/p/4f09043e22ea
下图是我用思维导图做的关于上文的内容梳理
如果能够消化完以上两篇文章,对知识图谱的初步理解应该不会有太大问题。
第二步 决定表现形式
根据不同的场景,需要决定知识图谱最后可视化呈现的格式。一般来说,我们会看到两种界面上的展现:
1.类似google/百度等搜索引擎的展现方式
搜索“健身”,页面能够推荐出相关与健身相关的信息,例如“健身领域的网络红人”“与健身相关的词汇”等等,这些都是通过知识图谱关联出来的信息。通过卡片形式展示给了用户。
这种常见的界面表现比较适合满足于寻求信息量杂、查找范围广、信息类别多样的诉求。但是针对目的明确,信息类别确定的情况(也可理解为垂直诉求),这种表现方式反而不太合适,因此需要我们用另外的形式去展现信息。
2. 逻辑关系式的表现方式
这种形式非常适用于研判、追踪、以及掌握全局范围的实体关系。
比如数据冰雹下面的产品表现:
这种利用图像化的形式反而更能直观地找到关注的内容。
当然这种形式需要考虑的是要用“树”呈现,还是用“图”呈现。前者更方便浏览,不会由于关系太多形成“蜘蛛网”;后者在表现实体间关系上有更大的优势。
因此,在整个知识图谱项目中,产品经理需要明确用户的使用场景,挑选最合适的界面表现,才能进行下一步的产品设计。
第三步 跟踪数据构建
在正式构建数据之前,相关开发会将数据列表给到产品。这时产品需要确认是否所有的数据类型已经包含在表内(可根据数据名称确认),这个部分甚至需要产品重度参与。
因为非常有可能发生的情况是:开发不清楚业务,因此遗漏部分所需数据,造成最后缺乏对应关系无法关联上数据。
这里简单举一个例子:
小明的妈妈买了一套房子,小明和妈妈一起住。
我们理清数据的思路可能是:
小明妈妈是业主,小明是非业主,房子跟业主关联。
但是“小明”,“小明妈妈”,“房子”这三者的关系实际应该是:
如果我们只将房屋和业主关联,就无法在数据中体现小明居住在该房屋这个事实。
因此对于数据之间的逻辑关系,产品应该是最明白的一个人。
产品应该对节点建模和关系建模的基本内容有所了解,需要了解每一类型下所涵盖的基本信息分类和关系分类。例如对于人来说:
基本属性(姓名、年龄等)
财产(房屋、车辆、手机等)
人际关系(亲朋好友)
行为(到什么地方做了什么事;通过什么方式达成什么交易)
...
对于每一类信息,根据产品所在的场景设计都应该有不同的权重设计。当然绝大部分需要算法支撑,但产品需要再最初时做好场景穷尽,制定基础的规则。
最后
如果你的项目是从0开始的,那么明确产品的最终态,理解用户的场景,是你现在必须面对的问题。如果你是中途接手知识图谱项目,建议你研究目前知识图谱的节点和节点关系,了解项目发展计划,应对需求再做出产品的调整。
我正在朝着AI产品的方向不断努力,分享的内容也是自己学习、总结的内容。如有错误或不同见解~欢迎大家指教
如果觉得有用,记得给我点赞哦。另外欢迎关注我的公众号“AI产品的自我修养”,目前正在不断更新中...