[关闭]
@Perfect-Demo 2019-02-27T11:28:39.000000Z 字数 1742 阅读 1483

小型电影以及演员知识图谱构建(一)

Knowledge_Graph


本文基于github上一个大佬的项目(何止是基于,这篇文章明明就是在说怎么跑大佬的项目,(小声))

大佬的项目:KG-demo-for-movie

首先,本人为机器学习与深度学习初学者,初入知识图谱,目前非常迷茫,看到大佬在github上的项目,先不管别的,跑了再说,并且发现在跑的过程中,还有不少坑,在踩完一个个坑之后,有了这篇博文.

本人深知大佬已经把所有东西处理好了,我要做的不过就是配置配置环境然后把数据和代码塞进去.所以,之后还要一步步弄懂大佬到底做了啥,并且也会更新相应文章.

一. 环境要求

操作系统: linux16.04
语言: python2.7(想用3.0的话,要改一改相应的代码),java10(这里好像java8及以上都可以)
工具:Apache jena fuseki
python工具包: jieba,REFO,SPARQLWrapper

二. 配置环境

我这里默认大家用的是ubuntu16.04,并且装好了anaconda,然后jdk也没有问题(这几个东西的安装搜索一下都有大把大把的教程,此不赘述.)

1. 创建虚拟环境

在我们配置好anaconda后,我们打开控制台,创建一个新的虚拟环境,命令如下:

conda create -n 环境名 python=2.7

这里我们使用2.7(像我这种小白,刚开始还是老实点好)

2. python工具包安装

在相应的环境中安装python工具包:jieba,REFO,SPARQLWrapper

source activate 环境名

pip install jieba refo SPARQLWrapper

3. Apache jena fuseki安装

jena和jena-fuseki可以直接在官网下(但是确实有点慢,先去吃个饭或者看看风景再回来,正好下完)

完成后直接解压在同一个文件夹下就行(找得到就行)
然后打开终端,进入相应的文件夹

cd apache-jena-fuseki-3.10.0

4. 启动fuseki

本人曾经写了一个简略的在ubuntu下部署fuseki的博文,可以参考.
在这里我们需要带上配置文件启动fuseki服务器

./fuseki-server --config fuseki_conf.ttl

三. 上传数据

在启动了fuseki之后我们需要把数据上传服务器.

1. 打开服务器

打开浏览器后输入:

http://localhost:3030/

这样就进入了该服务器页面,然后我们可以通过这个前端界面来进行数据库创建和数据上传的操作(也可以通过命令行来进行,但是,像我这种小白,一开始还是老实点.)

2. 上传数据

  1. 首先它会让我们先设定一个数据库名,这个名字要和之后的查询语句相对应,什么意思呢,就是我们之后用python来对fuseki进行查询操作,我们要先连接到fuseki上,在python中连接这个需要一个地址,这个地址格式是这样的:

    http://localhost:3030/数据库名/query

    所以这个名字可以自己按照喜好设定,但是设定完之后,代码也要相应更改.
    对于本项目,要更改的地方是:

    KG-demo-for-movie-master/kg_demo_movie/KB_query/jena_sparql_endpoint.py
    里的第22行的url

  2. 之后我们开始上传数据,在点击选择文件的按钮后,上传该数据文件

    kg_demo_movie.nt

    这样,我们就可以开始测试了.

    四. GO

  3. 首先进入环境

source activate 环境名

  1. 开始执行运行文件

进入目录KG-demo-for-movie-master/kg_demo_movie/KB_query/query_main.py

运行python query_main.py

  1. 等构建成功,不动了之后,就可以开始输入测试了!

周星驰演了多少部电影?
62
周星驰是谁?
(巴拉巴拉一大堆)

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注