KGQA

1-基于知识图谱的《红楼梦》人物关系可视化及问答系统

app.py是整个系统的主入口
templates文件夹是HTML的页面
|-index.html 欢迎界面
|-search.html 搜索人物关系页面
|-all_relation.html 所有人物关系页面
|-KGQA.html 人物关系问答页面
static文件夹存放css和js，是页面的样式和效果的文件
raw_data文件夹是存在数据处理后的三元组文件
neo_db文件夹是知识图谱构建模块
|-config.py 配置参数
|-create_graph.py 创建知识图谱，图数据库的建立
|-query_graph.py 知识图谱的查询
KGQA文件夹是问答系统模块
|-ltp.py 分词、词性标注、命名实体识别
spider文件夹是爬虫模块
|- get_*.py 是之前爬取人物资料的代码，已经产生好images和json 可以不用再执行
|-show_profile.py 是调用人物资料和图谱展示在前端的代码

环境依赖：
neo4j-community-3.4.6
py2neo 4.0
pyltp采用源码安装。安装指导

部署步骤：

系统整体流程图：

从搜狗那里爬取火影忍者的角色名单，作为实体集合。由于是尝试性实验，所以只是采用了少部分主角，合计大概29个。<br>

由于搜狗网页已经带有人物关系信息，所以在角色名单的边界确定之后，直接对各个角色的人物关系进行爬取，并做去重。
得到最后的关系文件naruto_relation.txt和各个角色的详细信息name_id_detail.txt

基于上述的naruto_relation.txt和name_id_detail.txt在neo4j中构建人物图谱关系
构建的效果图如下：

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
KGQA		KGQA
neo_db		neo_db
raw_data		raw_data
spider		spider
static		static
templates		templates
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
app.py		app.py
flow.png		flow.png
naruto.PNG		naruto.PNG
requirement.txt		requirement.txt
图片 1.png		图片 1.png
流程图.png		流程图.png
火影忍者.PNG		火影忍者.PNG