贪心学院
  • 首页
  • 公开课
  • 交互式初级课
  • 精品训练营
  • 高端训练营
  • 京东AI合作
  • 关于我们
    • 学习路线
    • 公司合作
    • 研究成果
    • 师资介绍
  • 首页
  • 公开课
  • 交互式初级课
  • 精品训练营
  • 高端训练营
  • 京东AI合作
  • 关于我们
    • 学习路线
    • 公司合作
    • 研究成果
    • 师资介绍
    • 登录
    • 注册
  • 登录
  • 注册
难度 中高级
学习时间 共12周(每周10小时)
基础准备 Java基础,SQL基础
立即试听
本课程适合谁,解决什么问题?
本课程是100%实战类知识图谱课程,目的是帮助学员搭建一个完整的可应用于工业界产品的知识图谱系统。项目涉及到的模块包括:通过NLP技术来处理非结构化数据、知识图谱的设计、大规模数据的离线/实时导入、基于Spark GraphX的图算法实现、对外服务接口的编写以及Neo4j/Cypher的使用。虽然课程以风控为案例,但所涉及到的思路、架构均适合其他的应用场景。
适合什么样的人群?

A想成为或者转型做知识图谱工程师的学员;

B已经从事相关领域的工作,想用最低成本迅速搭建知识图谱系统的公司和团队;

C想深入学习知识图谱的学员;

你将要搭建的知识图谱系统
你将学到什么?
Part 0:知识图谱基础
第一章:介绍
1.1 什么是知识图谱
1.2 知识图谱所涉及到的技术
1.3 知识图谱的应用场景
1.4 课程需要解决的业务问题:大数据风控
1.5 整体系统架构
1.6 课程结构:最小可用系统(MVP)到完整系统
Part 1:搭建最小可用的离线风控系统
第二章:Neo4j与APOC组件介绍
2.1 MySQL语句使用回顾
2.2 图数据库介绍:Neo4j
2.3 APOC组件的介绍
2.4 通过APOC把MySQL数据导入到Neo4j
第三章:Cypher语句使用
3.1 Cypher的查询
3.2 Cypher的修改、增加、删除
3.3 Neo4j的索引
3.4 Cypher的复杂查询
3.5 Cypher的路径检索(比如最短路径)
项目1:搭建最小可用系统 之(一)
1.基于给定的少量风控数据(包括3个关系表),把数据通过APOC组件导入到Neo4j
2.通过Cypher语句完成简单的查询
第四章:风控算法介绍
4.1 风控算法的评估
4.2 逻辑回归算法介绍
4.3 GBDT算法介绍
第五章:风控规则的制定与服务开发
5.1 风控规则的制定
5.2 风控规则的存储
5.3 风控模型的搭建
第六章:微服务介绍
6.1 什么是微服务
6.2 企业是如何应用微服务
6.3 Java常用微服务框架
6.4 规则引擎微服务开发
项目2:搭建最小可用系统 之(二)
1.利用Cypher编写不同的风控规则和模型
2.把结果以微服务的方式输出
Part 2:搭建完整的离线风控系统
第七章:非结构化数据(邮箱数据)的处理
7.1 知识图谱中常用的NLP算法介绍
7.2 文本预处理:分词、停用词过滤
7.3 命名实体识别
7.4 实体和关系的抽取
7.5 分类算法介绍
第八章:风控知识图谱设计
8.1 业务问题剖析
8.2 知识图谱的设计原则
8.3 知识图谱设计过程中常见的错误
第九章:实体(公司名)的消歧
9.1 常用的实体消歧技术
9.2 实现公司名字的消歧
第十章:Kafka消息队列介绍
10.1 环境搭建
10.2 生产者与消费者
10.3 消息订阅
10.4 Kafka Topic介绍
第十一章:数据的增量更新
11.1 增量更新的技术框架设计
11.2 环境搭建
11.3 工程开发
项目3:基于千万级数据的风控知识图谱搭建
1.观察并分析给定的千万级数据集
2.邮件数据的预处理,并通过自然语言处理技术自动对邮件内容加上标签,并存储在MySQL库中
3.根据知识图谱设计原则来设计合理的风控知识图谱
4.公司名的消歧
5.把数据批量导入到Neo4j中
6.模拟故障场景,利用Kafka实现数据的增量导入
7.设计有效的风控规则来构建风控模型
8.把模型结果利用微服务返回到业务系统中
Part 3:利用图计算引擎实现大规模图挖掘算法
第十二章:图挖掘算法
12.1 图挖掘算法介绍
12.2 图挖掘算法的应用场景
12.3 常见的社区挖掘算法
12.4 LOUVAIN算法介绍以及实现
12.5 标签传播算法介绍以及实现
12.6 在小数据集上实现图挖掘算法
第十三章:图数据库:Spark GraphX
13.1 Spark GraphX的应用场景介绍
13.2 GraphX架构介绍
13.3 环境搭建
13.4 GraphX的API介绍
13.5 Neo4j数据导入到GraphX中
13.6 在GraphX中实现图挖掘算法
项目4:基于GraphX的挖掘算法实现和模型训练
1.搭建Spark Graph环境,并把Neo4j数据导入进去
2.业务问题的定义
3.在GraphX上实现社区挖掘算法
4.整合社区挖掘算法结果和规则输出的结果
5.把结果以微服务方式返回到业务系统
Part 4:搭建完整的实时+离线风控系统
第十四章:实时知识图谱风控系统
14.1 实时风控系统的框架设计
14.2 Canal的应用场景
14.3 Canal的框架介绍
14.4 Canal的环境搭建
14.5 实时代码的工程开发
14.6 Neo4j Driver的实现
14.7 实时风控系统与业务系统通信
项目5:实时知识图谱风控系统开发
1.Canal client的功能实现
2.Neo4j Driver工程开发
3.Kafka通信系统开发
第十五章:课程总结
我们的课程服务

专属于本课程的学习交流论坛,开放答疑解决线上学习‘只能靠自己’的问题

我们将会在平台的课程话题--->问答区对学员学习时遇到的问题进行解答,并确保在当日24点之前作出快速、准确的回复。

助教带领专属职业规划学习小组,个性化分层解决线上学习资源分配不均的缺陷

根据学员入学水平和对未来职业的规划进行学习小组划分,由全一线工程师组成的“代码最牛男神助教团”实时为小组内的每位学员提供帮助。每周三次群内定时督促学习,助教老师在线辅导。任何问题随时问,所有困惑及时解,节省自己琢磨的时间!

GitHub统一维护代码,利用自动化方式解决线上课程实操学习的弊端

学员将代码提交至GitHub账号,我们及时反馈代码运行结果并附带评估及修改优化建议。学员在修改代码的过程中,如遇问题可第一时间讲问题提交至论坛、助教微信群内实时答疑及老师群内的定时辅导获得解答。
我们的独有福利

与行业专家交流

邀请多名一线数据科学家、算法工程师与学员在线交流,分析行业就业前景,探讨技术现状。

分成学习小组

报名即进行专属测评,根据测评结果进行个性化分层教学。学习小组由专业助教带领,获得更专业的指导。

企业面试辅导

我们的讲师和助教均担任了多年的企业面试官角色,熟悉企业面试流程,通晓企业技术要求。他们将与你在线上面对面,为你提供量身定制的就业建议。
课程导师有哪些?
  • 李文哲
    课程讲师
    李文哲,人工智能、知识图谱领域专家。曾任北京会牛科技的首席科学家兼投资总监 、美国亚马逊和高盛的高级工程师,负责过金融知识图谱、聊天机器人、量化交易、自适应教育系统等核心项目,并兼任多加创业公司的技术顾问。
  • 大周
    课程讲师
    大周,技术领域、数据分析领域专家。曾任百度资深工程师、国美金融技术负责人。拥有8年以上、大数据和AI方面的实战经验,先后负责过金融风控、知识图谱、计算机视觉、聊天机器人等多个公司级的核心项目。多家在线教育平台的金牌讲师,拥有丰富的授课经验。
  • Jia Xi
    课程助教
    Jia Xi,互联网公司技术负责人,资深架构师。十余年互联网开发经验。现任国美大数据中心知识图谱负责人、资深技术专家,曾任职去哪网,无线讯奇等一线互联网公司。多年大数据开发,数据挖掘,数据分析后端架构项目经验,精通java,Python,Scala等多种编程语言。
立即试听

北京贪心科技有限公司

电话:400-780-8803

合作邮箱:business@greedyai.com

投诉邮箱:tousu@greedyai.com

北京市朝阳区酒仙桥北路9号(厂区)11幢1层008号

隐私政策 京ICP备18022135号-1