上节课,给大家演示了项目的效果,总体来说还是不错的,接下来,就正式进入课程内容了。这节课主要给大家介绍的内容,是预设的意图类别和课程安排。
意图类别
所谓的意图类别,就是用户可以问的问题的类别,也可以理解为是产品需求。这些类别的定义,是结合用户需求,和我们能搜集到的数据,综合评估之后的结果,这一步一般都是由产品经理来完成。
疾病定义:过敏性鼻炎是一种什么病? 疾病病因:过敏性鼻炎一般是什么原因引起的? 疾病症状:感冒的常见症状有哪些? 症状查疾病:最近经常感觉头疼,可能得了什么病? 治疗方法:感冒了吃什么药好得快? 挂号科室:感冒了去医院挂什么科室的号? 预防:怎么预防过敏性鼻炎? 禁忌:高血压病人有什么忌口? 检查方案:怀疑得了流感,去医院需要做哪些检查? 治愈率:高血脂能治好吗? 并发症:高血压会引发哪些其他疾病? 适用症:阿莫西林能治那些病?
如果说大家想增加类别,首先要看图谱数据能不能满足,然后再去构造模型训练语料,重新训练模型即可。
课程内容
1、实体识别:复用《医疗命名实体识别项目》课程代码,会详细讲替换数据集的方法。
2、ChatGPT:开源数据集不能满足定制需求,魔法对抗魔法,自己生成意图识别数据集。
3、意图识别:复用《TextCNN新闻文本分类项目》课程代码,替换成自己生成的数据集。
4、Neo4j:复用《电影知识问答项目》Neo4j基础课程,补充Neo4j安装和数据批量导入方法。
5、模板解析:集成意图解析、实体识别、模板填充、数据查询功能。
6、前后端封装:复用《电影知识问答项目》前端基础课程,补充代码集成方法。
7、关系抽取:没用上,但可能是面试、答辩绕不开的话题,参考《CasRel关系抽取》课程。
专题课程
http://www.ichenhua.cn/edu/topic/nlp
这个课程的发布,反馈肯定会有好有坏。好的是集大成,把前面的零碎知识都串到了一起,知道前面的枯燥的任务有什么用了;不好的就是这个课程不够独立,引用了太多其他项目的内容。
从专业的角度回答这个问题,就是一句话:做人工智能,得一直往前走。前面还有太多值得我们学习和探索的知识,所以我没有时间,去重复前面讲过的内容,请大家原谅。
本文为 陈华 原创,欢迎转载,但请注明出处:http://edu.ichenhua.cn/read/644