前面课程当中,代码已经修改完了,接下来就是同步到Kaggle上,训练好模型之后,再下载到本地测试。因为Kaggle最近改版了,跟之前演示的过程略有区别,所以这节课,再演示一遍复制的流程。

操作演示

1、切换GPU

注意要先验证手机号,开启网络,再切换GPU.

2、上传文件

如果两份数据都上传了,要注意路径的问题。

3、复制代码

注意先后顺序,要把文件之间的引用去掉。

4、修改配置

注意路径直接复制,避免出错。生成文件直接放到根目录,Kaggle不会自动生成目录。如果报内存溢出的错误,可以把 batch_size 设小点。

5、测试和预测

内容不可见,请联系管理员开通权限。

6、补充说明

有同学问,预测出关系之后,还要不要做实体识别。关系确定之后,关系两端的实体类别就是确定的,不需要再做实体识别了。跟先做实体识别,再做关系抽取的 Pipline 的套路,是有本质区别的,大家可以再理解一下。

内容不可见,请联系管理员开通权限。

关系抽取,其实是传统 NLP 中比较难的任务,这个项目能搞定的话,NLP 的基础就算比较好了。再往后,就可以去了解知识图谱和大模型相关的项目。

本文链接:http://edu.ichenhua.cn/edu/note/727

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!