ChatGPT应用 P4 替换模板实体占位符并拆分样本
前面课程当中,我们用ChatGPT生成了语料模板,然后又从知识图谱的数据里面,抽取到了真实的实体。接下来,就只剩下最后一步,就是把模板中的实体占位符,替换成真实的实体文字。
另外,因为模板很少,实体却很多,所以把一个模板多替换几次实体,这样可以生成的数据就多了,同时,也可以帮助模型定位句子的重点,尽快排除实体对分类的干扰。
代码示例
1、解析label标签
内容不可见,请联系管理员开通权限。
2、加载模板和实体文件
内容不可见,请联系管理员开通权限。
3、遍历模板,每行替换随机实体
内容不可见,请联系管理员开通权限。
4、随机拆分数据集
内容不可见,请联系管理员开通权限。
好的,到目前为止,通过ChatGPT去生成训练语料的任务就完成了。除了这个应用场景之外呢,我还计划录制一个ChatGPT的专题课程,集中讲解ChatGPT更多精彩的应用案例,希望大家可以持续关注陈华编程的最新课程。
本文链接:http://edu.ichenhua.cn/edu/note/623
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!