大模型实战 P3 大语言模型通识和课前准备

作者：陈华 • 发布时间：2023-11-15 • 阅读 2249

从这节课开始，就正式进入课程的第一个篇章——GPT 大模型。在这一章节，主要介绍 OpenAI 相关模型的使用方法。在后面的项目中，也是先基于 GPT 模型把流程跑通，之后再介绍其他模型。整体学完之后，大家就可以灵活选择，比如想换个模型，改个配置项就可以了。

在正式介绍具体模型之前，要先了解一下大模型这个概念。所谓的大模型，当下指的是大型语言模型（large language model，LLM）。

大型：规模和复杂性更大，GPT-3模型拥有1750亿（175B）个参数。更重要的是，更加通用化，可以跨学科、跨领域。

语言：自然语言，人跟人交流的语言，用像和人交流的方式，和机器进行对话。

虽然，模型可以生成信息丰富、结构严谨的文本，但他们并不能进行创新性的思考，或生成没有训练数据的新信息，所有的回答都基于训练数据，并通过统计模式进行预测生成。本质上就是根据已知信息，进行文本补全的过程。

常用大模型：GPT、LLaMA、ChatGLM、QWen、BaiChuan、ERNIE

文心一言：https://yiyan.baidu.com/

ChatGPT：https://chat.openai.com/

1、先科学上网，IP 切到美国。

2、用国外手机号注册账号，最好绑定信用卡，否则会有调用次数限制。

https://platform.openai.com/docs/guides/rate-limits

虽然注册流程会比较麻烦，但是后面实践课程的基础。开源模型的下载和部署，以及其他有接口的模型，都会在后面课程中讲到。