CodeShell：北京大学与天府银行AI团队共同研发的多语言代码大模型

CodeShell 是一个由北京大学知识计算实验室和四川天府银行AI团队联合开发的多语言代码生成模型。本文将详细介绍 CodeShell 的特性、功能以及如何使用这一工具。

CodeShell 是一个具有 70 亿参数的代码生成大模型，经过五千亿 Tokens 的训练，拥有 8192 的上下文窗口长度。在编程语言的自动评估 Benchmark（如 HumanEval 与 MBPP）中，CodeShell 展现了同类模型中的顶尖性能。

要开始使用 CodeShell，开发者首先需要访问其在 Hugging Face 上的页面，并通过 Transformers 库调用 CodeShell 和 CodeShell-Chat 模型。以下是初始化和使用 CodeShell 的基本步骤：

环境准备：

使用 Transformers 库：

使用 Transformers 快速集成和调用 CodeShell。以下是一个示例代码，展示如何调用 CodeShell 模型进行代码生成：pythonCopy codefrom transformers import AutoTokenizer, AutoModeltokenizer = AutoTokenizer.from_pretrained(“WisdomShell/CodeShell-7B”)model = AutoModel.from_pretrained(“WisdomShell/CodeShell-7B”)inputs = tokenizer(“def hello_world():”, return_tensors=”pt”)outputs = model.generate(inputs[“input_ids”])print(tokenizer.decode(outputs[0]))

通过以上步骤，开发者可以快速开始使用 CodeShell 进行代码生成和相关的软件开发任务。

近期文章