Falcon2 是由 TII 构建的 11B 参数的仅解码器因果模型,并在超过 5T 的 tokens 上进行训练。

11b

32.3K 10 个月前

自述文件

参考文献

公告

Hugging Face