Chainbase 开源首个加密领域大模型 Theia-Llama-3.1-8B ,性能超越主流模型

报道 10月11日消息,全链数据网络 Chainbase 近日宣布在 HuggingFace 开源其专为加密领域打造的大语言模型 Theia-Llama-3.1-8B 。该模型在困惑度(Perplexity)和 BERT 评分上均超越了市场主流模型,对crypto世界的理解能力超过大多主流开源大模型。

Chainbase 团队独创性地构建了首个专业 Web3 数据集,收录了 CoinMarketCap 前 2000 项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用 LoRA 技术高效微调模型,并利用 DeepSpeed 等工具加速训练过程。此外,模型量化为 Q8 GGUF 格式,大幅降低了内存占用,提升了推理速度。

据悉,Theia-Llama-3.1-8B 是 Chainbase 在加密领域大模型的初步尝试且该模型已成功应用于 Chainbase DEMO 交互应用 TheiaChat,目前日活用户超过 30 万。

发表评论

您的电子邮箱地址不会被公开。