12月12日,蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。此前开源的LLaDA2.0包含MoE架构的16B(mini)和100B(flash)两个版本 … Continue reading 蚂蚁开源首个100B扩散语言模型LLaDA2.0
标签: 语言模型
OpenAI发布低成本开放权 重语言模型
译心发布第一个日文大模型评测平台JaLE
3月9日消息,北京译心公司表示发布了第一个日文大模型评测平台JaLE.ai。 JaLE(Japanese Language Evaluation),是译心针对日本商业应用对于大型语言模型的需求,推出的 … Continue reading 译心发布第一个日文大模型评测平台JaLE
Facebook强大的AI大型语言模型LLaMa遭泄露
3月8日 消息:Facebook的大型语言模型LLaMa通常只供获得批准的研究人员、政府官员或民间社会成员使用,现在已经泄露到网上供任何人下载。 据悉,目前在4chan 上已经有人在共享泄露的语言模型 … Continue reading Facebook强大的AI大型语言模型LLaMa遭泄露

