IT之家 2 月 4 日消息,亚马逊云计算人工智能实验室的研究人员发现,网络上大量内容来自机器翻译 (MT) 生成,这些跨越多种语言的翻译内容质量普遍较低。研究团队强调,这凸显了在训练大型语言模型 ( … Continue reading 研究:网络充斥低质机翻内容 大语言模型训练需警惕数据陷阱
标签: 大语言模型
英伟达推出 Tensor RT-LLM,使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍
10 月 18 日消息,英伟达是硬件领域的生成型人工智能之王,该公司的 GPU 为微软、OpenAI 等公司的数据中心提供动力,运行着 Bing Chat、ChatGPT 等人工智能服务。今天,英伟达 … Continue reading 英伟达推出 Tensor RT-LLM,使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍
StreamingLLM 框架问世,号称“可让大模型处理无限长度文本”
10 月 6 日消息,麻省理工学院联合 Meta AI 的研究人员日前开发了一款名为 StreamingLLM 的框架,为大语言模型可能遇到的 RAM 与泛化问题提出了一系列解决方案,号称能够“让语言 … Continue reading StreamingLLM 框架问世,号称“可让大模型处理无限长度文本”
微脉发布国内首款大语言模型健康管理应用CareGPT
风君子博客8月17日,全国最大的全病程管理平台微脉发布国内首款健康管理领域大语言模型应用——CareGPT。 与通用型的大语言模型产品不同,这款基于国内开源大语言模型自主研发的健康管理应用产品,主要致 … Continue reading 微脉发布国内首款大语言模型健康管理应用CareGPT
百度CTO王海峰:大语言模型为通用人工智能带来曙光
风君子博客8月16日消息,由深度学习技术及应用国家工程研究中心主办的WAVE SUMMIT深度学习开发者大会2023在北京举行。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰做了主题演讲 … Continue reading 百度CTO王海峰:大语言模型为通用人工智能带来曙光
各大公司竞逐 AI,消息称字节跳动今年向英伟达订购超 10 亿美元 GPU
感谢网友 航空先生 的线索投递! 6 月 13 日消息,据《晚点 LatePost》,今年春节后,拥有云计算业务的中国各互联网大公司都向英伟达下了大单,其中字节今年向英伟达订购了超过 10 亿美元的 … Continue reading 各大公司竞逐 AI,消息称字节跳动今年向英伟达订购超 10 亿美元 GPU
“史上最强开源大语言模型”Falcon 40B已在Amazon SageMaker JumpStart中可用
风君子博客6月9日消息,在Hugging Face上登顶、并搅动大模型领域风云的“新选手”Falcon 40B又有了新动态。 亚马逊云科技宣布,从6月7日起,两个开源Falcon大语言模型Falcon … Continue reading “史上最强开源大语言模型”Falcon 40B已在Amazon SageMaker JumpStart中可用
英伟达:CPU 已落伍,用 GPU 训练大语言模型成本可降低 96%
5 月 29 日消息,根据英伟达在 2023 年台北电脑展会上的演讲,该公司宣称其 GPU 可以大幅降低训练大型语言模型(LLM)的成本和耗能。 英伟达首席执行官黄仁勋在演讲中,向 CPU 行业发起了 … Continue reading 英伟达:CPU 已落伍,用 GPU 训练大语言模型成本可降低 96%
亚马逊发力生成式 AI 市场:推出大语言模型 Titan,发布 Bedock 云服务
北京时间 4 月 13 日晚间消息,据报道,亚马逊今日推出了一项名为“Bedock”的云服务,允许开发者使用类似于 ChatGPT 聊天机器人的人工智能系统,来进一步强化他们的软件。 此举表明,作为最 … Continue reading 亚马逊发力生成式 AI 市场:推出大语言模型 Titan,发布 Bedock 云服务