IT之家 6 月 6 日消息,据 Business Insider 消息,Anthropic 正通过一个由约 1000 名人类软件工程师参与的项目,提升 Claude Code 的性能。
该项目在数据标注公司 Snorkel AI 内部被称为“Marlin”(马林鱼),其核心在于微调 Claude Code 的回答,使其能够更接近开发人员的真实工作环境。
像 Anthropic 这样的 AI 公司通常会将数据工作外包给诸如 Snorkel 之类的第三方公司,而这些第三方公司会雇佣外包人员来向 AI 教授各种专业领域的学科,并执行其他任务以改进模型。
两位参与该 Anthropic 项目的外包人员透露,他们编写提示词并审查代码的报酬为每项任务 280 美元(IT之家注:现汇率约合 1902 元人民币)。他们表示,每项任务大约需要一小时,不过有些提交的内容需要与 Snorkel 的审批层进行多轮沟通。
在 Marlin 项目中,拥有软件工程背景的外包人员被要求对两种不同模型生产的代码进行 A/B 测试。他们会比较两组输出,选择自己更偏好的结果,并判断模型是否真正达到了提示词要求的细节程度。
一名外包人员表示,该项目旨在确保模型能够达到提示词中所期望的详细程度,从本质上讲,就是在训练 Claude Code 生产更简化、更易于维护的代码。
据悉,该项目目前仍在进行中。外包人员并不知道他们所评估的是哪个版本的模型。

