Meta发布开源AI模型Llama 3.1 405B 扎克伯格：性能直逼GPT-4o和Claude 3.5

Meta发布开源AI模型Llama 3.1 405B　扎克伯格：性能直逼GPT-4o和Claude 3.5© 由十轮网科技资讯提供

Meta今日正式推出了Llama 3.1，分别为8B、70B和405B三个规模的模型。Meta CEO Mark Zuckerberg称Llama 3.1 405B是Meta至今最强大的开源人工智能模型，性能测试更直逼GPT-4o和Claude 3.5，这将是首次有GPT-4等级的大语言模型免费开放给所有人使用。

Meta发布开源AI模型Llama 3.1 405B 扎克伯格：性能直逼GPT-4o和Claude 3.5© 由十轮网科技资讯提供

图片来源：Meta

Meta使用了超过16000个Nvidia H100 GPU和超过15兆token来训练Llama 3.1 405B。根据Meta提供不同基准测试的结果中显示，Llama 3.1 405B在MMLU、GSM8K及HumanEval等基准测试中的表现十分接近GPT-4、GPT-4o及Claude 3.5 Sonnet。Llama 3.1 405B在不同范畴的基准测试中都至少有一次是得分最高（除了程序编码），NIH/Multi-needle基准测试虽不及两个GPT-4模型的100分但仍有接近的98.1分，代表其有接近完美的处理复杂资讯能力。

虽然Meta声称Llama 3.1 405B为开源模型，但却被指滥用了“开源”二字。业界认为Llama 3.1 405B只是开放了“模型权重”，而不是真正开源。

数据源：The Register

图片来源：Meta

Post Views: 237

Meta发布开源AI模型Llama 3.1 405B 扎克伯格：性能直逼GPT-4o和Claude 3.5

黑贝

留言取消回复

黑贝

留言 取消回复

留言取消回复