Meta发布开源AI模型Llama 3.1 405B 扎克伯格:性能直逼GPT-4o和Claude 3.5
Meta发布开源AI模型Llama 3.1 405B 扎克伯格:性能直逼GPT-4o和Claude 3.5© 由 十轮网科技资讯 提供
Meta今日正式推出了Llama 3.1,分别为8B、70B和405B三个规模的模型。Meta CEO Mark Zuckerberg称Llama 3.1 405B是Meta至今最强大的开源人工智能模型,性能测试更直逼GPT-4o和Claude 3.5,这将是首次有GPT-4等级的大语言模型免费开放给所有人使用。
Meta发布开源AI模型Llama 3.1 405B 扎克伯格:性能直逼GPT-4o和Claude 3.5© 由 十轮网科技资讯 提供
图片来源:Meta
Meta使用了超过16000个Nvidia H100 GPU和超过15兆token来训练Llama 3.1 405B。根据Meta提供不同基准测试的结果中显示,Llama 3.1 405B在MMLU、GSM8K及HumanEval等基准测试中的表现十分接近GPT-4、GPT-4o及Claude 3.5 Sonnet。Llama 3.1 405B在不同范畴的基准测试中都至少有一次是得分最高(除了程序编码),NIH/Multi-needle基准测试虽不及两个GPT-4模型的100分但仍有接近的98.1分,代表其有接近完美的处理复杂资讯能力。
虽然Meta声称Llama 3.1 405B为开源模型,但却被指滥用了“开源”二字。业界认为Llama 3.1 405B只是开放了“模型权重”,而不是真正开源。
数据源:The Register
图片来源:Meta