【財新網】開源大模型的推手Meta發新一代模型。北京時間4月19日凌晨,美國社交巨頭Meta(NASDAQ: META)宣布推出Llama 3開源模型系列,將陸續登陸亞馬遜AWS、Databricks、谷歌云、Hugging Face等大模型平臺。Meta稱,還會在接下來數月的時間提供更強的長文本能力、多種尺寸、多語言的模型,目標是打造最好的基座模型。
具體來看,此次發布的包括80億、700億參數的兩個預訓練語言模型,根據Meta的數據,在考察常識能力、學科知識、代碼能力、數學能力的數據集榜單中,80億參數的版本全面領先谷歌的輕量開源模型Gemma 7B–it,和歐洲大模型公司Mistral的開源模型Mistral 7B Instruct;700億參數版本的整體得分小幅領先谷歌閉源模型Gemini Pro 1.5和Anthropic的閉源模型Claude 3 Sonnect。