会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Meta官宣深入AI大战!推出先进大型语言模型 欲背刺ChatGPT!

Meta官宣深入AI大战!推出先进大型语言模型 欲背刺ChatGPT

时间:2025-07-06 04:30:57 来源:顾名思义网 作者:探索 阅读:484次

财联社2月25日讯(编辑 赵昊)当地时间周五(2月25日),官宣脸书母公司Meta首席执行官扎克伯格最新推出了“Meta人工智能大型语言模型”(Large Language Model Meta AI),深入简称“LLaMA”。大战大型

扎克伯格在社交媒体上称,推出Facebook AI Research研发的先进LLaMA是“目前水平最高的”大型语言模型,目标是语言欲背帮助研究人员推进他们在人工智能(AI)领域的工作。

“大型语言模型”(LLM)可以消化大量的模型文本数据,并推断文本的官宣单词之间的关系。随着计算能力的深入进步,以及输入数据集与参数空间的大战大型不断扩大,LLM的推出能力也相应提高。

目前,先进LLM已经被证明能高效地执行多种任务,语言欲背包括文本生成、模型问题回答、官宣书面材料总结等。扎克伯格称,LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。

值得一提的是,近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。

Meta在官网介绍中称,LLaMA有7B、13B、33B和65B四个基础模型,在大多数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。

Meta还宣布,将针对学术研究者共享其模型,正在接受研究人员的申请。与之截然不同的是,旗下的DeepMind和OpenAI并不公开训练代码。

根据2021年媒体的一份调查显示,AI专家们通常将DeepMind、OpenAI和FAIR(Facebook AI Research)视为该领域的“前三甲”。

去年年底,Meta发布了另一款名为Galactica的模型,但因经常分享偏见和不准确的信息而遭到下架。

(责任编辑:娱乐)

相关内容
  • 因需求增多而生、存在诸多隐秘问题,“上门代厨”的生意能持久吗?
  • 贪官藏匿高档茶酒:销毁名贵普洱茶标识,将名酒拆除包装后倒入自制酒缸……
  • 美高梅中国公布2022年全年收益净额为6.74亿美元
  • 谷歌增强 iOS 端 Google Maps:iPhone 锁屏界面可显示预估到达时间、下个转弯距离等信息
  • 美媒:欧洲抵制拜登(对华做法),重申“中间路线”
  • 热门中概股周三多数下跌 e家快服跌超13% 荔枝跌超9%
  • 钧达股份推28亿定增加码光伏转型 产能释放全年预盈超6.8亿大幅扭亏
  • 超60万套!去年法拍房挂拍量创新高,但成交率还不到两成
推荐内容
  • 全国首部规范居民自建房的地方性法规出台
  • 华尔街“裁员潮”持续蔓延 资管巨头联博裁员100多人
  • 佰悦集团发盈喜 预计前三季度股东应占综合溢利不少于300万港元
  • 流浪地球导演郭帆出席ROG2023发布会
  • 服贸会9月1日举办论坛会议及推介洽谈活动49场
  • “宝妈带男童进女厕”频惹争议 专家呼吁 未来可考虑增设儿童卫生间