比特网早报:字节豆包大模型团队提出稀疏模型架构,OpenAI今年推出GPT5

Yu |  2025-02-13

  2025年2月13日消息,昨夜今晨,科技圈都发生了哪些大事?行业大咖抛出了哪些新的观点?比特网为您带来值得关注的科技资讯:

  字节豆包大模型团队提出稀疏模型架构,推理成本最高可降低83%

  据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。(36氪)

  相比传统MoE 架构,UltraMem的推理速度提升2-6倍,能使智能设备在处理复杂任务时更快响应,如在实时语音转文字、视频推荐、在线客服等场景中,可大幅缩短响应时间,提升用户体验。

  DeepSeek V3/R1满血版上线华为云

  2月12日消息,华为技术有限公司发文宣布,DeepSeek V3/R1 671B旗舰模型(满血版)已基于华为云昇腾云服务全栈优化适配,宣称满足业务商用部署需求。(IT之家)

  中国银河证券:VideoWorld模型开源,探索模型训练新路径

  中国银河证券指出,近期国内AI行业取得多项进展。VideoWorld的纯视觉训练方式在LDM的加持下具有较好的训练效果,且训练方式更贴近生物的视觉学习的模式。展望未来,其开源的策略有望推动视觉训练的快速发展,为行业带来了新的可能性,同时AI模型端的进步有望加速推动在影视、广告、社交陪伴等多个领域应用落地。在应用层面,建议关注受AI赋能的与C端用户体验密切相关的行业。(36氪)

  OpenAI今年推出GPT5

  OpenAI首席执行官奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。(新浪科技)

  GPT-5预计会在语言理解和生成能力上有显著提升,能够更精准地捕捉上下文关系,生成更加自然流畅、符合人类语言习惯的文本。

  Kakao称计划今年晚些时候推出与与OpenAI合作的人工智能服务

  韩国互联网巨头Kakao周四表示,由于内容部门的资产减值损失减少,去年第四季度净亏损同比大幅收窄。Kakao是韩国占主导地位的移动通讯软件KakaoTalk的运营商。该公司在一份提交给监管机构的文件中说,第四季度合并后的净亏损总计为2769亿韩元(约合1.901亿美元),上年同期为净亏损1.91万亿韩元。该公司表示,计划在今年晚些时候与OpenAI合作推出新的人工智能(AI)服务Kanana和其他相关服务。(新浪财经)

  思科本财季营收展望乐观,人工智能需求提振企业网络支出

  网络设备巨头思科对本财季的营收展望乐观,得益于企业为利用人工智能技术而增加在算力基础设施上的支出。思科当地时间2月12日公布财报称,截至4月的财季营收料在139亿美元至141亿美元之间。分析师此前的预测是在该区间的低端。思科还将2025财年的营收目标提高约10亿美元,至560亿美元以上,而平均预估为559.7亿美元。思科股价在盘后交易上涨约6%。(界面)

  苹果机器人最快2028年量产

  郭明錤在X上发文称,苹果正在为其未来的智能家居生态系统探索人形和非人形机器人项目,但目前这些内部产品仍处于早期概念验证(POC)阶段。他认为苹果机器人要到 2028 年或更晚才能实现量产,不过苹果在早期概念验证阶段就非常乐意分享其部分机器人研究成果,他认为此举可能是为了吸引人才的加入。(新浪科技)

  欧盟将投入1.51万亿用于AI研发

  在巴黎举行的 AI 行动峰会期间,欧盟宣布将投入 2000 亿欧元(IT之家备注:当前约 1.51 万亿元人民币)用于 AI 的研发,其中包括将用于建设处理和训练大模型的“AI 巨型工厂”的 20 亿欧元(当前约 151.11 亿元人民币)。(新浪科技)

查看更多内容
正在加载
第三方账号登录
X
发布