各位观众,大家早上好!今天是6月24日,星期三,欢迎收看本期AI早报。首先一起来看看今天的重点新闻。
字节跳动正式推出面向实际生产力场景的Seed 2.1系列大模型,版本包含C2.1 Pro、C2.1 TuR&Bo,还有专门针对代码编写与智能体任务快速迭代的Seed Evolving。这一系列模型拥有256K超长上下文窗口,并且支持多模态输入。官方介绍,它在通用智能体运行、代码项目交付这两大能力上都实现了全方位升级。目前这套模型的API接口已经在火山方舟全面上线。TreaWork中国版已经对所有用户免费开放试用,而Tray IDE里,该模型仅对高级付费用户开放。与此同时,豆包非极速模式也接入了C2.1 TuR&Bo版本。
同样来自字节跳动,豆包视频生成模型C2.5也已经官宣,预计在七月初正式上线。这款模型可以一次性生成长达30秒的原声完整视频,不用再分段剪辑拼接。它能够一次性读取50份全模态素材,大大提高视频创作的可控程度,还支持画面局部修改,调整内容的同时,能够保证整体画面风格统一。
再来看看海外动态,Anthropic全新推出Claude Tech功能,可以把Claude智能体常驻在Slack协作频道里,参与团队办公。大家只需要在频道内@它派发任务,它就能自主拆解工作,独立完成耗时数小时的异步任务。这项功能目前已经面向企业版和团队版用户开启Beta测试。
字节跳动还发布了豆包音频生成模型Seed Audio 1.0。它支持零样本多模态输入,能够一键生成带多个人物对白、情绪语气,再加上环境音效的完整成片音频。现在火山方舟已经开放该模型的API邀请测试,普通个人用户可以在体验中心领取30分钟免费使用时长。
除此之外,豆包视频模型Seedance 2.0的原声4K版本API正式对外开放。官方表示,这是业内首款原生支持4K分辨率、10bit高位深输出的视频模型,画面色彩、动态范围和细节画质都有大幅提升。图像创作领域也迎来更新,豆包CGEN 5 Pro图像模型,升级了交互式编辑、多图层分离等四项核心功能,能够承载信息密度更高的画面创作,这款模型会在近期正式上线。
即梦AI推出首款Seed音乐模型Seed Music One预览版,提示词遵循度更高,还能实现专业级混音效果,网页端和手机APP都已经开放体验。
Mistral AI发布Mistral OCR 4光学文字识别模型,可以提取文字,输出带坐标边框、内容分类的结构化数据,一共支持170种语言。在权威OCR测评榜单中拿下85.20分,性能位居前列,接口与各大云平台均已开放。
图像生成工具Krea放出了Krea 2文生图模型完整权重,分为标准版Krea 2 Raw和极速版Krea 2 Turbo两个版本,整体参数规模达到120亿,权重文件可以直接在Hugging Face平台下载。
腾讯AI带来22B参数的实时音视频模型Mancun,这是首款流式原生文生音视频模型。文字指令下发后,不到一秒就能渲染出首帧画面,还可以不间断生成十余分钟稳定连贯的音视频内容,源代码和试用通道现已公开。
Permas Agent新增learn学习指令,只要上传代码、PDF文档或者网页链接等资料,智能体就能自动提炼内容,生成可以反复调用的实用技能,命令行终端、网页控制面板等多个端口都可以使用。
Corder上线夜间优惠活动,每晚特定时段内,Pro试用版及以上等级用户,调用千问3.7系列模型执行任务,最低可以拿到两折优惠,模型性能不会有任何缩减。
IBM研究院推出开源企业智能体框架AgentHarness Coga,自带状态管理、长期任务规划以及自我纠错机制,在两大权威测评榜单里成绩名列前茅。
小米开源全屋智能方案MyLocal 2.0。以家用摄像头作为感知设备,依托自研NIMO大模型和智能体,在OpenCl平台自动联动家中所有智能设备,目前适配macOS与Linux系统。
Meta和依视路合作,推出摘掉Rayban标识的全新Meta智能眼镜,售价299美元。新机搭载星火模型驱动的Meta AI助手,已经在全球多个国家同步开售。
行业圈内还曝出一则舆论风波,Hermes Agent和OpenClaw两位创始人发生公开争执。事情的起因是OpenClaw创始人暗指竞品项目受到风投资本操控。随后Hermes Agent创始人公开发文回击,嘲讽对方靠着拿了风投的非营利机构OpenAI赚取高薪,双方就资金来源、项目数据安全各执一词。
资本方面,美国AI基建独角兽Basting完成总额15亿美元的F轮融资,投后估值达到130亿美元,这笔资金会全部用来扩充算力机房。
最后一条消息,微信开启代号为“大元”的AI智能体灰度内测。这款智能办公助手可以自动处理移动端工作流,自主回复各类消息诉求,目前仅有小部分用户可以体验。
好了,以上就是今天全部的AI资讯,我们明天再会。






