【塔猴今日达】世界数据组织总部设在北京;智元第10000台机器人下线;Sora关停前用户数腰斩日亏百万

2026-03-30 17:23:01
文章摘要
【塔猴今日达】世界数据组织总部设在北京;智元第10000台机器人下线;Sora关停前用户数腰斩日亏百万

世界数据组织今天正式投入运行


今日,世界数据组织在北京完成组建,选举产生首届理事、监事和组织负责人。这标志着世界数据组织正式投入运行,这是全球首个旨在推动数据发展与治理实践的专业性国际组织,总部设在北京。(央视新闻客户端)


智元官宣第10000台通用具身机器人下线


智元机器人官方宣布,第10000台通用具身机器人正式下线,标志着全球人形机器人迈入规模化部署新阶段。其中远征系列生产2126台,灵犀系列生产5008台,精灵系列生产2909台。2025年1月6日至12月8日,智元机器人实现了从1,000台到5,000台的量产成绩。从2025年12月8月到2026年3月28日,仅用了三个多月的时间,智元便实现了量产5,000台到10,000台的历史性突破。智元在短短15个月内,完成量产规模的十倍级跨越。(凤凰网)


美媒揭秘Sora关停内幕:

日亏百万、用户数腰斩,遭遇对手抢人


OpenAI关停生成式AI视频应用Sora,该应用虽曾火爆,但热度下滑且每日亏损约 100万美元,消耗大量算力。在筹备IPO之际,OpenAI为集中资源发展生产力工具而做出这一决定,打乱了合作伙伴迪士尼的计划。Sora被视为一场代价高昂的战略误判,其团队未来将转向机器人等长远布局。(华尔街日报)



月之暗面ARR突破1亿美金


月之暗面ARR突破1亿美金,距Kimi K2.5模型发布仅一个月。API供应趋紧,有客户开出千万美元级预付担保。公司近期传赴港IPO及新一轮融资,估值升至180亿美元。过去半年,月之暗面顶住大厂竞争压力,先后推出K2 Thinking与K2.5模型,强化Agentic能力与多模态,并加大技术透明度。在智谱、Minimax市值高涨及Agent应用普及的背景下,其专注基座模型的策略开始奏效。(界面新闻)


微软开源前沿语音AI家族VibeVoice


微软开源语音AI模型家族VibeVoice,涵盖自动语音识别和文本转语音能力,支持长音频处理、多说话人对话生成及实时低延迟特性,在GitHub收获约2.7万星。模型采用MIT许可,支持本地部署,包括三个核心成员:ASR-7B可处理60分钟长音频并输出结构化转录,TTS-1.5B能生成长达90分钟的多说话人自然语音,Realtime-0.5B实现约300毫秒低延迟响应。项目已嵌入安全机制,推动语音技术在内容创作、无障碍等领域的落地。(AIbase基地)


马斯克xAI创始团队全员离场


马斯克旗下AI初创公司xAI近期遭遇重大人事动荡。随着Manuel Kroiss与Ross Nordeen相继离职,xAI最初的11人创始团队已全部出局,目前仅剩马斯克一人留守。此次离职潮发生在SpaceX正式收购xAI之后,旨在为SpaceX未来的上市计划铺路。马斯克公开承认“xAI最初构建有误”,目前正从底层架构开始对公司进行彻底重建。(Business Insider)



Suno发布v5.5模型


AI音乐公司Suno推出v5.5音乐生成模型,强化个性化定制能力,新增“声音”“自定义模型”“我的品味”三大功能。“声音”功能允许Pro及以上用户上传个人人声生成专属音色,需声纹验证且默认私密;“自定义模型”支持高级用户基于原创曲库微调,最多创建3个专属风格;“我的品味”则通过学习用户偏好自动优化生成结果。此次更新正值Suno与唱片公司版权诉讼期间,官方称将为后续产业合作奠定基础。(The Decoder)


DeepSeek服务出现重大中断


DeepSeek官方服务状态网站显示,DeepSeek网页、App服务出现重大中断。根据事件报告,昨日 21:35,DeepSeek发现网页、App服务异常,并进行调查,于当日23:23解决该事件。今日00:20,DeepSeek对网页、App性能异常问题进行调查,并于01:24实施修复方案,现已恢复正常。(IT之家)


企业微信CLI正式开源


企业微信CLI开源项目正式登陆GitHub,开放消息、日程、文档、智能表、会议、待办、通讯录七大核心能力,支持Claude Code、Codex等主流AI Agent调用。开发者可基于这些能力,让AI助理更自然地执行企业微信操作,提升任务准确度并降低 token消耗。项目优先面向10人及以下企业开放高频能力,涵盖单聊群聊消息、文档表格读写、日程会议管理、待办同步及通讯录查询等场景。(新浪网)


Meta开源TRIBE v2模型


Meta基础人工智能研究团队开源TRIBE v2模型。该模型基于Transformer架构,可处理视频、音频和文本输入,精准预测人类大脑fMRI活动,空间分辨率较前代提升70倍。模型在超500小时脑扫描数据上训练,具备零样本泛化能力,无需重新训练即可预测未见过的个体、语言或任务的神经反应。Meta已公开模型权重、代码及论文,旨在推动神经科学、医疗及类脑AI领域的协作研究。(品玩)



智谱、字节、小米共有4款模型跻身全球前十

评测机构ClawBench发布了最新大型模型榜单。北京人工智能企业智谱、字节、小米共有4款模型跻身全球前十。其中,智谱GLM-5-Turbo以93.9分的成绩登顶榜首;字节Doubao-Seed-2.0-lite位居第二,使用成本为全榜最低;小米MiMo-V2-Omni位列第9,运行速度最快。(ClawBench)(微信公众号:Tahou_2025)


关注塔猴公众号,扫码下载塔猴APP,查看更多干货



扫码加入官方社群


声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
具身智能
视频生成大模型
语言模型应用
语音识别(ASR)
语音合成(TTS)
开源大模型
AI音乐工具
模型部署
跨模态融合增强