清华团队开源GUAVA实现0.1秒照片生成3D数字人(2025-09-12)
9月12日,OSCHINA讯,近日,清华深研院与国际数字经济研究院的中国团队推出GUAVA新技术,仅用一张照片0.1秒就能生成高质量3D高斯化身并实时驱动,画面流畅度超50帧每秒。传统创建3D数字人需复杂拍摄或耗时训练,而GUAVA速度惊人,其创新技术架构含EHM模型和3D高斯泼溅,身份一致性表现出色。该技术可为自媒体、直播等多领域提供支持。
【点评】清华团队开源的GUAVA技术是一项重大突破。在3D数字人生成领域,...
蚂蚁集团百灵团队开源Ling-mini-2.0模型(2025-09-12)
9月12日,OSCHINA讯,近日,蚂蚁集团百灵团队正式开源Ling2.0系列首款模型Ling-mini-2.0。该模型采用1/32激活比例的MoE架构,总参数16B,每个token仅激活1.4B参数。用超20Ttoken数据训练,经多阶段优化,性能对标7-8B规模dense模型。在多基准评测中成绩优于同规模及更大MoE模型,稀疏激活设计有显著效率优势,借助YaRN技术可外推至128K上下文。
【点评】蚂蚁集团百灵团队开源的Ling-mini-2.0模型亮点颇多。其...
B站语音团队开源新一代语音合成模型IndexTTS2(2025-09-11)
9月11日,OSCHINA讯,近日,哔哩哔哩语音团队发布并开源新一代零样本语音合成模型IndexTTS2,相关论文、代码与模型权重已在arXiv、GitHub与Hugging Face公开。该模型在自回归架构中引入“时间编码”机制,支持毫秒级时长控制和自由生成。它由T2S、S2M和BigVGANv2声码器三个核心模块组成,实现端到端语音合成。训练数据丰富,在多项基准测试中成绩优异,主观评测表现出色,还提供多种接口,可用于多种场景。
...
字节Seedream 4.0图像创作模型正式发布(2025-09-11)
9月11日,OSCHINA讯,近日,字节跳动Seed团队发布新一代图像创作模型Seedream 4.0。该模型采用同一构架实现文生图与通用编辑能力,融合常识和推理能力,在多模态效果、速度和可用性上较前代有显著突破。其亮点包括多模态玩法拓展、风格化美感提升、逻辑理解力增强、自适应与4K生成、推理速度跃升等,目前已上线,可通过多个平台体验。
【点评】字节跳动Seedream 4.0图像创作模型的发布是图像创作领域的一次重...
OpenDataLab与钉钉推出企业文档解析工具DLU(2025-09-10)
9月10日,OSCHINA讯,近日,OpenDataLab和钉钉基于MinerU推出面向企业用户的文档解析工具DLU(Document Language Understanding)。MinerU是上海AI实验室OpenDataLab推出的智能文档解析引擎,在GitHub上累计获超4万星标。DLU将于近期开源,具备良好文件格式兼容性,支持主流Office文档等多种格式,还能深层次理解内容,精准结构化输出,可提取纯文本,解析复杂视觉元素并转化为高质量语料。
【点评】OpenData...
智谱推出Claude API用户特别搬家计划(2025-09-10)
9月10日,OSCHINA讯,近日,美国大模型公司Anthropic停止向多数股权由中国资本持有的集团出售Claude服务,涵盖中国大陆及间接使用企业。为助开发者平稳过渡,智谱推出「Claude API用户特别搬家计划」。智谱全面兼容Claude协议,用户换API URL就能从Claude无缝切至GLM模型API。为新用户赠2000万Tokens免费体验,开发者有低价高量套餐,还有迁移教程。企业客户有并发规模、折扣优惠和顾问服务,还给出快速迁移教程。
我国研发出类脑脉冲大模型(2025-09-09)
9月9日,OSCHINA讯,近日,我国科研人员研发出类脑脉冲大模型“瞬悉1.0”。该模型由中科院自动化所李国齐、徐波团队与相关单位合作,基于“内生复杂性”理论构建,在国产GPU平台完成全流程训练与推理。它借鉴大脑神经元机制,与主流Transformer架构不同,仅用约2%主流模型数据量就能在多项语言任务中媲美主流模型。这是我国首次提出相关架构和构建训练推理框架,在超长序列任务建模场景有潜在效率优势,为人工智能发...
腾讯混元游戏视觉生成平台2.0版本发布(2025-09-09)
9月9日,OSCHINA讯,近日,腾讯混元游戏视觉生成平台正式发布2.0版本,新增游戏图生视频、自定义模型训练、角色一键精修等能力,大幅提升游戏2D生图模型能力,图生视频和文生图模型在游戏场景达行业SOTA水平。此次升级解决游戏美术设计痛点,帮助提高效率,且面向所有用户开放。新能力可让静态画面变动画,降低生图模型精调门槛,还能对角色原画细节丰富或风格转换。
【点评】该平台2.0版本的发布是游戏视觉...
中控技术发布流程工业可信大模型TPT 2(2025-09-08)
9月8日,OSCHINA讯,近日,中控技术正式发布时间序列大模型TPT2,这是专为流程工业设计的AI工具。它基于工业时序数据构建AI算法,是全球首个深度契合流程工业第一性原理的可信模型。凭借强泛化能力,能适配多类生产工艺并闭环应用,可精准挖掘工业数据价值,在保障生产安全等多关键场景发挥核心作用,为企业提供一体化支撑。
【点评】中控技术发布的TPT2大模型针对性强,为流程工业量身打造。其基于工业时序...
Wine10.14开发版发布,Windows应用兼容层(2025-09-08)
9月8日,OSCHINA讯,近日,Wine项目发布Wine10.14开发版,属双周更新。此次更新多项改进,VKD3D升级至1.17提升D3D12应用和游戏在Linux兼容性与性能;Mono引擎更新至10.2.0增强.NET应用运行表现;支持IPv6Ping利于网络诊断;CI迁至Debian13“Trixie”便于管理;还修复19项Bug,强化跨平台兼容与稳定。
【点评】Wine10.14开发版更新亮点颇多。VKD3D和Mono引擎的升级直接提升了特定应用和游戏的运行效果,支持IP...
腾讯优图实验室开源智能体框架Youtu-Agent(2025-09-05)
9月5日,OSCHINA讯,近日,腾讯优图实验室正式开源智能体框架Youtu-Agent。该框架以极简高性能为核心,为科研和开发人员提供高效易用的开发工具。它面向多方向应用,已支持腾讯云业务。不依赖海外闭源大模型API和额外训练模型,能在实际场景有好效果。在多个基准测试成绩领先,框架设计开源友好、架构灵活、自动化且简洁。
【点评】腾讯优图实验室开源的Youtu-Agent框架优势明显。其极简高性能的设计满足了科...
智象未来提出全新自回归图像编辑框架VAREdit(2025-09-05)
9月5日,OSCHINA讯,近日,智象未来团队将视觉自回归(VAR)架构引入图像编辑,提出全新指令引导编辑框架VAREdit,解决了扩散模型固有顽疾。该框架把下一尺度预测范式引入其中,基于文本指令和量化源图像特征预测目标图像多尺度视觉残差,还提出新颖SAR模块,实现图像编辑精准性和高效性双重提升。团队表示,VAREdit能“指哪打哪”,实现精准度与速度双重突破。
【点评】智象未来团队此次提出的VAREdit框架意...
小米澎湃OS 3发布,Beta版首批机型开启推送(2025-09-04)
9月4日,OSCHINA讯,近日,小米正式发布澎湃OS 3,优化升级多项系统化服务功能并全面接入苹果生态。该系统在自研芯片技术积累上,深入性能和图形根技术。新增“热点编译加速”“窗口绘制下沉”技术,提升能效和渲染效能。首推“小米超级岛”,跨端互联支持苹果设备,超级小爱全面升级,预计9月底支持众多应用和能力。8月29日Beta版首批机型陆续推送。
【点评】小米澎湃OS 3的发布是小米系统的一次重大升级。...
GTK 4.20发布,跨平台开源图形工具包升级(2025-09-04)
9月4日,OSCHINA讯,GTK 4.20正式发布。新版本在Wayland、渲染器兼容性、跨平台支持、无障碍以及视频与图形处理方面有重大更新,为Linux、macOS、Android与Windows提供更稳定体验,也为GNOME 49桌面环境提供技术基础。它在多方面功能提升,还将被GNOME 49默认采用。
【点评】GTK 4.20的发布是开源图形工具包领域的重要进展。其在多个关键领域的更新,如Wayland支持提升、跨平台增强、功能与渲染改进等,显著...
开源直播录制工具OBS Studio 32.0.0 Beta1发布(2025-09-03)
9月2日,OSCHINA讯,近日,开源直播与录制工具OBS Studio 32.0.0首个Beta版发布。此版本有诸多更新,包括引入内建插件管理器简化操作,可选自动崩溃日志上传助力问题修复。在NVIDIA RTX方面有新音频和视觉功能,还支持Hybrid MOV容器,增强跨平台兼容性。此外,有多项其他改进与修复,涵盖插件、UI、视频捕获、编码等方面,修复大量Bug。
【点评】OBS Studio 32.0.0 Beta 1的发布是开源直播录制领域的重要进...
具身智能高质量合成数据集开源发布(2025-09-03)
9月2日,OSCHINA讯,近日,国家数据局发文宣布,具身智能灵巧手多样抓取仿真数据集(DexonomySim)开源发布。该数据集由银河通用在国家数据局指导下介绍发布,专为具身智能机器人灵巧抓取任务设计,含超950万条高质量抓取姿态,覆盖超1万个物体与31种常用抓握类型,是当前开源最大规模相关数据集。
【点评】具身智能高质量合成数据集的开源意义重大。DexonomySim数据集规模大、类型覆盖广,能为多指灵巧手在...
快手开源向量化引擎Auron加入Apache孵化器(2025-09-02)
9月2日,OSCHINA讯,近日,快手开源并捐赠的向量化引擎Auron项目(原Blaze项目)近期进入Apache软件基金会孵化器。加入源于对开源生态认同和项目可持续发展考量,Auron已在多家公司应用。它基于向量化技术,有原生执行、向量化计算等核心能力,在TPC-DS上相比Spark有2+倍性能提升。
【点评】Auron加入Apache孵化器是开源领域的重要事件。该项目从快手的Blaze发展而来,有深厚的技术积累和广泛的应用基础。其...
UltraRAG 2.0发布,开源RAG框架革新(2025-09-02)
9月2日,OSCHINA讯,近日,清华大学THUNLP实验室、东北大学NEUIR实验室、OpenBMB与AI9Stars联合推出UltraRAG2.0(UR-2.0),这是首个基于ModelContextProtocol(MCP)架构设计的开源RAG框架。该设计让科研人员用YAML文件就能声明复杂逻辑,快速实现多阶段推理系统。
【点评】UltraRAG2.0的发布为开源RAG框架领域带来革新。其基于MCP架构的设计是一大亮点,通过组件化封装、灵活调用扩展和轻量流程编排等特性,...
群核科技发布空间大模型并后续开源(2025-09-01)
9月1日,OSCHINA讯,群核科技在首届技术开放日发布新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,后续将逐步面向全球开发者开源。SpatialLM 1.5能理解空间关系,生成结构化场景脚本;SpatialGen可生成多视角图像。
【点评】群核科技此次发布的两款空间大模型具有创新性。SpatialLM 1.5突破传统大语言模型局限,能输出“空间语言”,生成的场景可用于机器人训练,解决数据难题。SpatialGen能生成...
开源低代码引擎TinyEngine发布v2.8.0(2025-09-01)
9月1日,OSCHINA讯,近日,开源低代码引擎TinyEnginev2.8.0正式发布。该引擎能使能开发者定制低代码平台,支持在线实时构建与二次开发等。v2.8.0在AI新特性、区块管理等多方面有变更,还进行了文档更新、bug修复等。
【点评】TinyEnginev2.8.0的发布是低代码领域的一次重要更新。它持续强化核心功能,新增AI相关特性,提升开发效率。在区块管理、物料管理等方面的优化,增强了平台的灵活性与易用性。支持多种...
Java开源工具集Hutool-5.8.40发布(2025-08-29)
8月29日,OSCHINA讯,近日,Java开源工具集Hutool-5.8.40发布,此次为常规bug修复。修复了StrBuilder插入错误等多个问题,还新增了MathGenerator四则运算不生成负数结果、增加多种数据库驱动支持等特性。
【点评】Hutool作为功能丰富的Java工具库,此次更新意义重大。它修复了多个可能影响开发的关键bug,保障了工具使用的稳定性。新增的特性进一步拓展了其功能,如数据库驱动支持的增加,提升了工具在不同场...
货拉拉开源两款三方库解决开发痛点(2025-08-29)
8月29日,OSCHINA讯,近日,货拉拉开源了AspectPro Aop Plugin和page - spy - harmony两款实用三方库,解决应用开发中“代码耦合高”“远程调试难”问题。前者可让横切逻辑与业务代码解耦,提升代码质量;后者能实现远程可视化调试,加速问题定位修复。
【点评】货拉拉此次开源的两款三方库极具针对性。在软件开发里,代码耦合和远程调试难题一直困扰开发者。AspectPro Aop Plugin通过精准hook和编译阶段支持...
Docker Desktop修复高危漏洞CVE-2025-9074(2025-08-28)
8月28日,OSCHINA讯,Docker发布更新,修复了Windows 10/11和macOS版Docker Desktop中编号为CVE-2025-9074的高危漏洞,该漏洞评分达9.3/10,利用难度低。官方在v4.44.3版本完成修复,建议用户尽快升级。
【点评】此高危漏洞危害极大,攻击者能借此绕过隔离机制控制主机。在Windows 10/11环境下风险尤为严重,而Linux版不受影响。Docker及时发布更新修复漏洞,凸显了对安全问题的重视。用户应尽快升级到安全版...
新一代中国操作系统银河麒麟V11发布(2025-08-28)
8月28日,OSCHINA讯,近日,2025中国操作系统产业大会上,新一代中国操作系统银河麒麟V11正式发布。该系统采用全新磐石架构,操作体验、安全性和生态丰富度大幅提升,是首个突破百万生态的国产操作系统,与国产主流芯片全面兼容。
【点评】银河麒麟V11的发布是我国操作系统领域的重大突破。其全新架构带来多方面性能提升,构建起完整国产化生态体系,彰显了国产操作系统的技术实力。在国家重大工程、政务及多...
腾讯游戏发布AI工具集VISVISE提升动画制作效率(2025-08-27)
8月27日,OSCHINA讯,在科隆国际游戏展上腾讯游戏发布游戏创作AI工具集VISVISE,涵盖动画、模型等四个核心领域。其中MotionBlink工具动画生成效率提升8倍,GoSkinning工具提升3D角色蒙皮效率,还重新设计游戏开发流程。
【点评】腾讯游戏发布的VISVISE工具集是游戏开发领域的一大突破。它聚焦动画制作等痛点,通过AI技术大幅提升效率,降低创作门槛,为小型团队和独立创作者提供支持。不仅减轻美术师工作负担...
rsyslog 8.2508.0版本发布(2025-08-27)
8月27日,OSCHINA讯,近日,rsyslog 8.2508.0版本发布。此版本意义重大,推进负责任的AI First战略,迈向云原生运营,在质量、安全和文档方面有重大改进,亮点包括云原生进展、网络优化、安全增强等。
【点评】rsyslog 8.2508.0版本是一次全方位的升级。在云原生方面有显著进展,网络功能得到强化,安全配置和错误提示更优,语言和管道功能增强,开发者体验也得到改善。同时,其对AI生成内容严格审查,确保代...
百度发布视频生成大模型“蒸汽机2.0”(2025-08-26)
8月26日,OSCHINA讯,近日,百度发布中文音视频一体化生成的I2V模型“百度蒸汽机 2.0”,宣称是吃中文语料长大的,可一步到位生成音画同步、口型精准、情感自然的中文对话视频。此次百度蒸汽机 2.0实现全系模型开放,Turbo版、Lite版、Pro版及有声版均可体验。该模型是行业首个中文音视频一体化生成的I2V模型,支持环境音效和多角色语音一体化生成,能实现语音与唇形、表情、动作的毫秒级精准对齐。还首创多模态潜在...
FFmpeg8.0“Huffman”正式发布(2025-08-26)
8月26日,OSCHINA讯,近日,FFmpeg8.0“Huffman”正式发布,此版本因多次延期和项目基础架构现代化升级,是迄今规模最大的版本之一。新功能丰富,涵盖多个方面。在解码器上,新增Nativedecoders如APV、ProResRAW等;VVC解码器有IBC、ACT、调色板模式等改进;基于纯Vulkan计算实现新的编解码器,如FFv1(编码和解码)、ProResRAW(仅解码),适用于任何Vulkan1.3实现,使用相同hwaccelAPI和命令,用户启用Vulkan解码...
钉钉联手通义推出Fun-ASR语音识别大模型(2025-08-25)
8月25日,OSCHINA讯,近日,钉钉与通义实验室语音团队宣布联手推出新一代语音识别大模型 Fun - ASR。该模型能听懂家装、畜牧等十大行业黑话,支持企业专属模型定制训练,可准确转写各种语音信号,识别多行业术语、不同语言与口音,结合上下文实现精准转录。
【点评】钉钉与通义推出的Fun-ASR语音识别大模型意义重大。其功能强大,不仅能应对十大行业黑话,还支持企业按需定制专属模型,精准适配不同企业的特殊场...
赛昉推出低价RISC-V开发板VisionFive2Lite(2025-08-25)
8月25日,OSCHINA讯,近日,中国RISC-V企业赛昉科技StarFive在众筹平台Kickstarter推出入门级RISC-V开发板VisionFive2Lite。该开发板是单板计算机,外形规格与树莓派相同,为85mm×56mm。其定价亲民,最低的2GB内存版本仅售19.9美元(约合143元人民币)。VisionFive2Lite搭载2GB/4GB/8GBLPDDR4内存,正面配备1组40-PinGPIO、3个USB-A480Mbps、1个USB-A3.0/2.0、1个仅供电USB-C、1个MIPI-CSI、1个MIPI-DSI、1个HDMI2.0...
智谱发布AutoGLM 2.0:全球首个手机Agent(2025-08-22)
8月22日,OSCHINA讯,近日,智谱宣布推出AutoGLM2.0,称将Agent应用提升到新高度。它是全球首个手机Agent,人人可用,开创Agent+云手机/云电脑新技术范式,突破硬件限制,由国产模型驱动,具备全能能力。即日起人人可用,还将快速迭代推出新功能。
【点评】智谱发布的AutoGLM2.0具有重大意义。从功能上看,它是全球首个手机Agent且能在云端自主完成任务,突破了以往AI仅作为聊天工具的局限,能真正替用户干活...
腾讯Kuikly开源框架新增支持Web(2025-08-22)
8月22日,OSCHINA讯,近日,腾讯广泛应用的跨端开发框架Kuikly基于Kotlin Multiplatform技术构建,由腾讯大前端领域Oteam推出。此次在Android、iOS、鸿蒙开源基础上,新增开源Web版,支持H5和微信小程序,进一步扩展多端适配场景,且已接入腾讯多款业务,如搜狗输入法、鹅毛市集、QQ小游戏等。
【点评】腾讯Kuikly开源框架新增Web支持意义重大。从功能拓展而言,它在原有的Android、iOS、鸿蒙开源基础上,新...
PowerToys 0.93 发布(2025-08-21)
8月21日,OSCHINA讯,近日,Microsoft PowerToys v0.93正式发布,这是供Windows系统高级用户调整和简化体验、提高生产力的实用程序。此次更新修复大量错误,进行细微用户体验调整并带来诸多新内容。命令面板启动内存占用减少15%,加载时间减少40%,内置扩展程序加载时间减少70%,安装体积减少约55%,还解决超99个Command Palette问题,如剪贴板历史记录回归等,重新设计的dashboard更清晰。Mouse Highlighter推出全...
中山大学联合美团打造X-SAM模型(2025-08-21)
8月21日,OSCHINA讯,近日,中山大学、鹏城实验室与美团三方联合研发的X-SAM图像分割模型正式发布。该模型在图像分割领域实现重要突破,将传统“分割万物”升级为“任意分割”,提升适应性和应用范围。研究团队针对传统SAM局限性,提出视觉定位分割任务框架。X-SAM技术架构有多项创新,支持统一输入输出格式,核心双编码器架构和分割连接器提升分割精度,集成Mask2 Former架构突破传统技术限制。采用三阶段渐进式训...
蚂蚁集团开源新一代JVM即时编译器Jeandle(2025-08-20)
8月20日,OSCHINA讯,蚂蚁集团正式开源基于LLVM的JVMJIT编译器Jeandle。公告以“筋斗云”为喻,期望Jeandle为JVM提升性能、拓宽生态边界。Jeandle是基于OpenJDK Hotspot JVM的全新即时编译器,利用LLVM进行编译优化与代码生成,把LLVM的性能和生态优势引入JVM。但整合JVM和LLVM两个复杂系统需攻克诸多技术难题,如支持JVM的垃圾回收机制、为JVM各种功能定制LLVM特性、基于LLVM实现针对Java语言的多类优化算法等。目...
港大联手月之暗面等开源OpenCUA,可自主操作电脑的Agent(2025-08-20)
8月20日,OSCHINA讯,近日,香港大学XLANGLab联合月之暗面、斯坦福大学等机构正式开源OpenCUA框架,助力开发者低门槛构建和扩展CUA(计算机使用智能体)。该框架包含三部分:无缝捕获人类计算机使用演示的注释基础设施、首个跨越3个操作系统及超200个应用程序和网站的大规模计算机使用任务数据集AgentNet、可将演示转换为具有反思性长思维链推理“状态-动作”对的可扩展工作流程。项目由港大计算机科学系助理教授Tao...
昆仑万维发布Skywork Deep Research Agent v2(2025-08-19)
8月19日,OSCHINA讯,近日,昆仑万维集团推出Skywork Deep Research Agent v2,标志着天工超级智能体核心引擎显著增强,为用户带来多模态、高质量、高效率体验。v2引入“多模态深度调研”Agent,首次整合多模态检索、理解和生成,解决传统产品依赖纯文本检索分析局限。通过多模态爬取技术MM-Crawler、长距离多模态信息收集等技术突破,让研究人员等用户能获取完整、顺畅、视觉友好的深度报告。此外,还推出“多模态...
2024年中国隐私计算市场规模近10亿(2025-08-19)
8月19日,OSCHINA讯,近日,国际数据公司IDC发布《2024中国隐私计算平台主要厂商市场份额》报告。2024年中国隐私计算市场规模达9.8亿元,同比增长10.1%,蚂蚁数科以36.7%的市场占有率位居首位,且连续三年蝉联中国隐私计算市场份额第一。IDC认为,市场增长主要源于数据要素相关项目建设,大模型向各行业渗透使隐私保护需求升高,为隐私计算应用增长增添新动能。大模型在产业快速应用时,数据安全与隐私保护成为规模...
DeepSeek App更新,支持对话内容生成分享图(2025-08-18)
8月18日,OSCHINA讯,近日,手机应用商店显示,DeepSeek App发布1.3.0版本更新,首次支持对话内容生成分享图功能,用户问答对话可通过原生功能生成图片,比截图分享更便捷。今年6月DeepSeek团队曾加紧推进R2模型开发,CEO梁文锋对模型能力不满意,团队内部仍在提升性能,未准备好正式投用,原计划5月推出也因各种原因延迟,新模型预计能生成更高质量代码,具备用非英语语言进行推理的能力。
【点评】DeepSeek...
Warm - Flow 1.8.0版本重大更新,自研仿钉钉设计器发布(2025-08-18)
8月18日,OSCHINA讯,近日,Warm-Flow工作流引擎迎来1.8.0版本重大更新,带来全新功能与卓越用户体验。核心亮点是自主研发仿钉钉设计器,基于logic-flow研发,同时支持经典和仿钉钉双设计器,避免维护两套代码,提升统一性与可维护性。智能交互体验升级,绘制回退线条时系统自动识别设置为退回跳转类型,经典模式下节点和连线文字可自由拖动调整,设计器根据流程发布状态自动判断是否可编辑。功能增强与优化方面,新...