谷歌发布世界模型Genie 3,推动AI交互与训练革新(2025-08-18)
8月18日,OSCHINA讯,谷歌DeepMind正式发布最新一代世界模型Genie 3。它在生成时长、分辨率和物理一致性上显著提升,支持通过文本动态改变虚拟世界事件。作为通用世界模型,Genie 3能以24帧每秒生成720P分辨率的交互式3D环境,较前代Genie 2有飞跃,最长可维持数分钟环境一致性,视觉记忆时长达一分钟。其引入“可提示世界事件”功能,用户通过文本指令可动态修改虚拟世界,增强交互性,为游戏开发者、教育工作者和A...
Debian 14将显著改进对龙芯LoongArch64架构支持(2025-08-18)
8月18日,OSCHINA讯,Debian13“trixie”稳定版已发布,团队宣布将在2027年发布的Debian14(代号“Forky”)中显著改进对中国龙芯CPU架构LoongArch64(简称Loong64)的支持。按规划,Loong64架构资格认证将在Forky开发周期后期进行,相关软件包将很快可提交到该版本。目前LoongArch64作为非官方移植架构已存在两年,Debian14将推动其成为官方支持架构,类似Debian13对RISC-V的支持。Debian14的“unstable”分支即将...
苹果测试全新AI语音控制功能,提升iPhone操作便利性(2025-08-18)
8月18日,OSCHINA讯,科技记者古尔曼透露,苹果正在积极测试一项创新的Siri语音控制功能,旨在为iPhone用户提供更精准操作体验,提升使用便利性。新功能基于苹果最新的App Intents技术,赋予用户强大的跨应用语音控制能力。用户可通过语音指令完成各类任务,如查找、编辑和发送特定照片,无需手动操作手机屏幕;还能在社交媒体发布评论、浏览购物应用并添加商品到购物车等,实现“无手”操作。该功能推出意味着Siri...
腾讯混元开源图像生成新框架MixGRPO(2025-08-11)
8月11日,OSCHINA讯,近日,腾讯混元基础模型团队发布图像生成新框架MixGRPO。该方案将训练时间缩短近50%,还推出变体MixGRPO-Flash使训练时间降低71%,这得益于将随机微分方程(SDE)和常微分方程(ODE)相结合的创新采样策略。当前图像生成技术中效率与质量常矛盾,MixGRPO通过混合采样方法优化马尔可夫决策过程(MDP)提升训练效率,限制智能体随机探索范围减少计算开销、简化训练流程。与DanceGRPO模型相比,它在...
小米开源声音理解大模型MiDashengLM-7B,革新声音交互体验(2025-08-11)
8月11日,OSCHINA讯,近日,小米自研声音理解大模型MiDashengLM-7B正式发布并全量开源。该模型在速度精度上实现双突破,单样本首Token延迟仅为同类模型1/4、同显存下并发超20倍,在22个公开评测集上刷新多模态大模型最好成绩。它基于XiaomiDasheng音频编码器和Qwen2.5-Omni-7BThinker解码器,通过创新训练策略,实现对语音、环境声音和音乐的统一理解。训练数据为100%公开数据,以宽松的ApacheLicense2.0发布,支持...
谷歌Android Studio免费Agent模式上线,革新安卓开发(2025-08-11)
8月11日,OSCHINA讯,近日,谷歌在官方开发者博客及Google I/O2025大会上宣布,Android Studio正式推出免费Agent模式,为安卓应用开发带来革命性AI辅助功能,被视为对苹果开发生态的有力挑战。该模式基于Gemini2.5Pro,通过自然语言交互帮助开发者完成复杂多步骤开发任务,能深入理解项目上下文,自动制定执行计划并完成工作流。其核心功能亮点颇多,支持自然语言任务描述、UI代码快速修改、自定义规则设置,免费版...
统信Windows应用兼容引擎官网上线,开启生态共建新阶段(2025-08-04)
8月4日,OSCHINA讯,近日,统信Windows应用兼容引擎官网正式上线,标志着兼容技术从工具迭代迈向生态共建新阶段。该引擎发展历经多年,2014年deepin-wine团队以让Linux系统流畅运行Windows应用为目标,向wine上游社区提交200余个补丁,产品不断升级。2021年推出wine助手,降低wine技术使用门槛;2024年推出UOS应用迁移助手,聚焦专业场景。同年11月,UOS应用迁移助手更名为统信Windows应用兼容引擎并迭代至V3.0.4版...
中国移动“九天”3.0发布,多项核心技术同步开源(2025-08-04)
8月4日,OSCHINA讯,近日,中国移动发布自主研发的“九天”基础大模型3.0。“九天众擎语言大模型”架构有突破性创新,采用可扩展至万亿级的MoE架构,经多阶段配比预训练数据与全流程治理体系,推理能力显著强化。其构建二维分级后训练框架,结合动态强化学习策略,复杂推理能力提升35%。在多项评测中表现优异,如GPQA - Diamond评测全球第二等,还强化了可控生成能力,破解沉浸式角色演绎难题。基于此语言大模型,中...
智谱发布GLM - 4.5开源模型,推理与代码能力达开源SOTA水平(2025-08-04)
8月4日,OSCHINA讯,智谱发布新一代旗舰模型GLM-4.5,这是专为智能体应用打造的基础模型。官方宣称其在包含推理、代码、智能体的综合能力达到开源SOTA水平,在真实代码智能体人工对比评测中实测为国内最佳。该模型已在Hugging Face与Model Scope平台同步开源,模型权重遵循MIT License,还提供了开源仓库、模型仓库、体验地址及技术报告链接。GLM-4.5采用混合专家(MoE)架构,有GLM-4.5和GLM-4.5-Air两个模型及两种...
英伟达开源多模态音频模型 Audio Flamingo 3(2025-07-28)
7月28日,OSCHINA讯,英伟达发布完全开源的大型音频 - 语言模型(LALM)Audio Flamingo 3 (AF3),在超20个音频理解和推理基准测试中达最新最优性能。该模型旨在推动音频、语音和音乐领域AI研究,仅限非商业研究用途,依据NVIDIA OneWay非商业许可证发布。AF3引入多项创新功能,有支持语音等联合表征学习的统一音频编码器AF - Whisper、实现链式推理步骤的按需推理、支持多轮多音频对话功能,还具备长音频理解与推理...
英特尔将终止开发Clear Linux(2025-07-28)
7月28日,OSCHINA讯,英特尔发布声明宣布将终止开发Clear Linux发行版。经过多年创新与社区协作,英特尔将立即停止为Clear Linux OS提供安全补丁、更新或维护,其GitHub存储库将以只读模式存档。英特尔建议当前用户尽快迁移到其他积极维护的Linux发行版以确保安全性和稳定性。不过,英特尔会继续大力投资Linux生态系统,支持和贡献开源项目及发行版来优化英特尔硬件。近年来,因英特尔削减成本、强调主流Linux发行版...
微软服务器软件被曝严重安全漏洞,黑客借此在全球发起攻击(2025-07-28)
7月28日,OSCHINA讯,微软服务器软件近日被曝存在严重安全漏洞,不明身份黑客利用该漏洞在过去几天对全球目标发起攻击,多家机构服务器被攻破,相关部门紧急补救。微软7月20日发布安全警告,其广泛用于政府和企业文件共享的SharePoint服务器软件正遭持续攻击,入侵对象包括美国联邦和州政府机构、大学、能源公司及一家亚洲电信公司。此次“零日攻击”利用了SharePoint软件中允许授权攻击者网络伪装行为的未知漏洞,...
北京人形发布高保真铰接物体数字资产ArtVIP弥合Sim2Real鸿沟(2025-07-21)
7月21日,开源资讯讯,近日,北京人形机器人创新中心与北京建院联合发布高保真铰接物体数字资产数据集ArtVIP,实现高复杂度铰接物品高精度仿真,开源6个虚拟机器人训练场,还可提供定制化建模服务。ArtVIP数据集精准发力,构建起全球最为精细的复杂铰接物体库,26类共206种高精度可动物件,全面覆盖橱柜、烤箱等各类铰接结构,实现对机械结构变异性的精准复现,极大提升模型泛化能力。在物理特性方面,通过高精度动...
维基框架发布1.0.11至中央仓,深化国产化DevOps生态整合(2025-07-21)
7月21日,亿欧网讯,近日,国产全场景Java企业级开发框架维基框架发布v1.0.11版本至中央软件仓库(Maven Central),本次发布聚焦安全增强与云原生适配,同时深化国产化研发生态协同。在安全方面,集成OAuth2.1协议并修复5项高危漏洞,支持国密算法SM4加密通信,显著提升了框架的安全性能。云原生适配方面,全面支持JDK 17与Spring Boot 3.3.5,容器镜像大小减少40%,启动速度提升35%,大幅优化了云环境下的运行效率...
苹果MLX框架新增CUDA支持(2025-07-21)
7月21日,OSCHINA讯,近日,苹果公司宣布其专为Apple Silicon设计的机器学习框架MLX新增对英伟达CUDA的支持,开发者可在Apple Silicon Mac上开发应用并导出至CUDA环境运行,此前因MLX深度集成苹果Metal平台,开发者需额外硬件才能在macOS外操作。
【点评】苹果MLX框架新增CUDA支持意义深远。在开发成本方面,此前开发者受限于MLX与苹果Metal平台的深度集成,若要在macOS系统之外进行部署和测试,往往需额外购...
阿里开源首个音频生成模型ThinkSound(2025-07-14)
7月14日,开源技术交流讯,近日,阿里巴巴通义实验室宣布正式开源首款音频生成模型ThinkSound,将CoT应用到音频生成领域,实现高保真、强同步的空间音频生成。通义实验室构建首个支持链式推理的多模态音频数据集AudioCoT,融合多来源2531.8小时高质量样本,经严格筛选流程保障质量,还设计交互式编辑样本。ThinkSound由多模态大语言模型和统一音频生成模型组成,按三个阶段解析画面生成精准音频,在VGGSound和MovieG...
Windows11最新“黑屏死机”界面现已推出(2025-07-14)
7月14日,OSCHINA讯,近日,微软向Windows 11 Release Preview用户推出全新设计的黑色版BSOD,删除表情和二维码,采用简化黑屏,会列出停止代码和故障系统驱动程序,还包含快速机器恢复功能。
【点评】微软此次对Windows 11的BSOD界面进行更改意义重大。从界面设计来看,将蓝屏死机改为黑色版本,删除表情和二维码,采用更简化的黑屏,类似Windows更新期间的黑屏,这种改变让界面更加简洁明了。新界面能列出...
盟升电子股权转让价敲定32.59元/股,战略投资者入场倒计时 (2025-07-14)
7月14日,极客AI讯,近日,盟升电子发布公告确认股份询价转让价格为每股32.59元,11家机构投资者参与报价。本次转让通过市场化机制定价,旨在优化股权结构并引入长期战略投资者,增强资本稳定性。作为科创板企业,盟升电子持续聚焦电子技术研发与市场拓展,市场人士认为当前价格合理且参与机构数量适中,预计将支撑股价平稳运行。
【点评】市场化定价机制有效平衡了股东权益与市场规则,11家机构的参与深度...
DeepSeek数月来首次在LinkedIn发布招聘信息,职位包括前端开发、全栈开发和大模型实习生(2025-07-10)
7月10日,I OSCHINA讯,DeepSeek在LinkedIn上发布了招聘信息,可能寻求从海外吸引人才。该公司过去一周内在微软旗下的这一求职和社交网络平台领英上发布了10个职位,这是该公司数月来首次在该平台发布招聘信息。这些职位包括三个专注于通用人工智能(AGI)的岗位,工作地点位于北京和杭州。所有职位描述均以中文发布。值得注意的是,今年早些时候,这些相似职位曾在中国主流招聘平台上发布。但自2021年LinkedIn关闭...
阿里通义开源实首个音频生成模型 ThinkSound(2025-07-08)
7月8日,开源中国讯,阿里通义开源首个音频生成模型ThinkSound,将打破“静音画面”的想象力局限。该模型首次把多模态大模型的思维链推理引入音频生成领域,让AI可以像专业音效师一样逐步思考,捕捉视觉细节,生成与画面同步的高保真音频。目前,ThinkSound的代码和模型已在Github、HuggingFace、魔搭社区开源,开发者可免费下载和体验。据介绍,ThinkSound首次将CoT(Chain-of-Thought,思维链)应用到音频生成领域...
消息称 TikTok 为美国开发新版应用,9月上线替换现有版本(2025-07-07)
7月7日,IT之家讯,TikTok正在为美国用户开发一个新版应用,并计划于9月5日在美国应用商店上线。TikTok用户最终必须下载新版应用,才能继续使用该服务。现有应用预计可使用至明年3月,但这一时间表仍可能发生变化。新版应用将解决美国的安全顾虑,一个由非中国科技公司组成的财团预计将收购TikTok美国业务,其中甲骨文公司参与此次交易,而TikTok母公司字节跳动将保留少数股权。
【点评】TikTok为美国市场开...
豆包上线“深入研究”功能(2025-07-04)
7月4日,OSCHINA讯,豆包“深入研究”功能已经在豆包App、网页版及电脑版正式开启测试,用户可免费体验。基于模型的搜索、推理及Agent能力,“深入研究”可以帮助用户更快速、全面和结构化地处理高难度的复杂任务。针对长途旅行攻略、复杂购买决策、最新政策解读、商业科技趋势发展等需要获取大量资料、长时间研究的问题,借助“深入研究”能力,几分钟即可完成初步方案。同时,豆包还支持以可视化网页和报告文档两...
中国AI GPU芯片初创企业壁仞科技获15亿元融资(2025-06-30)
6月30日,开源中国讯,中国AI GPU芯片初创企业壁仞科技已筹集到约15亿元人民币,并正准备在今年第三季度赴港交所申请上市,最快可能在8月。此次15亿元的融资主要由两家国资背景的投资机构领投,包括一家来自广东的国资支持的基金和一家来自上海的国资基金。在最新一轮融资之前,壁仞科技的估值约为140亿元。
【点评】壁仞科技获得的巨额融资显示了资本市场对其技术和市场潜力的高度认可。随着AI技术的快速发...
文心大模型4.5系列正式开源(2025-06-30)
6月30日,开源中国讯,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。文心大模型4.5系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。文心大模型4.5系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态...
开源AI助手平台Cherry Studio企业版开启公测(2025-06-25)
6月25日,OSCHINA讯,Cherry Studio宣布其企业版已开始公测,这是专为企业打造的私有化AI生产力平台。Cherry Studio是一款支持多个大语言模型服务商的开源桌面客户端,兼容Windows、Mac和Linux系统。企业版相较于社区版,提供了企业集中管理能力、服务端私有化部署等核心差异,旨在为企业提供安全、可控、高效的AI助手服务。
【点评】Cherry Studio企业版的公测,为企业提供了一个安全、可控、高效的私有化AI...
网易有道开源首个专注数学教育的模型Confucius3(2025-06-24)
6月24日,OSCHINA讯,网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math),这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。Confucius3-Math由网易有道AI团队开发,专门针对K-12数学教育场景进行优化,具有数学任务上的顶尖性能、高性价比的部署方案以及文化与课程体系的深度契合等特点。
【点评】网易有道开源Confucius3-Math模型是数学教育领域的一...
华为自研仓颉编程语言将于7月30日开源(2025-06-23)
6月23日,OSCHINA讯,华为宣布自研的仓颉编程语言将于7月30日开源。仓颉编程语言是一款面向全场景智能的新一代编程语言,主打智能化、全场景、高性能、强安全。它融入鸿蒙生态,为开发者提供良好的编程体验。仓颉编程语言支持多种开发范式和编程模式,包括值类型、类和接口、泛型等特性,支持类型推断,减轻开发者类型标注的负担。同时,仓颉追求编码即安全,通过静态类型系统和自动内存管理,确保程序的类型安全和...
出发层VPD技术试点落地广州白云机场(2025-06-20)
6月20日,极客网讯,近日,广汽传祺联合华为在广州白云国际机场首次实现了“出发层泊车代驾VPD(Valet Parking Driving)”技术试点,这是全球首个机场出发层就能使用VPD的技术试点。该技术通过手机APP简单操作,车便能自主驶入地下停车场,智慧应对闸机通行、会车避让、礼让行人等复杂场景,精准巡航至可用车位,真正实现“下车即走,智享泊车自由”。返程时,通过APP远程启动车辆,设定好上车点,车辆将自主驶离车...
开源鸿蒙OpenHarmony 6.0 Beta1发布(2025-06-20)
6月20日,OSCHINA讯,开放原子开源鸿蒙(OpenHarmony)6.0 Beta1版本正式发布。相比5.1.0 Release版本,6.0 Beta1在ArkUI组件能力、分布式数据管理能力、音频引擎等方面进行了增强,提供了更安全、更灵活的组件布局,支持应用对标准化数据进行展示,提升整体运行效率并降低播放时延。此外,还增强了窗口、位置服务、输入法框架、安全等相关能力。
【点评】OpenHarmony 6.0 Beta1版本的发布,标志着开源鸿蒙操...
昆仑万维开源代码Agent模型Skywork-SWE-32B(2025-06-20)
6月20日,OSCHINA讯,昆仑万维开源了其专门为软件工程(SWE)任务设计的代码代理模型Skywork-SWE-32B。据介绍,昆仑万维团队通过构建超过1万个可验证的GitHub仓库任务实例,打造出目前最大规模的可验证GitHub仓库级代码修复的数据集,并系统性验证了大模型在软件工程任务上的数据缩放定律。Skywork-SWE-32B模型在SWE-bench Verified基准上取得38.0% pass@1准确率,刷新Qwen2.5-Coder-32B系列模型在OpenHands代码框架...
阿里云本月将在韩国设立第二座数据中心,加速全球扩张(2025-06-19)
6月19日,IT之家讯,阿里巴巴集团计划于6月底前在韩国建立第二个数据中心,以加速其在全球AI与云计算领域的扩张。这一扩张是阿里巴巴集团今年初公布的总额达3800亿元人民币的AI和云基础设施投资计划的一部分,旨在满足韩国企业对云服务和AI解决方案日益增长的需求。阿里云自2022年起进入韩国市场,首个数据中心设在首尔,目前已为多家AI解决方案商及客户提供服务。阿里巴巴表示,阿里云目前在全球29个地区设有87个可...
硅基流动完成数亿元A轮融资(2025-06-12)
06月12日,开源中国讯,硅基流动宣布已完成数亿元人民币A轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。硅基流动创始人袁进辉表示,公司通过持续的技术突破和产品创新有效解决了国内AI行业发展的多个重大问题。随着阿里巴巴通义千问Qwen、DeepSeek等开源大模型崛起以及AI推理算力需求激增,公司业务迎来了爆发式增长。硅基流动将继续加大研发投入,积极拓展海内外市场,...
美团发布 AI Coding Agent工具“NoCode”(2025-06-11)
06月11日,OSCHINA讯,美团上线了名为“NoCode”的AI Coding Agent工具,用户通过自然语言对话即可生成网页、小程序等应用,并支持实时修改、一键部署。NoCode是一款无需编程背景和经验,通过自然语言和对话形式,即可快速生成应用的平台。可帮助不同角色以“零代码”的方式创建个人提效工具、产品原型、可交互页面等,降低开发门槛,实现创意释放。NoCode功能亮点包括自然语言编程、实时预览效果、局部定位修改和一...
小米Mi-BRAG获中国信通院可信AI RAG评估最高等级(2025-06-09)
06月09日,开源中国网讯,小米自研智能知识库问答框架—Mi-BRAG顺利通过中国信息通信研究院组织的“可信AI检索增强生成(RAG)”评估,并获当前最高评级4+级。Mi-BRAG是小米大模型团队自主研发的智能知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,支持多场景定制化的智能知识问答技术方案。目前Mi-BRAG已在公司多个场景中落地,包括小爱同学的个人信息问答、汽车问答助手、商品问答等。
【点...
北京AI芯片独角兽奕斯伟拟赴港上市,有望成为“RISC-V 第一股”(2025-06-05)
06月05日,开源中国讯,北京奕斯伟计算技术股份有限公司日前向港交所提交了上市申请书,计划主板上市。奕斯伟由王东升在2019年9月创办于北京,2021年启动RISC-V的AI处理硬件开发计划,2022年启动RISC-V汽车处理硬件开发计划,2023年启动高性能RISC-V研发计划,2024年正式推出RISAA生态技术平台。招股书显示,奕斯伟聚焦智能终端和具身智能两大核心应用场景,正采用新一代RISC-V计算架构,创新领域专用算法及IP模块,...
奕斯伟计算向联交所递表,拟于香港H股市场IPO(2025-06-04)
06月04日,IT之家讯,国内RISC-V芯片技术企业北京奕斯伟计算技术股份有限公司(奕斯伟计算)5月30日向香港联合交易所递交文件,计划在香港H股市场进行IPO。奕斯伟计算的单一最大股东之一奕斯伟集团目前的董事长为京东方创始人王东升。根据奕斯伟计算提交的文件,企业在2022年、2023年、2024年的核心财务数据如下:收入分别为20.00亿元、17.52亿元、20.25亿元;毛利分别为5.18亿元、2.70亿元、3.78亿元;亏损分别为15...
DeepSeek R1模型完成小版本试升级,逻辑理解能力提升(2025-05-29)
05月29日,开源中国讯,DeepSeek发布官方消息,称DeepSeek R1模型已完成小版本试升级,用户可通过官方网页、APP以及小程序参与测试。升级后的DeepSeek R1在语义理解精准性、复杂逻辑推理、长文本处理稳定性等方面进行了强化。代码测试平台LiveCodeBench上的测试结果显示,DeepSeek R1的得分非常接近O3(High)和O4-Mini。
【点评】DeepSeek R1模型的此次升级,提升了模型在语义理解和逻辑推理方面的能力,这...
夸克上线“高考深度搜索”功能(2025-05-28)
05月28日,开源中国讯,夸克上线了行业首个面向高考志愿填报场景的“深度搜索”能力。用户只需要在夸克搜索框用最自然的方式询问高考志愿问题,勾选“深度搜索”后即可体验。据介绍,整个过程中会涉及动态的智能检索和多轮校验,检索数据来自于夸克自建的高考知识库,确保数据专业可信。知识库不仅有历年志愿数据,还有考研、就业数据。其中就业数据覆盖全国上千所本科院校的就业去向,以及100多个主要城市的就业数...
砺算科技首颗自研架构GPU芯片已成功点亮(2025-05-27)
05月27日,IT之家讯,砺算科技宣布其首颗自研架构全自主知识产权GPU芯片在封装回片后已于2025年5月25日成功点亮,截至目前结果符合预期。该企业下一步将根据台式机、笔记本、图形工作站等设备的需求,继续进行详细全面的软硬件测试和驱动优化工作。砺算科技是一家致力于研发多层次(可扩展)高性能图形渲染GPU的公司,目前在上海、南京、北京设有办公室,计划以自研架构、自主知识产权打造对标国际主流产品的GPU芯片...
腾讯大模型战略首次全景亮相:自研混元大模型、知识库、智能体开发、工具箱一应俱全(2025-05-21)
05月21日,TechWeb讯,在2025腾讯云AI产业应用峰会上,腾讯展示了其大模型矩阵产品全面升级,包括自研混元大模型、AI云基础设施、智能体开发工具、知识库以及面向场景的应用。腾讯正通过持续打磨技术和产品能力,为企业和用户在大模型时代打造真正“好用的AI”。腾讯集团高级执行副总裁汤道生表示,未来腾讯将持续加速大模型创新、加速智能体应用、加速知识库建设、加速基础设施升级,推动AI技术走进千行百业。
...