【软件产业】阿里开源首个音频生成模型ThinkSound(2025-07-14)
7月14日,开源技术交流讯,近日,阿里巴巴通义实验室宣布正式开源首款音频生成模型ThinkSound,将CoT应用到音频生成领域,实现高保真、强同步的空间音频生成。通义实验室构建首个支持链式推理的多模态音频数据集AudioCoT,融合多来源2531.8小时高质量样本,经严格筛选流程保障质量,还设计交互式编辑样本。ThinkSound由多模态大语言模型和统一音频生成模型组成,按三个阶段解析画面生成精准音频,在VGGSound和MovieGen Audio Bench测试集上表现优异,未来计划在模型能力、数据构建和应用场景三大方向拓展。
【点评】阿里开源的ThinkSound音频生成模型具有诸多亮点。从技术创新角度看,将CoT应用于音频生成领域是一大突破,让AI能更好地理解画面与声音的关系,实现高质量的空间音频生成。AudioCoT数据集的构建十分用心,融合多来源样本并进行严格筛选,为模型训练提供了坚实基础,交互式编辑样本的设计也满足了后续功能需求。ThinkSound的双模块设计使其能按阶段精准生成音频,在多项测试中表现远超现有主流方法,展现出强大的性能优势。未来计划在多方面拓展,有望在游戏开发、VR、AR等领域带来更丰富的声音体验,推动音频生成技术的发展和应用,为相关行业注入新的活力。
【软件产业】盟升电子股权转让价敲定32.59元/股,战略投资者入场倒计时 (2025-07-14)
7月14日,极客AI讯,近日,盟升电子发布公告确认股份询价转让价格为每股32.59元,11家机构投资者参与报价。本次转让通过市场化机制定价,旨在优化股权结构并引入长期战略投资者,增强资本稳定性。作为科创板企业,盟升电子持续聚焦电子技术研发与市场拓展,市场人士认为当前价格合理且参与机构数量适中,预计将支撑股价平稳运行。
【点评】市场化定价机制有效平衡了股东权益与市场规则,11家机构的参与深度印证了资本层面对公司技术路径和成长潜力的认可。战略投资者入场不仅优化了股东结构分散性,更可能通过资源协同强化产业链议价能力,尤其在电子细分赛道竞争加剧的背景下,稳定资本支持将成为技术迭代和产能扩张的关键变量。
【软件产业】Windows11最新“黑屏死机”界面现已推出(2025-07-14)
7月14日,OSCHINA讯,近日,微软向Windows 11 Release Preview用户推出全新设计的黑色版BSOD,删除表情和二维码,采用简化黑屏,会列出停止代码和故障系统驱动程序,还包含快速机器恢复功能。
【点评】微软此次对Windows 11的BSOD界面进行更改意义重大。从界面设计来看,将蓝屏死机改为黑色版本,删除表情和二维码,采用更简化的黑屏,类似Windows更新期间的黑屏,这种改变让界面更加简洁明了。新界面能列出停止代码和故障系统驱动程序,方便用户和IT管理员追溯蓝屏根源,有助于更快解决问题,体现了微软在提升用户体验和问题解决效率方面的努力。此外,这一改变是Windows 11更新的一部分,还包含了快速机器恢复功能,这是微软在去年CrowdStrike事件后为提高Windows弹性采取的更大努力,显示出微软对系统稳定性和可靠性的重视,以应对可能出现的系统故障,保障用户的正常使用。
【软件产业】DeepSeek数月来首次在LinkedIn发布招聘信息,职位包括前端开发、...(2025-07-10)
7月10日,I OSCHINA讯,DeepSeek在LinkedIn上发布了招聘信息,可能寻求从海外吸引人才。该公司过去一周内在微软旗下的这一求职和社交网络平台领英上发布了10个职位,这是该公司数月来首次在该平台发布招聘信息。这些职位包括三个专注于通用人工智能(AGI)的岗位,工作地点位于北京和杭州。所有职位描述均以中文发布。值得注意的是,今年早些时候,这些相似职位曾在中国主流招聘平台上发布。但自2021年LinkedIn关闭其在中国的本地化版本以来,LinkedIn上的招聘信息更多面向中国以外的求职者。在全球范围内,DeepSeek正面临来自OpenAI、Meta等美国AI巨头的激烈竞争。
【点评】DeepSeek此次在LinkedIn上的招聘行动,显示了其在全球AI领域扩大影响力和吸引国际人才的决心。面对激烈的国际竞争,DeepSeek通过招聘更多专业人才,尤其是具有AGI背景的专家,以加强自身的研发实力和市场竞争力。这不仅有助于提升公司的技术创新能力,也为中国在全球AI领域的发展贡献力量。
【软件产业】阿里通义开源实首个音频生成模型 ThinkSound(2025-07-08)
7月8日,开源中国讯,阿里通义开源首个音频生成模型ThinkSound,将打破“静音画面”的想象力局限。该模型首次把多模态大模型的思维链推理引入音频生成领域,让AI可以像专业音效师一样逐步思考,捕捉视觉细节,生成与画面同步的高保真音频。目前,ThinkSound的代码和模型已在Github、HuggingFace、魔搭社区开源,开发者可免费下载和体验。据介绍,ThinkSound首次将CoT(Chain-of-Thought,思维链)应用到音频生成领域,让AI学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成。
【点评】阿里通义开源的ThinkSound音频生成模型是AI音频技术领域的一大突破。通过引入思维链推理,模型能够更精准地捕捉和生成与视觉内容相匹配的音频,极大地丰富了多媒体内容的表现形式和用户体验。这一开源举措也有助于推动音频生成技术的进一步发展和应用。
【软件产业】消息称 TikTok 为美国开发新版应用,9月上线替换现有版本(2025-07-07)
7月7日,IT之家讯,TikTok正在为美国用户开发一个新版应用,并计划于9月5日在美国应用商店上线。TikTok用户最终必须下载新版应用,才能继续使用该服务。现有应用预计可使用至明年3月,但这一时间表仍可能发生变化。新版应用将解决美国的安全顾虑,一个由非中国科技公司组成的财团预计将收购TikTok美国业务,其中甲骨文公司参与此次交易,而TikTok母公司字节跳动将保留少数股权。
【点评】TikTok为美国市场开发新版应用,反映了其对美国监管环境和安全顾虑的响应。这一举措可能有助于缓解美国政府和公众对数据安全和隐私保护的担忧,同时也为TikTok在美国市场的长期发展提供了新的机遇。新版应用的推出和潜在的业务重组,可能会对TikTok的全球业务战略产生重要影响。
【软件产业】豆包上线“深入研究”功能(2025-07-04)
7月4日,OSCHINA讯,豆包“深入研究”功能已经在豆包App、网页版及电脑版正式开启测试,用户可免费体验。基于模型的搜索、推理及Agent能力,“深入研究”可以帮助用户更快速、全面和结构化地处理高难度的复杂任务。针对长途旅行攻略、复杂购买决策、最新政策解读、商业科技趋势发展等需要获取大量资料、长时间研究的问题,借助“深入研究”能力,几分钟即可完成初步方案。同时,豆包还支持以可视化网页和报告文档两种方式呈现研究结果。据介绍,将豆包更新至最新版后,打开App或电脑版,选择“深入研究”,输入详细指令或一句话prompt,等待几分钟,即可生成一份报告。使用豆包App生成报告后,还可以打开报告内容,选择右上角“听”按钮,一键转成播客,随时听。
【点评】豆包上线“深入研究”功能,展示了AI技术在提升信息处理效率和质量方面的潜力。这一功能将极大地方便用户处理复杂任务,尤其是在需要大量资料和深入研究的领域。豆包通过提供结构化的解决方案和多种呈现方式,进一步增强了用户体验,这也可能推动AI技术在更多领域的应用和普及。
【软件产业】文心大模型4.5系列正式开源(2025-06-30)
6月30日,开源中国讯,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。文心大模型4.5系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。文心大模型4.5系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力。
【点评】文心大模型4.5系列的开源是AI技术领域的一大突破,它不仅丰富了开源AI模型的生态,还为学术研究和产业应用提供了强大的工具。百度通过此次开源,进一步推动了AI技术的普及和应用,为AI技术的创新发展贡献了重要力量。
【软件产业】中国AI GPU芯片初创企业壁仞科技获15亿元融资(2025-06-30)
6月30日,开源中国讯,中国AI GPU芯片初创企业壁仞科技已筹集到约15亿元人民币,并正准备在今年第三季度赴港交所申请上市,最快可能在8月。此次15亿元的融资主要由两家国资背景的投资机构领投,包括一家来自广东的国资支持的基金和一家来自上海的国资基金。在最新一轮融资之前,壁仞科技的估值约为140亿元。
【点评】壁仞科技获得的巨额融资显示了资本市场对其技术和市场潜力的高度认可。随着AI技术的快速发展,专用AI芯片的需求日益增长,壁仞科技的融资将有助于加速AI芯片的研发和市场推广,推动公司在AI芯片领域的竞争力。
【软件产业】开源AI助手平台Cherry Studio企业版开启公测(2025-06-25)
6月25日,OSCHINA讯,Cherry Studio宣布其企业版已开始公测,这是专为企业打造的私有化AI生产力平台。Cherry Studio是一款支持多个大语言模型服务商的开源桌面客户端,兼容Windows、Mac和Linux系统。企业版相较于社区版,提供了企业集中管理能力、服务端私有化部署等核心差异,旨在为企业提供安全、可控、高效的AI助手服务。
【点评】Cherry Studio企业版的公测,为企业提供了一个安全、可控、高效的私有化AI生产力平台。这有助于企业更好地管理和部署AI应用,推动AI技术在企业内部的落地和应用,加速企业数字化转型。
【软件产业】网易有道开源首个专注数学教育的模型Confucius3(2025-06-24)
6月24日,OSCHINA讯,网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math),这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。Confucius3-Math由网易有道AI团队开发,专门针对K-12数学教育场景进行优化,具有数学任务上的顶尖性能、高性价比的部署方案以及文化与课程体系的深度契合等特点。
【点评】网易有道开源Confucius3-Math模型是数学教育领域的一个重要突破。这一模型的开源将促进教育技术的发展,提高数学教育的效率和质量,同时也展示了网易有道在AI技术应用方面的深入探索和开放合作的态度。
【软件产业】华为自研仓颉编程语言将于7月30日开源(2025-06-23)
6月23日,OSCHINA讯,华为宣布自研的仓颉编程语言将于7月30日开源。仓颉编程语言是一款面向全场景智能的新一代编程语言,主打智能化、全场景、高性能、强安全。它融入鸿蒙生态,为开发者提供良好的编程体验。仓颉编程语言支持多种开发范式和编程模式,包括值类型、类和接口、泛型等特性,支持类型推断,减轻开发者类型标注的负担。同时,仓颉追求编码即安全,通过静态类型系统和自动内存管理,确保程序的类型安全和内存安全。此外,仓颉语言实现了轻量化用户态线程和并发对象库,让高效并发变得轻松。仓颉编译器及运行时从全栈对编译进行优化,提供卓越的性能支持。华为还为仓颉提供了面向应用开发的一系列工具链,进一步提升软件开发体验及效率。
【点评】华为仓颉编程语言的开源是该公司在软件领域的重要举措,展示了其在编程语言设计和开发工具链构建方面的实力。仓颉语言的开源将促进开发者社区的参与和贡献,推动编程语言的发展和创新。同时,这也有助于构建更加开放和协作的技术生态,为开发者提供更多选择和更好的编程体验。
【软件产业】出发层VPD技术试点落地广州白云机场(2025-06-20)
6月20日,极客网讯,近日,广汽传祺联合华为在广州白云国际机场首次实现了“出发层泊车代驾VPD(Valet Parking Driving)”技术试点,这是全球首个机场出发层就能使用VPD的技术试点。该技术通过手机APP简单操作,车便能自主驶入地下停车场,智慧应对闸机通行、会车避让、礼让行人等复杂场景,精准巡航至可用车位,真正实现“下车即走,智享泊车自由”。返程时,通过APP远程启动车辆,设定好上车点,车辆将自主驶离车位,规划最优路径,抵达电梯厅旁的上客区迎接车主,极大提高寻车效率。
【点评】广汽传祺与华为合作的VPD技术试点在广州白云机场的落地,标志着智能驾驶技术在实际应用场景中的又一重要突破。这项技术不仅能够提升机场停车效率,改善旅客出行体验,也为智能驾驶技术在更多复杂环境下的应用提供了宝贵的实践经验。
【软件产业】昆仑万维开源代码Agent模型Skywork-SWE-32B(2025-06-20)
6月20日,OSCHINA讯,昆仑万维开源了其专门为软件工程(SWE)任务设计的代码代理模型Skywork-SWE-32B。据介绍,昆仑万维团队通过构建超过1万个可验证的GitHub仓库任务实例,打造出目前最大规模的可验证GitHub仓库级代码修复的数据集,并系统性验证了大模型在软件工程任务上的数据缩放定律。Skywork-SWE-32B模型在SWE-bench Verified基准上取得38.0% pass@1准确率,刷新Qwen2.5-Coder-32B系列模型在OpenHands代码框架下的最佳成绩。进一步引入测试时扩展技术后,模型表现提升至47.0%的准确率,不仅超越了现有参数规模在32B以下的开源模型,也显著效缩小了与闭源模型之间的性能差距。
【点评】昆仑万维开源的Skywork-SWE-32B模型,体现了公司在大模型技术特别是在软件工程领域的深入探索和积极贡献。该模型的开源将进一步推动软件工程任务中大模型应用的发展,为开发者提供更高效、更智能的代码辅助工具,促进软件行业的技术进步。
【软件产业】开源鸿蒙OpenHarmony 6.0 Beta1发布(2025-06-20)
6月20日,OSCHINA讯,开放原子开源鸿蒙(OpenHarmony)6.0 Beta1版本正式发布。相比5.1.0 Release版本,6.0 Beta1在ArkUI组件能力、分布式数据管理能力、音频引擎等方面进行了增强,提供了更安全、更灵活的组件布局,支持应用对标准化数据进行展示,提升整体运行效率并降低播放时延。此外,还增强了窗口、位置服务、输入法框架、安全等相关能力。
【点评】OpenHarmony 6.0 Beta1版本的发布,标志着开源鸿蒙操作系统在功能和性能上的进一步成熟。新版本的发布将为开发者提供更多的工具和能力,推动OpenHarmony生态的快速发展,为各类智能设备提供更加丰富和强大的应用支持。
【软件产业】阿里云本月将在韩国设立第二座数据中心,加速全球扩张(2025-06-19)
6月19日,IT之家讯,阿里巴巴集团计划于6月底前在韩国建立第二个数据中心,以加速其在全球AI与云计算领域的扩张。这一扩张是阿里巴巴集团今年初公布的总额达3800亿元人民币的AI和云基础设施投资计划的一部分,旨在满足韩国企业对云服务和AI解决方案日益增长的需求。阿里云自2022年起进入韩国市场,首个数据中心设在首尔,目前已为多家AI解决方案商及客户提供服务。阿里巴巴表示,阿里云目前在全球29个地区设有87个可用区,是中国最大的云服务商。同时,其他全球云计算巨头也在韩国扩建基础设施,如SK电讯与亚马逊云服务合作建设AI数据中心。
【点评】阿里巴巴在韩国设立第二个数据中心,标志着其在全球云计算市场的进一步扩张。这一举措不仅展示了阿里巴巴在全球云计算领域的雄心,也反映了韩国作为云计算和AI解决方案需求增长迅速的市场的重要性。随着全球云计算巨头纷纷在韩国投资,预计韩国将成为全球云计算竞争的关键战场之一。
【软件产业】硅基流动完成数亿元A轮融资(2025-06-12)
06月12日,开源中国讯,硅基流动宣布已完成数亿元人民币A轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。硅基流动创始人袁进辉表示,公司通过持续的技术突破和产品创新有效解决了国内AI行业发展的多个重大问题。随着阿里巴巴通义千问Qwen、DeepSeek等开源大模型崛起以及AI推理算力需求激增,公司业务迎来了爆发式增长。硅基流动将继续加大研发投入,积极拓展海内外市场,努力早日成为开发者首选的生成式AI开发平台。
【点评】硅基流动完成数亿元A轮融资,体现了资本市场对其在AI基础设施领域技术创新和市场潜力的认可。随着AI技术的快速发展,硅基流动有望通过其一站式大模型云服务平台SiliconCloud,为更多开发者和企业提供高效、低成本的AI服务,推动AI技术的广泛应用。
【软件产业】美团发布 AI Coding Agent工具“NoCode”(2025-06-11)
06月11日,OSCHINA讯,美团上线了名为“NoCode”的AI Coding Agent工具,用户通过自然语言对话即可生成网页、小程序等应用,并支持实时修改、一键部署。NoCode是一款无需编程背景和经验,通过自然语言和对话形式,即可快速生成应用的平台。可帮助不同角色以“零代码”的方式创建个人提效工具、产品原型、可交互页面等,降低开发门槛,实现创意释放。NoCode功能亮点包括自然语言编程、实时预览效果、局部定位修改和一键部署分享。
【点评】美团推出的“NoCode”工具通过自然语言处理技术降低了编程的门槛,使得非专业开发者也能快速构建应用,这不仅提高了开发效率,也拓宽了软件开发的参与群体。这一创新工具的发布,展示了AI技术在软件开发领域的应用潜力,同时也为创新和快速原型开发提供了新的解决方案。
【软件产业】小米Mi-BRAG获中国信通院可信AI RAG评估最高等级(2025-06-09)
06月09日,开源中国网讯,小米自研智能知识库问答框架—Mi-BRAG顺利通过中国信息通信研究院组织的“可信AI检索增强生成(RAG)”评估,并获当前最高评级4+级。Mi-BRAG是小米大模型团队自主研发的智能知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,支持多场景定制化的智能知识问答技术方案。目前Mi-BRAG已在公司多个场景中落地,包括小爱同学的个人信息问答、汽车问答助手、商品问答等。
【点评】小米Mi-BRAG获得高评级,显示了小米在AI领域的技术实力和创新能力。Mi-BRAG的成功应用不仅提升了小米产品的智能化水平,也为整个AI行业提供了新的解决方案,推动了智能问答技术的发展。
【软件产业】北京AI芯片独角兽奕斯伟拟赴港上市,有望成为“RISC-V 第一股”(2025-06-05)
06月05日,开源中国讯,北京奕斯伟计算技术股份有限公司日前向港交所提交了上市申请书,计划主板上市。奕斯伟由王东升在2019年9月创办于北京,2021年启动RISC-V的AI处理硬件开发计划,2022年启动RISC-V汽车处理硬件开发计划,2023年启动高性能RISC-V研发计划,2024年正式推出RISAA生态技术平台。招股书显示,奕斯伟聚焦智能终端和具身智能两大核心应用场景,正采用新一代RISC-V计算架构,创新领域专用算法及IP模块,构建软硬件平台,为全球客户提供系统级解决方案。截至2024年底,奕斯伟实现100余款系统级解决方案商业化,服务全球100多家客户。奕斯伟透露,本轮IPO所获得的资金将主要用于在智能家居、智能办公、智能便携应用场景、汽车、机器人和工业等领域和场景中开发、迭代新的智能终端解决方案;增强软硬件技术平台能力,完善开放、灵活且可复用研发体系,以及潜在的战略并购、扩大全球化商业网络等。
【点评】奕斯伟作为RISC-V架构的主要推动者之一,其赴港上市有望成为“RISC-V第一股”,这不仅体现了资本市场对RISC-V架构的认可,也预示着RISC-V在AI芯片领域的广阔前景。随着物联网、智能终端等领域的快速发展,RISC-V架构因其开源、灵活的特性,有望在全球芯片市场中占据重要地位。