登录

OpenAI再放大招!全新图像模型即将登场,复杂图表生成能力或迎质变


速读:全新图像模型即将登场,复杂图表生成能力或迎质变2026-04-2108:58·。 京东开源图像模型JoyAI-Image-Edit:达到世界一流水平。
2026-04-21 08:58

人工智能领域的领头羊OpenAI正准备在视觉生成技术上再次发力。据知情人士透露,该公司预计在接下来的几周内推出一款全新的图像模型。

这款即将面世的模型在技术规格上进行了深度优化,尤其是在处理高难度视觉任务方面表现突出。与现有的生成工具相比,新模型最核心的进化在于对复杂图像结构和专业图表的理解与构建能力。

这意味着,过去人工智能在处理多层级逻辑图、高精度统计图表以及细节繁复的视觉构图时存在的短板,可能在新模型中得到针对性解决。业内分析认为,这一进步不仅将提升艺术创作的上限,更有望在商业报告、科研绘图以及精密设计领域展现出更高的实用价值。

目前,OpenAI尚未公开该模型的具体命名或确切的上线日期。但随着发布窗口的临近,外界普遍预期这场视觉生成技术的迭代将再次引发行业对AI创作边界的讨论。对于依赖AI工具进行内容生产的用户而言,这无疑是一个值得持续关注的重要信号。

相关推荐

京东开源图像模型JoyAI-Image-Edit:达到世界一流水平

京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。

​图像编辑模型

​三维空间结构

​京东开源AI

OpenAI女神官宣离职了!曾被誉为GPT-4o之母

那个给GPT-4o注入灵魂的人,走了。

近日,被业内誉为GPT-4o之母”的OpenAI高管Joanne Jang在X平台正式发文,宣布结束其在公司长达4年半的职业生涯。

作为赋予ChatGPT灵魂的关键人物,她的离去无疑为这家AI巨头的IPO之路蒙上了一层阴影。

据悉,Joanne Jang斯坦福大学应用数学与计算机科学双学士学位,计算机科学硕士学位。

她加入OpenAI时,该公司还只是一个不到200人的研究实验室

​OpenAI高管离职

​乔安妮·张职业生涯

​GPT-4研发参与

微算法科技(NASDAQ: MLGO)区块链水印方案:守护压缩感知图像的全维度安全

MicroAlgo(NASDAQ: MLGO)融合多媒体水印、压缩感知、星际文件系统与区块链技术,打造专属区块链水印方案,为压缩感知图像构建全方位安全防护体系。该方案通过压缩感知实现图像数据压缩与天然保密性,借助水印技术确保图像可靠认证与完整性,利用IPFS完成分布式安全存储,并结合区块链的去中心化与不可篡改特性实现全流程溯源与验证,最终达成压缩感知图像大数据隐私、完整、可用的全维度安全保护。

​区块链技术

​压缩感知图像

​数字内容安全

腾讯混元3D世界模型2.0发布 一句话生成3D资产

今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。

官方表示,该模型一句话就能生成3D资产,并直接导入到游戏制作或具身仿真引擎,实现真正的可玩、可用。

具体来说,用户完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。

随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的�

​腾讯混元3D模型

​3D资产生成

​游戏引擎导入

荐 安利一个11万Star的必装插件,能让你的Agent体验直接质变。

​最近一直在聊Agent、聊Vibe Coding。

但是在给越来越多的朋友安利的时候,发现其实,一直有一个问题被忽略了。

就是,真正卡住大多数人的,是自己没有一个标准的工作流程。

特别在创造一个你想要的软件或者程序的时候,没有标准流程,其实是一件非常可怕的事情。

所以,我想给大家分享一个我自己在vibe coding的时候,一直在用的一个超好用的帮我提高Coding体验的一个

​工作流程

​vibe

​coding

悦享控股(CHR.US)旗下悦灵犀AI推出全新翻译功能+全局AI助手能力强化

2026年4月14日,悦享控股宣布旗下悦灵犀发布3.1.0版本,重点围绕AI能力普惠化与全场景创作协同进行升级。本次更新推出强大的多模态AI翻译功能,覆盖实时翻译、面对面互译、文本翻译及图片翻译,通过端到端语音识别与合成技术实现自然流畅的跨语言交流体验。同时,全新AI助手基于大模型驱动,结合AI Agent能力,支持从需求表达到结果生成的智能协作流程,标志着产品从AI工具向AI协作系统的升级。

​悦灵犀3.1.0

​多模态AI翻译

​AI能力普惠化

谷歌Gemini再升级!解锁新玩法:输入提示词即可生成交互式3D模型

近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。

这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。

例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。

​三维动态模型

​实时仿真运算

​交互操作

B站偷偷憋了个大招:AI创作工具updream开启内测 三大核心能力

近日,B站自研AI创作工具updream正式开启内测,成为内容创作领域的又一重磅动作。

这款工具面向B站广大 UP 主设计,主打轻量化、智能化创作体验,界面简洁易上手,降低普通用户的创作门槛。

updream 目前采取定向邀请内测模式,创作者需通过问卷申请筛选,才能获得使用权限。

该产品具备三大核心能力:

第一大核心能力是灵感生成与内容构思,帮助创作者快速找到选题�

勇摘四个第一、六大奖项!智身科技人形+四足双阵容验证全栈技术能力

4月19日,2026北京亦庄人形机器人半程马拉松暨机器人勇士挑战赛鸣枪开赛。作为全球规模最大、工况最复杂的具身智能极限赛事,本次赛事堪称行业技术天花板级试炼。智身科技携人形机器人破风者RX、四足机器人铜锤系列双阵容出征,成为唯一参与勇士挑战赛全部三项赛事的队伍。旗下铜锤M1一举狂揽六个奖项,斩获四足机器人自主导航、奖项数、总分、速度四项第一。面对行业公认的高难度赛道,智身科技交出三大碾压级答卷:一是刷新行业纪录的研发效率,仅耗时2个多月完成机器人从立项到赛道适配的全流程;二是奖项、总分、速度三个第一的技术硬实力,展现技术和服务的双价值;三是量产验证的商业化底气,真正实现“赛场即考场,技术即产品”。此次双赛道亮剑,不仅展现了中国具身智能的全栈自研硬实力,更为行业技术规模化落地树立了全新标杆。

主题:模型|图像模型