登录

模型


描述

模型是免费的,但运行的硬件可不免费啊。
文章

而对于较小的模型,指令调优的方法虽然在原始GSM8K测试中能显著提高性能,但在组合GSM测试中的提升则微乎其微。
文章

分类

模型

DeepMind新机器学习模型UniSim:模拟现实以训练机器人和游戏角色
文章

UniSim机器学习模型AI头条
文章

谷歌DeepMind的研究人员与加州大学伯克利分校、麻省理工学院和阿尔伯塔大学合作开发了一个名为UniSim的机器学习模型,可以为训练各种人工智能系统创建真实的模拟。
文章

研究人员设计机器学习模型以更好地预测青少年自杀和自残风险
文章

Airbnb的研究人员开发了Chronon,这是一个用于开发机器学习模型的生产级特征的框架。
文章

除了Llama-3.1-Nemotron-70B-Instruct之外,英伟达还开源了另一个Llama-3.1-Nemotron-70B-Reward模型
文章

到2018年,研究团队利用这一标准智能体模型,建立了通用智能水平的测量标准,首次对谷歌、百度、Siri等AI系统和不同年龄段的人类进行了智力测试。
文章

早在2014年,在中国科学院石勇教授的指导和支持下,研究团队就为了评估人类、搜索引擎、智能助理、机器人和智能设备的智能水平,发表论文建立「标准智能体模型」,这个模型借鉴了冯诺依曼架构,并结合自然界生物(包括人类)的智能特征,提出任何智能体都是具备信息输入(In)、输出(Out)、存储(St)、创造(Cr),以及对这四种能力的使用进行控制(Con)的系统。
文章

标准智能体模型是一条基础公理,为智能体提供了一个统一的结构和功能框架,奠定了欧米伽理论的基石。
文章

欧米伽理论由三个核心模型组成:标准智能体模型、智能体演化通用模型和智能宇宙演化模型
文章

一、现有序列建模模型的困境
文章

尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。
文章

尽管MM1.5模型在多项基准测试中取得了优秀表现,苹果团队仍计划通过进一步融合文本、图像和用户交互数据,设计更复杂的架构,来提升模型对移动设备UI的理解能力,加强“苹果牌”AI
文章

所以,其实很久之前,就有朋友问我,有没有那种一站式的集合体,能调用所有AI视频模型的,省点钱,现在本来就不咋赚钱,这真的氪不起了。
文章

美国财经电视频道CNBC引用李开复的话说,中国顶尖企业的大型语言模型大约落后美国同行6到9个月,而不太先进的中国模型可能落后美国大约15个月。
文章

“我预测,到明年初,应用程序在中国的普及速度将比美国快得多,”李开复说,并指出训练良好的人工智能模型的成本已大幅下降。
文章

中国一位科技大咖周三(9月11日)表示,中国在人工智能模型方面可能比美国至少落后半年,但在人工智能程序方面,中国追赶的速度可能会很快。
文章

李开复认为目前中国的人工智能模型可能比美国开发的模型落后至少半年,但中国的人工智能应用程序发展可能会走的更快。
文章

他们最终得出结论:这个通用的“跷跷板”模型是一个不受地域、种族和病种限制的人类核心菌群模型
文章

“跷跷板”模型图示
文章

“跷跷板”模型图示。
文章

这篇文章分两部分,我先简单谈谈同声传译这个行业,然后再来谈谈OpenAI发布的gpt-4o模型
文章

OpenAI发布了gpt-4o模型
文章

最绝的是,gpt-4o模型能够做到实时与人类交互。
文章

这里有个最关键的点,gpt-4o模型能理解并表现出人类的情感。
文章

然后将给出一个MDP公式,用于将原生CoT整合进LLM(进而得到类似o1的推理模型);
文章

单个GPU就能运行,机器学习模型推理速度提高11倍
文章

研究小组使用探针对一种神经元细胞系(neuroncellline)进行成像,这种细胞系可以通过皮质酮(corticosterone)的管理制成抑郁症的模型
文章

这些影像学研究表明,抑郁症模型中的血清素水平并不是主要因素。
文章

换句话说,我们需要在创建超人类模型之前学习如何对齐它们。
文章

简单地说,就像我们今天调整我们的前沿模型一样,超对齐是指导未来超人类模型的行动。
文章

超人类模型是指远远超过人类能力的模型
文章

使超人类模型受到较弱模型的影响而失去能力
文章

因此,我们可以得出结论,该方法显示了一些令人鼓舞的结果,但也清楚地表明,我们目前最好的对齐方法并不是对齐超人类模型的完全成熟的答案。
文章

在这种情况下,你猜对了,GPT-2正在扮演人类的角色,一个客观上处于劣势的人,试图告诉一个它甚至无法理解的超人类模型,如何表现。
文章

我们如何确保在引导具有弱监督信号的超人类模型的同时,仍能激发它们的超人类行为?
文章

由于通用的超人类模型目前还不存在,我们没有办法使用它们来找出如何最好地调整它们。
文章

简而言之,人类还没有找到一种方法来确保PGR的结果是1(如果这种方法存在的话),或者非常明确地说,我们目前还没有准备好调整一个超人类模型
文章

通俗地说,我们的目标是训练超人类模型按照预期行事,同时不强迫它像低等生物那样行事,从而使它变得愚蠢。
文章

数字孪生模型是物理对象的数字镜像,其拥有独立的生命周期,可以自演进、自进化,数字孪生系统则包含了数字孪生模型、物理实体、虚实连接、反向控制等综合一体的复杂大系统;
文章

在2020年,研究团队发表论文提出标准智能体模型存在三种典型状态,这些状态在定义智能与意识,以及分析物理学中的一些关键问题时具有基础性作用:
文章

OpenWebUI官网体验入口LLMs机器学习模型Web用户界面免费搭建方法指南教程
文章

TeachableMachine是一个由Google开发的机器学习工具,它允许用户快速、简单地创建自己的机器学习模型无需专业知识或编程技能。
文章

谷歌开发机器学习工具TeachableMachine允许用户快速创建机器学习模型
文章

2020年,谷歌旗下“深层思维”公司的德米斯·哈萨比斯和约翰·江珀提出名为“阿尔法折叠2”的人工智能模型
文章

此前,模型蒸馏是一个多步骤、易出错的过程,需要开发人员在互不关联的工具中手动协调多个操作,从生成数据集到微调模型和评估性能。
文章

苹果的「Ferret」是一种新的开源多模态机器学习模型
文章

与1986年4月的切尔诺贝利灾难相比,人类并没有创造一个超人类模型的特权,当试图引导它的行为时,得到一个“不伟大,也不可怕”的结果。
文章

Hallo2模型建立在latentdiffusionmodels的基础上,并引入了一系列创新性的技术,包括:
文章

Hallo2模型的发布标志着AI人物动画生成技术迈上了一个新的台阶。
文章

Hallo2模型的强大性能已经在多个公开数据集上得到了验证,包括HDTF、CelebV以及研究人员自己创建的“Wild”数据集。
文章

PGv3模型架构
文章

用户偏好研究表明,PGv3模型在常见的设计应用中,如表情包(stickers)、海报和logo设计,具有超越人类的图形设计能力,还能够精确控制RGB颜色和多语言理解。
文章

OpenAI再次引领人工智能技术潮流,推出了全新的gpt-4o-audio-preview模型
文章

作者认为,o1模型以往LLM很大不同在于,前者被训练成为近似「推理器」,而后者粗略视为「检索器」。
文章

由此,o1模型在成本、推理时间、保证、性能权衡上,仅是一种粗粒度的评估选择。
文章

对ChatGPT源代码的检查,以及微软使用OpenAI技术构建的人工智能模型的审查,是针对这两家公司版权侵权诉讼的关键。
文章

那以后,人类又取得了一个里程碑式的成就,创造了第一个通用的人工智能模型,比如ChatGPT。
文章

有趣的是,到2024年,我们可能会看到两个世界发生碰撞,第一个通用型超人类模型的出现。
文章

在准确率、压缩比和搜索成本效率方面,权值回放LTH网络是目前性能最优的对初始网络进行剪枝的模型
文章

通过优化数据处理方法和模型架构,即使是较小规模的模型也能实现强大的性能,这对于在资源受限的设备上部署高性能AI模型具有重要意义。
文章

PGv3采用了DiT风格的模型结构,图像模型中的每个Transformer块都设置得与语言模型(Llama3-8B)中的对应块相同,仅包含一个注意力层和一个前馈层,参数也相同,如隐藏维度大小、注意力头的数量和注意力头的维度,并且只训练了图像模型部分。
文章

Transformer模型中的每层捕捉到的表示不同,包含不同级别的单词级和句子级信息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦,特别是使用解码器风格的大型语言模型时,具有更复杂的内部表示。
文章

【新智元导读】PlaygroundResearch推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。
文章

一种新型的评估方法是基于问题的指标,从描述中生成问题,并使用这些问题评估所提出的描述,有助于全面评估文本到图像模型
文章

OpenAI声称,草莓o1已经突破了自回归LLM常规限制,成为一种新型的「大推理模型」(LRM)。
文章

【新智元导读】LLM不会规划,大推理模型o1可以吗?
文章

由此,o1发布之后,研究人员对其与普通的LLM进行了区分,并将o1称为「大推理模型」。
文章

东西

然后,需要单独训练一个非常好的开源模型作为检索器,作为将上下文输入到这些更大模型的东西。
文章

与小模型

协同进化:大模型与小模型共绘AI融合之路
文章

在人工智能的世界里,大模型与小模型是两种截然不同的存在。
文章

模型与小模型:双星闪耀
文章

如果说人工智能是浩瀚的星河,那大模型与小模型就犹如两颗璀璨的星辰,各自散发着独特的光芒。
文章

o1-preview

9月13日,OpenAI发布新一代大模型o1-preview。
文章

o1

并且仅次于OpenAI最新模型o1。
文章

今天(9月24日)凌晨,随着OpenAI新一代人工智能大模型o1的推出而变得异常活跃的首席执行官山姆奥特曼,破天荒发布长文《智能时代》,并兴奋地写道:深度学习生效了!
文章

根据测试数据显示,这个模型已经击败GPT-4o、GPT-4turbo、Gemma-2、Gemini-1.5、Claude-3.5sonnet等140多个开闭源模型,仅次于OpenAI发布的最新模型o1。
文章

Yi-Lightning

李开复透露:一次训练成本超2000万2024年10月17日16:29快科技快科技10月17日消息,日前李开复的零一万物公司,正式对外发布了新旗舰模型Yi-Lightning。
文章

零一万物新旗舰模型Yi-Lightning超越GPT-4o,李开复详解背后原因2024年10月16日16:42TechWeb【TechWeb】10月16日消息,在辟谣“不做大模型预训练”后,今天零一万物CEO李开复正式发布最新旗舰模型Yi-Lightning。
文章

新旗舰模型Yi-Lightning强在哪儿?
文章

此次,零一万物最强大模型Yi-Lightning的API定价为每百万token仅需0.99元。
文章

继上半年千亿参数模型Yi-Large之后,这次零一万物发布的最新旗舰模型Yi-Lightning在国际权威盲测榜单LMSYS上超越GPT-4o-2024-05-13、Claude3.5Sonnet,排名世界第六,中国第一。
文章

MM1.5

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力2024年10月13日10:22快科技快科技10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。
文章

MM1

苹果公司最近为其多模态人工智能模型MM1推出了重大更新,将其升级为MM1.5版本。
文章

苹果多模态模型MM1升级为MM1.5;
文章

Flux1.1Pro

最近,德国的人工智能初创公司黑森林实验室(BlackForestLabs)推出了最新的图像生成模型Flux1.1Pro。
文章