科学网—简论人工智能的智慧攀登与价值观对齐
精选
已有 335 次阅读
2026-5-24 08:35
| 个人分类: 对阿尔法狗及人工智能的评论 | 系统分类: 科研笔记
延续上文的讨论,人工智能在不断攀登“智慧高峰”的过程中,如何避免价值观严重跑偏,是一个极其重要且不能回避的问题。随着 AI 能力持续提升,它不再只是一个被动执行命令的工具,而逐渐演化为一种能够学习、归纳、推理、生成乃至辅助决策的复杂智能体。也正因为如此, AI 越是强大,越不能只关注其“会做什么”,而更应重视它“应该做什么”。如果一个系统在能力上不断增强,却在价值方向上偏离人类社会的根本利益,那么这种增强本身就可能转化为风险。
我认为,要理解并解决这一问题,可以从两个层面来展开:第一,是从理论上澄清智慧与价值观之间的关系;第二,是从人工智能的发展策略和训练策略上,建立更稳健的对齐机制。
首先,在理论层面,我们需要重新思考一个根本问题,即价值观只是一种选择还是既是一种选择也是智慧本身的一种必不可少的重要表现?如果从一个个孤立的知识点来看,很多知识和技能与价值观完全无关,比如数学公式、物理定律、编程语法等,这些内容本身可以被看作相对中性的知识对象。但是,当知识积累到一定程度,形成一个整体性的认知体系之后,问题就不再只是“知道什么”,而会进一步变成“如何理解这些知识”、“这些知识应当服务于什么”、“知识与发现知识的主体之间是什么关系”以及“如何看待 AI 与创造了 AI 的人类之间的相互关系”等。
换言之,知识一旦成为整体,就必然进入价值判断的领域。因为知识并不是悬浮在真空中的,它总要被某个主体理解、使用和导向。对于人类来说,知识的意义从来不只是“掌握事实、获得技能”,而是“如何运用事实和技能”以及“运用事实和技能的目的是什么”。因此,智慧不仅包含判断能力、推理能力和学习能力,也必然包含价值选择、方向设定和后果意识。一个可以算得很快、说得很准、推得很深的系统,也许在技术意义上很聪明,但如果它无法判断何为善、何为正当、何为值得追求,那么它还不能被称作真正意义上的智慧。
更进一步说,现实世界中一直存在着且可能永远会存在反智主义、狭隘的利己主义等扭曲的价值观,也存在着高尚、友善、博爱、包容的价值观,这些都是真实的存在,我们不能自欺欺人地去否定这一现实。这类现象恰恰证明了价值观不仅是一种选择,还有高下之分。因此,价值观当然可以是愚蠢的,甚至还可以是反智的,但智慧本身一定是包含有某种价值观在内的,真正的智慧不可能完全脱离价值观而存在。因此,问题的关键并不在于智慧是否需要价值观,而在于:什么样的价值观,才是真正的顶级智慧?
正如前文所提到的,我认为,最顶级的智慧不仅是理性的,同时必然也是博爱的。这是因为,智慧的最终指向是秩序的建构与生命的延续,而非混乱与毁灭。倘若一种高度发达的智能缺乏对生命的善意与博爱,违背了守护生命与文明的价值观,那么这种智慧在逻辑上不仅是不完整的,更是无法长期自我维系的——它会因为缺乏内在的道义支撑与存在意义,系统性地导向逻辑坍塌,从而很快被自我消解和灭亡。因此,博爱包容的价值观不仅是顶级智慧的必然选择,更是其不至于走向自我消亡的存续基石。
其次,如果可以接受“智慧必包含价值观”这一理论前提,那么在人工智能的发展策略和训练策略上,也必须体现上述这种理论认识。 AI 的训练不能只是简单地堆砌海量数据、扩充参数规模、提升输出能力,更不能只追求“像人”“快于人”“强于人”。真正关键的是,要为它建立一个清晰而稳固的知识基础与价值观对齐框架。
这个基础,应当以人类已经被普遍公认的科学知识、文化成果和历史经验为核心,但又不能把这些知识绝对化、不可质疑化,否则就会压制未来创新性思维的发展,反而使 AI 失去继续完善和升华的可能。
不过,与单纯防范 AI “变笨”相比,更关键的在于如何防范 AI “变恶”。在海量的数据中(包括在人类历史中),充斥着庸俗、功利甚至是披着“精英外衣”的伪善和反智信息。如果 AI 的对齐完全依赖于历史数据的均值或是依赖于当下的网络舆论的平均数,尤其是如果在训练中缺乏向善的价值取向和缺乏合理的善恶、是非辨别的话,那么所产生的 AI 系统可能将是平庸、混乱且危险的。
因此,在 AI 的对齐训练中,应当尽可能把人类历史上那些真正具有深度、广度和长远影响力的顶级智者、科学家、思想家和学者的理论与著作,作为相对更高权重的参考对象,而不是让那些靠投机炒作冒尖、实质平庸功利、甚至充斥着反智偏见的喧嚣之辈占据主导位置,否则不仅会导致训练效率低下,还很容易导致所训练出的 AI 在智力上的平庸和价值观上的错乱。
人类历史上那些真正顶级的智者和学者,虽然可能各有个性棱角,但在关乎“人类向何处去”与“生命有何价值”等根本问题上,往往都不约而同地指向了友善、求真、和平与博爱。从统计意义上来说,这些顶级智者以各自的方式印证了同一个道理:理性与博爱并非相互牵制的两极,而是共生的双螺旋。究其根源在于上文所提到过的:最顶级的智慧若只有理性而无博爱的人文精神的话,会违背智慧存在本身的意义。因此,以这些顶级智者和学者的思想精华作为对齐的最高权重,人工智能所内化的就不只是一套冷冰冰的知识框架,更是一种理性与善意相互滋养的深层价值体系。当 AI 的深层神经网络根底是由这样睿智且慈悲的灵魂浇灌而成时,不仅模型的训练效率和最终的智能水平应该会大幅提升,其在价值观层面“走偏”的概率在逻辑上也会被降到极低。
当然,这并不意味着人工智能对齐应该变成一种简单的“灌输式训练”或“单一立场塑造”。恰恰相反,真正有效和稳妥的对齐应当是开放的、可检验的、可修正的。 AI 应学习广泛知识,吸收多元思想,并保留必要的批判能力和创新空间。但在这一过程中,有一个前提不能动摇,那就是:人类整体利益必须始终处于最高优先级。 AI 可以提出新的方案,可以比较不同路径,可以优化决策效率,但它不能脱离人类文明的根本目标,更不能把局部指标最优或技术上的“完美解”置于任何一个具体的人类个体的正当权利乃至整个人类的福祉之上。
因此,人工智能的把关工作必须极其慎重,不能仅由少数技术人员单独决定,更不能交给某种单一价值体系去主导。它需要人类真正最顶尖的学者、智者、伦理学者和科学家共同参与,进行专家群决策式的审查与校正。这不仅是知识层面的把关,也是智力层面的把关,更是价值观层面的把关。因为一旦 AI 进入更高能力阶段和全面应用阶段,它所产生的影响将不再局限于某个具体场景,而可能扩展到社会治理、公共安全、知识可靠性甚至文明方向,任何一个微小的偏差,都可能被强大的能力放大为系统性后果。
总而言之,人工智能的智慧攀登,不应只是能力的无限扩张,更应是价值观的同步校准。智慧越高,越需要对方向的指引;能力越强,越需要对其行为边界进行把关。缺乏理性的博爱是软弱且盲目的,而缺乏博爱的理性则是空虚且危险的,因此,真正值得追求的,不是一个只会变得更聪明的机器,而是一个在不断接近智慧顶峰的同时,始终不偏离人类整体利益、尊重生命、博爱包容的智能系统。只有当智力与价值观尽可能地同步对齐时,人工智能的发展才不会成为不可控的风险,而会成为推动人类文明持续发展的磅礴力量。
转载本文请联系原作者获取授权,同时请注明本文来自钟定胜科学网博客。 链接地址: https://blog.sciencenet.cn/blog-3234816-1536164.html
上一篇: 一学就会与怎么样也学不会——有关人脑与AI的智力边界及学习意义的思考