您现在的位置是:首页 > 生活 > 正文
幻觉生成模型研究提升人工智能的可靠性
发布时间:2024-06-21 11:21:51劳伯晨来源:
导读 牛津大学的研究人员在确保生成人工智能(AI)产生的信息的稳健性和可靠性方面取得了重大进展。在《自然》杂志上发表的一项新研究中,他们展示
牛津大学的研究人员在确保生成人工智能(AI)产生的信息的稳健性和可靠性方面取得了重大进展。
在《自然》杂志上发表的一项新研究中,他们展示了一种新方法来检测大型语言模型(LLM)何时可能“产生幻觉”(即发明听起来合理但却是虚构的事实)。
这一进步可能为在法律或医学问答等“粗心大意的错误”代价高昂的场合部署法学硕士学位开辟新的途径。
研究人员重点研究了幻觉,即法学硕士每次被问到问题时都会给出不同的答案——即使措辞相同——这种现象被称为虚构。
牛津大学计算机科学系的这项研究的作者塞巴斯蒂安·法夸尔博士说:“法学硕士很擅长用许多不同的方式来表达同一件事,这使得我们很难分辨他们什么时候对答案有把握,什么时候只是在编造一些东西。”
“使用以前的方法,无法区分模型不确定要说什么和不确定如何说。但我们的新方法克服了这个问题。”
为此,研究团队开发了一种以统计学为基础的方法,使用基于多个输出之间的变化量(以熵为衡量标准)来估计不确定性的方法。
他们的方法在意义层面而非词序层面计算不确定性,也就是说,它可以发现 LLM 何时不确定答案的实际意义,而不仅仅是措辞。为此,LLM 产生的概率(表示每个单词在句子中出现的可能性)被转化为意义概率。
经过针对六个开源 LLM(包括 GPT-4 和 LLaMA 2)的测试,新方法被证明比所有以前的方法更能准确地发现问题何时可能被错误回答。
标签:
猜你喜欢
- 教授计算出保持啤酒杯冰凉的最佳玻璃形状
- 光学放大器和记录敏感接收器为更快的空间通信铺平了道路
- 科学家探索在非酒精饮料中模仿啤酒和葡萄酒的气味
- 气候变化对北极物种相互作用的影响
- 土壤pH值如何影响油菜中破坏性真菌的生长
- 研究人员利用机器学习来识别杀珊瑚的疑似病原体
- 软件工具连接2D和3D助力零浪费时装设计
- 认识MobiPrint可以立即升级你的家居的智能3D打印机
- 制备过程产生药蘑菇中的蕈碱如何产生性
- 花朵中发现的天然化合物可抑制与多发性硬化症和癌症有关的酶的活性
- 条纹光度立体法提高了3D表面测量的速度和准确性
- 哺乳动物化石揭示了更新世期间南欧生态系统的变化
- 新开发的方法打破分子对称性支持生命起源理论
- 海洋涡流将极热和极冷输送到充满生命的深海
- 微塑料污染无处不在甚至在海豚呼出的气体中
- 物理学家在随机相互作用的自旋模型中发现普遍的非平衡量子动力学
- 光遗传学方法显示植物保卫细胞可以计数环境刺激以适应水消耗
- 研究人员开发出锂离子电池高容量正极材料并获得专利
- 研究人员利用生成式人工智能保护广东瓷器艺术和遗产
- 开创性的河流修复工程宣告成功
最新文章
- 菲亚特公司
- 高德打车
- 鄂是哪个省
- 奥迪是哪国的品牌
- crv油耗
- 三手车和二手车的价格
- 油箱进水
- 这是运动型本田思域Si的到来时间
- 迈凯轮720S基本上是一款中置发动机轿跑车
- 2023年日产探路者岩溪透露
- 起亚计划对 K5 进行大幅改款
- 标普全球评级将日产汽车的信用评级下调至垃圾级
- 全固态锂离子电池被视为富有前景
- 起亚官方发布了EV9的最新预告实拍
- 雷诺 Austral 将获得一款时尚的双门轿跑车版
- 宝马集团钦奈工厂完成15年
- Android Auto 9.1 现已可供下载 但有一些神秘的变化
- JayLeno的Austin-Healey是终极的裸机驾驶体验
- 吉利星瑞1.5T扶摇版将于6月18日正式上市
- 下一辆日产Z车将被称为400Z
- 大众途观改款预告片暗示新的动态设计
- 2023年本田思域Type R被揭晓
- 这是法拉利令人印象深刻的赛道日活动中发生的事情
- 目前各大汽车制造商生产的最快的汽车