最新最快汽车新闻
太阳能光伏网

研究人员推出框架KnowHalu 检测大语言模型生成文本中的"幻觉"

大型语言模型(LLM)是基于人工智能的先进对话系统,可以回答用户查询并按照人类指令生成文本。OpenAI开发的高性能模型ChatGPT出现后,这些模型变得越来越受欢迎,并且越来越多的公司开始投资并开发。

尽管承诺实时回答人类问题并为特定目的创建文本,但LLM有时会生成无意义、不准确或不相关的文本,这些文本与人类用户提供给他们的提示不同。这种现象通常与用于训练模型的数据的局限性或其潜在推理中的错误有关,被称为LLM“幻觉”。

据外媒报道,伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)研究人员最近推出一个用于检测LLM生成文本中的幻觉的框架KnowHalu。据悉,相关论文已上传在arXiv网站,介绍称可以帮助提高这些模型的可靠性,并简化完成各种文本生成任务的使用。

“随着LLM的不断进步,幻觉成为阻碍其在现实世界更广泛应用的一个关键障碍,”该项目顾问Bo Li表示。“尽管大量研究已经解决了LLM的幻觉,但现有的方法往往无法有效利用现实世界的知识或利用效率低下。受这一差距的启发,我们为LLM开发了一种新颖的多形式基于知识的幻觉检测框架。此外,我们还发现,当前有关非制造幻觉的研究存在差距:事实正确但与查询无关或不特定的响应”。”

最新相关

特斯拉FSD累计行驶里程突破84亿英里

截至2026年3月3日,特斯拉官方安全页面数据显示,其全自动驾驶系统(监督版)(FSD Supervised)累计行驶里程已超过84亿英里。该数据由特斯拉实时更新,用于追踪FSD(监督版)及其他主动安全技术的运行...

BBA集体"向北"

BBA集体"向北"

2026年2月的最后一周,德国总理默茨率经济代表团访华的行程,意外成为全球汽车产业观察中德技术权力更迭的一个微观窗口。在北京,默茨坐进新一代奔驰S级的后排,亲自体验了一套由奔驰与中国科技公...

小马智行第七代Robotaxi,在深圳盈利了

小马智行第七代Robotaxi,在深圳盈利了

3月2日,小马智行正式宣布,其第七代Robotaxi于2026年2月在深圳实现月度单车运营盈利转正。这是自动驾驶行业多年积累之后一次具有标志性意义的突破。早在2025年11月,小马智行已率先在广州完成同...

均胜电子 L3/L4 智驾域控迎量产节点

近日,均胜电子发布公告称,公司在高阶智能驾驶领域取得关键突破,首款L3级智能驾驶域控制器与基于国产芯片平台的L4级智驾域控产品均明确量产计划,将分别落地乘用车型与低速无人物流场景。根据规...