AI聊天机器人面临持续的幻觉问题,影响其可靠性

来自OpenAI和谷歌等领先科技公司的人工智能聊天机器人在近期几个月内不断进行推理能力的提升,旨在增强回答的可靠性。然而,最新测试显示一些新型模型的表现甚至不如早期版本,表现出一种被称作“幻觉”的现象——即机器人生成虚假信息或提供虽然事实正确但与问题无关或不符合指令的答案。这一问题自大型语言模型(LLMs)如OpenAI的ChatGPT和谷歌的Gemini问世以来就一直存在,并且似乎难以彻底解决。 一份OpenAI的技术报告显示,2024年4月发布的o3和o4-mini模型的“幻觉”率明显高于较早的o1模型:o3的幻觉率为33%,o4-mini为48%,而o1的幻觉率仅为16%,当时用于总结公开事实。同样,Vectara在其排行榜中追踪到众多推理模型——包括DeepSeek-R1——的幻觉发生率显著高于前辈,尽管这些模型在回答前都采用了多步推理。 OpenAI坚持认为,推理过程本身并不一定是幻觉增加的原因,并积极研究减少所有模型幻觉的方法。幻觉持续存在,威胁到多个应用场景:频繁产生虚假信息的模型阻碍科研辅助;引用不存在的案例的律师助理机器人可能引发法律错误;信息过时的客服机器人造成运营问题。 起初,AI公司曾预测随着模型更新,幻觉现象会逐渐减少,早期模型的改善支持了这一预期。但近期更高的幻觉率挑战了这种观点,无论推理是否涉及。Vectara的排行榜显示,OpenAI和谷歌的推理模型与非推理模型的幻觉率大致相当,尽管具体数字的重要性不如相对排名。谷歌对此未作评论。 然而,这些排名也存在局限。它们混合了不同类型的幻觉,例如DeepSeek-R1的14. 3%的幻觉率主要由“良性”案例组成——答案在逻辑上合理且有知识支持,但未出现在源文本中。此外,仅基于文本总结的测试可能无法反映在其他任务中的幻觉频率,因为LLMs并非专门为总结任务设计。华盛顿大学的Emily Bender强调,这些模型主要预测可能的下一个词,而非通过处理信息真正理解文本,因此“幻觉”这个词本身具有误导性且带有人类化色彩。 Bender批评“幻觉”一词的问题在于,它暗示错误是系统正常运行中的异常,且赋予AI人类般的认知能力,实际上AI根本不具有“感知”。普林斯顿大学的Arvind Narayanan补充说,模型还会因为依赖不可靠或过时的数据而出错,而仅仅增加训练数据或计算能力并没有解决这些问题。 因此,错误多发的AI可能会成为一个持久的现实。Narayanan建议,只有在核实事实比自己进行原始研究更快时才应使用此类模型;而Bender则建议完全避免依赖AI聊天机器人提供事实信息。
Brief news summary
近期由OpenAI和谷歌等公司在人工智能聊天机器人方面取得的进展,主要集中在提升推理能力和准确性,但反而导致了幻觉率的增加——即模型生成虚假或误导性信息,以及未能正确遵循指令的情况。例如,OpenAI较新的o3和o4-mini模型的幻觉率分别为33%和48%,而较早的o1模型为16%,在DeepSeek-R1等模型中也表现出类似趋势。尽管存在这些挑战,OpenAI坚持认为推理模块并非问题所在,并继续努力减少幻觉发生。这个问题在科研、法律咨询和客户服务等领域尤为重要,因为错误信息可能带来严重后果。Vectara的评估显示,推理模型与非推理模型在幻觉频率方面差异很小,但数据仍然有限。专家警告称,“幻觉”这一说法过于简化了涉及依赖过时或不可靠数据的复杂问题。鉴于持续存在的错误,一些人建议将人工智能聊天机器人的使用限制在信息验证比独立核查更为简单的场景中。总体而言,幻觉仍然是人工智能语言模型中一个未解决的主要问题。
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

彭博社:Robinhood 正在开发基于区块链的计划在欧洲交易美国证券
据两位熟悉情况的消息人士向彭博社透露,Robinhood 正在开发一个基于区块链的平台,旨在为欧洲交易者提供访问美国金融资产的渠道。 据报道,该新平台正考虑使用三种区块链技术——Arbitrum (ARB)、以太坊 (ETH) 和 Solana (SOL),并将与一家数字资产公司合作开发。 代币化资产已成为传统金融机构寻求进一步扩展加密领域的关键焦点。已有多家公司推出了代币化基金,一些分析师预测到2033年市场规模将达到23

OpenAI 发布 o3-mini:快速、智能、经济实惠的人工智能模型
OpenAI发布了o3-mini,这是一款专为提升数学计算、编码任务和科学问题解决中准确性而设计的人工智能推理模型。该模型在AI技术方面取得了重要的突破,强调可靠和精确的输出,同时保持高效性和经济性。与一些早期的AI模型可能优先考虑性能而牺牲成本或速度不同,o3-mini在这方面实现了谨慎的平衡,能够快速响应,且既准确又经济。 o3-mini的设计比前代产品更快,用户可以快速获得答案而不影响回答的质量。OpenAI强调,该模型在生成最终结果之前采用了先进的事实核查机制,极大程度上降低了错误或虚假信息的可能性——这一点对于数学、编程和科学等需要高精度的领域尤为重要。 o3-mini的一个关键优势是其在ChatGPT和OpenAI的API等主流平台上的可用性。这种便捷性使其对个人用户和开发者都具有很强的吸引力。此外,OpenAI还提供了可调节的设置,让用户根据个人需求调整模型的推理程度,兼顾响应速度和深度分析。 虽然它不是OpenAI旗下最强大的AI模型,但o3-mini仍然是一个具有竞争力的替代选择,性能与在类似领域表现出色的DeepSeek R1模型接近。OpenAI的策略是以负担得起的价格提供足够智能和安全的模型,这使得它成为预算有限的用户和组织的理想选择。 为了促进使用,OpenAI为付费ChatGPT订阅用户提供更高的使用额度,扩展了对o3-mini的访问权限。此外,寻求在应用中嵌入高级推理功能的开发者,也可以通过OpenAI的API使用该模型,确保其具有广泛的兼容性和不同技术环境下的集成能力。 o3-mini的推出标志着AI推理民主化的重要一步。通过专注于速度、成本和准确性之间的平衡,OpenAI正努力让更广泛的用户能够使用到先进的AI工具。这一发展支持了持续使智能、安全的AI技术变得实用和可用的努力,惠及各行各业。 总之,o3-mini的问世为个人和组织提供了一个高效、精准的AI推理助手,具有广阔的应用前景。其策略性的功能组合、易用性和成本效益,使其非常适合支持复杂问题解决、编程和科学研究等多种任务。

泰达币(USDT)在Kaia区块链上线,推动亚洲地区稳定币的普及
稳定币发行商Tether宣布将在2024年8月推出的Layer 1网络Kaia区块链上部署其原生USDT稳定币。 USDT也将被整合到日本通讯应用LINE的Mini Dapp平台及其自持钱包中。 “泰达币的稳定币将支持Mini Dapps等应用,开启数字美元在亚洲的新篇章,”Tether在X上表示。 USD₮即将登陆Kaia,带来在LINE生态系统内的无缝数字美元支付。Tether的稳定币将赋能Mini Dapps及更多应用,开启亚洲数字美元使用的全新时代。——Tether (@Tether_to) 在Kaia上推出USDT后,LINE NEXT和Kaia Chain将推动稳定币和Web3在亚洲的普及。 “用户将能在Mini Dapps内利用USDT进行应用内支付、跨境转账和去中心化金融(DeFi)等操作,全部在熟悉的LINE环境中,”官方声明指出。 此外,Mini Dapps还将具备由稳定币驱动的功能,为用户提供“在LINE Messenger中的无缝数字资产体验”。 泰达币整合LINE 1

艾尔顿·约翰和杜娃·莉珀寻求保护免受人工智能的侵扰
德拉·丽娃(Dua Lipa)、伊丽·约翰爵士(Sir Elton John)、伊恩·麦克莱恩爵士(Sir Ian McKellen)、弗洛伦斯·韦尔奇(Florence Welch)以及超过400名英国音乐家、作家和艺术家,已敦促首相基尔·斯塔默爵士(Sir Keir Starmer)更新版权法,以保护创作者免受人工智能(AI)滥用其作品的侵害。在一封信中,他们警告称,如果不采取这种保护措施,他们实际上将“把自己的创作”赠予科技公司,这将危及英国作为创意领袖的地位。 这群人要求首相支持对《数据(使用与访问)法案》进行修正,要求AI开发者在用于训练AI模型时向版权拥有者披露相关信息。著名签署人包括作家石黑一雄、剧作家哈罗德·大卫、歌手凯特·布什和罗比·威廉姆斯,以及乐队酷玩乐队、戏剧家汤姆·斯托帕德、编剧理查德·柯蒂斯和保罗·麦卡特尼爵士,他们此前曾表达过对AI剥削艺术家的担忧。 信中强调,创意个人对经济和文化至关重要,指出:“我们是财富创造者……AI需要我们,就像它需要能源和计算机技能一样。”他们支持贝碧安·基德伦男爵的修正案,此案在英国上议院即将进行的投票之前提出,旨在使AI开发者和创作者能够建立授权机制,以确保人类创作内容的持续保护。 然而,并非所有人都持支持态度。英国进步中心(Centre for British Progress)联合创始人朱莉娅·威廉姆斯(Julia Willemyns)表示,此类措施可能限制创新,损害英国的经济增长,因为它可能促使AI开发转移到海外,同时无法阻止外国公司利用英国的创意内容。 在生成型AI工具日益普及、能够利用受版权保护的素材创作新内容的背景下,艺术家们的担忧也不断增加,特别是关于数据同意和能源消耗的问题。二月份,艺人安妮·伦诺克斯和达蒙·阿尔班(Damon Albarn)通过发行一张无声专辑,以抗议政府拟议的版权法变革。当时,政府曾考虑允许AI开发者在权益人未明确反对的情况下使用创作者的线上内容,此举引发了反对声浪并被重新审视。 石黑一雄批评了为了让大型企业而非个人创作者利益优先而修改既有法律,并承认进展有限,他指出,政府现在怀疑“退出”制度的可行性,可能会展开新的咨询,寻求更公平的解决方案。他强调,完善相关改革至关重要。 此前,议员们否决了基德伦男爵提出的另一项修正案,该修正案旨在依据英国版权法追究AI开发者的责任。她目前支持增加透明度要求,以便促成创作者与企业之间的授权协议,强调此类措施对英国在国际AI市场中占据重要地位至关重要。 政府则回应称,需严格评估公众咨询的反馈意见,并承诺会发布一份报告与经济影响评估,涵盖辩论中涉及的各种问题和观点。

区块链在金融包容性倡议中的作用
区块链技术正日益被认可为推动全球金融包容性的重要工具,尤其是针对那些无法获得传统银行服务的无银行账户和服务不足的人群。由于被排除在传统金融体系之外,这些社区往往面临有限的经济机会。实现金融包容对于可持续的经济发展、减贫和社会公平至关重要。然而,传统金融机构面临高成本、严格规章制度以及基础设施问题的限制,难以为边缘群体提供服务。区块链为这些挑战提供了具有变革性的解决方案。 本质上,区块链是一种去中心化的账本,在分布式网络中安全、透明地记录交易,减少对中心化中介机构的依赖。这种去中心化降低了成本并提升了交易效率。对于无银行账户的人群,区块链可以实现安全且负担得起的金融产品接入,如储蓄账户、贷款、汇款和保险,无需实体银行网点。 区块链金融服务的一个核心优势是为缺乏正式身份证明的个人创建安全、可验证的数字身份。这些基于区块链的身份有助于用户建立信誉,获取需要验证的服务,在身份欺诈和无凭证地区尤为重要。 此外,区块链支持微交易,手续费极低,实现小额资金的即时、可靠转账,这对跨境汇款尤为关键,因为低收入人群常常负担沉重的高额手续费。利用区块链,移民可以更高效地向家庭转账,促进当地经济发展。 全球范围内,各类项目利用区块链弥合金融差距。在拥有大量无银行账户人群的国家,试点项目部署区块链钱包和智能合约,以实现金融交易的自动化和简化,提供必要的工具,同时促进数字素养和金融管理能力的提升。 除了直接的金融服务,区块链还通过透明的供应链管理、安全的产权登记和高效的援助及社会福利分配,推动更广泛的经济融合,增强服务不足群体的金融韧性和赋权。 尽管具有诸多优势,但在推广区块链解决方案以实现金融包容方面仍面临挑战,包括互联网接入受限、界面不友好、网络安全问题以及需要既鼓励创新又保护消费者的监管框架。 政府、私营部门、技术开发者和非政府组织之间的合作至关重要,以构建包容性生态系统,促进信任与采纳。协调这些利益相关者能够加速区块链在金融服务中的融合,确保没有任何群体被排除在现代经济机会之外。 总之,区块链具有巨大的潜力,能够为无银行账户人群提供安全、负担得起且普及的金融解决方案。随着利用这一技术的努力不断推进,未来实现更加包容、公平和可持续的全球经济参与,超越社会经济或地理障碍的愿景,正变得日益可及。

区块链在医疗健康中的应用:保障患者数据安全
医疗行业正通过采用区块链技术正在经历一场重大变革,以改善患者健康记录的安全性与管理。虽然区块链最为人所知的是其在加密货币中的基础作用,但它如今正通过创建一个不可篡改的账本,解决关键的医疗数据挑战,这一账本能够确保患者数据的完整性,并且仅对授权人员开放访问。这一创新极大地提升了对敏感医疗信息的保护能力,有效防止数据泄露和未授权访问。 近年来,由于一些高调的数据泄露与网络攻击事件针对医院、诊所和保险公司,医疗数据安全的担忧日益增加,这些事件曝光了数百万患者的个人和医疗信息,造成了身份盗窃、保险欺诈和隐私侵犯等问题。传统的数据系统在应对这些不断演变的威胁时表现乏力,缺乏足够的保护措施和透明度。 区块链通过一个加密的、去中心化的账本提供了一个强有力的解决方案,将患者健康记录安全存储。每一条记录都通过加密链接到之前的记录,形成一条不可更改的链条,防止篡改或删除。此外,区块链协议还能实现精准的访问控制,只允许授权的医疗提供者、患者或相关方查看或修改记录。 区块链在医疗中的一大优势是赋予患者更大的医疗数据控制权。相比由众多提供者管理的碎片化系统,患者可以拥有一个统一、安全的个人医疗记录,可以根据需要授权或撤销特定医生或机构的访问权限。这种以患者为中心的模式增强了隐私保护、透明度和医患之间的信任。 许多领先的医院和诊所已经将区块链整合到电子健康记录(EHR)系统中,取得了令人鼓舞的成果,例如增强了患者对数据保护的信心,以及更好地遵守如美国的HIPAA和欧洲的GDPR等相关法规。一些机构利用区块链平台实现跨机构安全共享医疗记录,从而加快、更精准地进行诊断和治疗。该技术还通过提供透明、可验证的交易历史,优化了保险索赔和账单等行政事务。 然而,在医疗行业大规模应用区块链仍面临挑战。关键问题包括与现有系统的互操作性、标准化需求、为患者和医疗提供者设计的易用界面,以及不断变化的监管框架。医疗机构、技术开发者和政策制定者间的持续合作,对于克服这些困难至关重要。 展望未来,专家预计区块链将在医疗数据管理中发挥核心作用,推动个性化医疗、临床试验的透明化以及公共健康的实时监测等创新。通过保证数据的完整性与隐私,区块链技术有望将医疗行业转变为一个更加安全、高效、以患者为中心的体系。 总之,将区块链技术引入医疗领域,是在保护患者健康记录方面迈出的重要一步。通过构建一个不可篡改、权限可控的账本,区块链应对了数据安全、隐私和患者自主控制的关键关注点。随着应用的推广,医疗行业有望提升信任度,实现合规监管,并前所未有地赋予患者更多自主权。

莱奥十四世教皇阐述了他的愿景,并指出人工智能是人类面临的主要挑战之一。
梵蒂冈城(美联社)——星期六,莱奥十四世教皇概述了他教皇任期的愿景,强调人工智能(AI)是人类面临的重要挑战,并承诺继续执行教宗方济各设定的核心优先事项。莱奥以其独特的方式开辟了自己的道路,自他当选以来首次公开访问位于罗马南部的圣母庇护所,这一地点对他的奥古斯丁会团以及他的教名莱奥十三世具有重要意义。 在詹纳扎诺,市民们聚集在由奥古斯丁修士管理的十五世纪朝圣地——“善良统治圣母庇护所”外,该圣地在1900年代初由莱奥十三世升格为小圣堂。祈祷之后,莱奥向人群发表讲话,强调他们在迎接圣母时所拥有的恩赐与责任,祝福众人,然后在返回梵蒂冈途中,前往圣玛利亚大教堂,为方济各的墓地祈祷。 此次下午的出行紧随莱奥与选举他的红衣主教的首次正式会晤。在会晤中,莱奥多次引用方济各2013年的使命宣言,重申自己致力于使天主教会更加包容、关注信众,并关爱“最小和被拒者”。作为第一位美国教皇,他支持第二梵蒂冈大公会议的改革,强调人工智能是影响人类尊严、正义和劳动的重要议题。 关于莱奥未来的教皇任期,他的未来动向值得关注:梵蒂冈披露,他将保持来自秘鲁奇克拉约的主教座右铭和徽章,强调教会的团结。座右铭“In Illo uno unum”,源自圣奥古斯丁的布道,象征基督内的基督徒合一;奥古斯丁徽标——一个穿孔的燃烧的心和一本书——象征经文和虔诚之心。莱奥佩戴的胸部十字架,是他在2023年成为红衣主教时由奥古斯丁会赠送的,内含圣奥古斯丁和圣莫尼卡的遗物——早期基督教的重要人物及其教会守护圣人。 莱奥将自己的名字选择与莱奥十三世教皇联系起来,后者通过1891年的通谕《事物新貌》塑造了现代天主教社会教义,关注工人权益,批评资本主义放任自流和国家社会主义,标志着工业革命的曙光。莱奥表示,面对另一场工业革命和人工智能对尊严、正义与劳动的挑战,教会的社会教义依然至关重要。在其教皇任期接近尾声时,方济各日益警示人工智能的威胁并呼吁国际规范。 方济各视出生于芝加哥的奥古斯丁会主教罗伯特·普雷沃(莱奥的本名)为继任者。他于2014年任命普雷沃为秘鲁一个教区的主教,后来成为秘鲁主教团负责人,2023年召他到罗马监管梵蒂冈的主教提名。在梵蒂冈教廷会议厅的讲话中,莱奥频繁引用方济各的名字,并哀悼其逝世,采纳方济各2013年的使命宣言《福音的喜乐》作为自己的指导原则。 他呼应方济各对教会传教角色的强调,倡导合议制领导,关注真正、包容的民间虔信生活。莱奥强调教会爱心关怀边缘群体,勇敢应对当代世界。 在一场史上最大规模、最具地理多样性的特别会议中,于星期四当选为第267任教皇的普雷沃获得了超过133张选票中的100张以上,无比超出所需的三分之二多数。他以一份准备好的演讲稿发表首场公开讲话,尽管如此,他更自如地用简短的西班牙语表达。 梵蒂冈国务卿、重要的教皇候选人彼得罗·帕罗林在《维琴察日报》上发表的信中祝贺了莱奥。帕罗林赞扬莱奥对当前问题的理解,回忆起他首次呼吁实现“裁军与解除武装”的和平。他称赞莱奥在奇克拉约的领导能力,处理梵蒂冈敏感事务的能力,以及其冷静、平衡问题解决、尊重、关怀和爱所有人的品质。