为什么说GPT-4o并不惊艳？多维度测试揭示局限性

news/2024/10/1 3:59:12/文章来源:中华网

为什么说GPT-4o并不惊艳？

5月14日凌晨，OpenAI推出了GPT-4o，这款新模型集成了听觉、视觉与语言处理能力，能够实时分析音频、视觉及文本信息，并以任意组合方式输出文本、音频或图像内容。在演示中，GPT-4o展现了高度的人情味，它能感知对话者的情绪并给予适时的安慰与建议，其互动宛如与老友交谈，引发网友对人工智能视觉功能及其潜在应用，如辅助视障人士的讨论。

为了深入评估GPT-4o的性能，一系列测试被开展。在文本创作上，它迅速且准确地完成了从编写中国神话故事到解析公司财报的任务，甚至能快速识别财报中的关键数据和潜在风险。尽管在处理复杂翻译任务时速度稍有下降，但依旧能高效提取核心信息。不过，发布会提及的跨模态内容生成功能目前尚未实现，GPT-4o尚不能直接创建含图片和音频的文档。

为什么说GPT-4o并不惊艳？多维度测试揭示局限性

在问答能力上，GPT-4o转变为提供相关网页链接，显示出向AI搜索引擎发展的趋势，这与行业观察者的预测相符。图像识别方面，它在处理特定情境时表现出色，但在理解新兴文化现象时有所欠缺，突显了持续学习的重要性，尤其是对多元文化的深入理解。

至于图像生成，GPT-4o的表现参差不齐，虽然能在某些场景下准确描述人物情感，却在传统文化知识上出现误解，如错误描绘中国传统神话中的青龙形象。视频识别与处理能力也未达到预期，无法直接处理音频或视频内容。为什么说GPT-4o并不惊艳？

在逻辑推理和特定领域知识测试上，如解答高难度数学题时，GPT-4o的解题能力和准确性不尽人意，反映了其在高度专业和逻辑严密性任务上的局限。

对于GPT-4o的未来展望，虽然OpenAI的高层对其潜力充满期待，但实际测试结果显示，它距离彻底颠覆性的革新还有一定距离。同时，中美大模型之间的差距以及国内市场对软件付费的态度，都意味着国内大模型在商业化道路上还需经历长期探索与努力。国内厂商面对的不仅是技术追赶，还有商业模式的创新，这条发展之路无疑充满了挑战。

责任编辑：卢其龙 CN070

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rllx.cn/DGCQ/31289.gov.cn

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈邮箱:809451989@qq.com，一经查实，立即删除！