天天滚动:十秒做出网站、会看图解题 升级版GPT

2023-03-15 17:58:23 | 来源:钱江晚报

当大家在讨论能否追上ChatGPT,全球争相研发语言对话工具之时,OpenAI反手又来了一大招,推出升级版:GPT-4。今天,整个科技圈又震动了,GPT-4功能之强大,令人眼花缭乱。


(相关资料图)

社交平台上,OpenAI老板SamAltman兴奋地介绍说:这是我们迄今为止功能最强大的模型!OpenAI官网公布了一篇超长的技术报告,包括性能测试、研究论文以及演示模型。

SAT能考700分,10秒钟做网站

考试能力“与人类水平相当”

“GPT-4是世界第一款高体验、强能力的先进AI系统,我们希望很快把它推向所有人。”发布会上,OpenAI工程师这样说。

根据OpenAI官方介绍,GPT-4是一个超大的多模态模型,也就是说,它的输入可以是文字(上限2.5万字),还可以是图像,并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。

简单来说,GPT-4实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。

在一段发布会视频演示中,GPT-4花了10秒就做出一个网站,用户只画了一个草图,告诉它大致框架,GPT-4立刻生成网站代码。

升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当。工程师们让两个版本的模型进行了数十种人类的考试,从数学、化学、量子力学,到英语言文学、律师考试、大学入学能力测验等,GPT-4的水平几乎都胜过前一个版本GPT-3.5。

比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。做美国高考SAT试题,GPT-4在阅读写作中拿下710分的高分,数学得分700分(满分800)。

从官网的一份对比图显示,之前使用的语言模型版本GPT-3.5和GPT-4之间的区别很微妙。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。比如,在一次语言翻译能力的比拼测试中,被测试的26种语言的24种中,GPT-4优于GPT-3.5和其他大语言模型的语言性能。

值得一提的是,微软在GPT-4发布后第一时间表示:如果你在过去六周内的任何时候使用过新的Bing预览版,你就已经提前了解了OpenAI最新模型的强大功能。是的,微软的新必应早就已经用上了GPT-4。

会玩“梗图”、看图解题

帮你速读海量论文

那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示,尤其是演示了它超强的读图能力。

首先,GPT-4会读懂一些“玩梗”图,哪怕是奇奇怪怪的图。

提问:这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:

GPT-4捕捉到了这幅图荒谬的地方,用一个老式的屏幕显示器VGA接口,接到了智能手机上。

提问:芬兰、格鲁吉亚和西亚的人均每日肉类消费如图,请算出平均数:

GPT-4给出了计算过程以及答案

提问,计算该导体的线性温变,这道物理题是用法语提问:

GPT-4给出了解答过程,用的是英文回答。

提问:这张照片里有什么不对劲的地方。

GPT-4回答:这个熨衣服的男人被悬挂在了一辆出租车上。

GPT-4还能速读论文,给出一篇InstructGPT的论文,让它总结摘要。

不过,在技术报告中也指出,尽管功能强大,但GPT-4仍与早期的GPT模型具有相似的局限性,其中最重要的一点是它的回答仍然不完全可靠。OpenAI表示,GPT-4仍然会产生幻觉、生成错误答案,并出现推理错误。总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40%。

上一篇 下一篇

相关新闻

天天滚动:十秒做出网站、会看图解题 升级版GPT

雄鹿提前锁定季后赛席位!布登:在NBA进入季后赛是困难的|环球观焦点

吉野家吃出蟑螂后执法检查又发现43只 吉野家是吃什么的

环球资讯:新模式下广西首票属地查检业务成功办理

神武烧烤合成调料有哪些-神武烧烤合成调料|热推荐

霍建华微博叫什么_霍建华微博|环球百事通

当前快播:鹤岗市气象台发布暴雪黄色预警【III级/较重】【2023-03-15】

全球短讯!亿道信息(001314.SZ):拟使用不超8.5亿元闲置募集资金和不超4.5亿元闲置自有资金进行现金管理

环球热点!MathWorks 和 Green Hills Software 使用 Infineon AURIX 微控制器开发安全相关应用的集成

奉百禄:3.14黄金走势遇阻回调,晚间操作策略解析_天天新消息

信泰保险董事长谭宁:预计2028年我国寿险专业中介渠道份额将超过10%

天天看点:沪深两市成交额突破5000亿元

教育部、国家卫健委等部门印发通知:高校非疫情流行时不允许封校

磁致伸缩液位计:独特的测量原理,适用于多种介质液位测量

锦绣风华之农门商女_锦绣风华之农医商女 环球热门

最新新闻

天天滚动:十秒做出网站、会看图解题 升级版GPT

雄鹿提前锁定季后赛席位!布登:在NBA进入季后赛是困难的|环球观焦点

吉野家吃出蟑螂后执法检查又发现43只 吉野家是吃什么的

环球资讯:新模式下广西首票属地查检业务成功办理

神武烧烤合成调料有哪些-神武烧烤合成调料|热推荐

霍建华微博叫什么_霍建华微博|环球百事通

当前快播:鹤岗市气象台发布暴雪黄色预警【III级/较重】【2023-03-15】

全球短讯!亿道信息(001314.SZ):拟使用不超8.5亿元闲置募集资金和不超4.5亿元闲置自有资金进行现金管理

环球热点!MathWorks 和 Green Hills Software 使用 Infineon AURIX 微控制器开发安全相关应用的集成

奉百禄:3.14黄金走势遇阻回调,晚间操作策略解析_天天新消息

信泰保险董事长谭宁:预计2028年我国寿险专业中介渠道份额将超过10%

天天看点:沪深两市成交额突破5000亿元

教育部、国家卫健委等部门印发通知:高校非疫情流行时不允许封校

磁致伸缩液位计:独特的测量原理,适用于多种介质液位测量

锦绣风华之农门商女_锦绣风华之农医商女 环球热门

世界百事通!长安深蓝第二款产品S7将于今年推向市场

环球速递!拓尔思:聘任尹世杰为公司副总经理

说说中国经济发展——给孩子的两会新闻(2) 焦点快报

外卖平台招聘“居家审查员”?江苏刑侦提醒警惕刷单新套路 环球微速讯

淮南市大通区妇联“三个聚焦” 靶向推进“一执委一实事”

天天滚动:明牌珠宝:签署20GW光伏电池片智能制造项目投资合作协议

龙光集团:预计2022年年录得净亏损约70亿至90亿元-焦点快报

道教术法大全_道教法术口诀

外企观两会 |“中国机遇”更加明朗 在华发展更有信心|热消息

环球报道:信用卡有欠款影响征信吗

天天速递!美国将公示丫丫回国证明!回国后将住进妈妈原来的家,原玻璃房正改建成露天院子

输尿管结石怎么引起的_输尿管结石解剖图-全球要闻

环球快播:春秋时期王朝和列国官制_对于春秋时期王朝和列国官制简单介绍

焊接热影响区最高硬度_关于焊接热影响区最高硬度介绍-全球看点

【广电之声】鸡西新闻联播|环球新资讯