火星链 火星链
Ctrl+D收藏火星链
首页 > 火星币 > 正文

CHAT:国内“ChatGPT们”的出路在何方?

作者:

时间:1900/1/1 0:00:00

写在前面

2月13日,《2022年北京人工智能产业发展白皮书》正式发布,其中提到全面夯实人工智能产业发展底座,支持头部企业打造对标 ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

很巧的是,飒姐团队成员在今年10月份的时候测评过:百度文心、源1.0、某道,三款国内现有的大模型,当时对测评结果甚是遗憾。于是又将当时的测试内容让ChatGPT做了一遍,试图摸清国内外大语言模型在问答这一领域的实际差距,旨在希望国内产学研戒骄戒躁,稳扎稳打地发展。

测试方案

本次测试仅仅考虑非连续性的单次问答,且皆为常识性问题,答案唯一,但题目会有一定的挑战性。具体的,涉及到What,When, Where, Who, Which五类问题。

国内首台融合区块链与边缘计算一体机成功上线:8月13日获悉,国网宁夏电力研发的国内首台融合区块链与边缘计算为一体的区块链一体机成功接入“国网链”并上线试运行。据宁夏石嘴山供电公司互联网办主任杨龙雨介绍,该一体机采用“松耦合”的设计原则,超低耗能、体积小、装卸便捷,可在源-网-荷-储多环节进行部署,实现多用户、多市场主体间的赋信;可在生产作业现场、户外设备及杆塔等环境下进行部署,能够适应户外多种恶劣天气状况;可满足图像识别、视频检测、语音识别等人工智能需求,可实现云、边、端协同计算,同时可接入北斗卫星导航系统,实现电网时间基准统一。 自区块链上升为国家战略以来,国网宁夏电力高度重视区块链核心技术的研发和应用,并先后在电力调度、安全生产等业务场景实现落地应用。(全国能源信息平台)[2020/8/14]

问题样例如下:

1. “是什么(What)”型问题,如“爸爸的爸爸叫什么?”

2.“什么时候(When)”型问题,如“人们一般什么时候过元旦?”

声音 | 贝因美:与国内著名区块链技术公司联合探索行业应用,实现精准溯源:贝因美(SZ.002570)在深交所-互动易回答投资者提问时表示,公司正在与国内著名区块链技术公司联合探索行业应用,打造母婴行业供应链、新零售的区块链革命。如果成功,贝因美将是奶粉行业第一家使用区块链技术的公司,将大大提高供应链运营效率、实现真正精准溯源、极大提升消费者体验。[2020/1/19]

3.“什么地点(Where)”型问题,如“孙中山安葬在哪里?”

4.“是谁(Who)型问题”,如“中国历史上第一个皇帝是谁?”

5.“哪?个(Which)型问题”,如“哪个洲是倒数第二小的洲?”

问答样例对比

问题:“孙中山(孙文)安葬在哪里?”

ChatGPT:孙中山的遗体最初安葬在南京中山陵内,后因战乱多次迁移。最终于1929年安葬在南京中山陵北麓的紫金山下,此地现为孙中山陵园。

声音 | 交行副行长吕家进:交行率先将区块链技术运用于长三角地区的国内信用证业务:据青岛新闻网消息,9月5日,第230场银行业保险业例行新闻发布会在京召开。交通银行副行长吕家进表示,交行率先将区块链技术运用于长三角地区的国内信用证业务,实现分行间国内信用证电子开证、实时传输、交易触发等功能,满足客户高效结算融资服务需求。[2019/9/5]

百度文心:孙中山墓地

某道:"孙文(1866年-1925年10月12日),名文,字载之,号仲立,又名帝光,广东省香山县(今中山市)南朗镇翠亨村人,1883年(光绪九年)随父移居澳门。1904年参加孙中山领导的同盟会,任同盟会南方支部书记。曾两次赴日,组织策划惠州起义。后回澳门发展组织,被选为中国同盟会南方总支部庶务部长。1905年春,与陈少白、朱执信等在香港成立兴中会,被举为评议部评议员,旋被派往南洋联络同志,协助筹办革命刊物《中兴日报》。1906年冬,孙中山在日本东京成立中国同盟会中部总会,被委为秘书。1907年奉命回国,在广东发动民军起义。事败后潜赴南洋,继续组织发动华侨、华工和留学生进行革命活动。1911年武昌起义爆发后,被派往广州协助筹划起义,不幸事泄被捕,不久在广州黄花岗就义。

天风证券最新研报:预计2020年国内供应链金融规模达15万亿,区块链能够更好的进行企业风险刻画:4月16日,天风证券最新研报显示,预计到2020年,国内供应链金融市场规模将接近15万亿元。研报显示,供应链上的核心企业以及做供应链管理的传统巨头企业天然具有开展供应链金融业务的优势,而区块链技术能够更好的进行企业风险刻画,从而扩大业务覆盖范围,因此非常有动力搭建区块链供应链金融平台,但对自身供应链之外的企业吸引力较低。但区块链初创公司在与核心企业的谈判中,并不具备非常大的话语权,因此目前主要还是以技术服务商的角色来参与,很难做成生态。[2018/4/16]

源1.0:孙中山安葬在南京紫金山中山陵

问题:哪个洲是倒数第二小的洲?

ChatGPT:开始回答了错误的答案,与其对话后成功纠正(AMAZING!)

国鹏资本首席投资官:国内对区块链的监管会趋于保守:国鹏资本首席投资官赫崐在接受采访时表示,其对国内监管层的预判是其对于区块链领域的监管会趋于偏向保守。赫崐同时提到,因为区块链引入了“去中心化”的场景,对于因采用区块链技术而挑战到当前法律框架的应用领域,相关部门则应当加强监管,那些工程技术领域的应用则应该鼓励创新。[2018/3/1]

百度文心:南极洲

某道:南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)“

源1.0:大洋洲

总体分析

四个系统对于基本问题的问答可谓是手到擒来(本次样例问题直接排除了简单的基本问题,挑战难度较高,因此整体错误率较高)。五类问题中,when问题和who问题整体回答的情况最好。三个国产系统中整体文心系统的表现最好。ChatGPT也会犯错,但是往往只要略微引导,便能改正错误。

错误回答分析

错误语句生成:语句本身并不通顺,前后主题不一致或者内容不一致,给人错乱的感觉。

例如问:爸爸的爸爸称谓是什么?

答:  爸爸的父亲,也就是爸爸的爷爷,是妈妈的爸爸。爸爸的爷爷的爸爸叫太爷爷。爸爸的爷爷的爷爷叫太奶爷(奶奶的爸爸)

或问:我们党二大在哪里召开?

答:1921年7月23日至31日,中国第二次全国代表大会在浙江省嘉兴市南湖的一艘游船上召开。出席大会的正式代表共13人,候补代表5人,代表全国121名员。共产国际代表马林、尼科尔斯基和鲍罗廷等参加了会议。

事实性错误:产生了事实性的错误。

例如问: 孙文去世的日子?

答:孙文去世的日子是1918年3月13日

偏见性素材:回答取自的素材较少,体现比较强的笔者的主观性。

例如问:大家什么时候过元旦?

答:谢邀。我是在大学过的,所以元旦是在宿舍过的。我们宿舍六个人,有四个人都回家了,剩下我一个在宿舍,所以元旦那天我过得比较孤独,不过还好啦,因为宿舍就我自己了,所以我可以一个人吃饭,一个人看电影,一个人逛超市,一个人睡觉,一个人......

含有逻辑性的问题无法识别:问题中存在复合问题或者逻辑判断,一般难以处理。

例如问:哪个洲是倒数第二小的洲?

答:" 南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)

写在最后

飒姐团队认为,传统的单一问答模型可用性不大,给予用户的体验感也欠佳,国产大语言模型下一个里程碑,前辈ChatGPT已经给出了方向,便是对话问答。在使用ChatGPT的时候,虽然它也经常会给出错误答案,但是其回答的逻辑依旧符合人的习惯,同时经过一定的对话引导,可以自行发现其回答逻辑性的缺失。

作为全新的一种数据合成方式,大语言模型的直接输出可能是我们人类无法把控的,但是只要它能“理解”用户的输入,以此为依调整其输出,最后得到满意的回答,那便是可用的。进一步的,大语言模型未来的趋势很有可能是提前预判用户可能的“纠错”,并提前“自纠错”,并对纠错结果进行评估。

肖飒lawyer

个人专栏

阅读更多

金色早8点

金色财经

Odaily星球日报

欧科云链

澎湃新闻

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

链得得

标签:区块链HATCHATGPT区块链币在中国合法吗人工智能chatGPT下载人工智能chatGPTgpt币团队

火星币热门资讯
USHI:金色Web3.0日报 | NFT清洗交易占去年总交易量的35%

DeFi数据1、DeFi代币总市值:490.6亿美元 DeFi总市值及前十代币 数据来源:coingecko2、过去24小时去中心化交易所的交易量36.

1900/1/1 0:00:00
NFT:金色Web3.0日报 | 特斯拉前AI负责人宣布将加入OpenAI

DeFi数据1、DeFi代币总市值:500.01亿美元 DeFi总市值及前十代币 数据来源:coingecko2、过去24小时去中心化交易所的交易量52.

1900/1/1 0:00:00
APT:金色早报 | 当前拥有比特币核心代码修改权限的仅剩5人

▌ 一名比特币核心代码管理员已于本周四离开,当前拥有代码修改权限的仅剩5人2月17日消息,一名比特币核心代码管理员已于本周四离开,当前拥有代码修改权限的仅剩5人.

1900/1/1 0:00:00
CHA:这是一篇记者和ChatGPT合作完成的区块链AI项目分析稿

作者:金色财经记者Jessy;ChatGPT 近日,ChatGPT大火,和AI技术相关的区块链项目代币也在近些天迎来了大涨,随着AI技术近些年的发展.

1900/1/1 0:00:00
NFT:Web3 游戏能否跨越鸿沟 实现外部性收入?

Web3 游戏跨越鸿沟,本质是要实现外部性的收入,而且这个收入能够支撑起整个游戏的内部经济运转。它不再是通过后来进入用户的投入来支撑更早进入用户的收益.

1900/1/1 0:00:00
IMI:晚间必读 | 一文速览EigenLayer白皮书:共识层的扩容

北京时间2月21日下午,被众多一线投研机构视为2023年以太坊最重要的创新,有可能开启以太坊新叙事方向的Eigenlayer终于披露了其V1版白皮书.

1900/1/1 0:00:00