零点有数:ChatGPT 实践问题分析与应用展望
消息来源:baojiabao.com 作者: 发布时间:2024-11-07
ChatGPT 是 OpenAI 最新的语言模型,较其前身 GPT-3 有大幅提高。与其他大型语言模型一样,ChatGPT 能够以不同的样式和目的生成文本,并且在准确度、叙述细节和上下文连贯性方面表现更加优异。作为 OpenAI 最新一代的大型语言模型,ChatGPT 的设计非常注重交互性。为了调优 ChatGPT,OpenAI 使用了监督学习和强化学习的组合,其中强化学习的组件使其独一无二。OpenAI 使用了"人类反馈强化学习"(RLHF)的训练方法,该方法在训练过程中利用人类反馈,以最小化无用、失真或有偏见的输出。
ChatGPT 在实际测试与应用过程中的问题
1、多场景出错问题
1.1 由于标注数据问题而引发的知识性错误。诸如回答内容存在事实性错误,对于确定的事实,其给出的答案无法达到高置信度。对于常识性的知识问题不能高效地给出符合日常认知的答案。大模型训练所需语料涉及面非常广,仅就人文学科而言,就存在非常庞杂的知识的语料,因此,在标注过程中,相关任务对标注人员的知识面、逻辑思考能力等都有极高的要求。在此基础上,还需要针对更多语料中提及的知识进行自动抽取,反复校验,才可一步步改进上述错误。
图中,关于古诗《登鹳雀楼》的提问,ChatGPT 未能给出符合常识的回答,包括古诗的原文和作者信息。
1.2 数据理解上的问题。对于简单的数据说明可以顺利地进行比较分析,但面对略复杂的语义理解要求,ChatGPT 就会出现问题,对于中文丰富的词汇体系、语法和句法的特点,特别是涉及近义词之间的差别和近义程度的区分,还需要补充更多更广泛的训练数据、做进一步的训练和优化,才能修正相应问题。示例如下图。
1.3 基本的数据分析能力弱。由于基本的数据理解和分析能力较弱,ChatGPT 目前无法正确有效地进行数理逻辑计算。
如下图所示,针对四人四天喝四桶水,八人八天喝多少桶水的数据计算问题,并没有一次性形成合理的计算逻辑链路,给出正确的计算结果。
2、答复的生成内容不具备实时性。
知识库信息的时效性不强。由于 ChatGPT 目前的版本仅支持 2021 年之前的语料信息提问,其回答的内容没有进行实时信息关联。训练一个模型的人力成本较大、时间周期较长,短期内难以有效地更新学习即时性的知识信息。
俄乌战争起始于 2022 年 2 月,而 ChatGPT 使用的最新训练数据只截止到 2020 年,因此对于最近发生的俄乌战争事件,无法给出具有时效性的情况分析。
3、模型能力覆盖广,但专业深度不足。模型复杂度,丰富性和通用性足够高,但对于某个专业领域方向的资深知识信息结构认知不足。
在上述的问答中,ChatGPT 对于网络通信中的信息增益率公式只给出了概述性的描述,并未有效地展示公式的符合化表示及解释说明。
ChatGPT 的负 面影响分析
ChatGPT 在不同的场景中,展示出其应用之便利、性能之强大、前景之广阔,同时也凸显出一些值得关注的隐忧。从某种意义上而言,ChatGPT 的出现,让诸多领域面临新的挑战,若未引起足够重视,可能会引发负面的社会效应。
1、教育教学
在教育教学方面,最为直接的影响是学生在学习过程中,缺乏足够的思考,直接询问 ChatGPT,轻松地获取到相关的知识和解答,特别是在论文的写作过程中,直接查询或生成相关内容,不仅不利于学生有效掌握相关知识,无法锻炼问题研究能力,甚至会形成过度依赖,影响学生的创造力,不利于教育的发展。
2、公共安全
公共安全领域主要涉及社会治安和信息安全。就社会治安而言,利用 ChatGPT 模仿不同人员的对话习惯,再结合语音合成功能,进而实现高仿真的人类交流和互动。相关功能如果应用在诈骗等场合,助长违法犯罪,影响社会稳定。就信息安全而言,数据治理面临更大风险,特别是关涉国家安全、商业机密、个人隐私等多方面的敏感数据。ChatGPT 模型训练所使用的数据一般为大量可公开的数据和知识,但基于现有的技术研发数据管理体制,不一定能保证直接相关的敏感数据或基于公开数据研究所得的敏感数据不被泄露。
3、伦理道德
在伦理道德方面,无论是个人还是社会或国家同样受到一定的影响。从个人的角度来看,对于大多数未成年人,甚至部分成年人,尚未形成成熟且稳定的心智,在使用 ChatGPT 的过程中,个人想法很容易被直接或间接地带偏,进而做出不合适的行为;从社会或国家的角度来看,ChatGPT 如果作为一个文化冲击的工具,对整个社会和国家将有可能产生不良影响。
以上这些方面,都亟待相关技术方在技术层面对相关内容进行完善,对各种使用方进行权限的控制和监控,同时相关职能部门应从国家层面进行立法,进行合理的限制和管控。
零点有数专家的思考与拓展
1、行业训练数据优势。如何整合行业历史沉淀数据转换为高质量、有效的训练数据集,更好提升行业应用模型的精度。
2、行业数据理解与解读更专业。我们在各行各业多年来沉淀了大量的行业内的专业知识库信息(如:12345 政务服务便民热线),对各行业的数据特性有更深度的理解与解读。
3、强化推理能力。我们可以基于对业务场景的了解出发,对未知业务场景做从规则、向量表示推理到 prompt 的范式多层次学习推理过程。
4、线上更新机制。我们实时收集线上数据,并实时进行模式化的更新,动态反馈更新至模型中,形成模型长期反馈更新学习的机制。
5、合理挖掘发现行业应用场景,并更深层次地将 GPT 与垂直业务行业做融合,构建行业化的 GPT 模型,并服务于业务实际需求,如政务业务中生成式日报等。
更安全的数据管理。我们在长期业务实践中积累了丰富的数据管理经验,特别是在政务业务中,形成了完善的数据安全管理机制,保证模型构建和应用等过程中数据的安全性。
2023-02-24 15:33:19相关文章
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款
2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰
2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时
2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑
2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步
2024-06-28 09:27:13
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
- 国家新闻出版署:认真研究《网络游戏管理办法(草桉徵求意见稿)》关切 实行前进一步完善
2023-12-28 19:14:56
- 印度以打击金融犯罪为由逮捕了两名 vivo 高管
2023-12-26 16:49:01
- 在国外微信收不到国内信息?微信和WeChat将被拆分
2023-12-15 10:40:15
- 苹果iPhone15 系列手机发布最新消息 预计上市发布时间9月
2023-08-06 23:21:02
- 华为将发布鸿蒙HarmonyOS4操作系统 功能五大升级支持设备清单
2023-08-06 23:17:37
- 整治自媒体网红账号 400万粉丝网红发布擦边视频被无限期封禁
2023-07-12 09:56:09
- 网传微信文件传输助手是真人是真的吗?微信官方回应
2023-06-27 15:53:32
- 电信移动送手机成了“信用购”?你上了运营商的贷款套路了吗?
2023-06-12 17:18:55
- 中国电信广东地区崩了无信号 客服回应已在核实处理
2023-06-08 15:39:04
- 消息称小米新能源汽车价格表正讨论定价区间:双版本不同配置,高配或超 35 万元
2023-03-06 12:56:03
- 华为因制裁被传或分拆剥离手机业务? 内部人士回应:可能性不大.
2023-03-05 23:26:41
- OPPO正式发布安第斯智能云,让终端更智能
2023-02-24 16:02:27
- 华为与OPPO签订全球专利交叉许可协议 包括5G蜂窝通信专利
2023-02-24 16:02:26