清华大学唐杰:构建千亿参数大模型的经验及思考
2023-07-08 15:02:27来源:集微网
(资料图)
集微网报道 7月7日,在2023世界人工智能大会上,清华大学教授唐杰发表“构建千亿参数大模型之路”的主题演讲,重点介绍了大模型训练的经验及思考。
作为人工智能领域的知名专家,唐杰主持研发了ChatGLM-6B大模型,2023年5月,科技部在中关村论坛上发布的《中国人工智能大模型地图研究报告》显示 ChatGLM-6B 位列大模型开源影响力第一名。
演讲中,唐杰首先回顾了人工智能的发展历程。第一代人工智能的核心是让机器描述人类世界,于是就有了符号AI,机器描述之后,就可以做自动化处理,但这个时候它很难实现智能化;发展到第二代人工智能,就有了感知智能,它能自动识别;2016年,张钹院士提出第三代人工智能雏形,DARPA2018年发布AI Next计划,核心思路是推进数据统计与知识推理融合的计算,与脑认知机理融合的计算。而从AI发展趋势来看,计算机在经历计算、感知之后,应该向具有认知到有意识的能力发展。
发展至此,下一代的人工智能到底该长什么样?AI业界都在思考这一问题。唐杰认为,未来的人工智能应该有两件事非常重要,第一是知识图谱基础设施建设,第二是超大数据的深入学习深度理解,更重要的一点是如何把这两者结合起来。基于对人工智能发展规律及计算机技术进展的分析,早在2019年,唐杰及团队就预见到人工智能时代将很快到来。当时,唐杰及团队提出双系统理论,系统1用于直觉性思考,系统2用于推理性思考,以解决当时人工智能模型面对的挑战问题。
“我们觉得未来参照人脑认知的系统,系统1有一个超大规模的预训练模型,系统2应该有人脑的记忆机理,也就是说它解决我们现在大模型经常性的灾难性遗忘问题。”唐杰说。
从2019年开始,唐杰及团队开始进行BERT模型相关工作,但当时距离超大模型还有一定距离,到2020年决心自己来训练大模型,到2022年实现千亿模型训练。当时这几个模型的效果都还不错,但为了探索大模型的极限,唐杰及团队决定训练万亿大模型,为此找到一台海洋之光超算机。通过这台超算实现万亿模型的训练,在这台机器上,他们还探索进行了百万亿模型的训练。
不过,唐杰也表示,建议大家不要相信只要有超算机就能训练大模型。因为这里面的编程量非常大,从操作系统到算子到训练框架全部需要自己编出来,难度非常大。同时,用超算机训练大模型,成本也非常高昂。
去年唐杰团队又发布了千亿大模型,“我们也在思考,如何降低成本,如何将大模型应用起来。”唐杰说。
谈及与国外大模型的差距,唐杰表示,GPT4出来后我们确实非常震惊,事实上,我觉得我们的模型离GPT 3.5都还有一些距离,离GPT4就更远一些了,我们还需继续努力。
对于下一步规划,唐杰透露最近在研究如何让计算机拥有意识。对于大模型的未来发展,唐杰提出三点思考,一,目前的千亿模型能力已经很强大了,未来重要的是如何把它的智慧提炼发挥出来;二、大模型如何跟外界进行交互;三、如何让大模型具有反思能力,能自我反思,自我纠错,并且具有一定的价值观,具有一定的意识。
标签:
责任编辑:hnmd003
相关阅读
阅读排行
资讯播报
- 延时工作能否应获补偿
- 倾情托举“夕阳红” ——湖北襄...
- 期货行情分析系统(对于期货行情...
- 海南扎实推进国家生态文明试验区...
- 2023全球数字经济大会昨日闭幕 ...
- 强化大语言模型检察应用 推动检...
- 全球球精选!安全无小事!一起来...
- 中国女足抵达澳大利亚阿德莱德备...
- 江苏 沿江而动向绿而行-环球关注
- 新华全媒+|用心守护群众生命安...
- 阿斯巴甜致癌争议不休,想减糖还...
- 过高的期待高洪波 媒体:对耶伦...
- 瓶子的手工怎么做(用瓶子怎么做...
- “澜湄蓉欧快线”班列首发 中老...
- 对你的思念是一天又一天是什么歌...
- 最后的忏悔(关于最后的忏悔介绍)
- IN视频|一镜到底打卡大鹏办事处...
- Doll house Build & Design...
- 中国女足出征世界杯 “朝着目标...
- 贝里奇:足球“探险者”感知世界...
- 中国女足出征世界杯 王霜将从美...
- 还记得“雪姨”王琳吗?儿子长这...
- 怎么看自家路由器连了多少人
- it服务巨头排名 2022全球IT服务...
- 裙子下面不要穿防护裤!今年夏天...
- 移动彩铃设置在哪里(移动彩铃设...
- 湖北省2023年普通高校招生录取各...
- 股票行情快报:良品铺子(603719...
- 小暑连初伏,长沙今夏高温为何这...
- “林皇”林加德近日发言称,沙特...
- Intel酷睿i7-14700K将升级20核28...
- 2023普鲁申科梦幻冰秀启幕 原版...
- 德方纳米:公司目前已建成磷酸锰...
- 她被清华哲学系录取!这个复旦附...
- 害怕AI生成内容侵权?Adobe为客...
- 遭遇雷电未完赛 新加坡女子大师...
- 被罚71.23亿元!蚂蚁回应
- 最高44.1℃!河南迎1991年以来最热小暑
- 深南电路:PCB及封装基板业务部...
- 持续向好!济南机场上半年累计完...
- 李玟:1.5 亿世纪婚礼,换不来真心
- 每日短讯:青海:推进变电站扩建...
- 青海天佑德1.73万吨青稞酒原酒陈...
- 外交部军控司司长孙晓波同欧盟对...
- 什么情况!近30亿资金撤离这类ETF
- 推进老旧小区环境提质升级,武汉...
- 山东工业技师学院学生职业技能等...
- 通义万相上线:云图 AI绘画模型...
- 第四届“中国足球发展基金会杯”...
- 湖北武汉一电影院起火:男子逆行...
- 源自福特超级平台,江铃福特新款...
- 新赛股份:控股股东正筹划可能导...
- 对称性展现数学之美!杨振宁是如...
- 深圳出台金融支持外贸24条:鼓励...
- 元旦诗句大全100首(元旦诗句大全)
- 终极斗罗15:第858章名称确定,...
- 芝麻苗期渍涝害预防及应对技术建议
- 2023年中央美术学院建筑学专业录取线
- 隆基通威等9大光伏组件厂商达成...
- 天安新材: 公司的饰面材料、建...
- 元琛科技:公司复合铜箔产线目前...
- 桃源深处有人家藏经室悟证怎么过
- 表情符也“算数” 加拿大男子输...
- “全球最热一天”纪录被接连打破...
- 潢川县:“三个一批”为高质量发...
- 【国际漫评】这个生日真糟心!
- 大宗交易:红塔证券成交881.4万...
- 引金融活水,润实体经济——金融...
- 宏和科技:监事拟减持不超42.52...
- 大港股份:公司生产经营正常
- 泰国女孩眼里的“兰洽会”:传统...
- 国开行山西省分行被罚50万元
- Uzi带队出击,Fofo韩服ID改成我...
- 江西九江:阶段性购房补贴、交易...
- 倍感荣幸!新疆整形医教研之路得...
- 新增教育资源,城阳上马街道部分...
- 2023四川宜宾市屏山县住房城乡建...
- 耶伦抵达北京,此行预期展望
- 《2023互联网保险行业观察》重磅...
- 英国一游客在古罗马斗兽场刻字,...
- 美媒爆料白宫可卡因发现地点有变
- 《南浔铁路规划图》
- 女足前国脚刘英:让青少年爱上足...
- “高烤”预警 今天16时31分将迎...
- 收评:创业板指低开低走跌超1% ...
- 《逆水寒手游》言不廖任务方法
- 两岸140多名棒球选手福建连城比...
- 携手鑫伙伴 共赢鑫未来——南京...
- 「雷语话名家」雅克·路易·大卫...
- 5G发展迎规模化发展关键期 从“...
- 助力智慧出行,意法半导体带来安...
- 平安人寿上海分公司:让保险力量...
- 【评价】成都好的男科医院-成都...
- 【红色索加 生态高地——记录海...
- 丰田6月在中国新车销量17.45万辆
- 龙王传说27册:最惨烈的一战!死...
- 日本原子能规制委员会发放福岛核...
- 【“亮成绩、展形象,二十大精神...
- 每生一个孩子发5万?广州房贷放...
- 吉林开展重大地震灾害实战应急演练