本文刊载于《中国科学院院刊》第5期“科学观察”。本文根据2023年4月25日《中国科学院院刊》2023年编委会特别活动——“松山湖科学对话”第三场“关于信息技术驱动未来产业的若干思考”中专家观点整理而成,作者为该对话的主持人及嘉宾,署名方式以姓氏笔画为序。
包云岗1 刘 淼2,3 陆品燕4 邱锡鹏5 须 江6
(资料图片仅供参考)
1 中国科学院计算技术研究所
2 中国科学院物理研究所
3 松山湖材料实验室
4 上海财经大学 信息管理与工程学院
5 复旦大学 计算机科学技术学院
6 香港科技大学(广州) 微电子学域
,时长
50:16
党的二十大为新一代的信息技术产业指明了方向,要以推动高质量发展为主题,构建新一代信息技术产业新的增长引擎。信息技术领域市场巨大,技术竞争激烈,比传统产业更具垄断性和技术排他性。李国杰院士指出,决定市场胜负的主要因素不是单项技术,而是有优势的信息技术体系。一旦一个技术体系占据了主导权,后发者就很难在同一赛道实现赶超或取代,而原赛道的领先者也很难在新“蓝海”延续其成功。因此,形成新的技术体系必须把握住新应用出现时的宝贵机遇。随着新一轮科技革命和产业变革突飞猛进,科研范式发生深刻变革,把握当前信息技术发展的机遇期,对于加快构建新发展格局、加快建设科技强国具有重要意义。
1.人工智能的发展和应用成为信息技术发展前沿的主要趋势
人工智能的快速发展正在对人类社会产生重大影响况
《麻省理工科技评论》(MIT Technology Review)近 5 年发布的年度“全球十大突破性技术”(10 Breakthrough Technologies)中,涉及人工智能(AI)的相关技术频频入选。例如,2023 年“制作图形的AI”和“改变一切的芯片设计”;2022 年“终结密码”“AI 蛋白质折叠”“PoS 权益证明”“AI 数据生成”;2021年“GPT-3”“数据信托”“数字接触追踪”“TikTok 推荐算法”“多技能 AI”等。从这些入选的突破性技术可以看出,人工智能在应用侧和基础设施层面扮演着重要的角色。在应用侧,人工智能在许多领域(如生物学、图形学等)发挥着重要作用,其中 AI 助理也正在被广泛应用。在基础设施层面,支持 AI 应用的基础设施面临着许多挑战。例如,如何更好地生成、管理和保护数据,以及如何提供足够的算力等。总体来看,人工智能新兴的问题主要集中在应用侧和基础设施侧,这也是当前的重点研究方向。
当前,信息技术领域中蕴藏着巨大的发展机遇。随着新的数据挖掘和应用算法的推进,数据驱动的工具对许多基础科学研究具有重大意义。例如,人工智能的快速发展及应用对自然科学(如生命科学、材料科学等)有着巨大的推动作用。但同时,信息技术领域的发展也面临着巨大挑战,摩尔定律逐渐失效。一方面,信息技术的发展需要更多的算力;另一方面,一些新的计算方法,如量子计算、光计算等,对计算机本质的认识重新提出了挑战。例如,在重新设计量子计算机系统时,人们会发现当前并未完全理解计算机本质。这是在信息技术领域特别是计算机领域中的挑战,同时也是一个很大的理论机遇。
从整个信息技术领域发展的角度来看,人工智能的迭代性类似于摩尔定律——随着数据量、训练量和模型大小的增加,其能力不断提升,而且增长仍然没有停止。这种快速迭代不仅对人工智能本身的能力提升有帮助,同时也对传统产业和学科发展有巨大的助力,因为有了更多的数据,科研过程可以加速进行。因此,人工智能的发展对整个社会都有积极的影响。
信息技术领域学术界与产业界结合度仍需加强
信息技术学界与产业之间存在密切的联系,但现在学术界关注的问题与产业界实际关注的问题存在一定的差距仍是不争的事实。当前,急需从产业应用中提炼出关键问题,并将这些问题反馈给学术界进行研究。
以理论计算机学科为例,理论计算机学科主要研究计算的可行性,在很大程度上是计算机科学和信息科学的基础;理论计算机可以看作是计算机和信息处理世界中的基本规律,类似于物理学中的客观规律。在计算机被创造之前,理论计算机就作为数学的分支存在,关注计算的基本理论、算法和复杂性,计算机发明制造、算法应用等许多划时代革新都建立在它的基础上。因此,理论计算机学科在计算机科学领域中扮演着重要的角色,处在计算机科学与其他学科交叉的前沿。理论计算机科学是方法论学科,它的价值蕴藏在计算思维中,具有很强的普适性,能够在计算机、经济学、自然科学、工程等多个领域交叉,能够在许多原来缺乏语言描述或难以求解的复杂问题和情景中,提出新问题、新视角和解决思路,这不仅仅对于计算本身有意义,对于物理世界和人类社会也有重要意义。
理论计算机和应用之间的匹配是一个非常重要的前沿方向。在过去,理论计算机是先有理论,再有计算机;计算机的行为是由人来设定的,人类完全能够理解。但是随着计算机的复杂度越来越高,包括 ChatGPT 模型等的复杂度已经越来越接近自然科学,这时需要做一些实验来探索验证其理论,从而与原始的理论产生了不一致。因此,如何将理论与应用更加匹配是一个非常重要的前沿方向。当理论与应用不匹配时,需要发展新的理论或将理论应用的抽象性更好地呈现。例如,在深度学习方面,应用非常前沿,但理论认知还不够。因此,需要探索如何使理论和应用结合更加紧密。该方向既与基础研究密切相关,也涉及应用研究,同时也受到好奇心的驱动。2020 年华为成立了理论计算机实验室,研究方向涉及工业应用中算法复杂性相关的问题。理论计算机学科在工业应用中大有用武之地,尤其是在华为的信息与通信技术(ICT)、光、速通、芯片、系统、应用和云服务等方面都有大量的应用。
当前中国企业在高新技术方面有很大的探索空间,但因同时面临较大风险而止步不前。虽然企业是技术转移转化为产品的主体,但在探索新技术方面涉及较多基础研究投入,企业面临着较大的风险,而很多企业不愿意承担这种风险。这也导致了当前我国在复杂芯片设计和电子设计自动化(EDA)工具方面存在一定的短板。
以处理器芯片为例,处理器芯片需要软件和硬件的配合,是一类相对设计比较复杂的芯片。近几年,“开源芯片”(将开源软件的模式应用到处理器芯片设计中)的设计方式代表了处理器芯片领域的新方向。例如,RISC-V 新型处理器的架构,受到全球关注。可以像通信领域的 5G 标准那样,联合全球力量共同构建芯片生态,共同制定标准,各国可以在产品层面进行竞争。未来芯片的设计希望通过更加开放的方式,充分发挥出市场规模大、技术人才多的中国优势。近年来,中国科学院计算技术研究所发起的“香山”开源芯片项目,吸引了国内外企业参与联合开发。
人才培养是信息技术领域发展的重要动力储备
我国科技事业发展进入新阶段,创新成为引领发展的第一动力。在本土培养出规模宏大、具有突出创新能力的青年科技人才,是我国科技事业实现可持续发展的动力源泉。
如今,我国科研院所和高校在基础理论与核心技术方面投入了大量资源来培养人才、全力攻坚。例如:2019 年 8 月,中国科学院大学启动了“一生一芯”计划,通过让本科生全程参与处理器芯片从设计到生产、运行的全过程,培养具有扎实理论与实践经验的处理器芯片设计人才,提高我国处理器芯片设计人才培养规模,缩短人才从培养阶段到投入科研与产业一线的周期,培养更多国家紧缺的芯片人才。该计划已经开展了 5 期,有超过 2000 名学生参与,初步形成了大规模的高质量芯片设计人才培养方案。香港科技大学(广州)微电子学域组建团队,建立了一系列中央研究设施,包括材料、器件微纳加工实验室和 EDA 研究中心,旨在为微电子领域培养人才并推动产出更多的原创技术。近期,该团队在光电融合芯片、验证和多处理器高速仿真等领域取得了一些进展和原创性发现。
在信息技术领域的快速发展中,科学界的合作方式可能会出现一些变化。以前的学校和研究所的组织结构可能需要进行调整,以适应人工智能所带来的一系列变化。这些变化也会影响到学生的课程设置和教育方式。人工智能所带来的冲击让现有的教育体系显得跟不上技术进步的潮流。因此,需要不断地调整教育方式和组织结构,以适应新的科技发展趋势。
2.信息技术将推动自然科学研究加速发展
人工智能成为推动基础科学研究加速的重要动力
事实上,信息技术已经逐渐渗透到自然科学研究中。例如,数据库和人工智能等方法已经成为日常科研研究中必不可少的工具。
在数据科学领域,图灵奖获得者吉姆 · 格雷(Jim Gray)提出了第四范式——在实验观测、理论推演、计算仿真之后的数据驱动的科学研究范式。近几年第五范式被提出,这类新的科学研究范式是以智能为研究目标的浸入式具身研究,基于数据科学本体论认识。可以猜测“第五范式”和第四范式一样,都会以数据为对象;不同的是,“第五范式”更侧重于人、机器及数据之间交互,强调人的决策机制与数据分析的融合,体现了数据和智能的有机结合。
人工智能与科学研究结合可以帮助科研人员提高科学研究的效率和准确度。例如,在数学、统计学、物理学和计算机科学等领域有交叉背景的研究人员,就可以将人工智能与高性能计算结合起来,为分子动力学模拟和第一性原理模拟提供强大的工具。通过超级计算机的加速,研究人员在模拟原子方面取得了很大的突破,模拟规模从之前的百万级别提升到亿级,模拟时间已经提升到了纳秒级别,这对物理学和材料学研究都有很大的帮助。随着科学和人工智能的不断结合,未来将会有更多的突破。
未来,数据将成为科学研究的基础资源,数据库将成为重要的科学基础设施,像大科学装置一样滋养各学科成长。松山湖材料实验室联合中国科学院物理研究所近期发布的材料科学数据库(https://Atomly.net),利用高通量计算和信息化技术将高质量科学数据带给我国科研工作者。在信息技术助力下,物质科学发展进入了“大数据+人工智能”时代,打破了国外在此领域中的垄断地位,为广泛支撑我国物质学科的发展打造了优质基础数据及工具,并已经开始发挥效力,切实地推进了领域发展。
人工智能对整个科学领域带来了巨大的冲击,包括在教育领域也产生了影响。在学习和研究中,新技术的应用会带来新的挑战和机遇。例如,在使用 GPT 等技术时,需要权衡其优缺点,确保其合法和合理使用。从信息本身的角度来看,信息处理是现代社会的基础,包括在信息的收集、整理、加工、存储、加密等各个环节。人工智能对于信息的整理和收集有着巨大的帮助,但是在深度挖掘信息方面,由于人工智能本身是基于统计方式,其对于事物本身的发现仍然存在挑战,需要进行更多的研究和突破。因此,在应用人工智能时,需要充分考虑其局限性,同时也需要积极探索新的技术和方法,不断推动人工智能的发展。
在人工智能和理论计算机的发展过程中,需要关注它们对科学研究的正面和负面影响。正面影响:一方面,人工智能会降低基础科学研究的门槛,让更多的人可以参与到这个过程中;另一方面,从国家尺度到全球尺度来看,人工智能也会使大规模协作更加容易,科学家之间的合作将更加便捷。负面影响:例如,误用数据工具会导致大量的文章出现,而且现在已经有机器生成数据和文章、再用机器处理这些文章的情况,这可能导致信息流失和物化等问题。因此,在使用人工智能和理论计算机进行科学研究时,我们需要审慎地权衡利弊,保持对数据和研究结果的质量和准确性的关注。
人工智能促进学科交叉和交叉学科的发展
信息技术作为自然科学研究的工具,已经被广泛应用并取得了显著成果。除此之外,计算机科学的发展也对自然科学研究产生了深远的影响。例如,理论计算机中的 NP 完全问题,起初只是为了计算复杂度而提出,但现在已经被广泛应用于物理学、化学和生物学等领域。这些学科使用 NP 完全问题阐述它们的规律和复杂性,并将其作为一种描述复杂性的工具。如果某个物质是 NP 完全的,说明它的规律比较混乱;反之,如果它不是 NP 完全的,就可能存在一些内部规律。这种跨学科的应用,充分体现了计算机科学在自然科学研究中的重要作用。从不同的角度看待计算机领域,如与物理学、经济学等学科的结合,可以发现计算机科学的深刻性、普适性等方面的优势。计算机领域之所以如此独特,是因为它拥有着丰富的色彩和多样性。
信息技术和计算的发展为自然科学研究带来了新的本质概念和度量方法,这对科学的发展非常有益。例如,研究证明了一个统计物理系统中配分函数计算的复杂度与物理系统的相变线完全重合,这表明计算复杂度的概念与物理系统的相变有着内在联系。类似这种交叉学科的发展不仅是将信息技术作为工具使用,而且还为科学研究提供了新的本质概念和方法。因此,需要探索更多的交叉学科研究,将不同领域的知识和方法相互融合,推动科学研究的发展。又如,通信技术的发展,早期是基于香农的信息论和麦克斯韦的电磁场理论,但当将这两个理论结合起来,用电磁场作为信息的载体,就可以打破信息与物理之间的边界,提高通信效率。这种连接是非常重要的,可以给信息和通信领域带来更多的创新和突破。
第五范式是当前科学研究特别是“AI for Science”(人工智能和科学的结合)中的一个重要模式。现在,人们更多地认为人工智能可以帮助我们发现科学规律,并提出假设。特别是现在的大型语言模型,它可以阅读各种文献,包括计算机科学、信息科学,以及一些传统学科(如物理学和化学等)领域,这些概念在其语义空间中是相通的。因此,人工智能就像一个通才,能够促进不同学科之间的交流和互动,从而发现它们之间的共同点,并提出相关的例子。这种交叉学科的交流可以带来新的科学发现,也可以让我们更好地了解人工智能与科学之间的关系。
作为科研人员的工具,人工智能输出结果也需谨慎对待
人工智能在科学研究中的作用非常明显,它可以帮助科学家更好地探索和研究。以 ChatGPT 为例,它可以为研究人员提供更好的思路和方向,甚至比科学家本身的想法更完善。此外,ChatGPT 的输出还具有一定的随机性,可以作为头脑风暴的工具,提供新的思路和想法。然而,使用者也需要认识到人工智能模型背后的超参数,以及它们产生的输出可能存在的偏差和误差。因此,在使用人工智能模型进行科学研究时,需要谨慎对待其输出结果,同时保持对科学研究质量和准确性的关注。
3.信息技术引领工业界向数字化和智能化变革
人工智能为工业界和下游应用带来利好
人工智能、数据驱动和算力已经在科学界引起了巨大的变革,这种变革在工业界中也已经悄悄地发生了。随着信息技术的不断发展,工业界也在逐渐转向数字化和智能化。在这种环境下,产学研关系的发展和工业界发生的变化值得重点关注。
人工智能的发展为工业界和下游应用带来了明显利好。随着 AI 模型的通用性和能力的不断提高,下游应用的开发成本得到了大幅降低。以往将 AI 应用于传统行业需要专业人员进行数据收集、标记和调试,成本较高。现在,AI 模型的通用性和智能性得到了提高,每个人都可以利用自己的数据进行训练;AI 模型的理解能力也大幅提高,能够按照用户的意愿进行交流和修正。这种 AI 模型的广泛应用,使得下游应用的开发成本大幅降低,用户只需要通过简单的接口和提示就可以调试修改并达到想要的效果,这极大降低了成本和消耗的算力。因此,AI 模型在工业界和下游应用中的前景非常广阔。
人工智能在自然科学领域的发展前景非常广阔,将会取得更多的突破和进展。在未来 3—5 年,人工智能有望在生物学、物理学、气象预报和 EDA 集成电路设计工具等领域取得重大突破。目前,在这些领域已经有了一些初步的结果。例如,在生物学领域,机器学习已经被用于加速仿真;在物理学和量子物理学领域,也有许多应用场景;而在 EDA 集成电路设计工具领域,机器学习已经展示了其带来的巨大效果和效率。但目前这些应用场景仍需要进一步工业化,然后才能传导到产品上。
信息技术领域发展趋势
开源模式在信息领域中已经产生了巨大的影响,未来 3—5 年影响将会更加深远。开源软件已经对信息领域产生了巨大的影响,现在这种模式正在向硬件领域渗透。例如,在芯片领域,开源芯片的趋势将会逐渐增强。另外,尽管目前开源预训练模型还只是小模型,但是随着越来越多的人加入进来,它有可能从小模型逐渐成长为大模型。开源模式将会带来一系列深远的影响,包括数据的开源方式、数据共享和交换方式等方面。这种模式的影响不仅仅是单个技术层面的,更是整个技术研发模式和生产关系的改变。因此,不仅要重视开源模式的影响,更要不断适应这种变化,以便更好地推进信息技术的发展。
信息技术是一个能不断保持指数型增长的领域,这种指数型增长趋势并非每个研究领域都存在。以飞机发动机推力的发展为例,从 1911 年莱特兄弟发明第一架飞机到 20 世纪 50 年代,在这期间飞机发动机推力的发展出现了指数型增长;这种增长曾经让人们对能否登月充满了期待,但后来这种发展趋势基本停滞了。相比之下,从 20 世纪 60 年代起,信息技术领域中的摩尔定律已经发展了近 60 年,虽然摩尔定律的发展从现实中看即将面临停滞,但是数据领域又呈现出一个指数型增长,这给信息技术领域带来了新的活力。这种增长趋势不仅在硬件方面有所体现,在数据量和其他维度上也呈现出指数型增长。这是信息技术领域的显著特点,我们需要把握住这种机遇,不断发挥其优势,推动信息技术与其他领域的结合。
人类社会已进入信息时代,但是人们对于信息科技的理解、掌握和应用还远远不够。近年来,我们已经看到了许多令人惊叹的应用场景(如 ChatGPT 等),但这些只是冰山一角,未来还会有更多的新技术和新突破涌现。从信息技术领域来看,当前是学术研究的黄金时代,虽然美西方国家试图与中国“脱钩”,这就逼迫我们做自己的原创技术,寻找其他的出路,这给我们提出了新的挑战,但更是一个难得的机遇。在一个新的领域里,永远不缺乏新的出路。因此,要牢牢抓住这个机遇,积极探索开展研究,努力推动信息技术的发展。
信息科学和信息技术是一种共性技术,对于不同的科学研究和工业应用来说,它们都是底层的关键技术。因此,信息技术的重要性不言而喻,它对于科学研究和产业应用都具有助力作用。信息技术已经广泛应用于各个领域,如医疗、金融、交通等,为人们的生活和工作带来了便利。同时,信息技术的发展也推动了各个行业的创新和转型升级。在未来,随着信息技术的不断发展,它将继续发挥更加重要的作用,为人类的进步和发展作出更大的贡献。
包云岗 中国科学院计算技术研究所副所长、研究员,中国科学院大学计算机科学与技术学院副院长、教授。主要研究领域为计算机系统结构。
刘 淼 中国科学院物理研究所、松山湖材料实验室特聘研究员。主要研究领域:发展“人工智能+材料科学”方向的底层方法和数据库,主导开发了Atomly材料科学数据库及平台等。
陆品燕 上海财经大学信息管理与工程学院教授,理论计算机科学研究中心主任。主要从事理论计算机及学科交叉方面的研究。
邱锡鹏 复旦大学计算机科学技术学院教授。主要从事自然语言处理、深度学习等方向的研究。
须 江 香港科技大学和香港科技大学(广州)微电子学域主任、教授。主要从事集成电路方面的研究。
文章源自:
包云岗, 刘淼, 陆品燕, 等. 关于信息技术驱动未来产业的若干思考. 中国科学院院刊, 2023, 38(5): 766-772
DOI:10.16418/j.issn.1000- 3045.20230515003
标签:
关键词: