习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。2022年以来,以ChatGPT为代表的生成式人工智能席卷全球,被视作开启通用人工智能时代的钥匙,成为推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量。我国积极引导生成式人工智能发展,率先出台规范性政策文件,但是我国生成式人工智能整体竞争力与世界领先国家相比尚存在差距。
一是基础研究和核心技术不强。生成式人工智能依托的大模型构建、训练、调优、推理等流程使用的主要算法及核心技术被国外掌握,深度学习模型等重大原创性成果缺乏,自然语言处理技术与国外顶尖水平有一定差距,图形处理器(GPU)等高端芯片与国外存在代际差距。
二是数据资源未得到有效开发。数据对生成式人工智能大模型智能水平的影响占据主导地位,我国数据量大质低,许多不能直接用于模型训练,书籍期刊等版权数据、高质量互联网平台数据存在严格的防获取机制,大模型训练缺乏高质量的中文数据集。
三是部分生成内容违反伦理道德。一些基于机器学习算法的人工智能系统可能会出现歧视性偏见,导致一些产出或成果不公平或歧义,甚至有被滥用于诈骗、欺诈、政治造谣、伪造身份等风险。
四是人才紧缺。国内人工智能顶尖人才严重不足,人才培养能力相对薄弱、引进海外人才政策支持力度有限,对全球高端人才吸引力不足,难以满足行业发展需要。
为此建议:
一、加强基础理论研究和关键技术研发
开展大模型基础原理和新架构探索,前瞻布局视觉、多模态等下一代大模型研究,逐步形成生成式人工智能原创理论体系。重点突破分布式高效深度学习框架、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发,建立我国通用人工智能技术创新体系。有组织加大政策引导力度和资金支持力度,集中力量争取在芯片设计、制造上取得突破,并探索可重构、存算一体、超规格高算力智能芯片等新型架构芯片,形成对大模型训练、构建、推理等流程的算力支撑。聚焦产业需求,实施政企联动,支持企业等社会力量设立科学基金、科技奖项,对已获企业投资的科研院所开展的基础研究、应用基础研究和技术开发项目,采取财政优先跟投。
二、推动数据安全合理开放共享
建立多层次数据开放体系,推动具有知识产权的数据或公共数据机构,以及互联网平台对人工智能大模型构建实行分级分类数据开放,打破数据壁垒,促进数据转化利用和交易。建立我国大规模高质量中文数据集建设的长效机制,整合汇聚数据生产、存储、使用、加工、传输等各主体数据资源,建设大规模高质量的语言、语音、图像、视频和多模态数据集。统筹数据发展与安全,积极构建从硬件、基础架构、操作系统和应用等全套的国产化设备设施和软件程序等。
三、加强人工智能伦理道德评价
建立人工智能的伦理规范,明确人工智能的道德责任和社会责任,避免人工智能带来的负面影响和伦理风险。引入算法的伦理设计,从源头将算法透明、算法可解释、算法问责、算法审计等价值需求嵌入算法的设计当中。建立健全生成式人工智能评估、审查、监督、监测等各个环节的监管机制,强化责任主体科技伦理规范意识,推动各责任主体遵守科研诚信和科技伦理规范。
四、优化人才培养体系与拓展人才引进途径
依托人工智能实验室、人才实训基地等平台,深化产教融合、推动产学合作协同育人、培养适应产业发展需求的人才。通过与国外知名高校、科研机构和企业的合作,推进高层次人才的培养和引进。建立和完善人才评价和激励机制,设立创业基金、孵化器等,建设多元化人才梯队。加强国际技术合作,积极举办人工智能国际会议、论坛、展览等活动,加强全球人才的技术交流,促进学术成果共享。