(资料图)

编程客栈()12月9日 消息:如今,AI系统的能力越来越出众,比如最近火遍全网的chatgpt可以写作、写代码、写小说等等。最近,DeepMind 的新人工智能系统AlphaCode在能够在编程竞赛中“达到接近人类水平的表现”也引发了不少关注。

据科学杂志的报道,与 Codex 的研究javascript人员一样(注:Codex作为 OpenAI 用来支持 github Copilot 的大规模预训练模型,可谓是目前最强的编程语言预训练模型。),AlphaCode 的创建者首先向 GitHujsb 提供了一js个大型语言模型,其中包含了数十亿GB的代码,目的只是为了让 GitHub 熟悉编码语法和约定。

接着,他们训练使用从编程竞赛中收集的数千个问题将问题描述转化为代码。他们使用从编程竞赛中收集到的数千个问题,训练AI系统将问题描述转换成代码。

例如,一个问题可能要求程序确定长度为 n 但不包含任何连续零的二进制字符串(零和一的序列)的数目。当遇到新问题时,AlphaCode 生成候选代码解决方案(用 python 或 C + +) ,并过滤掉不好的解决方案。但是,尽管研究人员之前使用 Codex 等模型生成了数十或数百个候选方案,对比下下,DeepMind 却可以让 AlphaCode 生成了多达100万个候选答案。

为了过滤不好的解决方案,AlphaCode 首先只保留1% 通过伴随问题的测试用例的的程序。为了进一步缩小范围,它会根据训练人员的输出与虚构输入的相似度对其进行分组。然后,它从最大的集群开始,逐个提交每个集群的程序,直到成功提交一个或达到10个(大约是人类在比赛中能提交的最大值)。从不同的集群提交允许它测试广泛的编程策略。

研究人工智能编码的康奈尔大学计算机科学家凯文•埃利斯(kevinEllis)表示,这是 AlphaCode 过程中最具创新性的一步

据悉,经过训练,AlphaCode 解决了大约34%的分配问题。对比之下,在类似的基准测试中,Codex 仅成功解决个位数百分比的问题。

为了进一步测试其实力,DeepMind 让 AlphaCode 参加js了在线编码竞赛。在至少有5000名参与者的竞赛中,该系统的表现优于45.7% 的程序员。

研究人员还将其程序与训练数据库中的程序进行了比较,发现它没有重复大量的代码或逻辑。它产生了一些新的东西——一种让埃利斯感到惊讶的创造力。这项研究指出了软件不断自我改进的长期风险。一些专家表示,这种自我提升可能导致超级智能人工智控制世界的结果。虽然这种情况看起来遥不可及,但研究人员仍然希望人工智能编码领域能够建立制衡机制。

如果你想了解AlphaCode 更多内容,可访问官网了解。网址:https://alphacode.deepmind.com/

推荐内容

热点新闻