品玩 December 08, 2021

艾达·拉芙蕾丝,19世纪女英国的一位女数学家,诗人拜伦之女,在一份1843年出版的笔记中针对查尔斯·巴贝奇设计的世界上第一台可编程计算机提出建议,对机器进行编程以计算伯努利数的数据输入,这个最终遗憾留于纸上的设想被认为是第一个计算机程序。

103年后,美国人莫克利和艾克特发明了世界上第一台通用计算机“ENIAC”。1971年,Kenbak Corporation的Kenbak-1诞生,人类历史上首次个人电脑的普及迹象出现。

然后是2.97亿台,这是2020年全年全球PC市场的出货量数据。全球互联网的年耗电量在2017年已经超过2万亿度电,接近美国整个国家年用电量的一半,需要200个三峡大坝高负荷运转来抵兑。今时今日,日常的工作与生活已无法远离计算机。

与此同时,一个疑问在近几年屡次回头看向那位178年前的女性先驱:未来,程序员会消失吗?

人工智能站在这个天平的另一侧,机器代替人类思考的浪漫幻想在经历过几次低潮后,在21世纪的第二个10年里再度进入蓬勃发展的阶段。诸如Open AI Codex和Github Autopilot的出现则让那个虚无缥缈的发问越来越有了些逼近现实的味道。

今年八月Open AI发布最新技术Codex API,这个技术指向自然语言与代码之间的转化。OpenAI表示Codex API已经支持包括Python、JavaScript、Ruby等多种主流编程语言。可以将简单的自然语言(比如英语)转变成代码并且代替用户执行。这意味着毫无编码基础的普通人只要能用规则的人类语言给出需求,相应的程序就能被编写出来。

在编程技术的早期,使用汇编语言是编程的常态,之后这种繁琐的“低级语言”被另一种“高级语言”替代,也就是Python、Java、C、C++、这样的编程语言,这在编程效率,可读性以及与人类正常思维逻辑的贴近上更进一步。而“高级语言”之后的下一步趋势则是低代码或无码,开发者的工作进一步简化为顶层的决策者,不同经验水平的开发人员通过图形用户界面,使用拖放式组件和模型驱动逻辑来创造应用程序。低代码到无码的进一步开发降维,则几乎完全依赖于人工智能的发展。

Codex API是人工智能最新的进展之一,在其他更多子领域里,诸多突破性的进展同样正在出现。

ImageNet,一个包含近200个类别,近1500万张图像的数据集,常被用于计算机视觉下目标识别等领域的人工智能算法训练。ImageNet下的训练包含Top-1和Top-5两个准确率标准,即识别结果中第一顺位或前五顺位中包含正确答案的概率。

斯坦福大学《人工智能指数 2021 年度报告》中的数据显示,谷歌大脑团队的模型使用ImageNet预训练数据的最新系统在Top-1准确度在2021年1月达到了90.2%的最高准确率。而在2012年12 月,当时的系统每10次尝试中会出现4次错误。

这种精确性的提升与训练时间的缩短同时发生,MLCommons(一个非盈利性机器学习开放组织)组织举办的使用公共(残差网络)架构训练ImageNet网络的竞赛显示,ImageNet上的训练时间从2018年末的6分钟下降到2020年7月份的47秒。

Cityscapes是另一个关于城市街道场景的语义理解图片数据集,包含5000张高质量、像素级标注的图像和20000张每周标记的图像,用于深度神经网络的模型训练。语义分割是计算机视觉中的核心问题之一,场景理解基于静态2D图像、3D数据甚至体数据的识别能力,这极大约束着计算机视觉技术能在多大程度被运用进现实场景。近几年Cityscapes上的像素级语义标注任务挑战显示,2020年的参赛者基于交并比(IoU) 的分割准确度平均值比起2014年大幅提高了35%。

斯坦福DAWNBench团队则从费用维度度量了计算机视觉领域的进展。团队对训练单个图像识别系统做了纵向对比,2017年10月,一个ILSVRC的参赛者参赛需要耗费1100美元,3年后只需要不到8美元,成本下降了148倍。

算法设计的优化以及云计算成本的下降正在加速计算机视觉相关技术从实验室走出,成为更多热门领域可以触到的技术,比如近年同样呈现指数性发展的智能汽车和自动驾驶技术。

如果回到自然语言处理的领域上来,相比自然语言向代码的转换,“人话”向搜索结果的转化更容易让人理解一些。

2018年谷歌AI团队新发布的BERT模型在机器阅读理解顶级水平测试中,全部两个衡量指标上全面超越人类。2019年末,谷歌开始将此模型部署到搜索引擎中,到2020年10月,谷歌上的几乎每一个基于英语的查询都由BERT处理。公司表示其内部质量指标有了显著改善。

2020年年中,微软推出了BERT的一个“改进版本”,预训练语言模型DeBERT。在SuperGLUE语言基准上,DeBERT得到90.3分,超过人类89.8分的基准线。

DeBERT在SuperGLUE上捕获极高分,包括OpenAI首席科学家 Ilya Sutskever透露出未来GPT-4将会有大约100万亿个参数的消息,种种迹象表明人工智能在一些客观的衡量标准上正在逼近人类大脑(人类大脑有大约 100 万亿个突触)。但这两者中间仍然有着无限距离,而想象力和创造力是人类最后的一块自留地。

随着人工智能的发展以及部分应用场景的实现,全球范围内对于这一话题的研究和讨论愈热。相比2019年,2020年人工智能期刊论文数量增长了34.5%。并且中国在世界范围内的人工智能期刊论文引用次数首次超过了美国。另一方面,虽然疫情逼迫全球性会议向线上迁移,但《人工智能指数 2021 年度报告》中表示,2020年包括CVPR、ICCV在内的九个顶会的参会人员相比前一年几乎翻倍。

这一系列眼花缭乱而有令人兴奋的人工智能科研进展,让人们离一个与人工智能共生的时代越来越近。也让更多人开始思考,我们究竟要如何与人工智能相处。

在12月10日即将举办的品玩TIC2021科技创新者大会上,我们也邀请来亲身参与到人工智能的历史进程中的科学家和从业者,来展开一场关于未来的讨论:

人工智能作为一个深入改变着每个人日常生活的技术,需要更广泛直接的让更多人理解它的最新技术进展以及意义,在TIC上,京东探索研究院图神经网络方向负责人詹忆冰将会向大家介绍深度图神经网络近年整体的发展趋势;

与人工智能技术飞速迭代相伴随的,是人们对它在安全和隐私保护上越来越强烈的担忧。我们也邀请来RealAI瑞莱智慧副总裁唐家渝360 人工智能研究院产品及对外合作负责人童超,来分享人工智能时代的安全保障问题,一起讨论普通人是否有权力“拒绝”人工智能,又要如何”抵抗“恶意的人工智能应用;

随着虚拟与现实的边界越发模糊,一个越发成为共识的思考是:未来人们将与人工智能共享这个物理世界和虚拟世界。当天的活动,也可以提前体验一下这样的世界会是什么样子。STEPVR总裁郭成将会带来一场真人、虚拟人与机器人同时出场的“三人演讲”;

而今天讨论人工智能也是一个要“动感情”的事情,与人类做过最多感情交流的人工智能小冰背后的小冰公司 CEO李笛,在当天的活动上,也会分享他最新的思考,和大家探讨他们对于这个人工智能多样性时代的看法和想象。

我们凑齐这些不同的视角,是因为我们相信,今天是时候来这么一场关于人工智能的大讨论了。如果你也想第一时间聆听这些资深科学家和从业者的思考,请在12月10日加入我们的在线直播。本次大会还会有大量硬核的科学技术内容分享,欢迎点击进一步了解。

固定链接 '我们需要怎样的人工智能?是时候来一场讨论了' 提交: December 8, 2021, 6:18pm CST