早在好多年前不少电影都出现了人工智能(AI)这个概念,大家是不是第一时间想到那些好莱坞大片《艾利塔》、《终结者》、《钢铁侠》助理等等科幻电影那拥有人类智慧的机器人。那么AI到底是什么?今天带大家三分钟看懂ai人工智能。

  AI到底是什么?

  人工智能(英语:artificial intelligence,缩写为AI)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。该词也指出研究这样的智能系统是否能够实现,以及如何实现。同时,通过医学、神经科学、机器人学及统计学等的进步,常态预测则认为人类的很多职业也逐渐被其取代。

  AI 即是以人工编写的计算机程序,仿真出人类的智慧行为

  AI 这个词汇首次出现是在 1950 年,那时离现代计算机的发明也不过几年的时间,当时的人工智能做的不过是跑一些写好的逻辑程序、处理数学定理证明,应用其实并不广;此外,由于当时计算机体积庞大、性能又有诸多限制,人工智能发展很快就面临到瓶颈了。

  沉寂一阵子后,在约二、三十年前,因为计算机储存空间、运算性能的突破,AI 重新回归主流技术发展重点,开始出现机器学习这块领域,并得到了很好的成果,如发展出支持向量机(SVM)模型,能有效分类处理各种数据;到了最近几年,又因为技术与算法的进步,再度发展出深度学习这个领域,AI 的成长俨然已成为不可忽视的巨兽!

  到了这边,读者是否开始对逐渐出现的名词感到困惑呢?别担心,以下会用简单的方式向各位介绍。

  AI 的应用与技术内容

  AI 功能的身影已经充斥在我们的生活,它的样貌已不再那么的神祕,举凡交通、娱乐、医疗等,到处都可见其踪影,以下举几个例子让大家更了解 AI 的样貌:

  •   手机助理语音辨识功能
  •   社群网络上的广告投放
  •   影音网站的推荐
  •   导航最佳路线规划

  而要如何让计算机实现以上的功能呢?这边介绍一些常见 AI 的运行原理:

  搜寻:寻找最佳路径、最短运算的搜寻方法,用来加快计算机的运算或减少内存的负担,如 BFS 优先广度算法、A star(A*)算法等。

A*算法展示

  A*算法展示

  逻辑推论:为了让计算机能进行推理、抉择、修正,发展了许多逻辑推论系统,最广为大家使用的就是布林运算,其主要利用二元的运算符号(0、1)去定义逻辑的函数,相当方便直观,应用也很广泛。

  布林运算真值表

  统计、机率:主要目的是透过机率统计数学模型,帮助分析资料、处理大量数据,如 EM 算法、贝氏网络等。

  神经网络: 模仿生物神经网络的结构与功能,能透过输入的资料训练,产生对应的算法模型,学习判断指定的问题。

  解析 AI/ML/DL 的关系

  既然提到了神经网络,就不得不提及机器学习 Machine Learning(ML)、深度学习 learning(DL), 这两个最近非常火热的名词了,究竟机器学习(ML)与深度学习(DL)到底差别在哪呢?

  AI 演进

  我们可以从上面这张图清楚理解,AI、ML、DL 这三个名词的关系就像洋葱一样层层递进,机器学习(ML),是人工智能(AI)底下的技术分支,而深度学习(DL)是近年才从机器学习衍伸出的领域,可以比喻为俄罗斯娃娃,一个子领域之中又有更深入的子领域。

  机器学习与深度学习的训练比较:机器学习需要人为特征分类(Feature extraction),而深度学习则是交给模型自己处理分类

  机器学习

  简单来说,为了让计算机透过自我学习的方式,去解析数据或做出问题判断,不断优化改进自身,而非单纯写好程序,仅处理单一特定问题,其中其实包含了许多学问,如统计、机率、算法、逼近理论等多项领域。

  传统的机器学习结构:资料→特征撷取→模型→答案

  为了达到预测的效果,机器学习会不断让模型最佳化去拟合资料,然而在特征撷取上,仍然需要透过手动去标记特征,将特征转为编码或向量形式后,再透过机器学习的模型去处理,最后得到预测结果。

  机器学习在资料分析上已经发展得非常成熟。举例来说,如果将蓝球和红球都丢入袋子里,要怎么完美的划出一条线将他们分割呢?这时透过机器学习的模型—向量支持机(SVM)处理,就能将所有的球拉到更高的维度做切割,让原本散乱的球,在三维空间漂浮看起来,变得容易分类。

  SVM 分割示意图

  然而在处理影像辨识或是复杂的分析上,机器学习还是有一定的限制,毕竟它所需要的特征都还是需要人为的特征分类,那么深度学习又是如何运作的呢?

  深度学习

  深度学习是透过神经网络(Neural Network)的方式来实践,而神经网络由无数个神经元串联所组成,这些神经元的运作方式和人类神经一样,一个连着一个传递讯号,只不过输入的不是生物电流,而是变量、权重(weight)、误差(bias);其中,每个神经元本身都是个小小的函数,资料会在神经网络中慢慢转化,最后得到我们的预测模型。

  深度学习的结构:资料→模型(特征撷取自学)→答案

  与传统深度学习不一样的是,在特征撷取的部分,我们把它交给神经网络去处理,让它在不断地反复运算中逐渐萃取出所需要的特征,不断改进模型本身权重,最后产生预测模型。这个步骤需要大量的反复运算,也就是为什么深度学习领域到这几年随着 GPU 技术的突破才又突飞猛进的进步!

  以猫狗辨识举例,深度学习的训练只需将标记好类别的影像输入到模型中,神经网络会自行将影像特征撷取出来。那么这里问一个问题,如果这时候将猪的照片丢入,模型会给出什么结果呢?A. 猫 B. 狗 C. 猪,想好了吗?

  透过卷积神经网络训练猫狗辨识

透过卷积神经网络训练猫狗辨识

  其实答案选 A 和 B 都对喔!由于神经网络训练的是猫狗模型,所以模型会按照它分类的特征去判别这只猪的照片,尝试让它在猫或狗之中选出一个答案(即使它不是猫也不是狗),所以这也是深度学习的限制,预测的模型主要仍取决于输入训练的资料,所以选 C 的各位,抱歉答错了呦!

  AI的核心问题包括建构能够跟人类似甚至超卓的推理、知识、规划、学习、交流、感知、移物、使用工具和操控机械的能力等。人工智能目前仍然是该领域的长远目标。目前弱人工智能已经有初步成果,甚至在一些影像识别、语言分析、棋类游戏等等单方面的能力达到了超越人类的水平,而且人工智能的通用性代表着,能解决上述的问题的是一样的AI程序,无须重新开发算法就可以直接使用现有的AI完成任务,与人类的处理能力相同,但达到具备思考能力的统合强人工智能还需要时间研究,比较流行的方法包括统计方法,计算智能和传统意义的AI。目前有大量的工具应用了人工智能,其中包括搜索和数学优化、逻辑推演。而基于仿生学、认知心理学,以及基于概率论和经济学的算法等等也在逐步探索当中。

  看到这想必你已经知道了AI到底是什么,相信在不久的将来,最终的答案会为我们揭晓!