某某茶叶有限公司欢迎您!
金沙棋牌在线 > 必赢棋牌官网 > 人工智能关键词

人工智能关键词

时间:2020-01-31 10:11

  随着人工智能(AI)技术对各行各业有越来越深入的影响,我们也更多地在新闻或报告中听到“机器学习”、“深度学习”、“增强学习”、“神经网络”等词汇,对于非专业人士来说略为玄幻。这篇文章为读者梳理了包括这些在内的12个关键词,希望帮助读者更清晰地理解,这项人工智能技术的内涵和潜能。

向本书作者,目前为止最伟大的人工智能预言大师,雷·库兹韦尔博士致敬,请接受我最虔诚的膝盖,与我大把已经支离破碎的脑洞!—某石写在前面

 

  1、 机器学习

当我敲击键盘的时候,我在想,几亿年前那只最后进化成智人的猴子,当它正经历进化那“时间曲线拐点”的时候,是什么样的感受?是不是前一秒,它还在懵懂地敲击着两块石头来取火,电光火石间,人类的历史已然发生了巨大的转折。

数学基础:高等数据,工程数学线性代数

  汤姆·米歇尔教授任职于卡内基梅陇大学计算机学院、机器学习系,根据他在《机器学习》一书中的定义,机器学习是“研究如何打造可以根据经验自动改善的计算机程序”。机器学习在本质上来说是跨学科的,使用了计算机科学、统计学和人工智能以及其他学科的知识。机器学习研究的主要产物是算法,可以帮助基于经验的自动改善。这些算法可以在各个行业有广泛应用,包括计算机视觉、人工智能和数据挖掘。

可是,天真的它还一无所知。

概率论

  2、 分类

正像现在,这个愚昧而无知的我。

微积分

  分类的含义是,打造模型,将数据分类进入不同的类别。这些模型的打造方式,是输入一个训练数据库,其中有预先标记好的类别,供算法进行学习。然后,在模型中输入类别未经标记的数据库,让模型基于它从训练数据库中所学到的知识,来预测新数据的类别。

诚如开篇,雷从量子力学的角度来谈论宇宙的诞生:“如果宇宙未能进化出有意识的生命去理解它的存在,那么这种宇宙从一开始其实就没有存在过。

 

  因为这类的算法需要明确的类别标记,因此,分类算是“监督学习”的一种形式。

而从无意识,到有意识间跃进的距离,该有多远?是可见光粒子穿梭过杨氏双缝的距离嚒?是蜉蝣生物从朝生到暮死的距离嚒?是地球运转一个四季的距离嚒?是猿猴跨向人类的距离嚒?是亘古不变嚒?是沧海桑田嚒?

常见人工智能算法

  3、 回归

是有生之年嚒?是百年以后嚒?是此时此刻嚒?

主流机器学习框架

  回归是与分类紧密联系在一起的。分类是预测离散的类别,而回归则适用的情况,是当预测“类别”由连续的数字组成。线性回归就是回归技术的一个例子。

然而,雷却给出了这样的预言:

人工智能数学理论

  回归

随着技术的不断变革,“在21世纪结束之前,人类将不再是地球上最有智慧和能力的物种。”对于我们引以为傲的大脑,他说:“20世纪伊始,计算机的速度每三年就增加一倍,到20世纪五六十年代,每两年就增加一倍,现在每一年就增加一倍。这种趋势将延续到2020年,届时,计算机的存储容量和计算速度便可和人脑一较高低。” 即便如此,我们依旧不会承认,计算机可以与人类大脑智能的灵活性相媲美。然而,他继续说道:“使用逆向工程法——扫描人类的大脑(这项技术在21世纪将成为现实),并在一种内存充足的神经计算机(这种经过特殊设计的计算机可以模拟数量庞大的人类神经元)当中复制大脑的神经电路。”“到21世纪20年代时,计算机将能够自主阅读,能理解模仿所听见的话语。”当它们阅读完所有可阅读的材料之后,它们还会“大胆挺入物质世界,从各类媒体及资讯服务业中获取信息,并同其他计算机共享这些信息(机器要比制造它们的人类更容易做到这一点),从而自主收集获取信息。”“一旦计算机的智能与人类相当,它就势必会有超越人类智慧的一天。”“如果把一台智能水平与人类智能相当的机器与电脑在速度,精准性以及存储共享能力方面的优越性能结合起来,那么这台机器一定所向披靡。”  

矩阵

  4、 聚集

接下去的每一章翻过,我的内心都在希翼幻想与毛骨悚然间跌宕起伏,备受煎熬。我既崇敬万分,迫不及待,又脊背发凉,满怀惶恐地看着作者,那样轻而易举地,一步步地分析得出,这一切将如何,一点一点地成为现实。

凸优化

  聚集是用来分析不含有预先标记过的类别的数据,甚至连类别特性都没有标记过。数据个体的分组原则是这样的一个概念:最大化组内相似度、最小化组与组之间的相似度。这就出现了聚集算法,识别非常相似的数据并将其放在一组,而未分组的数据之间则没那么相似。K-means聚集也许是聚集算法中最著名的例子。

图片 1

流优化

  由于聚集不需要预先将类别进行标记,它算是“无监督学习”的一种形式,意味着算法通过观察进行学习,而不是通过案例进行学习。

首先,作者给出了他对于智能的定义:“对有限的资源(包括时间)进行最优化利用以达成各种目标。”此外,他也特别举例了自已所最赞同的来自R·W·杨的定义:“智能就是在混乱中发现秩序的能力。

牛顿法

  5、 关联

于是,一个核心问题也随之被抛出:“一种智能体是否能创造出另一种比自身更智能的智能体?

 

  要解释关联,最简单的办法是引入“购物篮分析”,这是一个比较著名的典型例子。购物篮分析是假设一个购物者在购物篮中放入了各种各样的物品(实体或者虚拟),而目标是识别各种物品之间的关联,并为比较分配支持和置信度测量(编者注:置信度是一个统计学概念,意味着某个样本在总体参数的区间估计)。这其中的价值在于交叉营销和消费者行为分析。关联是购物篮分析的一种概括归纳,与分类相似,除了任何特性都可以在关联中被预测到。 Apriori 算法被称为最知名的关联算法。

为了与人工智能的诞生作比较,雷先详谈了创造人类的智能过程进化。事实上,不止是人类,地球上的成百上千万变化多端的物种,都是“进化”这一程序设计大师的产物,而这些程序则被悄悄地记录在“一种独特分子构成的化学结构中,这种结构名为脱氧核糖核酸,即DNA。”DNA复制这一过程看似非常复杂,其实极其简单。地球上存在着数百万种生命形式,从最简单的原始细菌到复杂的人类,其错综繁复的基因数据库却仅有4对碱基对组合构成。“小型记录器”的核糖体分子从仅有的20种氨基酸中读取密码并复制蛋白质。地球生物体中丰富多样的功能机制都根据这一有效密码运作。”

特征工程

  关联也属于“无监督学习”的一种形式。

然而,对于创造了拥有睿智大脑人类的“进化”,雷对于它的评价却是:“只比白痴聪明那么一点点。”【不知道达尔文看到这句话会不会哭瞎在厕所呢?╮(╯_╰)╭】

网格搜索

  6、 决策树

理由很简单,“进化有一个致命缺陷——速度极其缓慢。”“因为解决问题的快慢一直都是衡量进程好坏的指标。”“进化的确已经取得了非凡的设计成果,然而用时实在太久。如果我们从时间角度考量进化的工作性质,只能很遗憾地说,“进化的智商无限接近于零。”另外,他也在前文中提到,尽管进化善于创造,却“缺乏过程记录”,“只留给我们一套低级的目标代码(即上亿比特的编码数据),却未提供更高级的源代码(即用人类能理解的语言表示的代码),没有任何解释说明。”“而在人类基因组计划中,我们正逐步记下60亿比特的人类基因密码”,但基因组密码的逆向工程,即解密其工作原理的过程,仍任重而道远。可见,“进化”并非一个善于耐心讲解的导师。除此之外,“进化还是一个效率非常低下的程序设计师。据现下估计,97%的基因密码不作运算。也就是说,大部分密码序列不能生产蛋白质,看上去毫无用处。真正活跃工作的密码仅为23兆字节,这比微软文字处理软件占用的空间量还要小。”

超参数调优

  决策树是一种自上而下、分步解决的递归分类器。决策树通常来说由两种任务组成:归纳和修剪。归纳是用一组预先分类的数据作为输入,判断最好用哪些特性来分类,然后将数据库分类,基于其产生的分类数据库再进行递归,直到所有的训练数据都完成分类。打造树的时候,我们的目标是找到特性来分类,从而创造出最纯粹的子节,这样,要将数据库中所有数据分类,只需要最少的分类次数。这种纯度是以信息的概念来衡量。

就自我改进而言,每次只能保证一个或几个特性发生积极变化的,“适者生存自然选择法则”,并无法真正影响到面向绝大多数改变的,基因随机编程机制

 

  一个完整的决策树模型可能过于复杂,包含不必要的结构,而且很难解读。因而我们还需要“修剪”这个环节,将不需要的结构从决策树中去除,让决策树更加高效、简单易读并且更加精确。

而这一点,正与人类编写程序的惯常方法恰好相反。“我们会有目的地进行程序变更设计,可以同时对程序进行多重变更,其中每一项变更的效用都经过独立测试,而不是对改程序的总生存期做一个概括评价。”而人类创造技术之所以更高效,还在于“我们将分散的能量聚集到几件事上,速度加快了上百乃至10亿倍。”

决策树

  7、 支持向量机(SVM)

技术即人类所创造的“进化变体”。通常会被定义为“人类为获得控制环境的能力,而挖掘的创造工具的技艺。”然而,这一定义并不充分,正如猴子也可以使用石头来敲开坚果一样。而“人类的独特之处在于运用知识——记录下来的知识,来制造工具。知识库代表了不断发展的技术的遗传密码。”“进化过程的关键要求之一就是将进化结果以书面的形式记录下来,否则这一过程将注定一直在为已经解决的问题反复寻找答案。”不难理解,为什么在当今的时代,“大数据”的地位会是如此举足轻重。

随机森林算法

  SVM可以分类线性与非线性数据。SVM的原理是将训练数据转化进入更高的维度,再检查这个维度中的最优间隔距离,或者不同分类中的边界。在SVM中,这些边界被称为“超平面”,通过定位支持向量来划分,或者通过最能够定义类型的个例及其边界。边界是与超平面平行的线条,定义为超平面及其支持向量之间的最短距离。

比较过后,雷毫无顾虑地给出了结论“人类必会完胜进化,并在几千年内完成进化几亿年才完成的创造。

分类算法

  SVM的宏伟概念概括起来就是:如果有足够多的维度,就一定能发现将两个类别分开的超平面,从而将数据库成员的类别进行非线性化。当重复足够多的次数,就可以生成足够多的超平面,在N个空间维度中,分离所有的类别。

而且,他甚至笃定地说道,“从进化或人类历史角度看,本书读者在有生之年必能见证机器智能赶超人类智能的一天。

 

  8、 神经网络

图片 2

KNN算法的原理

  神经网络是以人类大脑为灵感的算法,虽然,这些算法对真实人脑功能的模拟程度有多少,还存在很多的争议,我们还没法说这些算法真正模拟了人类大脑。神经网络是由无数个相互连接的概念化人工神经元组成,这些神经元在互相之间传送数据,有不同的相关权重,这些权重是基于神经网络的“经验”而定的。“神经元”有激活阈值,如果各个神经元权重的结合达到阈值,神经元就会“激发”。神经元激发的结合就带来了“学习”。

这里,我们必须提到一个重要的定律,即“

贝叶斯算法原理

  9、 深度学习

加速回报定律

svm分类预测

  深度学习相对来说还是个比较新的词汇,虽然在网络搜索大热之前就已经有了这个词汇。这个词汇在研究和业界都名声大噪,主要是因为其他一系列不同领域的巨大成功。深度学习是应用深度神经网络技术——具有多个隐藏神经元层的神经网络架构——来解决问题。深度学习是一个过程,正如使用了深度神经网络架构的数据挖掘,这是一种独特的机器学习算法。

。”,其定义为“

 

  10、增强学习

秩序以指数级速度增加,时间也随之以指数级速度加速。

主流回归模型

  对于“增强学习”最好的描述来自剑桥大学教授、微软研究科学家Christopher Bishop,他用一句话精确概括:“增强学习是在某一情景中寻找最适合的行为,从而最大化奖励。”增强学习中,并没有给出明确的目标;机器必须通过不断试错的方式进行学习。我们来用经典的马里奥游戏举个例子。通过不断试错,增强学习算法可以判断某些行为、也就是某些游戏按键可以提升玩家的游戏表现,在这里,试错的目标是最优化的游戏表现。

线性回归