机器学习是定义在学习之上的, 由于学习目前尚无严格的定义, 因此对机器学习也不能给出一个严格的定义。从直观上理解, 机器学习就是让计算机来模拟人类的学习功能, 它是一门研究怎样用机器来模拟或实现人类学习活动的一门学科。也是人工智能中最具有智能特征的前沿研究领域之一。目前, 关于机器学习的研究主要集中在几个方面:认知模拟、理论性分析、面向任务的研究。
1 机器学习的主要策略
学习是一项复杂的智能活动, 学习过程与推理过程是紧密相连的, 按照学习中使用推理的多少, 机器学习所采用的策略可分为:机械学习、类比学习、示例学习、解释学习以及基于神经网络的学习。
1.1 机械学习
机械学习也称记忆学习, 它是通过记忆和评价外环境所提供的信息来达到学习目的的。在这种学习方法中, 学习环节对外部提供的信息不进行任何变换, 只进行简单的记忆。虽然机械学习在方法上看似很简单, 由于计算机的存储容量相当大, 检索速度又相当快, 记忆精确、无丝毫误差, 所以也能产生人们难以预料的结果。机械学习的典型代表是西蒙的西洋跳棋程序。该程序用极大极小博弈树搜索来选择走法。学习环节记忆了棋局态势和倒推得极大极小值。在下棋过程中, 只要碰到过去出现过的棋局, 就可以直接采用原来的走棋方案。
1.2 类比学习
类比学习系统只能得到完成类似任务的有关知识, 因此, 学习系统必须能够发现当前任务与已知任务的相似点, 由此制定出完成当前任务的方案, 因此, 它比上诉两种学习策略需要更多的推理。
1.3 示例学习
示例学习也称为实例学习, 它是一种从具体示例中导出一般性知识的归纳学习方法, 这种学习方法给学习者提供某一概念的一组正例和反例, 学习者从这些例子中归纳出一个总的概念描述, 并使这个描述适合于所有的正例, 排除所有的反例。
1.4 解释学习
解释学习是一种分析学习方法。这种方法是在领域知识的指导下, 通过对单个问题求解例子的分析, 构造出求解过程的因果结构, 并获取控制知识, 以便于以后将其用于类似问题的求解。解释学习在获取控制性知识、精华知识、软件重用、计算机辅助设计和计算机辅助教育等方面有较多应用。
1.5 基于神经网络的学习
神经学习也称为联接学习, 它是一种基于人工神经网络的学习方法。利用神经网络解决问题, 一般分为训练和工作两个阶段。训练阶段的主要目的是要从训练样本中提取隐含知识和规律, 并存储在网络中, 供工作阶段解决问题使用。神经学习是指神经网络的训练过程, 其主要表现为联接权值的调整。
2 机器学习系统的基本结构
一个学习系统不仅与环境和知识库有关, 而且还应该包含学习和执行两个重要环节, 它们之间的关系如图1所示。
该图给出了学习系统的基本模型, 它由四部分组成。其中, 环境是以某种形式表达的外界信息集合, 它代表外界信息来源;学习环节是将外界信息加工为知识的过程, 它先从环境获取外部信息, 然后通过对这些信息的分析、综合、类比、归纳等加工形成知识, 最后把所形成的知识放入知识库中;知识库是以某种形式表示的知识集合, 用来存放学习环节所得到的知识;执行环节是利用知识库中的知识完成某种任务的过程, 并把完成任务过程中所获得的一些信息反馈给学习环节, 以指导进一步的学习。
2.1 环境与学习环节
环境中信息的水平和质量是影响学习系统设计的第一个重要因素。所谓信息的水平是指信息的一般化程度, 或者说是指信息适用范围的广泛性。而信息的一般化程度又是相对于执行环节而言的。高水平信息的一般化程度比较高, 能适应于更广泛的问题。低水平信息的一般化程度比较低, 只适用于个别问题。无论环境中信息的水平是高是低, 这些信息与执行环节所需要的信息水平往往是会有差距的, 学习环节的任务就是要缩小这一差距。如果环境提供的是高水平信息, 学习环节就是要补充遗漏的细节, 以便于执行环节能将其用于更具体的情况。如果环境提供的是低水平信息, 学习环节就要由这些具体实例归纳出适用于一般情况的规则, 以便执行环节能将其用于更广的任务。
2.2 知识库
知识库的形式和内容是影响学习系统设计的又一个因素。知识库的形式是与知识表示方式直接相关的。知识的表示有多种形式, 如特征向量, 一阶逻辑语句、产生式规则、语义网络和框架等。这些表示方式各具特点, 在选择表示方式时要兼顾以下几方面:表达能力强、易于推理、容易修改知识库、知识表示易于扩展。对知识库中的内容, 其初始知识是非常重要的。学习系统不可能在没有任何知识的情况下凭空获取知识, 它总是先利用初始知识去理解环境提供的信息, 并依次逐步进行学习。学习系统的学习过程实质上是对原有知识库的扩充和完善过程。
2.3 执行环节
执行环节是整个学习系统的核心, 它与学习环节之间是相互联系的。学习环节的目的就是要改善执行环节的行为, 而执行环节的复杂度、反馈作用以及透明性又会反过来对学习环节产生一定的影响。
复杂度。不同复杂度的任务, 所需要的知识是不一样的。一般来说, 一个任务越复杂, 它所需要的知识就会越多。
反馈。所有的学习系统都必须有从执行环节到学习环节的反馈信息。这种反馈信息时根据执行环节的执行情况, 对学习环节所获知识的评价。学习环节主要根据这些反馈信息来决定是否还需要从环境中进一步获取信息, 修改、完善知识库中的知识。目前, 学习系统所采用的评价方式主要有两种, 一种是由系统自动进行评价, 另一种是由人来协助未按成评价。所谓自由系统自动完成评价, 是指把评价时所需要的性能指标直接建立在学习系统中, 然后由系统由系统对执行环节得到结果自动进行评价;所谓由人来协助完成评价, 是指由人提出外部执行标准, 然后观察执行环节相对这个标准的执行情况, 并将比较结果反馈给学习环境。
透明性。所谓透明性是指从系统执行部分的动作效果可以很容易地对知识库的规则进行评价。可见, 执行环节的透明性应该越高越好。
摘要:学习是人类获取知识的重要途径和人类智能的重要标志, 而机器学习则是机器获取知识的重要途径和机器智能的重要性标志。机器学习一直是人工智能研究的核心课题之一。本文主要本文讨论了机器学习的一些基本概念、主要策略和结构。
关键词:机器学习,系统,模型
参考文献
[1] 李长河.人工智能及其应用[M].北京机械工业出版社, 2006.
[2] Tom M.Mitchell, 曾华军, 等[译].机器学习[M].北京:机械工业出版社, 2003.
相关文章:
以语言学习策略促进航海英语教学01-22
初中生的学习动机与学习自我效能感的关系01-22
家庭环境因素与小学生学习成绩的关系研究01-22
二语习得与英语学习的关系研究初探01-22
提升小学生学习力的策略与技巧01-22
外语学习行进中的高级语言学习者语言滞化现象成因探索与分析01-22
合作学习中的组织与管理策略心得01-22
高效学习的策略与方法01-22
浅谈基础知识学习与能力培养的辩证关系01-22