【摘 要】本文综述了学习控制的概念,发展历程和研究方向,并对目前学习控制的几大前沿热点加以考察,最后根据学习控制目前的运用状况探讨未来的发展趋势及方向。
【关键字】学习控制;迭代学习控制;反复学习控制;异步学习控制
引言
控制理论从形成到发展至今,主要分为三个阶段:第一阶段是以40年代兴起的调节原理为标志,称为经典控制理论阶段;第二阶段以60年代兴起的状态空间法为标志,称为现代控制理论阶段;第三阶段则是80年代兴起的智能控制理论阶段。这是一种基于模型的系统综合方法,以这种方法进行控制系统综合设计的步骤是先建模,再利用数学模型设计控制器。
1 学习控制的概念
学习控制是智能控制的一部分,是模拟人类自身各种优良控制调节机制的一种尝试。学习控制系统是一个能在其运行过程中逐步获得被控过程及环境的非预知信息,积累控制经验,并在一定评价标准下进行估值、分类、决策和不断改判系统品质的自动控制系统。
学习控制根据系统工作对象的不同可以分为两大类:一类是对具有可重复性的被控对象利用控制系统的先前经验,寻求一个理想的控制输入。而这个寻求的过程就是对被控对象反复训练的过程。这种学习控制又称为迭代学习控制;另一类是自学习控制系统,它不要求被控制过程必须是重复性的。它能通过***实时学习,自动获取知识,并将所学的知识用来不断地改善具有未知特征过程的控制性能。
2 学习控制分类
2.1 基于模式识别的学习控制
这一方向主要起源于人工神经元的研究,采用的方法基本上是模式识别,着重于参数的自学习控制。随着基于模式识别的参数自学习控制方法的发展,出现了利用模式分类器、再励学习、Bayes学习、随机逼近、随机自动机、模糊自动机和语义学方法的各种学习控制系统。
2.2 基于迭代和重复的学习控制
这一方向主要针对在—定周期内作重复运行的系统,它不但与传统的控制理论相联系、而且可导出易于工程实现的简单的学习控制规律。主要在时域中发展的迭代自学习控制应用较广,成果较多。这种自学习过程实质上是逼近逆系统的过程。一些研究者随后又提出了多变量系统的最优迭代自学习控制、离散时间系统的迭代自学习控制,自适应迭代自学习控制以及非线性系统的迭代自学习控制等方法。
2.2.1 迭代学习控制
迭代学习控制是智能控制中具有严格数学描述的一个分支。该控制方法适合于具有重复运动性质的被控对象,它不依赖于系统的精确数学模型,能以非常简单的方式处理不确定度相当高的非线性强耦合动态系统。目前,迭代学习控制在学习算法、收敛性、鲁棒性、学习速度及工程应用研究上取得了巨大的进展。
迭代学习控制模仿人类学习的方法来达到有效控制的目的,能够通过一系列迭代过程实现对二阶非线性动力学系统的跟踪控制。整个控制结构由线性反馈控制器和前馈学习补偿控制器组成,其中线性反馈控制器保证了非线性系统的稳定运行、前馈补偿控制器保证了系统的跟踪控制精度。它在执行重复运动的非线性机器人系统的控制中是相当成功的。
2.2.2 反复学习控制
就在迭代学习控制被提出的同时,控制理论专家们又在酝酿着另一学习控制理论一反复控制,又称反复学习控制。这理论堪称迭代学习控制的孪生兄弟。同样着眼于利用受控对象和目标轨道的周期性或重复性,用前一周期的控制信息去改善后一周期的控制,同样大量地使用存储器以纪录过去的控制信息。只是,迭代学习控制志在有限区间上完全追踪,而反复控制关心的是无限区间上渐近追踪。反复控制的提出,主要是针对伺服控制任务。反复控制理论与方法在伺服控制中得到了广泛的应用。
2.3 异步自学习控制
基于迭代和重复的学习控制,针对一类特定的系统但又不依赖系统的精确数学模型,它通过反复训练的方式进行自学习,使系统逐步逼近期望的输出。这类方法可导致结构简单的学习控制器。它在时域中的发展即为“迭代自学习控制”,在频域中的发展即为“重复自学习控制”。“异步自学习控制”方法将两者有机地统一起来,提出些新的理论观点。
3 学习控制的今天与未来
学习控制的作用是为了解决主要由于对象的非线性和系统建模不良所造成的不确定性问题,即努力降低这种缺乏必要的先验知识给系统控制带来的困难。它与自适应控制的最大区别在于学习控制强调记忆。学习控制要求把过去的经验与过去的控制条件相联系,能针对一定的控制局势来调用适当的控制经验。目前主要有几大研究方向:
(1)基于模式识别的学习控制,如再励学习、Bayes 学习、VC学习、随机逼近等。
(2)基于迭代的学习控制。主要针对周期性作业的非线性控制系统,如机械手作业控制。
(3)连接主义学习控制。主要基于人工神经网络技术。
(4)进化计算。进化计算是模拟自然进化过程的一种随机性全局优化方法。遗传算法、进化策略等的优化算法在全局性、鲁棒性、并性等方面表现出为学习控制算法优化提供了有力的工具。
让我们从较为数学的角度来考察学习控制理论,探讨新的研究方向。许多控制方法只在内积空间中有效,如何在内积空间对经典学习控制方法进行加工改造,发挥内积空间的特点,有待进一步研究。再考察新学习控制理论的发展空间。吸取各大控制理论流派的精华,产生新一代如非线性最优学习控制,非线性模型预测学习控制,模糊学习控制,统计学习控制,生物学习控制等等。
参考文献:
[1]于少娟,齐向东,吴聚华.迭代学习控制理论及应用[M].北京:机械工业出版社,2005(07).
[2]高立群,董长义.线性时滞系统的迭代学习控制[J].大庆石油学院学报,2004,28(2).