参考课程https://www.bilibili.com/video/BV1PE411W7QM/?spm_id_from333.1387.favlist.content.clickvd_source8f8a7bd7765d52551c498d7eaed8acd5一、引入1、神经网络控制的优越性1传统的基于模型的控制方式是根据被控对象的数学模型及对控制系统要求的性能指标来设计控制器并对控制规律加以数学解析描述。2模糊控制基于专家经验和领域知识总结出若干条模糊控制规则构成描述具有不确定性、复杂对象的模糊关系通过被控系统输出误差及误差变化和模糊关系的推理合成获得控制量从而对系统进行控制。3相比于前两种控制神经网络控制具有很强的逼近非线性函数的能力即非线性映射能力神经网络用于控制正是利用这个独特的优点。①神经网络可以处理那些难以用模型或规则描述的过程或系统。②神经网络采用并行分布式信息处理方式具有很强的容错性。③神经网络是本质的非线性系统。④神经网络具有很强的信息综合能力。⑤神经网络的硬件实现愈趋方便。4神经网络在控制中的主要作用①在反馈控制系统中充当控制器的作用。②在基于精确模型的各种控制结构中充当对象的模型。③在传统控制系统中起优化计算作用。④在与其它智能控制方法和优化算法如模糊控制、专家控制及遗传算法相融合中为其提供非参数化对象模型、优化参数、推理模型及故障诊断等。2、神经网络控制器的分类1按照神经网络在控制器中的作用不同一般分为两类①一类称神经网络控制它是以神经网络为基础而形成的独立智能控制系统。②另一类称为混合神经网络控制它代表着那些利用神经网络学习和优化能力来改善传统控制的现代控制方法。2一些典型的神经网络的控制结构和学习方式可归结为七类导师指导下的控制器、逆控制器、自适应网络控制器、神经内模控制结构、前馈控制结构、自适应评价函数、混合控制系统。①导师指导下的控制器神经网络的输入信号来自传感器的信息和命令信号神经网络的输出就是系统的控制信号一旦神经网络的训练达到了能够充分描述人的控制行为则网络训练结束神经网络控制器就可以直接投入实际系统的控制②逆控制器③自适应网络控制器自适应控制系统要求控制器能够随着系统环境或参数的变化而对控制器进行调节在线逼近未知非线性动态并自适应更新网络权值以便达到最优控制的特性④神经内模控制结构用一个神经网络作为模型状态估计器另一个神经网络作为控制器被控系统的实际输出与模型M的输出信号差作为反馈⑤前馈控制结构单纯的求逆控制结构不能很好地起到抗干扰能力因此可结合反馈控制的思想组成前馈补偿器的网络控制结构在误差产生前直接测量可测扰动提前补偿⑥自适应评价函数整个学习系统由一个相关的搜索单元和一个自适应评价单元组成在这个算法中相关搜索单元是作用函数自适应评价单元为评价网络相当于最优控制中的代价函数J随系统状态、环境或学习进程动态调整而非固定⑦混合控制系统是由神经网络技术与模糊控制、专家系统等相结合形成的一种具有很强学习能力的智能控制系统它集人工智能各分支的优点使系统同时具有学习、推理和决策能力成为智能控制的最新发展方向二、非线性动态系统的神经网络辨识1、神经网络的辨识基础1所谓辨识是在输入和输出数据的基础上从一组给定的模型中确定一个与所测系统等价的模型。①输入/输出数据指能够量测到的系统的输入/输出。②模型类指所考虑的系统的结构。③等价准则指辨识的优化目标。2神经网络系统本质上是一种非线性映射它可以从某一输入空间通过网络变换映射到输出空间因此训练神经网络的过程是非线性函数的逼近过程。多层前向传播网络能够逼近空间上的任意非线性函数关键在于如何确定隐含层和隐含激励神经元的个数。3训练神经网络前需要考虑的三大因素①模型的选择——精确性和复杂性的权衡。②输入信号的选择——持续的激励信号充分激励足以覆盖系统的频谱类似于采样定理信号点过少将会引起失真。③误差准则的选择——可且不仅可选择如下误差的泛函。4神经网络的辨识在确定上述三大要素之后就归结为一个最优化问题它不是传统的参数估计问题有五个特点①不要求建立实际系统的辨识格式。②可以对本质非线性系统进行辨识是通过网络外部的输入/输出来拟合系统的输入/输出。③辨识的收敛速度不依赖于待辨识系统的维数只与算法有关。④神经网络有大量连接权通过调节权值逼近系统输出。⑤作为实际系统的辨识模型是一个物理实现可在线控制。2、神经网络辨识模型的结构1前向建模前向建模是利用神经网络来逼近非线性系统的前向动力学模型神经网络模型在结构上与实际系统并行2逆模型法逆模型建立的最直接的方法是将系输出作为网络输入将网络输出与期望输出即系统的输入进行比较得到的误差作为此神经网络训练的信号逆模型法的学习过程不一定是目标最优的可以适当在稳态下加入一个小信号的随机输入信号或者采用下图所示的逆模型建模结构用前向神经网络训练逆模型网络即逆模型的输入遍及整个系统的输入空间但这又引伸出了新的缺点训练依赖前向模型的精度如果前向模型辨识不准逆模型训练也会出错而且需要两个网络结构相对复杂除此之外一旦非线性系统的对应关系不是一对一的那么不准确的逆模型可能会被建立三、神经网络控制的学习机制1、神经网络的学习方法1神经网络辨识器的期望输出值和系统实际值应该是一致的因此样本信息是已知的而神经网络控制器的样本是系统的最佳控制量是未知的。2神经网络的学习方法就是寻找一种有效的途径进行网络连接权阵或网络结构的修改从而使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。3两类神经网络的学习方法①监督式学习有导师指导下的控制网络学习包括离线学习法、在线学习法、反馈误差学习法、多网络学习法。②增强式学习无导师指导下的学习模式通过某一评价函数来对网络的权系数进行学习和更新最终达到有效控制的目的。2、监督式学习1离线学习法离线学习指的是在计算机中用数据训练学习训练完成后再放到实际系统里运行运行时不再更新网络权值2在线学习法在线学习指的是控制器在实际系统运行时一边输出控制信号一边根据系统反馈的误差实时更新神经网络的权值3反馈误差学习法控制系统的结构由前馈控制器和反馈控制器两部分组成缺点直接使用系统的误差信号去更新控制网络的权矩阵而忽略了非线性系统本身的动态性能因此可能导致学习算法的发散现象4多网络学习法利用神经网络辨识的手段在线识别出未知系统的动态模型并利用此模型进行神经网络控制的设计和学习且在学习过程中进一步改善模型的精确性达到高精度的控制目的①建立未知非线性动态系统的前向模型②建立未知非线性动态系统的逆模型四、神经网络控制器的设计1、神经网络直接逆模型控制法1直接逆模型的训练结构2用带遗忘因子的B-P算法训练逆控制器的完整步骤①初始化参数②准备训练样本③初始化迭代计数器④前向传播计算网络输出⑤判断误差决定是否停止⑥求反向传播误差⑦更新权系数⑧迭代循环2、直接网络控制设计法1直接逆模型控制法没有考虑到系统本身的输入输出状态因此一旦系统运行的环境、参数发生变化时这类控制器就无法适应了。2基于以上问题设计改进方案——直接网络控制设计法3直接网络控制法需要系统的Jacobian矩阵对此有4种解决措施