学AI你必须懂这些关键术语
来源:互联网
时间:2026-06-15 14:51:28
一. 神经网络
神经网络,本质上是模仿生物神经网络(比如人类大脑的神经元系统)而设计的一种计算模型。它由大量的人工神经元相互连接构成。
网络结构
神经网络由输入层、隐藏层和输出层组成。各层之间采用全连接方式——也就是说,前一层的每一个神经元,都会和后一层的每一个神经元建立连接。信息在神经元之间借助权重和偏置完成传递和计算。特征提取方式
特征提取主要依赖人工设计的特征工程。简单说,就是先把原始数据转换成适合模型输入的向量,再交给模型处理。隐藏层通过线性和非线性变换来组合、抽象这些特征,但对原始数据的直接特征提取能力相对较弱。因此,它适合处理简单的结构化数据,比如传统的分类和回归问题——输入通常是被固定长度的向量,例如信用风险评估、股票价格预测。数据处理能力
主要适用于结构化数据。对于具有空间或时间结构的复杂数据(如图像、音频),则需要先通过复杂的特征工程将其转换为向量形式,才能输入模型。这种处理方式有时会限制最终的效果。训练难度和参数数量
由于全连接结构的存在,参数数量非常庞大,很容易导致过拟合。训练过程中需要较大的计算资源,训练时间也比较长,对数据增强、正则化等技术的依赖相当大,才有可能防止过拟合。应用场景
在简单的分类、回归任务以及传统的数据挖掘领域有广泛应用,比如信用风险评估、股票价格预测等。这些场景的数据结构相对简单,不需要处理复杂的空间或时间特征。应用案例
- :如化工生产中的过程控制。神经网络通过学习大量生产数据,能精准控制温度、压力、流量等参数,提高生产效率和产品质量;在机械设备控制中,也可用于预测设备故障,帮助提前维护。
工业控制领域
- :股票市场预测、风险管理中的投资组合风险评估、信贷评估——根据客户收入、信用记录等判断违约风险。
金融领域
- :根据实时交通数据预测流量变化,优化信号灯时长、缓解拥堵,或为出行规划提供参考。
交通运输领域
- :帮助飞行器实现精准的姿态控制和飞行路径规划,提高安全性和效率。
航空航天领域
- :医疗影像识别系统辅助诊断疾病;药物研发中预测药物活性、毒性。
医疗健康领域
二. 卷积神经网络
卷积神经网络(CNN)是专门为处理具有网格结构的数据(如图像、音频)而设计的深度学习模型。网络结构
在神经网络的基础上,引入了卷积层、池化层等特殊结构。卷积层通过卷积核在输入数据上滑动完成卷积操作,提取局部特征,显著减少了模型参数数量,降低计算量和过拟合风险。池化层则对卷积层的输出进行下采样,压缩数据规模,同时保留主要特征。特征提取方式
CNN能够自动从原始数据中提取特征。卷积核在滑动过程中会自动学习到不同的局部特征模式。随着网络层数加深,它能提取到从低级到高级的复杂特征——在图像识别中,边缘、纹理、形状等特征都是自动完成的,不需要人工手动设计。数据处理能力
尤其擅长处理图像、视频、音频这类具有空间或时间结构的数据。卷积和池化操作能够有效利用数据的局部相关性和空间结构信息,因此在图像识别、目标检测等任务中表现非常出色。训练难度和参数数量
由于卷积和池化操作减少了参数数量、降低了模型复杂度,训练难度相对较小,不容易过拟合。另外,其结构特性更适合利用GPU等并行计算设备加速训练,能在较短时间内达到比较好的效果。应用场景
主要集中于计算机视觉领域,如图像分类、目标检测、图像分割等,也在自然语言处理、语音识别等领域有成功应用,例如文本分类、语音情感识别。应用案例
- :ImageNet图像分类挑战中,AlexNet、VGGNet、ResNet等基于CNN的模型取得优异成绩;目标检测方面,R-CNN、Fast R-CNN、Faster R-CNN、YOLO等框架广泛应用于自动驾驶中的道路标识、车辆、行人识别;图像分割方面,U-Net可对医学图像中的器官进行精细分割。
图像识别与分类
- :通过CNN模型学习人脸特征表示,实现识别、验证和检测,广泛应用在安防监控、智能手机解锁等领域。
人脸识别
- :姿态估计(学习人体关键点)、图像生成(通过生成对抗网络制造逼真图像)、风格迁移(将照片转为艺术作品风格)。
计算机视觉
- :将文本表示为二维矩阵,用CNN进行特征提取和分类,用于文本分类、情感分析。
自然语言处理
- :学习语音特征,对语音信号进行分类和识别。
语音识别
- :推荐系统中学习用户行为和偏好;游戏领域的自动玩法、内容生成;机器人视觉中的导航和避障;医学影像分析中的疾病诊断、器官分割和三维重建。
其他领域