深度学习应用案例
深度学习擅长识别非结构化数据中的模式,而大多数人熟知的图像、声音、视频、文本等媒体均属于此类数据。 下表列出了我们已知的应用类型及与之相关的行业。
声音
应用类型 |
行业 |
语音识别 | UX/UI、汽车、安保、物联网 |
语音搜索 | 手机制造、电信 |
情感分析 | 客户关系管理(CRM) |
探伤检测(引擎噪音) | 汽车、航空 |
欺诈检测 | 金融、信用卡 |
时间序列
应用类型 |
行业 |
日志分析/风险检测 | 数据中心、安保、金融 |
企业资源计划 | 制造、汽车、供应链 |
传感器数据预测分析 | 联网、智能家居、硬件制造 |
商业与经济分析 | 金融、会计、政府 |
推荐引擎 | 电子商务、媒体、社交网络 |
文本
应用类型 |
行业 |
情感分析 | CRM、社交媒体、声誉管理 |
增强搜索、主题检测 | 金融 |
威胁侦测 | 社交媒体、政府 |
欺诈检测 | 保险、金融 |
图像
应用类型 |
行业 |
面部识别 | 平台登入、政府、电眼 |
图像搜索 | 社交媒体 |
机器视觉 | 汽车、航空 |
相片聚类 | 电信、手机制造 |
视频
动作检测 |
游戏、UX/UI |
实时威胁侦测 | 安保、机场 |
特征内省 | 机场、内安 |
传统机器学习的优势是能够进行特征内省-即系统理解为什么将一项输入这样或那样分类,这对于分析而言很重要。但这种优势却恰恰导致传统机器学习系统无法处理未标记、非结构化的数据,也无法像最新的深度学习模型那样达到前所未有的准确度。特征工程是传统机器学习的主要瓶颈之一,因为很少有人能把特征工程做得又快又好,适应数据变化的速度。
对于必须进行特征内省的应用情景(例如法律规定,以预测的信用风险为由拒绝贷款申请时必须提供依据),我们建议使用与多种传统机器学习算法相集成的深度神经网络,让每种算法都有投票权,发挥各自的长处。或者也可以对深度神经网络的结果进行各类分析,进而推测网络的决策原理。
文本
命名实体识别
物体识别指算法识别任意物体的能力,物体可以是球、动物,甚至人脸。这一功能通常用于工程应用程序,在建模时进行形状识别。它也用于实现社交网络中的照片标签功能。Facebook的Deep Face是深度学习应用于这一领域的典型案例。
以下是由神经网络完成的人脸聚类示例:
机器视觉 + 自然语言处理
现实捕捉和现实计算领域的进步令虚拟世界与现实不断交融。就此类全新的数据而言,深度学习网络的应用之一是识别并标识三维环境以及现实中的物体。
实现这一功能后,就很容易发展出模拟语义,让机器借由各类现实物体的虚拟表示来学习这些物体的本质和限制,随后将这种理解运用到语言的生成和处理当中。我们认为这是神经网络未来众多的发展方向之一。