如果说数据是新时代的石油,那么学习算法就是从中提取信息的炼油厂;信息积累成知识;知识深化成理解;理解演变成智慧。欢迎来到深度学习的新世界。
——特伦斯·谢诺夫斯基《深度学习》
2019年3月27日,深度学习三巨头迎来了他们的高光时刻:美国计算机协会(ACM)宣布,将计算机领域的最高荣誉——图灵奖颁发给约书亚 · 本吉奥(Yoshua Bengio)、杨立昆(Yann LeCun)和杰弗里 · 辛顿(Geoffrey Hinton)。颁奖当日,ACM主席切莉 · 潘可(Cherri M Pancake)在评价三位时说道,“Hinton、LeCun和Bengio独立工作,共同开发了深度学习神经网络领域的概念基础,通过实验和实际工程证明了深度神经网络的优势。”
什么是深度学习?
自从2016年AlphaGo以四比一击败韩国顶尖围棋选手李世乭开始,人工智能(Artificial Intelligence)就成了普通人时常挂在嘴边的热词。但人工智能究竟包含哪些研究方面呢?
(人工智能研究分支)
人工智能所涵盖的内容非常广泛,是一个庞大的体系,我们同样耳熟能详的机器学习也仅仅是其中一种实现人工智能的方法,而深度学习则是一种实现机器学习的技术。
(人工智能、机器学习、深度学习的包含关系)
近年来,在数据量的高速增长和算法、算力的不断进步之下,深度学习取得了突破性的成果,其在语音、图像和自然语言处理等方面的表现,远远超过先前的相关技术。
基于图像识别的AI医疗
长久以来,全球健康医疗领域一直面临着人口增长、老龄化严重、慢性病发病率逐年提升及劳动力不足等困境,就医需求的激增和优质医生资源的匮乏带来的是医疗市场供需结构的严重失衡。
以CT图像为例,一个放疗科医生一次靶区勾画的工作量约200-450张CT片,按传统方式需要耗时5小时左右,相当于一天只能诊断1-2名患者,极大的限制了医学影像诊断的速度,且漏诊、误诊频发。
基于深度学习的医疗影像分析则为提升医疗服务质量带来了希望。现阶段的AI医学影像系统可以在几秒之内快速完成对十万张以上的影像处理,针对肿瘤放疗环节的影像处理技术能将一名医生5个小时的工作量缩短到30分钟,大大提升诊疗效率。
在未来,每个人都将是AI医疗的受益者。
基于深度学习的自动驾驶应用
据统计,全球每年有超过124万人死于交通事故,这个数字到2030年可能达到220万人,平均每天有500人因为交通事故丧生,而深度学习技术则能通过对道路标识、车道线、行人、红绿灯、交通拥堵情况等信息进行数据训练及特征提取,帮助汽车快速精准的理解周边环境态势,并基于当前状态做出正确的驾驶决策。
以突发情况判断为例,一个普通驾驶员从肉眼感知异常状况到手脚做出行动需要大约0.6秒,用脚踩下制动踏板到制动系统开始起作用又需要大约0.6秒,整整1.2秒的反应时间,按120km/h的车速来计算,汽车还将继续行驶40米,而对自动驾驶系统而言,这个过程被缩短到0.2秒,从系统反应到停驶,汽车仅仅继续向前行驶7米,大大提升安全性。
在未来,自动驾驶将重构城市交通系统。
基于自然语言处理的金融科技应用
如何用自然语言处理(NLP, Natural Language Processing)技术感知金融市场?NLP是一门融语言学、计算机科学、数学为一体的学科,是能够让智能机器理解并生成人类语言,从而和人类进行沟通交流的重要技术手段。在金融科技领域,NLP技术主要基于海量大数据、预处理模型、语言学等技术和资源,实现文本分类、信息提取、语言生成、机器翻译、智能问答、情感分析等具体应用,进而服务于实际金融业务及产品。
在金融领域,每天产生的金融相关数据量非常庞大,这其中包括公司新闻、金融产品资料、宏观经济、政策法规、社交媒体评论等,因此从海量数据中获取有效数据意义十分重大。
以誉存科技的“三链合一”价值体系构建为例。平台以企业为分析主体,通过工商、新闻语料、法务、招投标、行政处罚、招聘等多维数据,对企业、行业从月度、季度、年度等不同的时间粒度进行多维度、多指标的统计分析,形成分布式数据库,应用自然语言处理(NLP)领域的关系抽取、文本分类等技术,获得实体间上下游关系、股权投资关系、原告被告关系、合作竞争关系等,最终形成了企业知识关联图谱,并应用于价值链、产业链和供应链的分析:
以数据库和企业知识图谱为驱动,在已确定的价值链分析目标指导下对数据进行深度挖掘,过滤出各行业、地区的头部企业,绘制区域产业的价值地图;
在企业知识图谱中发现产业脉络,结合国家行业政策(扶持或去产能),市场趋势(如今年的房地产),发展脉络(如高污染)等,综合分析区域价值链下的重点产业链,精准定位金融活动集中地;
供应链则是将视野从头部企业转移到整个产业的局部产业块,向前、向后发掘企业在整个生产链条中起到的作用,梳理企业相关的上下游关联关系体系,并实时跟踪供应链变化趋势,动态维持供应链全息画像。
作为金融科技领域的“双子星”,自然语言处理与知识图谱的双剑合璧,实现了价值链、产业链、供应链的三链合一,而其与金融信贷场景中全业务流程的紧密结合,必将成为推动普惠金融发展的重要动力。