英特尔戴金权:详解全新大数据分析+AI平台AnalyticsZoo|CCF-GAIR2018【开云手机在线登陆入口】

本文摘要:

Analytics Zoo正是这样一个更加高级别的数据分析+AI平台,需要利用Spark的各种流水线、内置模型、特征操作者等,便利用户建构深度自学末端到末端应用于。某种程度上它是Spark和BigDL的扩展,它的目的是便利用户研发基于大数据末端到末端自学的应用于,除了内置的模型、内置的一些非常简单的操作者之外,它里面还获取了大量的高级的流水线的反对,需要用于Spark DataFrames、ML Pipelines的深度自学流水线,需要通过迁入自学的API建构API模型的定义,在这个基础上就可以很便利地将我们获取的Model Zoo的模型甚至末端到端的参照应用于,比如说出现异常检测等等,可以通过非常少的代码,用于这些高级的API,并且用于内置的模型,很便利地就能将一个末端到端的大数据分析再加深度自学的应用于建构一起。合作案例戴金权讲解了用户如何用于Analytics Zoo for BigDL在他们现有的大数据集群,一般来说是有十分大规模的至强劲的处理器上应用于大数据的集群或者平台上,建构新的深度自学的应用于。

目前,BigDL和Analytics Zoo的技术能在还包括AWS、阿里云、百度云等完全所有的公有云平台上用于。第一个例子是英特尔与京东进行的合作。

京东有大约几亿张的图片存储在分布式存储系统当中,他们想把这几亿张图片从大数据系统里面读出来,然后对它展开处置。在这个案例中,用了SSD的模型来企图辨识图片里面有什么物品,探后再行用DeepBit的模型,将物品的特征提取出来。原本京东早已在GPU卡上做到了一些应用于,但是这里面有一些问题,还包括如何处置末端到末端数据的流水线,还包括如何提升末端到末端处置的效率。

戴金权讲解到,“当我们把整个处置的应用于迁入到Spark和BigDL平台上,可以看见它提高了很多的运维的效率,用于BigDL/Spark在Intel Xeon(英特尔至强劲可拓展处理器)集群有效地拓展,获得相对于GPU集群3.8倍性能提高。”AI的三个核心点在大数据、算法、算力,现在很多人指出要有充足的AI算力,非GPU不能。京东的这个案例反映了BigDL与英特尔至强劲可拓展处理器因应,对整体深度自学展现出的提高。

戴金权告诉他,京东这个案例一开始是创建在多个GPU之上的,他们的团队在Caffe上训练,在研发、部署、性能方面都碰到问题。英特尔将京东方面迁入到Spark上面,跑完在1200个逻辑的核,一台服务器反对50个逻辑,大体用了24台服务器,利用Spark这样的末端到末端流水线处置,与之前用GPU的方案比起可以超过差不多3.8倍的性能提高。

第二个案例是英特尔和MLSListings合作的案例,他们是加州的不动产交易商,他们可以辨识用户网页的房屋图片,为用户引荐相近的房屋。这套系统建构在Microsoft Azure上。第三个案例是和世界银行在AWS上合作。

世界银行通过志愿者上载的世界各地的食物图片,协助大家来分析在世界各地的物价水平。其中如何通过大数据处理对图片展开清除、处置,再行用迁入自学来建构图片分类模型是有一点注目的问题。第四个案例是与UCSF的合作,通过3D的模型对医疗图象展开分类,首先对3D的MRI照片展开辨识,然后对它展开分类,可以企图临床膝盖上面的一些病症。

第五个案例是们和Cray公司(美国做到超级电脑的公司)合作。合作内容是做到近期的降水云图的预测,通过Seq2Seq的模型,把过去一小时的卫星云图做到了一个序列,输出到模型里面,能老大预测下一个小时每10分钟这个卫星云图的变化,通过这个来展开一些降水的分析。

第六个案例是和GigaSpaces合作的通过基于自然语言处置对呼叫中心展开管理。当有用户打电话进去,把其语音并转成文本以后,导入到BigDL系统里面,然后对它展开动态的流式处置,用于BigDL上的文本分类模型可以告诉用户打电话进去是为什么,他是Windows出有了问题还是Mac出有了问题,自动就不会把呼叫中心的电话载入到有所不同的部门。最后,戴金权总结到,英特尔致力于末端到末端全栈人工智能解决方案。

BigDL和Anaylitics Zoo致力于架起大数据和人工智能之间的桥梁,当用户有数基于Apache的大数据集群,就可以很便利地展开大数据分析和上人工智能应用于,不仅需要有更高的资源利用率,还可以提高末端到端的研发效率,以及提高部署效率。涉及文章:英特尔AI事业部三位负责人介绍:AI技术如何落地应用于公布新一代NNP芯片外,英特尔AI软件和应用于更加透漏其AI野心原创文章,予以许可禁令刊登。下文闻刊登须知。


本文关键词:开云手机在线登陆入口

本文来源:开云手机在线登陆入口-www.dusalai.com