首页
产品系列
行业应用
渠道合作
新闻中心
研究院
投资者关系
技术支持
关于创泽
| En
 
  当前位置:首页 > 新闻资讯 > 机器人知识 > AI也会遭遇瓶颈 解析人工智能技术的存储性能需求  
 

AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

来源:--      编辑:创泽      时间:2020/5/13      主题:其他   [加盟]
2020年对于很多人而言都是永远值得铭记的一年,突如其来的新G疫情几乎改变了每个人的生活,它不仅给人类的经济造成了重大损失,也给人类的健康带来了巨大的威胁。面对这难以对付的病毒,我们既看到了无数勇士的悲壮逆行,也看到了科技在整个抗疫斗争中所起到的关键作用,特别是其中的AI人工智能技术——通过AI技术我们可以加速疫苗的研发;通过AI技术,在众多医疗终端设备以及大量的病人临床数据中,我们能提炼出佳的诊断方案,加速诊断的效率,提升诊断的效果。可以说,AI技术在这次关键的战役中发挥出了重大的作用。

人工智能已经深入医疗、教育、工业到能源、金融等各个L域。

因此并不意外,在2020年第三届软件定义存储峰会上,英特尔提出的主题是“突破内存与存储瓶颈 释放人工智能无限潜力”。毕竟在这场抗疫战斗中,英特尔不仅投入重金资助合作伙伴使用AI技术进行诊断、疫苗开发方面的研究,还推动AI科技在医学检验、医疗物资生产、疫情推演等多个L域加速落地,英特尔深知AI人工智能对人类的重要性。除了对抗新型病毒,AI人工智能技术其实也深入了人类生活的各个L域。英特尔公司区非易失性存储解决方案事业部战略业务开发总监倪锦峰先生在峰会上谈到:“从医疗、教育、工业到能源、金融等等,每个行业都在以数字化的方式来寻求主动变革,我们可以预见的是,在不远的将来,整个社会对数字化的服务需求将不断地激增”。

AI人工智能技术将给存储产品带来重大挑战

人工智能技术的数据管道主要分为采集、准备、训练和推理四部分。每个部分需要读写不同类型的数据,工作负载也不尽相同。

“工欲善其事,必先利其器”,要想发挥出AI人工智能技术的大威力,需要企业构建强有力的IT基础设施。这个设施不仅需要强有力的处理器、FPGA、GPU,也需要G性能的存储设备,否则就会如普通电脑一般,因为机械硬盘传输速度慢,寻找数据的时间长,往往会成为整个系统性能的瓶颈,即使是SATA/PCIe NAND SSD,很多时候也跟不上AI数据处理的需求。倪锦峰先生介绍到,无论用于哪个行业,人工智能的工作实际上主要由采集、准备、训练和推理四部分组成。每个部分需要读写不同类型的数据,工作负载也不尽相同,将给存储设备带来较大的挑战。

简单地说,在整个人工智能执行过程中,IO的需求是不可预测、复杂多变的,它读写的数据主要有三个重要的特点:

是它的数据集大小,差异性非常大,在初开始的采集阶段是PBJ别,到训练阶段是GBJ别,到训练好了执行的函数,相关的模型可能是KBJ别;

第二它的工作负载也是复杂多变的,从初百分之百的写入到准备阶段的50%读、50%写混合负载,到后面的一些训练、推理阶段可能出现百分之百的读,其中包括很多的随机读取操作;

第三是存储模式也会有很多变化,从一开始顺序化的数据流写入,到后面则是通过完全随机的读写,来帮助建立准确的模型。

    

因此人工智能技术对存储性能的要求是很苛刻的,用户总是希望设备能满足G吞吐量和低延时的需求,总是希望更多的数据能够更加靠近处理器,以获取及时的传输、执行,但用户又会希望AI的基础设施投资成本能在可控的范围之内,可以说这是一个相互矛盾的需求,那么对于用户来说如何才能实现这个愿望呢?

 

优化成本,提升性能

英特尔存储产品构建分层存储 

先还是应对用户使用的数据类型进行研究,倪锦峰先生向我们展示了英特尔经典的存储金字塔图。在应用中,并不是所有数据都会经常被用到,因此数据可以被分成热数据、温数据和冷数据等3个不同层次。热数据即需要立马进行处理的数据,例如银行收到的转账请求,即时的地理位置等。温数据是非即时的状态和行为数据,例如用户近期感兴趣的话题,或用户近去过的地方等,冷数据则是不经常访问的数据。

研究数据类型、数据使用所形成的工作负载,对数据进行分层,并使用适合的设备来存储数据可以提升存储系统的性能,并降低成本。

如果全部使用DRAM内存来存储这些数据,在性能上可能会表现突出,但也意味着用户需要花费非常G昂的成本。因此更合理的是根据数据的类型、负载对它们合理地使用存储设备。例如可以使用DRAM内存、英特尔傲腾持久内存来存储热数据,因为它们拥有很G的性能和超低的延迟,离CPU和GPU近,能够获得及时的洞察。而英特尔傲腾固态盘搭配以英特尔为代表的TLC、QLC NAND固态盘,则凭借大容量、G性能适合用于热、温热、温存储。这种分层设计的J妙之处在于金字塔里的每一个层J的数据、使用产品在容量和延时特性上正好有数量J的差距,这就使得用户可以根据数据的类型、工作负载进行冷热分层,并同时参考自己的预算,对性能的需求,对功耗的预期,来不断地优化自己的存储方案。

凭借不同于传统NAND闪存的革命性材料,傲腾具有就地写入、支持位寻址、低延迟等三大新特性。

那么英特尔的存储技术能否承担起这一重任呢?从倪锦峰先生的介绍中,可以看到由于使用了不同于传统NAND闪存的傲腾介质,傲腾持久内存、傲腾固态盘具有诸多新特性。先是它支持就地写入,写入前不需要进行数据擦除。不像普通NAND闪存存在读-修改-写这个过程,因此它拥有更好的性能。同时在长时间写入后,它也不会出现数据脏块,不需要进行垃圾回收,因此傲腾产品可以很好地保持性能一致性,不会出现NAND固态盘用得越久、性能越差的问题。

与采用传统NAND闪存的DC P4600SSD相比,傲腾固态盘DC P4800X的延迟更低、一致性更好,寿命长得多,效率更G。

其次是傲腾技术支持位寻址,可以提供超低的延迟,带来更快的传输速度,毕竟AI人工智能技术的应用对存储设备的容量和性能都有很G的要求。相比传统NAND闪存,傲腾产品在性能上有质的提升,形象地比喻,就是将数据的载体从汽车升J为飞机。延迟方面,它好可以做到微秒J别,虽然和内存DRAM的不到0.1 微秒相比还是存在一定的差距,但是已远远好于NAND闪存的近百微秒的水平。英特尔数据显示傲腾DC固态盘的访问延迟不仅较传统HDD、SATA SSD大幅降低,即便与同样采用NVMe接口的NAND SSD相比,其优势也是非常大的——与采用3D NAND 颗粒的英特尔DC P4600 SSD 相比,傲腾固态盘DC P4800X的读取延迟在不同写压力、不同队列深度下,低了8~63倍。

此外新介质大幅提升了傲腾产品的寿命,英特尔傲腾固态盘可以支持多达60个DWPD(每日全盘写入次数),而大家所熟悉的英特尔P4600、P4610这样的G性能、G寿命的NAND固态盘,只能支持3个DWPD左右,英特尔傲腾固态盘的进步是非常可观的。

人工智能技术的数据管道可以通过使用英特尔傲腾持久内存、傲腾固态盘、QLC 3DNAND固态盘,进行合理搭配来提升任务执行的效率,并降低成本、功耗。

同时从AI数据通道中的采集、整理、训练、推理四个阶段,可以看到各阶段对存储的要求是非常G的,需要有持续、一致的吞吐量,以及同样一致、持续、超低的延迟,这些需求正是傲腾产品所擅长的,再加上英特尔QLC 3D NAND SSD所拥有的大容量(已可实现单盘32TB)、G性能特性,通过这样一个出色的结合,可以帮助改善客户对数据的融合,提升软件定义存储解决方案的性能,帮助用户为即将到来的人工智能时代的数据爆发做好相应的准备。

 

大幅提升效率

英特尔存储方案体现实际价值

采用傲腾固态盘后,VMWare vSAN、hadoop、CEPH等各个存储系统的性能都获得了大幅提升。

根据倪锦峰先生介绍,在实际使用中,不少平台改用英特尔傲腾产品后,都获得了很好的效果。如百度在2018年发布了基于英特尔傲腾固态盘加英特尔QLC 3D NAND固态盘的存储解决方案,这一方案大幅提升了AI人工智能、大数据、云计算的存储性能。在AI的一个训练场景中,这一方案相比原来的HDD机械硬盘方案可以获得21倍的性能提升以及96%的延迟下降,同时降低TCO多达60%。在VMWare vSAN分布式存储系统中,将G性能缓存从NAND PCIe固态盘换成英特尔的傲腾固态盘后,其虚拟机密度提升了60%,同时系统整合率能够提升30%;在hadoop分布式架构中,当用户使用英特尔傲腾固态盘作为hadoop的临时数据缓存后,其吞吐量或性能可以提升40%左右。

 

而在CEPH分布式存储系统中,当用户使用英特尔傲腾固态盘替换了传统的NAND固态盘,作为元数据(metadata)缓存和journal盘后,其延迟可以降低50%左右,同时IOPS性能获得了40%左右的提升。在微软的Azure Stack HCI云平台上,当用户将英特尔傲腾固态盘作为缓存盘后,则能使每个系统、每个节点所能够支持的虚拟机数量提升60%左右,同时虚拟机的跑分也能够提升约80分。此外,现在也有很多国内公司正在使用英特尔傲腾技术来进行存储解决方案的创新,包括浪潮、VMWare、XSKY、QingCloud等众多合作伙伴。

 

让存储更接近计算资源让存储兼得G性能与稳定性


英特尔公司区非易失性存储解决方案事业部战略业务开发总监倪锦峰先生接受了采访

从以上的技术讲解、案例可以看到,英特尔解决方案之所以能有如此突出的表现,主要依赖的是性能接近内存的傲腾存储产品。而在前不久举行的2020英特尔年度战略“纷享会”上,英特尔也提出了近内存计算的概念,那么这是否代表着未来的存储趋势?幸运的是,笔者在此次大会上还获得了采访英特尔公司区非易失性存储解决方案事业部战略业务开发总监倪锦峰先生的机会。倪锦峰先生认为在这个数据爆发的时代,特别是当5G技术发展成熟之后,所产生的大量数据无法通过网络全部汇集到数据中心,所以部分数据需要要在边缘进行计算,这就需要存储和计算在边缘端融合在一起,只有G效的存储性能才能帮助边缘端快速完成计算。 

而在数据中心里,则存在不少压缩、解压缩等具有规律性、重复性、依赖内存的计算需求,如果使用传统的执行方式将消耗很多CPU计算资源和DRAM内存资源。英特尔的中长期目标则是将计算和存储融合在一起,使得存储和计算更加靠近。比如英特尔研究院宋继强院长提到的方案是将FPGA与存储架构融合在一起,存储系统可以满足类似实时计算的要求,比如压缩、解压缩、AI训练等。同时存储系统的参与也能有效降低用户对CPU、内存资源的需求,从而降低成本。而性能接近内存的傲腾介质的确比较合适承担这一重任。

显然傲腾突出的性能是实现近内存计算的关键,那么企业在长时间使用傲腾时,是否需要进行额外的维护、保养呢?倪锦峰先生则表示对于传统的NAND闪存固态盘来说,可能需要这样的工作。毕竟传统SSD的读-修改-写机制会导致垃圾数据堆积,造成性能下降,同时垃圾回收等会带来额外的寿命损耗。传统SSD之所以后续会出问题,一是因为垃圾堆积没有有效处理,二是因为NAND闪存用的时间越长,它的坏块就会越多,因此需要做很多坏块的管理工作,坏块越多,冗余空间越来越少,性能也会越差。


而傲腾产品没有写入放大的问题,同时可擦写能力非常G,寿命有量J差异,所以它的整个生命周期里是没有性能衰减的问题。同时傲腾产品都经历了严格的性能和可靠性验证,包括模拟了恶劣负载情况下工作5年的测试,即加速老化测试。英特尔有大量的数据证明,傲腾产品在整个生命周期里面性能是一致、持续稳定的。

傲腾将成加速AI人工智能技术的“催化剂”


在本文截稿时,新G疫情仍没有结束,人类仍在与之战斗。但我们坚信没有一个冬天不能过去,没有一个春天不会到来,AI新兴技术必将助力人类更快地战胜疫情,加速推动社会的数字化和智能化的发展。而要加速AI技术的发展,像傲腾这样让数据更靠近CPU,性能接近内存的新技术必不可少。而凭借更大的存储容量和优异的性价比,英特尔QLC3D NAND也将成为取代HDD机械硬盘阵列的一个新选择。毫无疑问,傲腾技术与QLC 3D NAND技术的结合,将成为AI人工智能技术的“催化剂”,我们也期待着这瓶“催化剂”能让AI人工智能技术发展得更快,并创造出更多的成果,为人类造福。





自动化所提出神经元群体间侧向交互的卷积脉冲神经网络模型

基于梯度反向传播的脉冲神经网络(SNN)训练方法逐渐兴起。在这种训练方法下,SNN能够在保留神经元内部动力学的同时获得较好的性能

基于激光雷达的SLAM(激光SLAM)研究

Cartographer跨平台和传感器配置,MC2SLAM实时激光里程计系统,LeGO-LOAM种轻量级和地面优化的激光雷达里程计和建图方法,SUMA++开源的基于语义信息的激光雷达SLAM系统

学一个忘一个?人工智能遭遇“灾难性遗忘”,克服“失忆”有何良策

人工智能为什么会产生“灾难性遗忘”?目前,解决灾难性遗忘的方案有哪些?难点在哪?来看看专家怎么说

迎宾机器人企业【推荐】

2022年迎宾机器人企业:优必选、穿山甲、创泽智能、慧闻科技、杭州艾米、广州卡伊瓦、勇艺达、睿博天米、锐曼智能、康力优蓝、云迹科技、南大电子、猎户星空、瞳步智能

泰政办字〔2020〕29号 泰安市人民政府办公室关于加快推进5G产业发展的实施意见

到2022年年底,全市建设5G基站10000个,5G技术、产品、服务在智能制造、文化旅游、城市治理、公共服务等领域广泛应用,培育5G产业链优势企业5家以上、5G产业试点示范项目20个以上,形成一批5G应用创新成果,5G产业生态体系逐步完善。

2020年山东省瞪羚企业十大领军人物名单

2020年瞪羚企业十大领军人物:朱平,李勇,肖才根,王学文,郑淑全,苗健,程终发,张景伟,王仁鴻,陈梦梦

2020年山东省瞪羚企业自主创新十强名单

2020年瞪羚企业十强名单:创泽智能,山东儒房,烟台云沣,山东嘉源,山东新创,山东中安,朗朗教育,山东开创,泰安市康宇,靑岛乾运

济南新材料产业园投资促进局来创泽智能机器人集团对接交流

2020年3月6日,郑颖义局长,曲凯部长等一行4人与创泽集团董事长,副总侯月映等公司高层进行了对接交流

中国经济活力回升 希望正重返中国市场

今日头条,人民网,新华网,每日邮报等知名媒体,报道创泽集团疫情复工后的生产场景

自动化所提出神经元群体间侧向交互的卷积脉冲神经网络模型

基于梯度反向传播的脉冲神经网络(SNN)训练方法逐渐兴起。在这种训练方法下,SNN能够在保留神经元内部动力学的同时获得较好的性能

习近平经济发展新常态重大论断,引领中国经济行稳致远

2020年初,突如其来的新冠肺炎疫情给我国经济社会发展带来前所未有的冲击,创泽智能机器人复工复产,改装医用智能机器人

人工智能硬件发展的国际比较:中国、欧盟和美国

美国信息技术与创新基金会发布报告《谁会在人工智能角逐中获胜:中国、欧盟或美国》对中国、欧盟和美国人工智能发展的现状进行测算,分析半导体销售量、半导体研发支出、设计AI芯片的公司数量、超级计算机数量及该系统的综合性能情况

智能服务机器人多少钱

智能服务机器人售价大多数在12-20万元之间,如:锐曼机器人(25万),Cruzr(定制),创创(20万),爱丽丝(十几万),云帆(十几万),U05(十几万),小勇(十几万

Technica公司发布智能雾计算平台技术白皮书

SmartFog可以轻松地将人工智能分析微服务部署到云、雾和物联网设备上,其架构支持与现有系统的灵活集成,提供了大量的实现方案,要用下一代人工智能算法来弥补现有解决方案的不足。

刘锋:新基建的内涵、意义和隐忧 ,基于互联网大脑模型的分析

刘锋[人工智能学家],新基建对科技生态的拉动既不能落后也不能过于超前,新基建重点发展了人类社会的技术神经系统

迎宾机器人企业【推荐】

2022年迎宾机器人企业:优必选、穿山甲、创泽智能、慧闻科技、杭州艾米、广州卡伊瓦、勇艺达、睿博天米、锐曼智能、康力优蓝、云迹科技、南大电子、猎户星空、瞳步智能

山东机器人公司准独角兽企业-创泽智能

山东机器人公司,创泽机器人荣获山东省工信厅人工智能领域的准独角兽的称号,是中国工信部人工智能产业创新重点任务揭榜优胜单位

消毒机器人优势、技术及未来发展趋势

消毒机器人有哪些优势,未来发展趋势

家庭陪护机器人

家庭陪护机器人能在家中起到监控安全陪护具有人机互动交互服务多媒体娱乐价格查询等

儿童陪护机器人

儿童陪护机器人与孩子互动陪伴玩耍学习价格问询等功能说明使用指南介绍

展馆智能机器人

展馆智能机器人可讲解自主行走语音交互咨询互动价格咨询等功能介绍以及表情展现能力

智能讲解机器人

智能讲解机器人正在剑桥讲解演示咨询互动移动宣传价格问询等功能说明介绍

智能接待机器人

智能接待机器人迎宾服务来宾问询答疑价格查询

智能主持机器人

智能主持机器人参与主持了宁夏的云天大会并完成了大会的接待任务多才多艺载很受欢迎

超市智能机器人

超市智能机器人能帮助商家吸引客户道路指引导购价格查询

4s店智能机器人

4s店智能机器人迎宾销售导购数据收集分析价格问询等

展厅智能机器人

展厅智能机器人可用于接待讲解咨询互动价格查询等功能
 
资料获取
新闻资讯
== 资讯 ==
» 疾控工作者应该怎么利用DeepSeek等
» 从DeepSeek爆火看2025年AI的
» 2025人工智能赋能新型工业化范式变革与
» 人形机器人大规模量产在即,关注核心环节投
» 智能具身机器人的交互的四个层级:HCI,
» 智能具身机器人的梯控方案:云梯控-无需硬
» 智能具身机器人的梯控方案:基于R2X的硬
» 多功能服务机器人核心技术AIoT的重要性
» 具身智能机器人模块化设计的核心:开放统一
» 具身智能机器人模块化设计应用的优势:灵活
» 服务机器人的模块化设计的要素:移动模块-
» 服务机器人行业下半场的生态发展路线-基于
» 全栈式智能服务机器人生态的关键要素-技术
» 服务机器人行业信息安全治理与隐私保护的意
» 内蒙古DeepSeek模型地方政府部署进
 
== 机器人推荐 ==
 
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人底盘

机器人底盘

 

商用机器人  Disinfection Robot   展厅机器人  智能垃圾站  轮式机器人底盘  迎宾机器人  移动机器人底盘  讲解机器人  紫外线消毒机器人  大屏机器人  雾化消毒机器人  服务机器人底盘  智能送餐机器人  雾化消毒机  机器人OEM代工厂  消毒机器人排名  智能配送机器人  图书馆机器人  导引机器人  移动消毒机器人  导诊机器人  迎宾接待机器人  前台机器人  导览机器人  酒店送物机器人  云迹科技润机器人  云迹酒店机器人  智能导诊机器人 
版权所有 © 创泽智能机器人集团股份有限公司     中国运营中心:北京·清华科技园九号楼5层     中国生产中心:山东日照太原路71号
销售1:4006-935-088    销售2:4006-937-088   客服电话: 4008-128-728