湛江学生考235分伪造清华录取通知书与父争吵后离家

8月19日,有网友向南方日报、南方+记者报料,湛江雷州市调风镇一学生自称考上清华大学,伪造录取通知书。

调风镇居民蔡先生称,这件事情在当地轰动一时,学生所在村子甚至拉横幅、放鞭炮来庆祝此事,后被发现系造假。

云侧芯片则对解码能力、大数据并发效率、开发工具成熟度与易用性、功耗以及价格要求较高。

如今,身临海思难产之际,市场缘何又顿入无芯可选之境?制约AI安防芯片规模化应用的核心技术问题究竟是什么?

三是开发工具成熟度与易用性。

“存算一体的处理方式,其实违反了芯片中的成本结构。芯片中,之所以设计和区分片上的缓存SRAM,及片外的DRAM,就是因为如果所有存储都放入芯片内部,成本就大幅上升,会上升几十倍到上百倍。”

一款好的芯片,一定需在实际场景中打磨迭代而出,缺乏经年累月的正向打磨,很难沉淀AI工程化交付能力。

当时,经邻居提醒,曹先生意识到儿子的录取通知书可能是假的,便要求和儿子一同查高考成绩,随后谎言被揭穿。

触景无限副总裁陈勇:做芯,软硬件耦合是关键 

眼下,不同玩家们大多都会基于自身资源及优势,选取业务、性能、生态等方向作为突破点。

“平时在家很听话,都是他煮饭做菜。”曹先生提到儿子平时很乖,没想到他会欺骗自己。

有人痛骂囤货涨价无理,也有人感慨后继无人凄怆。

二是大数据并发效率。

另外,我们认为虽然在摄像头内,主控芯片很强势。但AI协处理器有它独有的灵活性和高效性,并不能简单地被主控芯片集成。这种通用性和专用性的取舍会一直存在,而这也是AI协处理器存在的机会。

同时,从业者们也逐渐发现,芯片中最为关键的其实并不是单纯提升算力,如果不进行存储优化,那么芯片实际提供的计算力会大大降低。

由网上流传的图片可见,假录取通知书有多处破绽,不仅颜色与正版有出入,还有错字、漏字等问题。

针对安防缺芯之话题,此前AI掘金志也采访了多家有着不同创新路径的芯片企业,他们或从优化芯片的计算、存储架构入手,或选择做软硬一体,或着眼于摄像头中的ISP、编解码芯片。

同时,国内AI芯片企业,眼下普遍缺乏后端设计人才,后端设计相对于前端逻辑设计,更多涉及到芯片的工艺,也相对更需要丰富的经验。

衡量一款芯片是否达到AI工程化交付能力,考察最明显的算力之外,还需从端侧、云侧分开验证几个重要指标。

8月19日19点,记者联系上学生家长曹先生,他表示儿子曹灿(化名)已经离家出走,几天没联系上了。

与通常计算的先有计算指令然后提供数据相反,SFA架构考虑数据在搬移过程中做计算,也就是由数据带动计算而非由算子带动数据。

曹灿是家里的小儿子,2个哥哥、1个姐姐已经成婚,曹先生夫妻平时农活忙,都是曹灿做饭、干家务。

云侧芯片处理的是经过编码的图片或视频,需要持续解码。

二是AI芯片与安防芯片的集成方式。

但仅看算力指数显然远远不够。于端侧,安防芯片考察本身竞争力、集成方式、开发工具成熟度与易用性、功耗与价格等。

也就是说,CPU在执行命令时必须先从存储单元中读取数据。每一项任务,如果有十个步骤,那么CPU会依次进行十次读取,执行,再读取,再执行…

以前,我们发现AI加速只是前端落地应用需求的一个点,打磨很长时间的AI加速芯片产品,用在前端的效果还是不够好。

如今,合二为一的方案已是主流,在系统复杂度、成本、功耗上都更有竞争力,实现过程也更加复杂。

记者致电雷州市教育局了解情况,工作人员表示“没有听说这件事情”、“不太了解情况”。

在芯片具体研究中,我认为,对AI 安防芯片来说,由于多层神经网络的应用,如何做到各种神经层中间的高效数据传输是一个难点。

这可以谈到人类大脑的存储和计算方式。从生物角度讲,大脑存储大量的知识,能够快速提取并访问,而大脑的内存和计算并不是分开的,更多的是存在一定的相容性。

另一个点是芯片的算力能效,芯片不能只单单提供算力,还要在满足应用算力要求的前提下消耗最少能量。

从大环境来看,国内虽有不少公司关注对AI芯片的底层架构的研发,但更多只追求有、不追求好,用拼凑的方式做芯片。

时间拨回2014年,人工智能落地刚刚兴起,端侧AI芯片算力仅有0.2Tops,云侧AI芯片算力仅有5Tops;如今端侧AI芯片算力已经达到4Tops以上,云侧AI芯片算力也已达到256Tops以上。

首先,从应用角度出发看看这个问题。

譬如,OS、安防SDK、ISP、编码皆重要非常,这对芯片厂商提出的综合要求明显提高,需要具备完整能力的芯片。

在完成大量计算的过程中,一般芯片的设计思路是大量增加并行的运算单元,例如上千个卷积单元,需要调用的存储资源也在增大。

端侧设备,对功耗和价格都非常敏感。

由此,很多厂商会通过外包的方式做后端服务,来完成生产。这对芯片厂商来说,其实是一个很大的竞争劣势。

芯片的软件开发工具非常重要。譬如,是否支持Caffe、Tensorflow、Pytorch等主流深度学习框架,相关工具是不是易用、稳定,对于AI应用开发者来说都非常重要。

一、安防市场极度碎片化,且做到500万片以上的出货数量才有成本优势; 二、前端、存储、产品开发、组织建设,都需要相应时间做充足积累。

云侧芯片在这方面虽然没有端侧芯片那么敏感,但低功耗与低价格永远都是用户的诉求。

不夸张地说,AI初创芯片公司虽然采用不同的路径打造芯片,但事实上都在努力对这一问题予以解决。大部分针对 AI,尤其是加速神经网络处理而提出的硬件架构创新,都是在与这个问题做斗争。

如何解决这一问题呢?目前解决方法有以下几种:

应用安防市场,SoC面向专用市场,在芯片中深度学习加速计算事实上只是一部分,而其他大部分芯片面积则交给了主控处理器、视频解码等模块。

(原题为《湛江学生考235分伪造清华录取通知书,与父亲争吵后离家出走》)

安防领域存有大量的算法需要前置,而目前的算法训练基本还是基于后端的深度学习模型。

海思之外,尚无一款足够优秀且合适的安防前端通用芯片,也尚无一款足够适用安防后端的AI芯片出现。

对于AI安防芯片要解决的主要问题和创新路径,企业家们有着共识,也有各自不同的选择和看法。

曹先生确认,网上说的“被气晕入院”、“父亲离开当地”等均为谣言。

那么,做一款比肩海思产品线的芯片难在哪儿?换句话说,一款「成功」安防芯片的自我修养是什么?

此外,安防行业还需实时处理大量连续图像数据流,数据处理在于两大维度:一、每秒处理帧率要越来越高;二、图像分辨率要越来越高。

若想突破AI芯片的瓶颈,并不能只是简单的增加计算算力,而是一定要把数据存储管理做好。对于存储问题的解决,仍是一个探索中的新方向。

终端通用深度学习加速器芯片市场的应用则刚起步,大多公司的市场布局主要在试错的同时,培养开发者生态。

作为计算机视觉落地较快的领域之一,安防赛道有一个基本封印的现实需要承认:

触景无限做芯片就是为了让自己的算法和工程经验找到一个更好耦合的练兵场,达成软硬件的协同优化,更好地实现前端感知。

这一点与AI大神Lecun所宣称的所有的神经网络都是图计算问题不谋而合。那么打破传统冯·诺依曼架构,自研存算一体架构的依据是什么?

与父亲吵架后离家出走

甚至于,不少玩家为了顺应市场形势,将自己包装成一个AI芯片公司,给市场徒增泡沫。

诚然,算力实为衡量AI芯片指标的重要因素之一。

如果开发工具不成熟或不易用,很容易就会被开发者抛弃。

也有人不太认同存算一体的处理方式,探境CEO鲁勇认为,这样做的成本太高,并不符合市场需求。

文章发布后,不少媒体相继跟进,大多谈到了安防市场缺芯现状及可能的替代方案。

探境科技CEO鲁勇:芯片的数据存储管理要做好

其次,从技术角度看看这个问题。

针对已经入场的大小玩家,分析他们的产品形态,大致可以分为两种:一是针对特定应用的SoC;二是通用加速器做独立芯片。

就像一条公路,AI芯片的集成像是铺上了柏油,但车辆通行时除了对于路面的高要求,还有对于路牌、路标、服务区的需求,而这些在实际过程中,都没法得到很好的满足。

因此,未来的计算机可能不是基于计算的存储,而是基于存储的计算,更多做到融合。不过,因为当前芯片领域对于AI算法的关注还较多,针对AI的结构改进尝试还偏少。

“最受伤害的还是我们,他妈妈也哭了好几天。”曹先生表示,自己很受伤。

一是安防芯片本身竞争力。

安防端侧一直用得是安防专用芯片,并不存在通用芯片。即使AI时代,端侧芯片首先需要的是有竞争力的安防芯片,其次才是在这基础上叠加AI算力。

但,造芯之难,除了考察纸面理论、战略打法外,还需解决一道又一道的实际挑战。

端侧芯片,虽然体积小、价格低,但系统复杂度、技术难度丝毫也不低。

较为常见的方法是加大存储带宽,采用高带宽的外部存储;二是从算法入手,设计低比特权重的神经网络。 除此之外,存算一体化也被看做是未来的发展方向,在实现上也分为不同的路径。 其一是SSD中植入计算芯片或者逻辑计算单元,可以被叫做存内处理或者近数据计算,这其实是深度学习的一种应用场景,并非是AI芯片架构的创新。 另一种就是存储和计算完全结合在一起,使用存储的器件单元直接完成计算,比较适合神经网络推理类应用。

造芯,登高还需防跌重

“他几天几夜睡不着。”曹先生说儿子谎言被揭穿后,他们有过争吵,儿子也失眠多天。

安防领域的数据特点,其实主要在于需要实时的处理大量连续的图像数据流。

过去几年,不少企业针对安防领域纷纷宣布流片之喜,但似乎还未出现强势的对传统芯片的替代或继任者。

传统芯片采用的是冯·诺依曼架构,其核心架构中计算模块和存储单元是分离的。CPU和内存条并不集成在一起,只在CPU中设置了容量极小的高速缓存。

而这一“乌龙”刷屏后也引发公众热议,有网友表示:事件已经发生,一味指责考生,一味取笑考生,都只能让事情往坏处发展,让考生陷入情绪困境中。也有网友评论指出,从照片中可以看到,造假的证书真的很高仿,这样骗了全村人的证书是怎么印出来的?是谁印出来的?其中是不是有违法行为?

后来,儿子离家出走,扬言不再上学、要去打工。

两大维度之下,安防对于端侧芯片提出了一些要求。

现在云侧芯片的AI处理能力非常强,所以大数据并发交互的效率非常重要,大数据并发效率决定了AI算力实际能发挥多少。

在芯片设计上,需要内嵌专门的硬解码模块,不占用AI算力;另外,解码能力上必须不能低于AI处理能力,不然解码就会成为瓶颈。

这就造成了延时,以及大量功耗花费在数据读取上,这一问题也被称为传统芯片的内存墙问题。

前些年,AI落地端侧,采用的是在主芯片边上加一颗AI协处理器,即两颗芯片的方式。

第一是每秒处理帧率要越来越高,第二是图像分辨率上要高。在这两个维度上,安防对边缘芯片提出了要求。

安防为何缺芯?毕竟这并非一个高门槛应用行业,无需苛刻的芯片工艺选择。

海思缺货之前,AI安防芯片混战常被提及,弯道超车之论屡被谈起。

做一款AI安防芯片要从全栈解决方案出发,不仅仅只有芯片,还要有比较完善的软件生态来耦合这个芯片,这样用户才比较容易、也能动态部署符合他们需求的方案。

而在AI应用中,冯·诺伊曼瓶颈问题显得愈发严重。

我觉得,这两个方面对于AI安防芯片来说最重要。

AI依赖的算法是一个庞大和复杂的网络,包含很多参数需要存储,也需要完成大量的计算,这些计算中又会产生大量数据。

AI芯片对于传统芯片带来的挑战,并不只是计算架构上的,更多是在存储架构间的。

今天,我们沿着该话题进一步聊聊: