15_ 原文 2026 年 01 月 01 日 16:33 好,咱们开始本学期的最后一次课。按理说下周?下周四还有一次,这周是第 15 周。但是下周第 16 周的教学周四是元旦。那么也就是说意味着咱们今天的课是咱们计算机组织体结构的本学期最后一次。
一句话,到目前为止我们的期末试卷我还没出吧?那么出什么题我也不知道,因为我们这个课程组的老师还没有一起坐下来商议,为什么不着急出呢?因为今天是 24 号,到咱们真正考试差不多将近距离将差有 20 天,咱们是考试周的最后一天的上午,我不记得应该是 16 号,因此咱们时间也比较宽裕。老师因为到年底了,各种科研报告也是够呛,也还没有出试卷。但是今天我的任务第一我会把鲲鹏 920 芯片的机核心概念给大家讲一讲,这是第一件事。第二件事我会做一个所谓的总复习,然后的总复有的同学觉得有用,有的同学觉得没用。其实自己看自己的自己的复习情况?
一句话,咱们这门课由于战线拖的比较长,差不多还有应该是还有 20 天大家都考试。希望在座各位合理安排时间。你别说三个星期以后考,一问三不知,这个事情就比较难办了,是吧?难道到时候就都报不了你,也就是第一合理安排时间。第二一定搞清楚咱们的评分标准,也就说卷面就是期末考试试卷只占 70 分。70% 就 100 分的卷子要乘以一个 0.7,剩下的有大作业实验、上课出勤率、提交作业做的情况等等,这是 30%。
也就说这个大家可以根据实际情况,合理安排时间。一句话,这个我不会太为难大家,但是做这个是有底线。我已经说过了,咱们这次考试第一是统一阅卷,是课程部统一阅卷。也就说那天参加计算机技术体系结构的考试,同学有软件工程专业和大数据专业的,将近两百多人是吧?两百多人数也不少。人工智能专业的之前已经考过了继科的以及什么徐特立的,他们是下个学期。咱们这一张卷,希望大家要认真对待自己的学习,是吧?认真对待自己学习。好,咱们就切入咱们的课程的正题。
上节课主要讲到最后,我们讨论了一下基于 ARM 结构的相关的一个知识。首先大家要明确 ARM 这个概念代表什么含义。宏观的讲,我们说。AIM 是一个公司的名称,现在这公司所在地是在英国英国剑桥大学厦门的公司。他这个 ARM 目标跟我们传统的 CPU 的目标是不一样的。他的目标用一个比较通俗的话来讲的话,ARM 目标是做我们嵌入式系统的设计商。
什么叫嵌入式系统呢?就是说我们传统的 PC 机是以英特尔的 CPU 为代表的,就是 CPU 内存、硬盘、网卡是吧?声卡等等等等这一切。
大家从小到大要用台式笔记本,大家发现这些我说的 CPU 的内存也罢,硬盘也罢等等等等,都是集中在一个被称为主板的机器这样的一个装置上面。然后 CPU 是 CPU,内存是内存,硬盘是硬盘,什么是什么?这是一种形式,就是我们这是我们标准的文诺依曼及结构,计算机就这么长成这样。
而 ARM 所代表的嵌入式系统,他由于他的目标是往工业生产的其他产品相结合。比如说手机,比如说家电,比如说工业控制的机器人等等等等。这些设备它最大的特点,因为由于它的体积可能是非常小,以传统的 CPU,内存什么什么彼此独立的这种方式不符合他的需要。那他需要在很小的板子上把 CPU 存储各种还有网卡等等等等。这所有的信息要集中到一起来进行一个处理。我们叫嵌入系统是吧?
当然我们说我们牵引系统从过去的这 50 年的发展,我们早期讲的是 PCG 的。比如说 825182538255 这些接口控制器的一些设计,就是我们 PC 机的。到现在我们说都集中到一起这种机制。到后面我们今天讲这个昆明处理器内核,大家发现我们传统的 CPU 不但具有我们上理论课讲做数据处理,这个就是 CPU 有做有控制器与运算器之外,它还设置了什么什么 PCR 接口的控制器,网卡的控制器等等等等。
这种形式谁就是比如说 ARM 最先提出来的,当然是到了 2020 年的今天,在嵌入式系统中做的最好的,世界上占有率最高的就是 ARM 公司的设计思想和产品。ARM 刚才我说了,第一他是英国一个做专注于嵌入系统软硬件 CPU 设计的这样一个公司。第二是一类嵌入系统处理器的通称,也就是我们所谓的 ARM 架构。第二是一类处理器的通称。第三是一种技术的名称,这个都是什么特点?它的指令集,比如说苹果公司的 M 系列的处理器就是基于 ARM 架构。我们常见的各种手机的处理器也主流是基于阿里架构。
大家经常听到的什么效果多少?联发科的什么什么 9000 系列的,9900、940、950。这些芯片它都是采用 ARM 指令集进行设计,这是 ARM 怎么理解?
我们说 ARM 从一九八几年到现在也将近 50 年了。早期它有指令集,它有对应的物理的嵌入式系统的内核,它都有。它的这个指令集的版本从 V 一到 V7,这个时间大概有个二十多年。因为 win 7 就是 ARM 架构 N7 这个指令。这个版的指令集大概是 2004 年出现的。也就是说唯一大概是 1985 年到 2004 年正好 20 年。那么这些早期 ARM 架构的,无论它的指令集,它的产品,只是在众多嵌入式系统中,它只是占很小的一部分。与之相关联的,比如说德州仪器,还有一些很多很多这些,比如说摩托罗拉它也有枪系统等等等等,这有很多在当时发展起来。
但是随着 2018 年就 2014 年大家想一下,2014 年的时候,我们用的手机也就主要是在当时 04 年。主要是以诺基亚做的系统,他做的是塞班分比较分配的系统。到了 2010 年前后,你这个安卓这种开源的屏手机操作系统为代表。那些手机出现以后,由于安卓这个手机系统是免费开源。然后 ARM 在当时由于小公司,他只能是靠自己的知识产权去卖钱。因此他对于自己家产品的推广,应该来说他收费不高。大家就交交一点钱,象征性的交一点钱,你就可以免费使用了。
因此在当时就 2010 年前后,随着安卓手机这个智能手机快速的使用之后。On 逐渐成为在当时这个手机的一个智能手机中最耀眼的一种架构。因为在当时还有所有的架构,比如说基于 java JJ two ME 的黑莓手机,还有当时的诺基亚等等,都没有退市。但是这个是有很多公司在由于安卓的知识产权出来以后,逐步就发展起来了。
我们说到了 2011 年,20V8 这个指令集出现以后,在过去的这十几年,应该来说基于 RMV8 无论是手机的使用以及最近就是最近七八年主要还是英特尔这个 CPU 发展出现了瓶颈之后,这个 ARM 架构的 CPU 以低功耗大家关注的点做的比较好之后,基于 ARM 的 PC 端的处理器现在是用非常多。比如说 AMD 公司的最新的 CPU 很多都是基于 ARM 架构,比如说苹果的 M 系列都属于它。这是 2011 年,也就是说在二公司所给出的这种通用指令集里面,现在用的最多的是 ARM v8 到 2021 年就疫情最严重的时候,MV9 也出现了,像阿米 V 八大家可以看一下它的代表的这个处理器的内核,是让大家要看一下前一段时间,比如说骁龙对这种最有名的处理器,你可以看看一下他用的内核都能看到什么 A53、A57、A72、A73 等等。这一个 context action 两位数的基本上是基于 RMV8 指令集所对应的硬件产品。如果是 MV 九大家可以看一下,还叫 context,只不过是 A 后面是跟着三位数的编号的处理器。比如说 A510、A710 是吧?这就说因为现在消融,现在骁龙什么 888,什么发动什么技能,什么什么第二代、第三代、第几代的,你可以看一下,都是具有阿莫 V9 架构,也就是说这是它一个比较好的一个东西。那就是说事实上昨天我再看一下最新的 CPU 的性能。
Intel CPU 我们说过了,我上节课曾经说过,由于这个企业英特尔企业在过去的有十年,从 2015 年开始,他始终处理器的是制造水平一直非常差。因此而且它的 CPU 有缺陷,就是说所谓的第十三代第十四代就二年、二三年、24 年这三年左右的英特尔 CPU 不建议大家种,就是第 11 第 10 二,第十三代第十四代英特尔出的 CPU。因为英特尔 CPU 是一年出一代,那几年的 CPU 是绝不可能买的。所以它设计的缺陷就是正缺陷,会导致这个 CPU 处于高压高热状态,他的损伤是一种物理损伤,物理损伤,这点请大家注意一下,我们说 ARM 这个因为我们华为公司用的,因为在 2015 年一那时候咱们跟国外的这个关系还是不错的,是吧?
华为是购买到了 MV8 的永久知识产权,RV8 的永久知识产权。MV 八是永久知识产权。之后由于对国际关系的原因,ARM 始终没有给华为授权 ARM v9。但是 24 年 7 月,这是去 24 年去年 90 月份才给的消息,就 ARM 该公司也拿到了阿姆 V9 的名酒。是也是过了三四年,大概知道国内应该是差不多类似的东西能做出来以后,他进行。当然这种授权跟过去的授权是不一样的。
尽管 24 年给了华为的授权,但是因为华为从 2018 年之后就开始自主研发它的处理器,研发它的产品。目前所谓的华为主流的处理器都是基于 RMV8,说白了 V8.2 这个版本的指令集自研处理器。比如说就是现在市面上华为所卖的主流产品,都是基于 RMV8 这个指令集所设计的 CPU。
好,下面咱们看一下鲲鹏 920 这个芯片。鲲鹏 920 这个芯片大致其属于 2020 年之前,华为和国外关系比较好的前提下,代表了他当时就五六年以前的华为的最高芯片设计水平。在当时鲲鹏 920 芯片是由华为海思公司设计,由国外?由海外的一些公司代工生产的对吧?
一般来说,对于阿里架构的微体系结构,我们希望大家要注意三个概念。第一是内核,process 框就是处理器内核。所谓的处理器内核等同于咱们理解的传统的单 CPU。大家听清楚,我们这里讲的处理器内核就对应的是我们这个学期讲的 CPU。那么主要完成对于主要我只是控制器这个角度取指令分析指令,执行指令,说白了对于指令的解析。而且大家注意一下,我们现在计算机的指令都是基于流水线技术设计和使用的,为什么呢?因为现在的这个 CPU 都是多内核,因此我们说大家注意下,这里的内核对应是咱们这个学期从开学一直讲讲到现在所对应的那个 CPU。
说白了那个控制器?指的是内核,下面这个概念 ARM 处理器。那么 ARM 处理器可能答案就是这就是你所说的 CPU。事实上大家看一下,比如昆仑 920CPU 他有 64 个内容。就相当于 64 个 CPU 我集中到一起构成我这个处理器。意思说你总说这个概念你一定要弄清。
我们说这个内核指的是咱们这个学期大家对于 CPU 的理解,就说白了这个内核指单 CPU 和单功能器。而现代意义上所说的处理器,比如说华为,我们 920 是 64 个内核。它极端情况下它可以对于服务器,一台服务器可以装四个处理器,也就是 256 个人。现在这个 AR 算力是吧?这就是一个很大一个一个一个东西是吧?那么有了内核,有了处理器,我们还有一个概念 SOC。SOC system of cheap 片上去。
这片上系统对应的是我们传统嵌入式系统的那个板子上的东西 SOC。实际上 SOC 这个概念大家在各种新闻报道各种地方经常能看到。因此大家看一下,这种概念跟我们理论教学的概念完全不一样的。也就说我们理论教学对应的是第一个内核 process call。而处理器我们会讲昆明 920,它这个处理器要 64 个内核。比如说多机器有肉视力,就在一个很不大的一个处理器的里头,我植入了 64 个 VCPU?那你怎么去工作?
然后是片上系统 SOC。大家可以看一下,鲲鹏 920 是华为自主研制的这个高性能处理器片上系统。大家注意一下,这是华为自己定义鲲鹏 920 系列芯片,是华为自主设计的高性能处理器片上系统,把它等同于 SOC 是吧?你还说你你把你把这个 CPU 放进去,你连上网线,这个完整的系统叫 SOC。它对应的是 RA8.2 这个指令集这个具体版本。
一个 CPU 内核,一个宽盘处理器支持 64 个内核。我说一下这六十四核它怎么设计的。利用片间的这个开始一致性接口,也就说在一个所谓的装有鲲鹏 920 的服务器上面,它能装同时装插什么四个鲲鹏 920 的这个构成 256 个。算那个那么在我们的鲲鹏 920 芯片里面,除了有 64 个内核之外,它还集成了以太网控制器、SAS 控制器以及 PCRE 控制器。除此之外它还有在芯片集成了安全算法、压缩解压缩算法、存储算法的加速引擎。
你说这个 920 芯片除了我有 64 个内核之外,它有强大的 IO 处理能力是吧?这是网卡的接口,SAS 是经典的存储器接口,PCRP 同样大家都知道对吧?显卡主要是通过 PCRE 这个接口进行工具。你可以看一下这个是 IU 除了之外,还在上面还能够硬件实现是安全、解压缩等等这些算法是吧?OK 这个芯片是不是跟我们教学过程中所讲的抽象理论,计算机的 CPU 的芯片是否长得不一样,是吧?这个希望大家一定要注意一下。
我们用一张图打开一个鲲鹏 920 内核那个芯片之后,大家可以看一下。在这我极端情况下,我可以给你放 64 个内盒,这里面有 64 个四个是吧?然后他们中间你看我可以大家可以看到这个蓝浅蓝色的这一圈。浅蓝色的里头是六十四内存,这浅蓝色机身叫什么?它叫环形总线。环形总线在华为基因总线皆有。比如说 DDR4 什么意思?内存?
这个有这里什么 SAS set SAS 可能大家不知道,你看到 SATA set,那么就是说我们硬盘接口,set 接口 SAS 接口,那么这个 SAS 就是 sas 接口对吧?PCRE 显卡?还有这是这是其他 L 接口标。
这上面这个 CCRX,刚刚我说了,我可以在服务器里面插 4 个 CPU 是吧?这 4 个 CPU。怎么通讯呢?就靠 CCRX 结构进行通讯。这里还有网络接口,硬件加速器,就把我们什么什么压缩算法压缩解解压缩算法、安全算法?你失去他调查的处理。事实上大家可以看一下,在我们右边它有大概的一个描述。事实上鲲鹏 920 的 CPU 有鲲鹏 920 的处理器,它也是三级。
开始大家看清楚它属于三级态势,怎么讲呢?其中每一个内核,比如刚才我说了,它正常情况是 64 个内核,每一个内核有单独的一级缓存和二级缓存,有每一个内容有自己独立的一级缓存和二级缓存。其中一级缓存我们写的是什么?哈佛结构,什么意思?哈佛结构的一级缓存分为二指令。指令缓存和数据缓存。这每个内核是用 4K1 级缓存,每个内核有 512K 的二级缓存。
三级缓存大家注意下,L 三我们称为共享缓存。L 三是共就是是共享,就是每个内核独占一级缓存、二级缓存,三级缓存是内核共享。这是它的一个特点是吧?集成最多 64 个,他要正常情况下就是要 32,要么六十四。然后这个 PCRESSSAS 就对 sky 接口对应这一块存储 PCI 等等等等。大家可以看一下,就这是一个效果,这一个我们常说的处理器要有 64 个内。
好,这张图把刚才那张图拆开放大了,大家可以分别看一下。它内核产生什么就放放了什么,这叫泰山内核。当然我们会说泰山内核是它的内核是怎么样使用,就是内存。Fabrics 环境检测是吧?
大家可以看它这个特点,就是说利用环形总线这个 CPU 与 CPU 与其他的 IO 接口进行相连,这就是经典的嵌入式系统。就在一个 CPU 里面既有做我们标准,就我们理论学习的处理器的功能,除此之外它还有做 IU 操作功能。所以说这就是我们 ARM 架构跟英特尔架构最大的区别。就是英特尔架构的处理器里面没有这些东西,没有环形总线之外的所有东西,就英特尔 CPU 是没有的。但二架构我说他是做嵌入系统,就一个 CPU 既要干传统 CPU 的活,还要兼做 RU 控制器的工,这个级别是不一样的是吧?而且由于它的制造工艺先进性,这也是为什么现在基于 ARM 架构的打败了英特尔架构的处理器。
就在这我这个功能强功耗低是吧?我尤其像这种非传统的比较基于 ARM,基于这个 AI 运算、AR 运算,说白了所谓的 AR 运算力,说白了就是一个矩阵计算。其实华为还有一块芯片叫升腾处理器,是专门做专门做这个人工智能算进去是计算的是吧?这个没什么关系,我们到时看情况。
好,这罗列了一些信息。说白了,在鲲鹏 920 里面,它的内核称为泰山。他自研了泰山,那可是泰山 V110。贺龙待会介绍一下。自研内核它的性能它这里用十年十它是泰山 16 这个核,1620 的那个核,它有四十八核,与当时的英特尔十年以前的某一款 CPU 做了一个对比是吧?这是第一点。
第二点,它集成了 IU 接口这经典的嵌入式系统。按照我们因为咱们国内所有的计算机组成一体结构的理论教学,它的指导蓝本是基于英特插花肉架构去讲,分什么运算器、存储器,这控制 IO 控制器。而这种嵌入系统它是放到一起,在昆明 920 芯片里面,它含有丰富的 IO 接口控制器,能够支撑硬件极简化设计。包括内存,包括网卡,包括等等等等单位,他是做了高度集成。
除此之外,我们说它还有一些创新。就是说除了金标准的 CPU 和 IO 设备之外,它还进行了一些其他业务能力创新。比如说直连交换机,直连什么什么?什么 CPU、GPU 等等等等,还加了一些其他功能。
这个我们传统 CPU 传统 CPU 尤其他所谓的他第三步的能力,就是所谓的架构创新。这块英特尔 CPU 做的东西,大家可以看一下他所做的事儿。事实上这就相当于把我们的这个第一块他描述的实际上对于我们存储接口的扩容扩展。第二个通过这个专用的 CCRS 接口,能够进行新的使用需求的一个我支持。然后这个东西我觉得仁者见仁智见智。
一句话,我们传统的鲲鹏 920,我们的昆明 920 跟传统的 CPU 来大家可以看一下我们这张图说明了我们这里分成 920 和英特叉 86 架构下,我们理解的计算机产品之间的一个对应关系。我们的英特的鲲鹏 920 这个嵌入系统的处理器,是我们英特尔 CPU 网卡、硬盘控制器、桥接芯片等等等等的一个综合体。就变成了这个就原来我是分 CPU 网卡、硬盘控制器,因为英特尔的 CPU 分为它内部结构架构,分为南桥、北桥?南桥干什么和北桥干什么,它都是有角度的?
一个管关,就显卡处理什么一个怎么着,就是快速把所有的东西都能够融在一起,就形成你不能 92,而且这张图说明了我在一个所谓高端库里面,我同时插四个昆仑 92 情况下,我可以形成 256 个内核的算力是吧?现在的算力大家都知道,这个非这两天非常热是吧?好。这张图说明了鲲鹏 920 和我们英特器件之间的一个关系。下面咱们可以看一下。一些概念。
这里我们要讲一讲有关一些基础知识。首先大家看鲲鹏处理器芯片,第一不仅包含传统的 CPU 其内核,而且包括多个部件构成的 SOC 系列系统,因此把它称为系统芯片是吧?事实上我们说,我们因为现在我们知道咱们国内,被别人被国外在半导体里中卡的最厉害的就是所谓的芯片高端芯片的生产能力。咱们国内目前还是出现了问题是吧?而且但是最近一个好消息,前两天大家应该能看到,咱们把光刻机高端的光刻机搞定了。那么光刻机照射生产的那个产品,我们这有几个概念,咱们一起首先是称为经历的概念。经历的概念就是最终分装到我们处理器铁盒子里面的那个那个今天就是经历,那么大家看一下。
首先精力这个概念是指由半导体材料制成,而且未经分装的一小块集成电路的本体?一般来说这个集成电路是一种我们把它刻成一个 12 寸甚至更大的一个芯片,就芯片?然后这个芯片是圆形芯片,然后通过相关工具进行切割。切割器以后甚至变成的这一小个方片被称为金。每个经历都是一个集成电路的复制品。
说白了经历就是讲的我们叉 86 架构下的 CPU。具体到昆明 920 这个经历,我们把它称为泰山 V110 处理器内核。大家可以看一下这一个经历,我们给他我们华为公司给他一个名称叫泰山内核,而且它有型号为 V110。然后大家看一下柯南 920 是把这四个内核四个经历集成一个 class 1 处 8,每个经历它可以分光八个 class。那么大家看一下四个经理构成一个 pass,那么他一个经历就是一个经理他可以分装这么八个簇,相当是就一个经历,就是华为公司设计的它一个经历,它包含 32 个 CPU 内核,32 个 CPU 内核。
那么托盘 920 分装了,大家注意一下,昆仑 12 又分装了三个精力,大家注意一下这三个精力的功能是不一样的。其中两个精力是用来运算的,我们说的就是由泰山这个泰山内核构成。还有一个经历做 IU 操作,这三个监狱是不一样的。因此我们说鲲鹏 92 侵权是 64 伏?三个经历只有两个精力用于 CPU 处理?还有一个经历作为 IO 操作,因为我们刚才前面讲了什么你的 PCR 的控制器,存储控制器等等等等。好,那么就叫他变形。
从。
非常是。
好,这个也就说咱们刚才讲的这个 CPU 的内核,咱们可以看一下。也就是说说首先咱们要有几个概念。第一个是这个内核的概念,第二个概念是经历的概念,第三个概念是处理器的概念,就是内核精力处理器。所谓的内核就是我们理论教学中所讲的 CPU 对应的是内侧。而昆仑 920 他分装了三个精力,其中两个精力是用于处理运算或者这里计算,第三个定理用于 IO 操作,这两个用于计算的精力,每一个精力能够最多情况下包括 32 个内核是吧?那么这三十二内核是四个内核一组,这一组称为 class class 一个经历可以有八个 class。总的来说昆仑 920 这个处理器包含 64 个。
内核好,这是泰山内核的架构。大家可以看一下泰山内核就我们经典的架构,大家可以看一下,说白了这个可能比较。就是比较字太小了。
我们用一张大脸图说白了,大家可以看一下刚才那张图,我把它翻译成中文。说白了光看这个描述是不是跟我们之前讲的处理器,就跟我们今年处理器讲的不太一样是吧?就是不是处理器经典的控制器,我们控制器的作用是什么?取取指令解释指令,执行指令的控制器的作用。大家可以看一下,事实上我们说现在就算是经典的,都是基于流水线技术进行快速的处理,指令的执行。
大家看一下这个流水,流水线包含了取纸、一码运算三大部分,其中运算又细分为整形和浮点。实际上这个图事实上是我刚才这张图的一个改一个中文说明。比如说 RFU 取指令单元 OOO 乱序乱序这个一码乱序一码。然后 RES,RES 是我们进行整齐,就是我们一般我们分为整形运算和负面运算。整体运算 FSU 浮点运算,大家可以看这个过程?我们做了一个明确的说法。其中这个 MMC 事实上用的是我们处理器过程用到的什么这个内存管理单元内存管理。
事实上我们用这张图把刚才那张图做了一个翻译,这张图相当于是原始的设计图。我们担心在座各位有的同学看不明白,把他问题讲话就变成傻大微粗?比较简单。
什么整形浮点刚才我们都说了,这是我们把刚才那张图再细化给出来的一个结构。但是这三张图我们的标题都一样,是指的是我们的。这个芯片中的单个内核所具备的功能。那么咋发现这个就所谓的泰山内核,就是我们经典的具有流水线处理的 C 控制器的一个设计是吧?控制器的一个设计也不能不算控制器,就是我们经典的单核 CPU 的设计。因为传统的控制器只有解析,那执行过程就牵扯到运算整型运算浮点运算?这个大家可以回头下自己看一下。对于这个 SO 对于多个构成的芯片来说,你光有芯片,实际上它还需要一个相关管理控制,综合内容叫 SOC 片上系统。
好,这张图相当于我们泰山,不是泰山,就是鲲鹏 920 的处理器的结构。刚才我们说了泰山 920 处理器有三个经历是吧?两个精力适用于运算,第三个精力用于 RU 操作,这是三个。刚才那张图是将每一个经历内部长什么样,怎么干活的给大家讲清楚?大家看这是太上瘾了。
然后这是什么鲲鹏 920 处理器的内部一个框架示意图。它包括三个经历,两个精力贡余运算,第三个经济共余,还有操作。实际上这个是我们因特 CPU 和嵌入式 CPU 的最大区别。事实上不再经历了这一块。事实上现在英特尔 CPU 现在也是多多内核的多核的?它无非是大小和那的。而我们说英特尔 CPU 和欠二价的 CPU 最大区别实际上是最右边的,大家看不起不起眼的东西。那么是这是什么 silver IO cluster 超级 IO 错是吧?
那么这个是这这是 R 架构和英特架构最大区别就在第三个阶段,而不是前面。实际上前面英特尔最新款的 CPU 这块儿大家彼此差不多。但是它最要命的是这一块,它有 IO 操作的这个东西?这三块构成我们的这个鲲鹏 920 处理器的功能?这个只不过是这三个我们这么画是吧?
是这么画。但是但是有些地方因为是每个经历,他他的这个描述跟那个跟我们就是说这张图可能大家要稍微看怎么理解,因为这两个图都是抽象的画?为了他为了展示什么东西又做了一个描述。好,大家可以看一下。
还是刚才的那张图?那么这张图大家发现跟刚才那张图又不一样了。刚才我说了这张图是两三个经历,两个做运算,一个做 IO?这是物理动画,但是我们逻辑把它画成这种环形总线下,内部是 64 个核,外面接的是我们第 3 个 IO 经历的功能。什么这里有加速网络等等等等,这个 set PCREIU,还有这加速这个什么 HYDRA,这个是对应的是什么?多核之间通讯的结合。对刚才我们说了一个服务器里面我可以装四个鲲鹏 920 的芯片,那 999920 芯片要进行分配化跟套片的结构。也说这几张图事实上你画成这样对不对?
对,画成这样也对。它就是同样的东西,它有不同的画法。但目的说我这里面是通讯的,它有个还原总线,但是还原总线真的这么是一个圆形这么画的吗?我们说它起成这个 fabric,但是到底内部结构,那只有华为工程师知道是吧?华为海思工程师知道。比如说这张图和我们这张图功能是等效的是吧?功能是等效的,这张图是华为公司给我们提供的教学品。
如果大家看这张图的话。我看了一下,它是要分成四块。大家注意下,你真真要看就看右侧这两块。因为这面就中间这两块,它因它是复制过来,而右边最右边的这个他把这个图发了 180 度就成这了。你会发现这里面所有的信息都是反的这是对应的是这个 OK。
这张图我大概说一下,你有些图也是怎么说呢?一句话,因为牵扯到华为公司的商业机密,它只是很范的给你给了个示意图。这人长这样是吧,大家要把控他是吧?因为毕竟这应该算是华为比较核心的商业机密是吧?他处于自己自我保护的这个原因就不展开说了。
下面我们看一下,就是这个泰山内核是独享一级、二级开始,三级开始是一个共享的?它的通讯机制实际上是三级态势,它有一个缩小 LLC,我们把它叫 3D 开始其实在很多说什么叫 last level cash,就三级 cash 真正在昆明教的专业书籍里面叫 LLC。我们根据我们对于开始级别的划分,把它称为三级开始是吧?就三期开始。但是华为的官方名称叫 LLC,这个大家一定要弄清楚。实际上它的通讯机制较弱。
这个我们回头自己看,因为这个宽盘处理器,昆仑处理器有专门的书籍。这是华为公司和北邮的戴志涛老师。戴戴志涛老师。我想可能有些人知道考研的话,科学出版社有一本计算机组成原理的书籍。白中英老师。后面过去就白中英老师一个人,现在后面跟了一个戴志涛,他也是北方过去这个白振英老师是西北工业大学的老师。
这是有鲲鹏,就是说这本书也是华为公司给我们给的,我看是哪一年出的。那就 2020 年疫情的时候的,这本书重点讲的是昆 920 的内容。好,这就是说他内核怎么构成。比如说这里有个讲话,我有四个内核,就是这个四个内核是构成一个 class?我们正儿八经昆明 920 是要八个 plus,也就是 32。
除此之外,我们对于用于计算的这些内核,我们有一个称谓叫 SCCL。就是什么 super CPU cluster,super 第一个 S 第 2 个 CPU fast?它主要描述了有关运算经历的一些内容。它包括 6 到 8 个内核,2 个 IU 集群,4 个 DDR 控制器等等等等。每一个面包分成一个晶片,一个晶粒是吧?就还是这张图。就每每一个经历称为一个。
CSCCL 也就是所谓的超级内核集群,这是单个算力精密内部的结构大致齐。事情长这个样是吧?事实上华为设计的鲲鹏 920 系列芯片,性能最高的是 16601620。这个就是两个算力经历,一个 IO 经历,还有 1620S1 个算力一个 F 是吧?一个算 16615 办工作,还有工作。比如说他有性能高有性能一般的,还有单独做,还有插桩,他们这个设计是非常灵活的。
如果一个户型装四个鲲鹏 920 处理器,它的通讯录就是 HYDI。DIA 主要通过这种华为自研的片片间通讯接口来实现的是吧?像这张图和我们这张图是完全一样的,主要是我们用一种彩色形式进行标注。它描述了 IB 所谓的一个服务器物理服务器。主板上我装四个昆明 90 内核,他们是用什么机制通讯,对吧?也是他用专用的华为的设计的这种接口服务来实现通讯。
好,刚才我们主要讲的内容,下面主要看一下就 IO 集群。IO 集群主要实现对于 IO 设备的管理,主要是有网络 PCR 总线的硬盘加速的等等等等。大家可以看一下这些内容由于比较多是吧?大家看一下,它是陷阱,是连起来既可以独立工作,也可以分庄村特定的昆明 920 一起整合到工作。这个由于时间关系,我就不想再啰。后面大家可以下去,可以自己看一下。后面是有两块,一个是鲲鹏 920 芯片的流水线设计技术,内容比较多,大家注意一下,这个也是属于我们和国内一些高校我们合作就是一起合作。因为华为公司每年都要组织我们要进行这个课程的一个学习。
首先大家说明,我所拿到的这个 PPT 的很多材料,是由我们兄弟院校的老师提供的。昆明教练他内容比较多,回头我把这个 PPT 会发给大家。这块主要是大连理工的一个老师给我们分享的一些材料。它主要是对于流水线运算过程,每个环节我干什么说的很清楚。也就是说大家可以看一下,他分了这么多户是吧?就是曲折性的第一步到第四步,我这个立马第一步到第三步我追星的都不到。他每个环节都有一页 PPT,大家可以下去以后自己去看一下是吧?那么那从我们 90 页开始,它每个环节每一步动态它会变什么?大家下去给自己看一下。
因为时间关系我要展开讲,咱就要结课了是吧?那么这块内容我们就简单说一下,我们只做概念性的普及,不会在期末考,不会深入讨论,这个相当明确。好,最后我们说我们的这个昆明 920 指令系统这块。一句话,由于华为是拿到了这个阿里 V8 的指令集的完整版授权。事实上在华为设计鲲鹏 920 指令系统的时候,只用到了 MV8 的 64 位指令集。大家听清楚,就华为拿到了 ARM v8 的完全满足授权。但是他在涉及鲲鹏 920 芯片,就泰山那个仅涉及基于 64 位操作系统,64 位处理器的指令机在上面做了裁剪。对于这个 32 位指令,对于 16 位的指令等等这些他执行不了。
因此我们说这个基于华为鲲鹏 920,它在使用过程中有特定应用领域,特定应用领域就是它全能的。比如说我们常见的什么云计算?AI 运算,AI 算力等等等等,这些他都支持。但是真正这种嵌入式系统的经典工作,与智能家电,与其他的一些设备整合到一起,昆明 920 是做不了这个项目,一定要弄一定要弄清楚。这样我们这个有关工程华为 ARM 架构芯片的一个描述,我就讲到这儿。今天的课咱们就我也因为三节会其实也没有必要,还有点时间。
我会说一说这件事。好,总复习。那么总复习大家一下今天我所讲的内容,我会把 PPT 一定这两天一定会发到咱们的群里面。那么总复习说白了这是最后我刚才说了,咱们题还没出,但是基本上这个思路是不变的。我们分为两类。这个期末考试卷子是百分之是吧,占比是 70 分,就百分 100 分,你乘以 0.7,你卷面成绩考多少分,你乘以 0.7 你能算出来是吧?
这是这块儿,咱们的考试比较传统和经典。园林专业基本上是 20 年过去了,这二十多年都是这个标准,50 分基础,50 分应用题。所谓的基础题就是填空和选择。
那么这个。我上课所讲的,说我哪地方我要考,这话我不是白说的,我会兑现的是吧?这是一块。那么这块儿就成我选择有小的计算,我上面说的有个什么什么,比如说 R 进制,我给你设计一个七进制,设计一个三进制,你会比较大小是吧?我随便给你编一道题出来,比如说类似于这样就是小的计算,小的最或者最基本的概念,比如冯诺依曼思想是什么?你总是说你学这学期和 MS 是谁,你都不知道他思想是啥不知道,那就比较难看了,也就这些。
刚才我说的东西就是在填空和选择 50 分后面有计算题、分析题、设计题、问答题。这个基本上跟我们课后作业类似的。但是听清楚没有?课后作业猿题你们想都不要想是吧?
但是基本上跟客户课后作业猿题,只要你课后作业是自己做的,不是抄的,我觉得应该问题不大。但是还是我那句话想说的,同学想教育的同学人不来,跟你们讲也没啥意义。那么凡是坚能正常坚持上课的同学,我觉得你考试肯定没问题,是吧?
好好向大家注意一下,按照我们这个课程组的要求,我会在选择题里面有 5% 的华为的习题。当然这个你们不要担心,因为华为给我们了相关的这个复习题,我会一一并回头发给大家。这个没关系是吧?就是有 5% 的是华为的习题,只要在选择题里面要求填空,华为的这填空题就太为难大家了,这是我强调一下剩下的题。这是一个基本要求是吧?注意平时的作业,你只要你认真做完,做了平时的作业,我想剩下的 50 分基本是没有问题的。
我大致其罗列了一下,有这些内容。下面咱们看一下每一章的内容。第一章是概述,主要讲了存储程序的概念?这是冯诺依曼思想的核心。然后 CPU 包含什么?主机包含什么?计算机系统包含什么?我可以出填空题,也可以出选择题,是吧?
这种题说难听的讲就是送分是吧?就是送分的给大家送分的,不是为难大家的。你别说 CPU 发生什么选择题选不对,你填空题写不出来这种事儿你别找我是吧,我给你说你不要,那我也没办法是吧?
这是第一章,第二章。咱们是运算是吧?第二张是基本运算。预算大家看一下,就我们今天的第二章内容,第二张有一这个东西。大家随便去去弄是吧?只不过我强调一下我所说的,我上课说我要怎么着是吧,这些我都会一一兑现。
第一块是原补返的表示,第二部分是定点数和浮点数的表示。定点数浮点数表示我怎么考?就看我们的怎么说呢?定点数的表示和附件数表示简单一点,我就考个定点数怎么表示是吧?比如说一个 32 位的小数,32 位的小数如果用 32 位小数,如果用乘法表示是吧?他表示的最大的速度是多少?说白了定点数的表示,浮点数表示最核心的是什么数的表示范围?这是简单的,我就考定点数的表示范,想跟大家看看,大家水平都考一个负点数的老师那多容易,然后他最后以 754 标准,这个没什么含糊?除此之外阿斯马哲汉字的方法,我们汉字分为国标法、区位码、机内码,它们之间有有两个公因式可以相互转换,我给你比如说某个汉字的什么国标码,它对应的区位码或者尽量把内容写出来是吧?就校验是吧,这个也是最基本。
第二章。绝大部分会出的是填空或者选择是吧?真要出一个五分的大题,我可以直接告诉大家,就在就有两个地方可能出。一个是浮点数的表示方,表示浮点数的文化里面出出可以出大题,或者是 S 等于 754 标准是吧?我给你一个数,你给我按照 RIQQE754 标准写出来,就是给你一个十进制数是吧?随便说给你个数,随便写个 93 分又 64 分之 47。那他确实就是标准,如果要出如果这道题,如果第二章我们要出大题的话,只有吹玻璃 R6754 标准和浮点数的表示方法简化,我可以出动大气,否则别的地方出不了 OK 那么第三章指令系统。
最核心的可能出大题的一个是操作码的设计,一个是 EA 有效地址计算。别的东西你要指令格式,就访问次数等等等等,其他的是不是也只能出一个填空选择是吧?如果出大题就这两块,这是第三章、第四章。
我说过了定点数的乘法和除法?乘法分为原码一位乘法和补码一位乘法。除法原码加减、交替法和补码加减法 4 种方法?这个概率很大。当然咱们丑话说在前面,我们要求大家是按照什么?计算机处理加减乘除法则方法去做。
如果有同学拿小学生进行乘法计算的过列式去算,对不起,一分不给好吧。这一点有的同学还是吧期末的交作业的时候,居然还能给我写出这样的。如果光光你直接小学毕业就够了,还需要再跑到大学里,跑到咱们北纬东的教室去做去学这个吗?没必要是吧?你我也不用投机,我现在把要求直接告诉大家,你写还不如写写了也是零分,不写也是零分是吧?你还少浪费几分钟。OK 第四章唯一的重点就是乘除法,而且讲的是一位定点数的乘除法。Ok 第五章存储器,因为咱们书上的第五章和第六章都是讲存储器是吧?那么第五章最核心的内容就是主存储器的设计问题。
咱们第五章节练习讲了很多要求,大家做了很多,围绕的就是这个红颜色的标注这个难度是吧?应该就是至少咱们课后作业的要求你要做到。当时我说过,你们的问题主要出在画图,画图太不规范了。如果你起码大家觉得你画的对不对,那画成什么样?咱们不是上课有例题吗?就那个例题的那个标准,你能画出来才算你认可是吧?而且大家注意一下,我们贾老师的教材画图是不带 CPU 的,是吧?换句话说,你不带 CPU 画这个存储器的设计图是没有问题,没有问题。
就是咱们因为咱们就统一,那别的教材一般都是带 CPUOK,这是第五章。那么第六章。那么是也是讲的是存储是吧?但是第六章我记得我们它叫存储系统的设计问题。事实上我们没布置作业,但是我丑话说到前面了,第六章的 PPT 我是发给大家的,PPT 里面有关有好几道例题,我是要求大家去看的。
也就是说有关态势的计算问题没要求,但是也要考是吧,就掌握基本公式,这就考大家的自学能力了是吧。第六章听清楚,因为我们把第六章的课件给大家了,那么有关开始计算例题里面都有,大家自己看一看,应该都明白,没有什么难度是吧?这是第十五章。第七章有总线,有外部设备和 RU 系统。那么我对不起,我说错了。那那是第八章,第七章主要讲的是控制器,那么控制器。
那么。核心就一块什么?微指令编码法的设计。咱们第七章的作业讲完了是吧?好像就是第十九题。什么?就是那个指令的设计,就是直接编码法和自动编号麻烦,这是最核心的。别的内容填空选择?你只能出填空选择,那大厅只能出现,这是第七章,第八章我说了是总线。第八章我这好像落了一个。
第八章也就是刚才落了一个这边处之前处理一点问题。第八章就是我刚才说的,包括总线,包括外部设备,包括 IOC。在这一章里面总线我们讲,但是题也比较简单,我们布置了第八章的作业,是有一道总线型的这个形式是吧?这相互计算这个应该没问题。除此之外其他内容。这个外部设备就 8.2,这节我们不做要求,因为 8.2 大家自己看看。
除此之外,主要是围绕接口。接口我们分为四种方式,有 IO 信息传输控制方式有 4 种。这四种的区别是什么?有人知道这四种分别是程序查询方式、中断方式、DMA 方式和通道方式?在上面逐一做罗列。
这里面重点难点是中断?中断尤其中断音指令指的什么东西?中断屏蔽指什么东西?我们屏蔽有屏蔽码的设计?这个考试的时候,我们都可能有可能涉及到那么好。
第九章咱们没有讲,也不考是吧?基本上我们说。第一,咱们考试的复习准备时间是比较充足的。大家合理安排时间,这是第一点。
第二点,我们刚才说了,我们分成两部分。一部分是基基本概念,看书、看课件、看笔记,上课时认真听讲。还有一部分是所谓的大题,是吧?大题因为我们也是 AB 卷,我们也是学校是背靠背,到底抄一卷还是抄 B 卷?你可能说我复习了 50 家,这这这结果老师你不说你要考,结果怎么没考?如果你要问我,就说你再考一遍,你都会见到是吧?
因为尤其大题我们是分成两套题,到底哪一套题有什么我也不知道对吧?我们平均分就这些,就是这些大题的考点这些?可能有一套题,有可能另外一套题没有什么的。这个东西是我也不能确定?因此就是说一句话,大家复习要全面?改要求的重点知识点,我刚才已经强调过了,大家去准备就行。
其实我觉得真正每年咱们这门课不及格率每年控制的还是可以的,大概在 10% 左右。一个班 30 个人,班也就是两三个。当然你们这一集坦率的讲,你们的出勤率不高,我不知道是吧?我也不想为难大家,但是你就是不来,你就是不学。你说让我给你给个 60 分,想都不要想好吧。然后你说你能考个卷子,真能考个八九十分,你不来我也受不了是吧?但是你非得上课来都不来,考那么一点成绩,还要找人说给我把它放过去。这种事第一不要想,第二你也别找,第三我也不能同意,好吧。
这几块内容,我觉得应该只要认真上课,认真听讲,认真做课后作业,我觉得都没问题好吧。还有还有一点就是说咱们这个大作业或者我们布置了一篇大作业,一个大作业还有一个实验报告的相关内容,这些都要统一,最后我们这叫核分。只要算你光有你说我光光是这个期末考试只有成绩,别的我啥也不干是吧?那我觉得也基本上是过不去的?除非你卷面能得到 90 分以上,否的话基本不可是吧?好吧,那咱们就基本就上到这儿。因为最后一次课了,我也不想上到 12 点钟,大家饿肚子挺有点什么,那就这样。但是有我在事先声明一点,到目前为止我虽然做了总复习,但是到目前为止试卷还没有出。是吧?咱们还没出,因为咱们这个班情况特殊,正好礼拜四,下周礼拜四是元旦,上不了,好下课。
我会标标志,比如我告诉你 A 大型 A 他他的那个 art 码,你说是不是少写了一些?
我是想问一下您,我们上课讲的也在您就是公民讲直接班的那个。比如说比如说有的,比如说第六章我是基本人手,但我说那那。这个比如说第八章走向往前,但是走向作业会布置。对,就是您上课程之前都是说过的。比如一些像那个校验码那里,您说的技术校验剩下的,但是基础校验您也是讲的前半部分,我们有一些详细的组织校验的一些规划,就那些属于你。比如说就我校验就对这个数是吧,你把要计较价位或者计较不行就没有流量。
这个挖矿怎么挖?有没有?有计算,全部有计算,有计算也有人去干都他如果我们要重点去练习一下的话,就是做哪些。
好像好,因为可能是那种,可能是咱们说这些大厅的他店可能没说。对,就是针对这个书上的课后题,可以对课后题或者是上课我们讲哪些地方,我不是说过吗?
肯定不一样,考研就得多难。做了点考研的题,他上次讲的完全不在一个难度段,就是出题的老师都不一样。上次讲的那些理论在考研题上都能找到,但是那个题就是特别费脑,还是得练,不练这个不行。对,如果要看考研建议的话。最多少钱?大气牛逼,牛的难度太高了。
我们说第六章客户很多,后面很多作业都是有考研真题都说过了。其实是你书上。的。那个。那个实验代表的就是我找那个 nice 的,第一季是没有找到乡村。
在邻居记里面说他现在把下载那个里面的东西看一下,就是那个 2,你给的是九版本的那个,但是你给的那个安装方式上版本,然后那个里面有。好,而且里面的内容跟您给的那个 PDM 里面的内容也不一样。那我是以 court 9 为例子,十三五的自己找回。有有 2 个 PS 还是就直接交那个 PS,你最好两个都给,因为我怕有的同学直接用什么豆包裹生成一个,然后他才能生成那个是吧?我要看你就相当于我留的原始资料,我看了也没看清,或者说是不是都交了。对对对,那您后面看看那个钉钉的声音。钉钉里说如果还有杂音,中科在应该没有专门过来打几分,就是个别有些问题。
对对对,行行行,这个就比较忙的,可能有的时候可能不长,我尽量有一签到,然后当时那个没签上,然后,对,那我看,但是我是用你点安装那个压缩包里面的赛道的。我的 PPT 是版本标的,按照 poto 49 那个是问题。13 个正经您给的也是在,我们给你那个在那个百度网盘那个链接是 9 和 13 个都给你那个下,都两个都给对。我以为都是 13 岁,就只有一个,一个是十三,一个是 99,因为九已经两个多月了,那十三对,因此我们考虑大概什么情况,我就回,行,就是山东还得自己找。
对对对,那你都能找到。应该网上这种都是现成的,挺多的。行行好。而且你说哪怕就那个啥的话,你去教学用的话,直接用他的那个试用。就是试用了。我按那个试用 30 天,他还是不给我下载那个里面的设备。然后我就每次说下载,他就说失败,然后要么就用 19。行,我行,好,没事。
继科或者没有专业,他网银群里面有相关单位。听说差不多,也我看他们虽然学的教材,可能还有他们的那个 CSAPP,这是属于 CSAPP。就是不他那个应该是他不分两个班,一个视频没有那什么,把他们好像拆开了。应该他们也不是普通班级,你应该不也是这么说的,应该是对,是别的专业。这个题有没有上?差不多,你想参就参,反正也差不多是吧?好。
在这一个近视从这个小镜子里面出现,有一个地方它选择有一些比较细致的地方。短期其实是再找一些黑皮的那些外国教材,这种就特别难的问题。你那个东西你。怎么说呢?第一国内和国外的这套是一样的。你要是准备的话,你就只能准备在国内的。比如说常见的,比如说网络这些他们比较相关的教材写法跟国外不能用。因此你如果准备考研的话,建议国内教材为主,这是第一块。
第二块,你要如果要做的话。如果要做的话,因为可能怎么说呢?还是得找一些历年真题去练。而且因为我知道那个出题老师怎么挂了,到底明年会怎么样,我也是原来是谁我们都知道,但是想帮助更有可能。就是因为后续的确实是自己去准备一些项目。
比如说我准备一个项目出来,如果说说白了你是考本校,考外校,本校。这个我觉得你就说你有课程设计就可以了。本校的同学一般人都不回答,就这么回事,说一说我还是更不靠谱,对吧?就是想问的也许他们说自己保研的时候,自己拿出来的项目被本身的老师给淘到了,就比较心疼。
你就实话实说就行了。比如说小学期的作业,比如说我们门课程,比如说过两年不就是机器学校,甚至一个课程作业不说那些了是吧?不用,这个没啥要不。比如说你准备说我做了一个什么深度学习的什么什么,反正把学的东西都拿过来,我贴着我说我说往上面一问,你啥也不会。你不是这不是加分项,成人的加分项目,如果说用的不是自己有点搞成,起码你做些啥你能说出自圆其说。而且老师问这个问题的时候是发散性的,老师问什么问题谁知道,然后老师都都不好说。你上个东西最好就是说你做过了,参与了一些这东西,你去说你没有做过揭发别人的这东西很多东西对吧?而且老师在评的时候就那几分钟是吧?
一般来说我觉得第一你要考本校,都自己保持自己在只要不是特别离谱的,基本都不会为人赚钱。这是这这点肯其实你要真的干,就是实话实说。那你认为这就是你这怎么学习没有变更,会当女生生活,是不是这还是考虑了大家选择。
最开始发包银行卡 850 多块钱,对吧?我不想。对,是因为我现在留学生办的。对,然后您只是教我们教两次左右,所以我们是以吃住为主的事。对对对,就不是一整个发展。对对对,那那那个我不是最好,你就是我要我说几次就 0145,浇几次,浇几次就对对对。然后因为我们像我们这边很需要考研,我们有些是没需要考研的,到考研地步。所以说我们只需要顾及您说的客户型平台级的 PPT 就行,也没有必要到他们说的,没必要,谢谢。
第三点的话就是多少钱给他的卡,就是他的卡。对,然后我给他提账号,因为他昨天晚上盖。
你的意思就是这个,那都是吧?是。
但是里面我们可以应用,就是说给法人法庭。可能是 30。
没有。
是保证,就是保 22 万。我们都要考虑检测的一个分类的。
今天我就是。
是一个问题。
他说。
最后一个分配不是少一个吗?我们当时不是跑了两个,一个是用 630 6 点 40 的,一个是用 A3R。
你可以可以的,我们。保险还有。
不会。
21 年说他的地方在了他的好。
来源越来越少。
好。好。
因为我们算法的东西,方法就是。
感觉我的这样。就在你在这。
他这个主要是在学校定位在一些,我爸问他要去。
万事。
不是这样的。