screen_ 计算机组成与体系结构 _ 第 2 周 _ 星期四 _ 第 2 大节 _ 原文 2026 年 01 月 01 日 16:52 好,咱们开始今天的课程。我想在座各位新版的教材应该是绝大多数同学都已经手里有了。因为之前这个教材我没有,就是新版的人民邮件出版社出的教材。那么之前我没仔细翻过,上周我的教材拿到手之后,给大家一个一个建议。也就是说新版的教材与原版教材就教学内容而言变化不大,只不过是法则。

第五章我们叫存储系统,有关存储器的一些内容,它一分为二,分为我们主存储器一部分。像第六章主要讲的 case 流水,也就是开始的一些用,以及在开始方面的一些变化。像这个在咱们第五章的内容,之前的老的第五章是就是新版的人民邮电出版社的第 56 章或者是一张。除此之外,他跟他对于咱们老板的第八章基本上做了三节是吧?第八章是相当于咱们老板教材的第七第八两张,然后后面增加了一个新的所谓关多机系统的内容。

其实就教学内容我没有时间去上,对吧?因为咱们这个连通所谓的实验学时总共 48 学时是吧?48 学时国庆你们还好是吧?只放到一次课。我的研究生的课是礼拜三晚上,国庆要给我放到 60,我从 32 5 分之 1,那么 45 个学时。我们还要讲华为的内容,其实我们上了很多。因此我们说无论大家用新教材和老教材,就咱们这个学期的上课、教学、考试,我们说都问题不大。

但是新版就是人民优先,这版的新教材最大的好处主要他在于课后练习。你们仔细看一下,就人民邮电出版社的很多课后练习题,你知道来自于哪吗?来自于考研 408 的真题或者 408 的一些变更。就说你们有老版的教材的电子版,也有新版的教材内容。不用对,就看一下课后练习。凡是新版教材出现的,老版教材没有的课,课后练习题大概率是 408 考研真题是吧?我给大家已经点到这儿了,就看他自己了是吧。

当然我们期末考试不会按照 408 计算机组成的标准去要求大家。因为这个如果真考的话,估计你们这级同学都会吵翻了?那就我们还是很传统的对吧?传统的考试当然有一些,比如 408 的一些选择题,就 408 考研真真考过程中的很多选择题都是咱们。

蒋老师老版教材的课后题的一个变。比如说我上节课提到过的有关这个叫就经常有一些所谓的技术指标?自传、频率等等等等。某一年 48 就是两个的一个小的计算题。这个向大家注意一下,我们这边是人民邮电这版教材怎么用,大家一定弄清楚是吧?主要是客户练习题。为什么我们不这么干?坦率的讲,在我们没有换教材蓝本,就蓝颜色的就是清华那一块。

蒋老师的这个书的最大一个特点,你们注意一下,给大家提个醒。贾老师教材的最大的特点是什么?上课在座各位都能听得懂,听得明白,但是做作业没有第三方的辅助材料,你大概率做起来很困难。这是咱们讲这个教材的一个特点,为什么?因为当年蒋老师师编这套教材,是选取了全国很多高校的考研真题。就是把考研真题变一变,就是咱们做练习。因此咱们学咱们这个教材的课后习题的难度还是比较大,希望大家要引起足够的重视,一定要避免。是什么?上课我听明白了,我听懂了,觉得我既然会了,我就靠这些,我就可以应付,往往不让人家在这个环节是灾难跟头。

这点相当如下,尽管咱们这门课有习题课,那么在 20 年疫情的时候,这套教材的所有教育视频我都有,是吧?那么原来在研究课堂上也是能看到的,现在好几天我是没有没把它放出来。如果需要的话,如果咱们时间不允许的话,我把这个客户习题作业的讲评视频给放上去。而且人民邮电出版社出的这套教材有个最大好处,它不是每一个每每一部分都有个二维码,是吧?扫一下,我没扫,我坦率我没扫,应该能听到咱们学院蒋本山教授的给你的奖品是吧?我觉得这套教材还是比较?也就说换句话说,我已经告诉大家你的目标是什么,你怎么去用。也就现在咱们这个学期的教学,我们期末考试难度不会按照 408 要求大家,这是第一点,大家一定明确。

第二个,把新版教材我从第一道题做,第二道题做到后面越做心越慌,觉得说考试考的越难做。我大概这句话一定,我为什么今天以前像这个东西我不说,为什么这次换了教材?我特意强调原因就在我们期末考试要求难度没那么大,基本上你们把旧版的蒋老师的教材都练习。假如是这新版旧版,只要其是一样的,就那些超出,那就是老板靠在其没有出现其大概率情况,方式也不考虑。我先吹个风,别到最后 N 多找 N 多关系说这那的,这点向大家明确的给自己的定位,要定位清楚。

还有一点,咱们计算机组成一个体系结构是一门专业基础课。大家学习的方式跟在座的各位学习高等数学、线性代数、大学物理是一个套路。要拿出笔拿出纸去做作业,不要说是什么哪个学校这那的,如果真那么要求的话,估计很多人又又该往上去抱怨说一个要求太高太难或者怎么着,咱们就相当于说会给大家很大压力,这点希望大家注意一下。

好,我们上节课开始了说也就第一章、第二章我们是在复习性质的一个学习。上节课我们讲到了机器的 3 种机器数的表示方式,分别是原码、补码和反码。我们说过了,对于源码和反码而言是什么?他表示的竖一竖轴,我们坐标就是 X 轴,以原点左右是对称,也说一原点左右对称的是原码表示和反码表示,而午马表示在相同的这个什么存储空间。在相同的存储空间,比如说我们的存储空间自成为 N 加一位的存储空间。在这个前提下补码要比相同这个空间的源码和补码能够多表示一个数。

那么这个数是谁呢?如果画错标轴的话,像这张图你说的清楚了,就是这个数轴最左侧的这一个数,也就是这个数。这里的负八在原码和补码你是找不出来的,只有补码才能出现。那么这个数我们是有讲究的,那么这个是一个 N 加一倍的,你看我们字长,这字长为四位含一位符号位。如果写成 A 加一位上,这里的这个具体的应用就是 3 加 1 是吧?

3 加 1 一定要弄清楚,因为我们有的时候直接给你数字,比如说四位含一个,实上就对应的是一种就 3 加 1 等于 4。因此希望这里的是 N 是等等于三个。就是说一定大家注意一下,我们谈论存储空间的字长的时候,一般描述成 N 加一倍。如果给你直接一个数值,你一定要把它拆成 N 加一的形式。为什么呢?因为我们在描述塑造范围区间的时候,需要这个 N 比如说多出来的一个数,对于全整数为负的 2N 次方。如果对于纯小数来说是 -1-2N 次方,负的二的 N 次方,那么 N 是等于三不是等于四是吧?

往往有些同学在第二章,还有我们后面第四章,第二章是讲数的表示是吧?第四章是二进制运算的时候,往往对于 N 加一倍的表示。转过来,事实上我们教科书通常讲成 N 加一倍。N 加一这么写表示有 N 位数值位一位符号位,这是 N 加一位的来源。也就是咱们第二章所有的信息,它默认前提就是 N 加一是吧?

N 加 1。只要涉及什么机器数,无论你是原码、补码、反码表示就是 N 加 1。那么这多出来这个数是数轴最右最左侧那一位,对正整数来说是负的。2N 次方对于小数来说,这个希望大家注意一下。事实上这个一定要记住。而且大家发现对于多出来这个数,如果对于小数来说,负一是不是跟这个小数多少位是没有关系的,是吧?有一年是一个 C9 学校出的计算机组成的专题,就在这做了文章。

给你一个 64 位的小数,问你在红码情况下,它的最小的这个数是多少是吧?大家一看这都是四位或 32 位变更了。那么大家发现这个数跟这个小数是多少位没有任何关系的。无论多少倍,它最小的数一定是负一是跟位数是没有关系的。这点我要强调一下。

除此之外大家看一下咱们的数轴上就这张图是负八是吧?那么这个负八用补码来表示,大家看一下它的表述形式。那么这张图因为咱们教材上也应该也是算。大家可以看一下。

那么复发大家看一下,我们补码中出现了最小的那个数 -8,它的二进制表示形式是什么状态?是不是 1000?这个状态在我们源码中对应的什么?-0?也就是说因为我们在补码中,无论你的正零还是负零表示形式都一样。但是这个 -8 对应的状态是用的源码,就源码中负零的表示的一个状态。

大家看清楚,也就说还是这么多二进制的表示信息,只不过它所代表的含义是不一样的。大家听清楚是吧?都是 1000,对于原码来说是负零的表示,对于补码来说是负的二的 1 次方的表示。

一样问题来说,在二进制的 N 加一倍的空间里面,每一个二进制状态各种码数都会充分利用,是吧?这点希望大家注意一下。这是我们有关这个表述范围的内容。表示范围的内容,这点希望大家一定要注意一下。

这个。好。别的我就再不啰嗦了是吧?那这个其他的东西你们下自己看,这不是我要讲的这就是应该来说你们大一像我说应该是应该上的什么计算机系统概论,我记得是对吧?系统盖的那本书我也有看的,就比较杂是吧?而且你们的学生还很多,像这些东西都是由我来给你讲。

下面咱们讨论一下什么机器数的定点表示和浮点表示,我们说我们先研究明白什么定点表示的极值。这个掌握明白了,机器数的定点小数和定点整数相结合,就变成了我们的浮点数的表示是吧?这个也就说咱们这一部分重点是定点表示。那么定点数又分为两种,定点小数和定点整数。所谓的定点小数加入下我们计算机内部二进制的定点数的表示。

小数点是不单独占存储空间,我们都是一个隐含表示状态。比如说小数点的位置,固定在什么最高数位的前面或者是尾部,如果小数点位于最高数位的左侧,对应的是定点小数。如果小数点在整个串数的最右侧的最第一位的右侧,那就是定点整数,是吧?这个我会约定俗成的一种说法,这点希望大家注意一下。好,大家可以看一下,这是我们定点小数。

对于定点小数大家注意一下,我们需要讨论它的数的表示范围。大家可以看一下,这里刚才我说说了一个什么?在咱们第二章在讨论的时候,表范围我们隐含的数的二进制数的字长为 N 加一位。大家听清楚,就在咱们教科书第二章,我们隐含的是 N 加一位是吧?存储空间的正常为 N 加一位,然后我们再进行讨论。因此我们对定点小数来说,它的最大正数它的表示形式是什么?就是最高符号位为零,表示这符号为正。其他的数值位我通通为一,就是 0.111111。

那么 0.111 到底几个幺呢?是不是由我们的字长 N 来决定?那么 0.111。我们怎么进行表示呢?用一减去二的负 N 次方来表示。在这儿大家注意下,二的负 N 次方是一个二进制状态,就是一减去二进制的 0.00001 是他,大家千万要在我们这个机制,就第二章的实际运算过程中。

二分次方有时候是个十进制的计算,有时候是一个二进制的计算,你要掌握它的方法,什么时候用二进制的计算,如二进制的负的二就 2 就 2 进制的 2 的 N 次方就相当于这个数,相当于 0.000?这有多少这个。那么这多少个零是吧?就是这个这个相当于这个零是有 N 减一个,对吧?小数点后 N 减有 N 减 N 减一个,我应该是啊不包含小学点钱问题,总共是分建一个。大家看一下,大家注意一下,也就是说二的负 N 次方?

有时候说看成二进制的话就变成 0.0001。有时候看成进制,那么你要守住它的处理,这是最大正数,也最大正数,我们将 0.11 写成了一减去 2 的 3 次方来表示的,这个是等价的,这个是做的是 2D 的这个东西了。听清楚二级核算,那么这是最大正数,那么最小正数我想是比较容易写出来的?二的负 N 次方是最小正数最大正数。最小正数无论是原码反码都一样。但是当这个定点小数的符号位为一的时候,表示成读码的情况,表示成一个负数。那么原码表示读码表示它的这个数的范围是不一样的,是吧?因此我们要分别讨论。也就说当这个数字源码表示用红码表示,大家可以看一下它所表示的数是什么样。

如果是这个数是用转码表示,那么它所能表示的最大次数为 1.1111。那么这个数由于什么?刚好在这个 PPT 里给大家讲述。如果一个用条码表示的数一,我的坐标轴它是左右对称,因此我知道了最大正数,因此给他前面加一个负号,是不是给出了用原码表示出的绝对值?对的吧?因为原码表示的数是依托数轴原点,左右对称。你知道最大变数,那么绝对值最大的负数值也就知道了是吧?它是有做一个对称关系,而用补码来表示的话,这个数表示形式 0.00000 对应的这个表示的值是负一。

好吧,这是我们的定点小数,最大正数、最小正数无论元股款都一样,但是对于负数来说就是绝对值。最大的负数要分为原码和公式公式。那么原码也比较好办,就是最大正数前面取一个负号,就左右一,我的竖轴左右对称。而补码来说,它能多表示出一个数,这个数是谁?-1OK,这是这个定点小厕所判决。

综上所述,机器资产为 N 加一倍,原码的定点小数表范围是负的 22,负的一减去二的。关于出发到正的一减去 2 的 1 减去二的作用情况,这是这个话,下面对于补马来说是这样,为什么要去给大家去讲了考试的时候?记住,我要为难在座的各位的时候,我就给你出一道浮点数的表范?只要我想出,就意味着我对你们很不满意,就不想让你们有人得高分。如果为难在座各位速度比较快,为什么我要去讲的考试的时候记不住这个值的话,你现场推,你要能推得出来是吧?你要说了半天这个记不住,你又不会推,那你不就完蛋了,是吧?

好,我们举个例子,一个机器自查为八位,大家看一下八位把它拆解成什么?3 加 1 是 7 加 1 给出了算好吧?这些说实话我们大家应该都是非常熟的是吧?以前我们上同原理这块,他讲的比较细,现在因为这个是学识压缩太厉害是吧?

北航当个是你们的一倍的教学时间,时长 96 小时。在过去我刚走上咱们理工大学的讲台的时候,这门课是七十二穴,72 到 48 含多少是吧?就 72 分是我上过,64 我上过,56 我上过,现在 48 我也上。你要你像人工智能 32 小时是吧?你要咋上?那只能是看东西了。

像仁州镇的,如果上仁州镇的教育班的话,这些我都不少。那就是很就是很很很那个对吧?这个希望大家注意一下。

好,定点整数与之对应只不过是将小数点的位置放在整个数的这个数字 XN 的右边隐含默认的位置。因此与之对应我们得到的最大正数,大家看一下,这个最大是整数。由于是定点整数,它表示形式还是 01111。但是对于这个 0111,它的描述是二的 N 次方减一是吧?如果对于这是个小数,我变成是一减去二的负 A 次方。而对于这个来说,同样一个形式变成了 2N 减 1,这都是二进制的描述是吧?那么最大正数、最小正数跟就是形式上二进制存储空间的表示。

无论是定点整数还是定点小数,有这无论是整数的整数还是小数,它的二进制的状态是一样的。但是它代表的数值含义是一样的,对吧?这个相当注意一下。就同样是 01111,如果是定点小数的话,如果是定点小数是一减去二的负 N 次方。如果是定点整数的话,是二的 N 次方减 1。同样对数据空间的表现形式,但对应的值含义是一样的是吧?与之对应。用原码表示的绝对值最大负数是负的 2 次方减一就我知道最大倍数前面加一个负号,ok 这个是不等化公司方,这是这块。

大家说这个定点小数,定点整数是很简单的是吧。很简单的话,大家注意一下,光是简简单单的定点小数或者定点整数的这种讨论,我们说是非常 easy,大家都会讨论。我们主要用在什么地方,就是什么浮点表述方法。因为在自然界,在我们实际的工作生活过程中,纯粹一个数是纯粹的小数或者是纯粹的整数。这种情况下应该在数的表示这个在自然界里面这种情况是少之又少的状态。绝大部分的二进制就绝大部分三这个数表示是既有整数又有小数,而且小数点的位置随着数的大小,它的位置会发生改变的这是自然界最真实的一种数字表示状态。

对于这种数在计算机怎么去表示呢?大家可以琢磨一下,小数点的位置不固定,我怎么表示这个数?当然我们比如说你在键盘上录入,到把它转换成我们所谓的成二进制,那还是有一个处理的过程。咱们就在这就不展开去说了。咱们就说给你一串数,小数点位置不固定,那么你把它怎么放到计算机里面去?这就是用到我们的浮点数的形式。

浮点数的这种形式,大家一看,这种形式有点像咱们中学所学到的十进制中所描述的科学技术法。完全类似那么一个自然数。自然界的数 N 我用类似于十进制的科学计数法进行表示,就变成了 M 乘以 2 的 1 次方。其中 M 是一个定点小数,就定点小数一个纯小数 RE 是一个纯整数。

那么在这给大家。讲到了我们计算硬件学习过程中最核心的一个思想转化的思想。一句话,条条大路通罗马?你不用这种形式直接进行数字表示行不行?只要你想做,你一定能发明对应的装置?但是这个效率不会很高,那么我们是有转化的。

同样一个数 N,小数点的倍数估计我可以描述成这种形式。一他用一个纯小数乘以二的多少次方来表示。这种就是我们中学所学的实际运输的科学技术法,那么在我们计算机组成或者计算机硬件基础这块,我们对于 M 和 E 有一些专有的名称。

其中 M 我们称为尾数,E 我们称为阶码?M 尾数是一个纯小数,通常用原码和补码来表示,而阶码是一个纯整数,要用移码和补码来是吧?大家看一下补码。大的那这不又蹦出来一个疑吗?这是对吧?咱们叫做段,后面就刚一下。对,而且在某一年,就是咱们客户的老板不说新版,咱们老版教材中第二章某一道课后习题,当年就考孙林发的命题,老师之一把那个题的数字改了改,就作为 48 考研的一道选择题。咱们在标准的传统教学中,我们会把这道题读到后厨。

好。这个有关疑马的讨论我们放到后面去讲。具体对于复检中我们的表述,请看 PPT 这张图。这张图我们用一个正常位,应该是 K 加一位加 M 加一这个是吧?其中 K 加一前半部分表示的是接码,后面部分表示的是整数。大家可以看一下。

大家问一下,在这种表示形式中,尾数和解码都有符号位是吧?尾数和接码都有符号位。那么这两个符号位它起到的作用是不一样的。如果要判断这个浮点数它是正数还是负数,注意一下我们看的是尾数 MS 是零还是一。如果这个纬度的 MS 是 0,表示这个浮点数表示这是一个三在列的数。如果这一位是一的话,表示一个负在列的数是吧?就是我们说尾数的符号位是整个浮点数的相是整个福建数的符号位,这个相当不。

那么还有一个符号位是解码,就最左侧的 ES 那么它表示的是什么?我们小数点的实际位置,这两个都标记清楚是吧?而且极端情况下,大家觉得这两个符号为极端情况下哪一个可以省略?ES 可以省略,MS 是不能使用,这个商家一定要会影响说 es 是可以省略,但是你用补码表示是不行的,就要用到另外一种模式叫乙码。如果从移码来角度的话,就没有 ES 只有 MX 是吧?这个需要注意些。

那么后面我会讲好,下面我们有个假设条件,就是我们下面对于风险的讨论。我们这有个大前提是什么?阶码和尾数均用补码表示这个前提下,然后我们会讨论后面有关浮点数的一些工作,加强一下什么工作呢?第一件事什么浮点是我们范围的是吧?因为机器数一句话是对于码字是比较就具体的机器数字是原码表示还是母码表示,还是什么码表示,他是很敏感。因为用不同的码表示的,它数表示范围是有差别,因此这个多点数来说。我们分别要讨论就是说它的最大正数、最小最大正数、最小正数、绝对值,最大的负数?这三个值要给出这个我们约定的存储空间,约定自成的前提下,我所简述的表示犯罪是吧?

好,刚才我们给的是最大正数,那么最大正数它的特点是什么?美容部分是一个最大的。小数点中最大的一个数就 0.111,那么我们用乘法表示就是一减去二的负 N 次方,这是定点小数中的最大整数是吧?那么阶码是定点整数,那么它的最大正数是 01。

如果用我们的描述的话,是去加入一下,这里有两个?其中这个紫色的二是我们的底,而我们刚才说的这一串数是红颜色二的 K 次方减一进行表示。你千万别不要把这个手机号,因为大家注意一下,我们科学技术把那个零下面的是十的多少多次方,这里是 20,就应该这个基底是二是吧?就在啰嗦。如果是八进去的话,这就八是吧,只有一个是。

OK 这最大的,那么最大正数我们给出来,下面咱们给出最小正数,最小正数。大家可以看一下,这最小正数也是有讲究的。其中尾数你要是保证它是整数中最小的一个数是吧?0.101,而这个最小正数的阶码表示什么?100000,由于这是红码表示是吧,就古马中数轴最右侧的那。二的负的 2N 次方对吧?就这具体讲究这是 K 的就负的二的 K 次方就 OK。

好,这是最小正数。就是你别看就这么一个式子,我为什么费这么大劲讲,说白了。这种考考试,给你出一道题,90% 你要当这本书是吧,套过的一本书。厚厚的一本书,大家可以看厚厚一本书,你每一个每个字你都背吗?背一下吧?像这种要求会规范?

当大家都想,因为我们教材好几本,我今天拿的是我最早的教材,这个我看一下这大家能不能出。2002 年蒋老师的很最早的教材,2002 年二十多年了,我上 72 学时就用这。当然现在的是人民邮电,我觉得大家这是对自己前途要有想法的话,人民优点数还是不错的,至少你不用再去找 48 真实的 OK 在这大家一定要注意一下,这个推导过程我就不啰嗦了是吧?好,咱们休息分钟。

大家都有都拿手机了,请在 200 里群里面群签到一下。

计算机组织体系的这个外部流程。因为咱们开始点名开会时间。记住,我的点名的策略不是为难在座的各位,但是属于事后追责。就说你可以不来,我也没关系。我但是考试,你说你不来,你考试能考 90 分 OK 你一个学期不来,我也不不会说那啥。但是就怕有些同学上课不来,考试考一塌糊涂,然后还要找人跟我说?我就把这些所有的给大家看出来,我什么时候点的不确定是吧?有事你跟我请假 OK。

咱们这个大家先抓紧一点,五分五分钟之五分钟之内应该是三分钟之内有效是吧?你超过三分钟 OK,那那我们就不认账了是吧?我在教室里跟你在座的各位说了,三天之内大家都能做完这件事。现在签到的人是 85 人,对吧?你们能看到我也能看到谁签到谁没签到,策略就这样好吧?因为我看一下咱们教室总的人数是 120 120 多人,现在就来了 3 分之 2,还有 3 分之 1。这 3 分之 1 未来大概率就是这门课会出问题的,是吧?

OK 现在差不多是只有 92 人。

现在还有 32 位同学没有签到,那么我已经截图了,谁谁没来,谁谁来。我的这个也就是说咱们以后上课,我不挨个去拿着名单给大家讲解,没那时间就是这种形式好吧?而且是随时都有可能。我只要感觉今天不够多,你就缺了 32 个?这个就说就说白了就是说难听就是一个学习态度的问题。我跟你们学习能力没有关系,但这个学习态度好,接着刚才内容讲,刚才我们讨论了最小,最小振幅的对于浮点数,我的补码,用补码来表示阶码和尾数。

它对应的最小正数,其中尾数是真正就是一个最小正数 0.012,它的阶码是对应的是什么数?是一个绝对值最大的一个负数,对吧?这是最小正数。同理,我们对绝对值最大的负数只有这一个二的不一负一,就是什么定点小数最小的那个数乘以。

0 乘以 2 的 K 的底为 2,他他这个竖条上面表示的形式。第二个数有 202 的 K 次方减一是吧?这个表示形式。因为我们这大前提是什么?我的这个尾数我的尾数,我的这个阶码都用补码来做,因此只有一种形式是吧?

好,下面我们要讨论一下规格化浮点数。什么叫规格化浮点数?对于一个二进制引用科学技术法表描述成浮点数,实际上对于同一个二进制的二进制,自然界的二个二进制数,比如说 110.111,对于他来说我可以写出 N 多种。

这种所谓的浮点数的表示方法,最常见的是 0.110111,这是一种形式。我也可以写成 0.01101 是吧?我有很多种这个附件处的表述形式,哪一种你要讲是都可以的。这些数你不做规范,同样一个原始数据,我有 N 多种浮点数的表示形式,怎么办?

这样的好处是吧选择多药缺陷在哪呢?是不是你出起来特别繁琐,而且我们知道我们在计算机内部保存任何数据,它都有一个特点,就我们在只能在有限的存储空间里面完成相应的操作。这点请大家注意一下,在有限存储空间进行数据保存,你这个复检这个表示形式如果多的话就比较麻烦。因此我们在这为了解决这个问题,就提出了所谓的规格化浮点数的表示。这种形式使得我们在有效的存储空间,能够最充分的利用这有效空间进行某一个粘贴的层数和粘贴的数量最大化的保存。

这时候的规格化整改数的问题,对于规格化和减数来说,我们规定尾数的最高位是一个有效的值。什么叫最所减?尾数的最高数位必须是有效的数?这大家都是有点绕口。

二进制数,你只有两个状态,要么 04 要么是一,没有价值,大家是不是不是觉得有点难过?有效值?要么你说一,要么说零。那到底这有效值是什么?可能是零,也可能是一。因此他用有效出来,比如说总共二进制,二进制总共就两个状态,两个状态都可能属于规格化浮点数,这个大家要弄清楚。

这块有的同学觉得说的比较含糊?有效值这个有效值就 20 两个状态,零还是一。这块内容法律过去应该是第六章,不是第四章是吧?我们是二进制运算,有关浮点数运算的时候,就会对于服务检测的有效值的问题做一个讨论。如果这个尾数就这个风险数用个用补码来表示的话,那么规格化浮点数就有 6 种形态。你们可以看一下咱们教科书上第四章的有关浮点数运算,你们会讲到这个,大家清楚了。可如果慢慢第四章教材就行了,我们就不展开说了。

好,规则化的这个我就给大家去说了是吧?这个回头大家自己去看一下。我们把最关键部分给大家讲了。实际上咱们教科书上为了帮助大家记忆,用一张表来列出了最大质数、绝对最大值、最小正数最多化的最小正数为绝对值,最小负数,规范化绝对是计算数等等等等一堆?对于这些东西,如果我们考试的时候,主要大家如果要分析这个数据表示范围,就两种途径,要么使劲掰?

临考前最后十分钟,我把这个背熟了,这个疏一交,我先抓紧写草稿纸上,这是一张。还有一招掌握他的表示的形式叫现场现推,就看大家水平了。我想以在座各位这种水平小 case,这比起你们高中做的各种数学题,这个难度对你们来说是零。如果我考试考这个的话,那你就注意一下。

好,下面我们讨论浮点数阶码的移码表示,这个也是属于咱们第二章能够出现在 408 考试真题的一个考点。这 48 考考申请由第一届第一年出来以后,应该是 1 几年,一二年还是 13 年?15 年之前,有个年初我看了,其当时因为我看到这个题之后,我就题很简单。但是说有的老师告诉我说,这道题当年考分得分率是非常低的,是吧?

那么咱们一起来看一下,如果我的 5.2 的阶码用移码来表示的话,那么会出现这样。首先大家要明确乙码是怎样的码制。具体来讲所谓的一段就是在真值 X 对于真实 S 来说,给它加一个常数,相当于。这个 X 在数轴上向正方向平移了一半去,这就明白的来由。这说的文绉绉的,很抽象,这是什么意思?

所谓的以马说白了因为我的肩膀首先搭入一下解码,用在解码的表示在后点浮点表示数的表示形式中,阶码是一个整数是吧?既然是整数,它有正有负。通过移码我使这个有正有负的解码,通过平移的方式把它通通变成一个大于零的整数。那变成大于一也就有什么好处。那么当我进行两个阶码大小比较的时候,我能够进一步优化它们比较速。因为对于两个无符号的正整数来说,它的大小比较是不是很简单,如果是你两个有可能有负的两个整数之积比较是比较麻烦的,那么这就是为了优化我的整数的比较速度搞出来的迷茫。

那么大家看一下 X 一码等于偏移量加 X 大家看一下有效值有效数是吧?有效值偏值说的人多多的啥意思?一句话在这又给你挖了一个不小的坑。也就是说对于乙方来说,它的偏移量根据你的。规则不一样是吧?那么就意味着你这个偏移量的选择可能不是唯一一个。

就是对你说网络偏向选择有两种可能性是吧?常考的一种,还有一种不常考。结果不常考的在某一年考研真题里面出现了,成了当年的标准火爆的问题。

因为什么?分布高两分选择题是吧?但是你说你这是错一个选择题两分没了?你要考研的时候分出来,现在讲差 0 点 5 分,你有时候就过不了那鬼门关,你差两分,咋有觉得很乱,对吧?咱们先来看一下,首先大家看一下,我们又谈到自然为 N 加一的一年整数,它的移码形式是 X0X1 到 XN 是吧?XN 为这个标那什么?

首先大家看一下,一般我们的对 N 加一倍的这个数来说,它的偏移量就是它的一码。所谓的这个偏就是偏置值为二的 N 次方。2 的 N 次方比如说字长为八位,它的这个偏移量为二的 7 次方是吧?这是我们最常见的。比如说当我的天量为二的 7 次方的时候,那么我们得到了 S 的姨妈总是对于这个数来说,与此同时我将这个 X 对应的补码来表示也给出来耷拉下。当这个数它的偏偏向为二的 N 次方的时候,它的移码和补码大家看一下这两个形式有什么区别?是不是除了符号位不一样之外,其他数据也是完全一样,是吧?

这个前提是我的偏移量为二的 N 次方。这个希望大家注注意一下,我们有相应的特点,就当我们偏量为二的 5 次方,那么在一码中最高位为零一表示正数,最高位为一表示正数。当偏音就这个以马为全为零的时候,它对应的这个争执是最小,权威一的时候争执最大。那么一句话,这就是迷茫,就是将真实命运设到一个最主域。

因此乙码可以看成无报数,直接按照无数规则进行大写解码的比较大小。这就是刚才我说的,就通过乙码的尺寸是一个有符号的整数变为无符号数。也就是两个数通过移码之后都处于大于等于零的区间范围之内。那么进行两个无符号数的大小比较是否一样?像这种大小比较,一个用我们的运算加减运算,还有用什么沃尔运算。

而且第四第五点说了,就是当我们天天为 20 次方的时候,对于同样属性的一码和 5 码,除了最高位相反之外,其他各位销售大家看一下,我这表示什么最高位。最高位可没写最高符号位,最高位和最高符号位是两个不同的派。最高位因为已满所有在已满一个 S 的已满是一定是大于等于零的数是吧?因此对于以往来说,它最高位已经不是数值位了,是吧?这个不是符号位。因此我们的一个就是说用最高位来描述,对于符号来说,最高位是一个符号,对你你马上说还不好。

那么为什么使用以码来进行减码走势?一个是便于浮点数大小比较。第二简化我们的计算机的判零电路。什么叫判零?就判别两个数是否相等,用判决第二 ok。好,事实上在我们的移码表示中,我们觉得性能比较好的,比较方便使用的。

你通常我们对于自称为 N 加一倍的这个数,我们通常用偏移量为二的 N 次方作为它的偏离,只有它进行计算。但是我们说如果画一个坐标轴的话,那么二的 N 次方。这是基本上接近一个数轴的正中间。但是在正中间如果我给你这样一个数,一个是二公次方对吧?

还有一个是 2N 次方减一就相当于它在它的数轴这个 2N 次方这个点的左侧,那个数是 2N 次方一是吧?能不能说你光两个行不行?我写成 2 的 N 次方加一行不行,理论也可以,是吧?只不过现在我们规则就定了两个,我们偏向现在有两种选,要么选二的 N 次方,要么选 2 的 N 次方减 1,没有写 2N 次方加 1。比如你 2N 次方加一也可以做,也没问题。但就是这种规则的这种规则目前还没有形成国际标准是吧?没有进行标。

如果在座各位有兴趣,可以把这个专辑证明,当你的偏量为二的次方加一也是有效,也是计算比较方便的那也 OK 是吧?你可以提出新的这个标准来。因为我们拒绝被中间的二分之方减去或二分次方。无论选哪个作为偏一项,基本上都可以使得我们解码帧值的正负数分布基本均匀?

那么对于我的偏移量为二的 N 次方减一这种形式,国际上有对应的标准。就当我的这个夷马用 2 的 N 次方减一进行移码表示。这种形式并不说咱们拍脑袋,想大家注意一下,国际标准化组织对于这种形式给了一个标准,叫称为 ITOE,对吧?HOE754 标准是吧。而且这个 754 标准它的最核心一点就是乙码的偏移量为二的 N 次方减 1,这是最关键的。

那么对于 FOE754 这个标准的描述,蒋老师的教科书上和其他,比如说哈工大唐朔飞老师的教材,以及什么过去西工大白中英老师的教材上,它的描述方有差异是吧?一般的教科书上,这个跟咱们教科书上的描述方法是有差异的。咱们教科书上把它称为什么?我看一下。

就是短浮点、短浮点数、长浮点数和临时浮点数。这是咱们蒋老师教科书的提法,别的教科书书上不是这么讲,是吧?大家看一下对于这种形式,大家看一下 F5754 这个标准跟我们传统一开始学接码表示,大家看一下是不是有差异和区别。

首先咱们看一下 F5575419 中这个附件处的结构。它是包含三部分是吧?其中我们在开庭见到的解码的符号位部分原来是在中间,现在放在这个数是最左侧是吧?这是 MS 就是尾数的符号位,然后是阶码 E 然后是尾数的数字部分。其中对于短浮点数,大家来看,它总共是 32 个是吧?32 位其中尾数的符号位占有一位,阶码部分占八位。尾数的数值位是 23 位。这是二车 N754 标准的一个基本刚大家问一下,光有这个还不行。

其中这个尾数加法器,它的它是用移码来表示,大家看一下它的遗码的偏移量是多少?127 这数是怎么算出来的呢?0 127 是二的 7 次方,27 次方等于多少呢?是不是 128 是吧?2 的 7 次方减 1,得到就二的 N 次方减 1,用这个偏移量构建了 IE754。

这张表上告诉大家,大家看一下 64 位它的天气站,因为它的解码是 11 位,它对应的这个肩膀的 678,它排量是 10232 的 10 次方减一是吧?OK 也就说这个阶,八要用 N 加一来来描述,是不是 7 加 1,这是十项是吧?这个意思。也就说我们在这儿很多地方都隐含 N 加一的表示,哪怕直接用 81 进行描述,你也要把它拆成 N 加一的形式,这样你就能算出来。不然的话我们就算不出来,就不理解为什么是一二的 7 次方减。因为你这个八没有猜对,要拆成 N 加 1,你知道就二十几号。

大家看一下 RGOE754,我们就是以短波点的作为例行讨论。大家可以看一下,首先对于解码来说,它是以二为底,它的偏的量为 127。光有这 1.754 标准还是不够的。它还有一点是什么?其中尾数是 23 位,就数字部分是 23 位是吧?但是大家注意一下,HOE 为了能够使尾数部分能更多的表示一个位数值位,它是 RQ754 标准,采用了隐含尾数最高位作为一的方法,上面有隐含,你看总共这个 ITOE754 标准的。尾数部分事实上是 24 位,而且用尾数跟大家想象的尾数是不一样的。

HU754 标准真实的尾数是什么?一点 X。X. 大家看一下,这是 F5754 隐含隐藏的情况是这样的,就一点 X 这个小数点前的一位,这个一并不是符号位,是他真实有效的数值位。这点希望大家注意一下。

对,大家就写的很清楚,你拿的就是一个认定书。而且对于这个 HV754 标准的尾数是用原码来表示是吧?用原码来表说这么多。记住概念,考试不会考子定位是吧?给你这么一个数,十进制数的 100.25,把它转变为 RQO754 的数是吧?这个做的过程中不需不需要我给你去做了,我相信你们的这个水平足够高?像这道题考研我做半天,咱们期末考试让我出这么类似于这么一道题,大题题给你五分是吧?我要步骤,我要过程。

考研这是一道两分的选择题,难吗?不难,但是记得当年刚开始考的时候,得分率非常低。应该说北京地区是咱们全国计算机考研人数最多的最多的一个省,是吧?而且就是你像去年,24 年考研,全国总的考研人数在下降,降 50 万。但是北京地区计算机考研人数在增加,具体是多少这不方便公布。但是我敢肯定是考研。而且大家也知道今年年底考研的时间定下来了,12 月 22 11 号对吧?

那么就实际这,你说难吗?只要你能把咱们后面蒋老师的给你布置那些题做一做都 OK。那么这道其实如果大家注意一下,我期末考试考这道题,你爹给我写个答案,五分的题就只给你一分。因为这种作为大题,我给你五分的话,我要看过程,你没有中间过程是吧?

理论上讲如果心情不好的话,这道题你光说给个最后的答案。比如说你给我给的最后一个什么 42C88000H。我,心情好给你一分,心情不好我一分不给。不给原因,我答应是抄的是吧?你没有跟他做,整个图就出来了。我心情不好我就跟你去。最后我而且还考察里面的题,没有人能说我是什么。也就是说我们这就是你们考试的时候做题的必要的措施。

要有。因为我们严格判定这个研究费算,我们按得分点去给分了。你说这个得分点也是白白的,给别人少几分是吧?每一年都报成的是什么?

有人要什么高考查分、考研查分,你不想你做的过程怎么回事?要这道题就你没有过程,我不是去,我想给你最多给你一份,不想给你直接就零分。什么疑问没有过去,我没有把它完整整出来是吧?

因此这道题就想把第一个例子说一下,过程我们不说了,大家可以看一下这道题他考核了几个点。第一个什么十进制变成二进制,第一个环节就是 6 到 15 分,你要写出这个二进制的形式就给你一份是吧?十进制转二进制判逆转,对不对?

第二步你把这个数转变成规格化。规格化的符合 754 标准的尾数的形式,1.012、1.10010001 乘以 10 的 15 次方,写出这个再给你一份是吧?如果我觉得这一个环节比较有效,写出这个形式,这是一分。这给你两分钟说也说这是你能够正确进行 754 标准表现。最关键一点就是尾数是比较特殊的。就 HOE754 标准中的尾数是特殊的,是一点多少,而且这个小数点前的积也是尾数的一部分。

但是在我们后续的表述过程中,这个仪式已经弹掉了。然后对于尾数这个 6 次方这个六转换成二进制是 110,给他加添力量,127 得到这种,你要能把这个写出来,我还可以给你两份或者给你一份是吧?写了这样给你两,这第二步给两多少,这就最多给一份,然后写出最终的形式。

你第四步,只不过是为了我们教学清楚标明了它的尾数是它的尾数的符号位是几,接法是几,尾数是几?最终你写出无论是二进制的表示形式,还是个二进制四位示意图,写成 16 进制的这种助记符。先答一个都可以给你五分。好吧,这道题五分我怎么给大家,我说的很清楚了,是吧,就这么给的 OK 至于我现在记不得当时的 48 考试怎么考的,但是无非就是我们最常规的实际奇迹,就给你一个实际制数,你把它写人,就是有 754 标准。要么你可以倒过来,给你个 754 标准的一个数,把它描述成十进制,你就反过来就可以是吧?这我就不啰嗦了,大家感兴趣可以因为课件发给大家了。

好,对于什么叫表述范围,你一下自己看。好,我们把我认为在你们一两年以前学习过程中可能没注意的问题,我们在这再结合考研这个题给大家讲一讲。其他部分你可以自己去看,下面是这个。实际制,就是非输入执行顺序的表示,非诉执行数据。

过去我们知道世界上第一台计算机是用于美国导弹运动轨迹计算。也就是说在计算机使用的早期,计算机的目的作用主要用于科学计算。但是随着计算机深入到每个人的日常生活,比如说咱们的手机就一个小计算机是吧?我们普通人没有机会拿你的手机去进行科学计算,绝大部分是处理文字、音频视频等等等等这些普通老百姓能够接触到,能够用得到的一些信息。这些信息往往是非数值型数据。传统的数值型二进制的这种表示已经不符合当下人们对于计算机使用的需求。

我们首先看一下这种非数值型数据我们怎么进行表示。第一个叫阿斯玛阿斯克码是美国国家,我看一下叫什么,这美国国家信息交换 american standard called for information is change。英特 into interchange?阿斯玛的原文翻译是由美国国家标准化研究所搞。实际上这个标准化研究所在美国计算机领域中是非常权威的一个单位?阿斯玛值,他就规范,因为计算机是美国人发明的,美国人首先约定规范计算机如何表示英文字母。

大家看一下,他用一个字节,我们知道一个字节是八个比特位是吧?那么用一个就一个字节八个比特位,那八个比特位的 8 层是什么?256 状态。大家可以看一下,他要之前他是第七位,最高位我不用,那么是在最高位干什么?

做就校验这做校验数据校验。一个是结果用七位二的 7 次方是 128 种状态。这 128 种状态描述了十个十进制数,0 到 9 英文字母我描述了 52 个。

大家都说英文字母是 26 个,但是在这我们英文的大写字母和英文小写字母。分别分开 52 个大写,52 个小写,总共就才是 64,62 是吧?127 减去 62 还有 65 个。那么这 65 个大家看一下,128 个奖励,还有 66 个。那么 66 个有 34 个专用号,比如说句号、逗号、封号,对吧?还有什么?

而且大家可以看一下,你们在咱们键盘上还有什么符号,一个。这是什么?这是什么美国刀老头叨佛什么这我们还叫两种国,这是什么?英镑的符号是吧?每分每刀和英镑能放在阿斯玛的这个符号表里面,也就说这 32 34 个专用符号。大家可以看一下,我是不是可以这里是不是可以看到我的刀老婆英镑佛是吧?

那么这些可见的还有就 32 专用,说什么大概感叹 202 井号百分号、左括号、右括号、乘号、加号等等等等,这是可见的符号。但是最开始的这些 HOSOH 等等等等,这些是我们称为空控制符控制符是吧?那么控制符就是我们操作时候用到的符号,这构成了我们阿斯玛值。好,咱们休息五分钟,待会再。

那可以。

没有。

我是。

好,咱们接着内容往后去。也就是说在阿斯玛里面既有可见的,比如说数字英文字母常见的一些可见的符号之外,还有一些控制字符。比如说在我们编码中用用到了一些符号?比如说我们的这个回车键转移字符等等等等,这一些控制类的符号都在这个 28 表里面。

那么我们对大家的要求是什么?我们考试的时候,这个知识点我们会考到这一页 PPT 写到哪一步,只要知道其中一个数字或者字母的阿斯玛值,不查表可以推导出其他数字或者是字母的 2 分之 3。比如说我给你的大写大写的 A 大写的 A。大家可以看一下大写的 A 和,比如说大写的 A4。大写的 A 它对应的阿斯玛就是多少,是不是四丫 H。那么还大写 H24 码是二对,20 码的是多少?你能不能写出来?OK 考试的时候看大家的真本事了是吧?

好,对于字符串的存放就不啰嗦了是吧?就两种。咱们最常见的要么就是数组,要么就是链条。第二个就是像这个就所谓的向量法,还有一个什么串表法向量法就是数?逻辑相连,物理也相连,这数字对或者就这里向量的最大特点?还有什么串表法,就是我们数据结构所学的单向力?这些东西都不用多啰嗦,对吧?

好,下面咱们看一下汉字的表述。汉字表示这是咱们计算机引入到中国,为中国人服务。首先要解决一个汉字的表示问题是吧?汉字表示因为汉字计算机很早,咱们中国的上世纪 50 年代、60 年代,北京一些研究所已经搞出来了。所谓的咱们纯国产的计算机,早期主要用于科学计算是吧?就跟国外一样。

当计算机为普通老百姓服务的时候,首先咱们看一下汉字的表示我们是怎么样解决。其实对于汉字的表示,我们说首先大家要有一个概念。在计算机里面汉字的表示大家注意一下,它分为好几个阶段,这个向大家注意一下。怎么讲?就要安置。

咱们打交道汉字,大家可以想一下汉字第一块是什么?汉字的输入是吧?汉字的输入。什么汉字的。机内保存。

汉字输入到机内保存。然后计算机与计算机之间是不是这两个计算机之间是不是要进行信息交换,是吧?这是交换。

汉字是不是我要在打印机上按照我想要的字体大小进行输出,对吧?

大家看一下汉字从输入计算机内部表示输出阵营三人马上了计算机,与计算机之间进行汉字信息的交换,有个交换 OK 输入机内输出交换就汉字表示咱们这有四种形式是吧?那么咱们分别看一下这四种形式里面,我们讲的什么马到底是属于哪一类?你别弄了半天,我这找一个交通书,我算了半天,这几种,我也会算,但是到底他们之间是怎么回事,整不明白是吧?整不明白这地方我们也是有考试的要求的。

首先咱们看一下叫汉字的国标法,汉字的国标国标码从这个国标码,我们一般说 GB2312-80 这个国标法,它是国标法。GB2312-80,它已经告诉大家这个标准的诞生年代,1980 年就是 GB23012-80。这是我们第一代汉字的国标码,它包含了 6763 个汉字,其中一级汉字 3755 个,按照拼音排序,二级汉字是 3008 个,按照这个部署排序,除此之外还有 682 个字形符号,这是汉字的国标码。

汉字国标码在这张图里面大家说一下汉字国标码群,这里面的哪一块机内表示输出,还有什么?大家觉得汉字的国标属于这一块,计算机交换的时候。属于交换对吧?国标法属于信息交换。那么这 80 年,后面我们还会讲到了,就 80 年往后推 20 年,就是 2000 年前后。GP2312 有点过时是吧,就是国标。GB2312 1980 年到了一两千年前后叫 GDK 第二段国标码叫 GPK 对吧?

有的人去查,2000 年之后,随着什么 java 语言的普及,现在就什么 UTF8 就用,这是最新的这个是国际标准。国际标准也就说早期我们说计算机主要是什么英文。那么是啊随着这个计算机向全世界普及,需要一个全世界能够共用的字符集?中文、韩文、日文这几个东亚与这语言体系中的文字的表述,跟欧美拉丁派系是不一样的?欧美拉丁派系就是由字母构成单词来进行表达意思。因此对于这种拉丁语系的,无论是你英文、法文、德文?西班牙文、俄文等等,它能表就他表示数组所需要的增值器容量是非常小的,咱们东亚地区的中文、韩文、日文,他所占的字符级的就是他需要的工,他的数量比较多,他不是拼写的,他有专门的汉字。提出了 unique,他的目的是将世界所有的语言,所有的符号用唯一的编码进行表示,这叫 unit on。

我为什么要这么说呢?大家现在大 3,我不知道大家前就是在在两周以前小学期做的是什么什么题目。说如果做外的开发,所谓开发比如说反正你要做一个静态 HTML,那就没什么好说的。比如说我用 python 言写一个小网站,我用 java 的 javascript,或者 PHP 我写个小网站。

将一个汉字信息,就用户某个用户提交一个汉字信息写入到数据库,再从数据库里面读出信息到屏幕上显示。我不知道在座各位遇到过没有,说汉字从屏幕上收集过来写入到数据库,再从数据库里面读出汉字变成了乱,我不知道在座何遇到过。我因为现在可能大家都喜欢走高端路线?走高端路线一说起来什么 AR agent,就玩是那个东西。但是传统的底层的这种基本功大家都要熟知?高端的就是一个提示词,这样的不是说它不好?这个大家的基本功还是。

今天早上我从中关村过来的车之后,翻到一些媒体上的一些材料,对大家来说,未来可能大家的主要是不是写代码了?我借助于 AR 工具,很多简单的事物。他都能帮你做了。你要具备什么能力?识别和辨析的能力就是 A1 代码给你生成一个代码,你不能拿过来贴过来就用是吧?这种贴过来就用的 AI 代码生成到目前为止,我不知道你们用过没有我跟很多在这方面用的药多的学生交了以后,他给我的结论是什么?

用 AR 写代码,简单的 HTML 前端页前端的开发没问题。但是你写一些后台逻辑,它会出现什么局部正确整合到一起调试是非常困难的。因为你用 AR 写的代码,它只是局部的?你这个数这个变量的定义什么一些东西,你和其他的代码整合到一起就可能就乱了?

你要没有这种变现能力,你肯定搞把它整合到一起。因此我们说现在你要有这样的能力?也就是说换句话说,大家要一些基本的。处理能力。我做过这个外部开发,我的解决方案强制的数据类型转换强制数据类型转换。然后输入往数据库写的时候,指定数据库的字符集格式。输出从数据库中读出来,强制指定数据格式是吧?而且我用专门的字编写的字符转换程序,强行对于这个数据做一个准确的这时机的确定,这样来完成我最后的数。

的朴实?就过去这个人如果你要做外开花作风及出现暴力是常见的事。有的人就是看网上的教程设字符集怎么设呢?在前面一个 HTMA 文件里面,我要设什么 UTF 杠 8。数据库我卸载了重新安装,设计的初始字符集要设定为 UT 和 8 这个套路。

我想说一句什么呢?你在你的笔记本里面,你想装数据库,你想装什么软件?大的装完了、装满了、崩溃了,你重新装操心你重新装这个数据库软件没问题是吧?你随便一折腾,但是你想到一个工作岗位,只要任何一个单位的数据库你没有资格做。你想说这个测绘机设错了,我重新给你设一遍门都没有是吧?你说我要去设计,人家数据库管理员连口令密码都不给,你想干想都不要想。那么对于这种苛刻的数据库的要求前提下,你要进行看这个输出正确的设置。

你琢磨一下这件事,你们每个同学将来会写代码,这一百?当然你说你这高中 AI 在那个我就不说这事,就假定这些底层的别人替我替你做了,你举个高端的。但是我想问一句,如果在座各位像我所说的,你就会有几个词你会就会高调应用,那你和别的专业区别在哪?你安身立命的本钱是什么?你会别人也会,你不会的别人也不会,这是对 AI 群体的现状,对你们来说绝对不行是吧?

你学学第二层就要学电子,最起码你电子信号的处理,雷达信号的处理,你看很熟。咱们光电的对光学这些处理它很熟。车辆对车辆的很东西的东西,你说你会什么?你会的,他们别的学员也会,我们不行的。因此我的意思说的,在座各位一定要把咱们专业基本功要打好是吧?这是你安身立命的一个核心的拳头。你不要说你会,别人也会有 AR 提示词工程和 AR 对这个的应用有啥难度,找一个说明。

前两天我们在保研富士,很多人一说起来大创这个赛那个赛讲那个讲真正说我们针对一个特定的研究课题?有的同学自己做的,你一句话老是问不到他。但绝大部分一说起是第三或者第五,作者也不知道什么什么。

然后一问干了些啥,做什么文献的收集,这个绘图表格的处理有数据,表格的处理等等等等一系列给你挂个地铁坐也有是吧?当然就是我们见多了,这有的时候难听的也就咱们课课下这么说。有很多同学简历站在我们老师的角度来看,经不起老师 30 题的,很快就被抢了,是吧?你们就是说你们将来考研考研或者考研复试的时候,你的 PPT 写的东西,帮你准备的材料一定要准备充分了?不要说我为了保研,反正就觉得这老师啥也不知道,我写的啥就是啥,老是跟你较个真,问问这东西到底咋回事,别露馅,别太难看。这个给大家提个醒,就是你们要扎实一点。

好,咱们汉字主要我们发讲一个发展历程。那么对于 GPR312 它最大的特点是什么?我们用双字节进行,就 GDR3123 的,我们讲的 GDR32312,他用双字节进表示汉字的,而且每个汉字都就每个字节是用低七位高,最高那一位全是一。大家听清楚汉字的最跟阿斯玛区别什么?阿斯玛只用一第七位最高位作为校验位,而与此同时的 G131-80 是用双字节,每一个字节的最高那一位要质疑要注意,大家听清楚,这是国标。国标法刚才我们讲到了,这属于数据交换的交换。

汉字的区位码是第二种教材中出现的码,它是一种什么?汉字的输入码为什么叫区位?它就是将这个 GB2312-80 的 6763 个汉字分成 96 个区,每个区有 94 个区,每个区 94 个汉字。就每个汉字就相当于咱们二位数是吧?9。就是这 26 组,他的行有 94 行列四列就是一个 94 行乘以 94 的矩阵。那么每一个汉字给他唯一的编号是唯一的区号,这是区号是吧?还有一个在这个区里面,这个汉字应该是从 1 到 94 进行内部相对编号,每个汉字既有区号又有问号,这样构成了区位吗?

那马妍说一个汉字给它赋予唯一的一个区位编码是吧?比如说中国的中在区位码表上,它在 40 54 区 48 位,那么单位的七位码 5448 国的第 25 区的第 90 位就 259。这种方式因为 1980 年大家想一下是什么年代,咱们很很落后是吧?很落后。当时咱们要和软这个亲人进行通讯,电话基本不可能。最常规的是写信,贴个八分钱邮票送到放到油桶里。

这个?如果加入紧急事咱们怎么弄?一般去邮电局拍电报,拍电报就跟这个用缺位码一样。您说这个缺位码为什么会提到?就是在当时拍电报每一个汉字都有所谓的它的编码,与之类似就得到了区位码。

区位码与我们的国标码之间有这样的计算关系。大家注意一下,是用区位码加 2020H 等于这个汉字的国标码,这他有对应关系。比如说汉字的春天的春,它的区位码是 2026。那么你要是你要想计算它的国标码,就 2026 加这个 2020H 是吧?那么大家看一下,2026 首先是十进制的表示,把它翻译成 16 进制制。141AH 加 2020H 就等于 343A 就春的国标码就是 343AH 就这么简单是吧?

刚才我们讲到了确认码是一个输入码。当然我们说这种输入码早期上个世纪 80 年代,我们用当时主要是什么汉字,这种编码方式教学电信局电报员的一个工作范畴。他因为他拍电报也是法看记录数字化进行一个映射对应因此在上世纪 80 年代这么干,汉字的数码区位码是最早的一种,之后有拼音居多,还有五笔字形。现在连就一般来说这个拼音输入法是用的最多的,手机上还有什么手写书等等的这都是汉字的输入过程中的表示形式。

下面咱们看一下汉字基,它这个机内码。刚才我说了区位码输入码,国标码是交换码,机内码是在计算机内部进行汉字表示的。第二个,由于我们计算机最早是只能处理英文,我们是在处理英文的操作系统上假装使它能够处理中文。你所说汉字的操作系统既要能够处理汉字,也要处理业务字体。为了出现一个二进制信息,到底代表着阿斯玛值还是汉字的编码是吧?有可能会出现二义性,为了解决这个问题我们怎么办呢?大家可以看一下,是在汉字的国标码上最高每个词的最高位加一就说白了就是说的,因为刚刚我们说了,我们汉字的国标码是用双字节晶表示,每个字节用第七位,跟阿斯码是保持一致。

为了在计算机内部既能处理汉字又能处理奇文,因此汉字机内码是在国标码的基础上加 8080H。那么八里是是是十六进制是吧?一个 16 进制是对四个二进制位,80 就是一个字节是吧?8080 是两个字,就说相当于把我们的汉字的金表示汉字的那个级别最高的。那么。汉字的机内码汉字的国标码,汉字的区位码是吧?之间有两个计算公式。是不是之间有两个村?

国标法等于区位码加 2020H 那么机内码等于国标码再加 8080H 那么我给你的汉字的机内码或者国标码,我交给要交这叫区位法、界内法和国标法。只要一个汉字,我给出他的其中的一种码的描述。你是不是能够来自于网络公司,把这个汉字的其他两种码对应的 26 进制的或者实际的表示,你能给我写出来是吧?这是有要求的。好,这个掌握了,是不是你期末考试是不是一道一分或者两分的全部题就给大家,期末考试这个点大家注意一下。

OK 我已经说的很直白了,下面咱们看一下字形码。字形码在我这一个图中属于输出码。那么早期我们的汉字字形码是什么?点阵字库用 16 乘 16,32 乘以 32 或 48 48 乘 48 的个汉字,就每一个汉字你们自行输出。有 16 乘 16,我不知道大家 C 点基于 C 点是否调用过这种典型字库进行汉字在屏幕上输出。

然后我们说现在这个是在用的标识,当中一个汉字的点阵,就这点阵这就就是一个汉字所用到的点阵的数量越大,它这个汉字显示的就热清晰。因为咱们现在这个显示器,热情的你你你比如说在座各位笔记本 14 寸、13 寸,那么可能觉得这个字很清晰。但是你突然放到我这讲台上,这大概是有个 27 寸,相当于我们的一倍。同样一个汉字,在大屏幕上面这一个汉字的有不规则的曲线边就能看出来是吧?当我们就看这个片就规模比较大,那这个就可能性越低是吧?

这是这块,也就说刚才我们做了这汉字字形码属于输出码,这个我们不做要求。但是区位码、机内码、国标码之间的一个计算关系大家要掌握。我给你一个汉字的区位码、国标码、机内码这三中码的任意一种形式。你应该用公式将这个汉字的其他两种码的对应的,只要给我写出来,这是咱们对它的要求。

好,汉字的发展我们一圈我们提前讲是一个是 GBK 是吧?我挑了典型的去去说的,现在最最先现在国家统一的是 unit cost 是吧?Unit cost 它是上用一个 16 位解释,还是双字节?双字节进行和全世界所有符号的表示,那么 16 倍能够表示 6556 千不 65503 16 个符号的描述。应该来说全世界所有的语言符号都能表示。咱们国内中文常见的汉字也就六千多个符号,也就占他的 10% 多一丢丢。那么要韩文日文也就是这个数量级,这两这东亚这三个国家也就占据总的符号的 30% 多,到不到 40。这样全世界其他国家用。

60% 的去教师绰绰因素说有你考虑现在可能这个计算机领域中符号的一种统一默认的形式。但是现在之所以不统一,因为我们用的应用系统有不同年代生产出来,有的还在正常。因此现在我们做外部应用系统的时候,我们用了这个集可能是差别比较大新系统一般来说都是设定为 UTF 杠 8,但老系统就不一定了。这个相当注意一下,优衣库的码,大家现在注意看一下能装是吧?

最常见的是 UTF 杠 8,它翻译过来叫 U 的转换格式,对。Unique or translation format 是吧?油田的缩写。好,这是我们的正题。2.4 字串这个我就不打算描述了是吧?

首先是十进制数,在计算机过程中我们有个 BCD,BCD 码它的账号我们用四位。二进制数来表示一位十进制数,因为我们这个二的四次八等于 16 是吧?你用四位二进制表示十进制数的话,就因为十进制它的符号是 0 到 9,那么它总共十种状态是吧?四位二进制状态表示十种状态,是不是我要多出来 6 种是吧?所谓的冗余状态,你根据这六种冗余状态的就多穿这个肉红红状态的位置不一样。

那么在 BCD 码中我们用一张表,大家可以看一下,我们给出了最为常见的 4 种 BCECD 码的格式。其中有 8421、2421 和余三码,以及格雷对格雷玛这四种形式。大家看一下,大家最常见、最用用的、最熟的、最擅长的是 842158 字二方法。

大家看一下,这是符合咱们每个人,你们哪怕没学过计算机,将这个十进制转换成二进制,你会得到这样一个表示。比如说 00000009100181000701118421,说明这每一位如果出现一,它的权重是多少,比如说我们十进制,十进制的 100 在百位出现一,大家知道这是 100 是吧。如果在千位上出现一,我们这是一千,那么八个二维码最高位出现了 110000,这是二进状态,只要把它翻译成十进制值就是八是吧,它都有一定关系。你所说 8421 说明了这四位每一位出现一的话,它对应的权重是多少?我们十进制每位我们称为个位、十位、百位、千位、万位,这个个十百千是不是也就是十进制每一位出现一个重?这个也是一样。

那么有这里总共我们要求大家掌握前三种,8421、2421 和余三码。也就是说我给你一个数,你能按照 8421 码、2421 码或者余三码的形式,你给我把对应的 BCD 码写出来是吧?这个我就不啰嗦了,我只提要求。这又给大家送出一份,期末考试选填空题,就这个知识点大家去琢磨一下。

OK 其中大家注意下,2421 码是对九个字符码。什么是自古?大家现在去看年龄学过。比如说这里的 222421 是 0011,他对 9 的 56 6 的 2421 码是 110000111100 对自我是吧?那么最关键就是 28421、2421,还有余三码,你们要看注意一下它的冗余状态。冗余状态我们称为什么非法非非法。

好,除此之外还有第三个,这个我再不啰嗦,也是他也对酒的字符 OK,这就是我们十进制数串的要求。然后对于十进制数串的压缩不压缩的,对于符号位怎么去弄,自己看我就不多啰嗦了,没啥意思。这一节 2.5 我们就不啰嗦了。

下面咱们看一下第最后一节数据的校验。在这我们只掌握基本校验,别的不做任何要求。期末考试的是标准奇偶校验是一种最为简单的校验。那么在校验码中除了具有校验之外,我们还有别的校验码。比如说循环冗余校验,或者是还有后面什么海泥校验,循环领域校验。这个咱们以前我们讲,现在我们不讲与课程压缩了。现在咱们看一下旧校验是一种简单的校验,它最大的特点对于。

奇偶校验实验方法就是若干个教费再加一个二进制校验费构成较量。根据我的校验方式,我们分为奇校验和偶校验。所谓的基校验就是整个校验码,就包括有校尉加一个的校验费是吧?它所包含的二进制的一为奇数个,被称为奇校验。

如果偶校验就有效信息位加校验位,总共 22 进制的一是这个就是偶校验。这个我觉得应该你们大一都学过,没什么好说的。比如说这是八个零是吧?八个零这是有效信息。

如果是构成鸡校验码奇校验变成什么?1820 入手校验 08 个 0 是吧,满足。一为奇数个或者偶数个,比如说这个零,那么对这个零的偶校验,是不是相当于你的一是哪一个?OK 都是不想的,考试的时候一会儿是问题好。也就因为第二章如果出大题就两个考点。RQQ1754 给你出一道五分的题,或者再狠一点,给你搞一个福建或者转型范围。如果不出的话,我出就这些一分的填空题是吧?

这张可能出的考试题,你说我出个再出个大题,别的大题有吗?不可能对吧?比如说选择题给你出一个,请比较下面二进制、八进制、三进制氢七进制的所有大小。

好,咱们下课这一章的题我也讲完了。那么课后作业因为大家的这个版本有新版的,有老版的。我回去明天给大家对一下第二章每课的作业。然后我又在艾菲里的群里面,白 S 去公布第二章的作业的内容。好,下课。

表现是什么?

不是这么做。