数值数据常见的编码方式有三种法有哪些并简述其编码规则。

  计算机的产生是20世纪最重要的科学技术大事件之一。1946年美国宾夕法尼亚大学经过几年的艰苦努力,研制出世界上第一台电子计算机--埃尼阿克(ENIAC)。

  一、 计算机的发展史:

  根据计算机所采用的物理器件不同,可分为四个阶段。

  第一代:电子管计算机,开始于1946年,结构上以CPU为中心,使用机器语言,速度慢、存储量小,主要用于数值计算。

  第二代:晶体管计算机,开始于1958年,结构上以存储器为中心,使用高级语言应用范围扩大到数据处理和工业控制。

  第三代:中小规模集成电路计算机,开始于1964年,结构上仍以存储器为中心,增加了多种外部设备,软件得到一定发展,计算机处理图像、文字和资料功能加强。

  第四代:大、超大规模集成电路计算机,开始于1971年,应用更加广泛,出现了微型计算机。

  计算机硬件发展的同时,软件始终伴随其步伐迅猛发展,就计算机的编程语言而言,也划分为三代。

  第一代:机器语言。每条指令用二进制编码,效率很低。

  第二代:汇编语言。用符号编程,和具体机器指令有关,效率不高。

  第三代:高级语言:如FORTRAN、COBOL、BASIC、PASCAL等都属于高级语言。

  二、我国计算机的发展

  我国从1956年开始电子计算机科研和教学工作。

  1983年12月研制成功每秒运行1亿次的"银河"巨型计算机;

  1992年11月研制成功每秒运行10亿次的"银河Ⅱ"巨型计算机;

  1997年研制成功每秒运行130亿次的"银河Ⅲ"巨型计算机。

  三、计算机的发展趋势

  计算机的发展向微型化和巨型化、多媒体化和网络化方向发展。

  计算机内所有的信息都是以二进制的形式表示的,单位是位。

  位:计算机只认识由0或1组成的二进制数,二进制数中的每个0或1就是信息的最小单位,称为"位"(bit)。

  字节:是衡量计算机存贮容量的单位。一个8位的二进制数据单元称一个字节(byte)。在计算机内部,一个字节可以表示一个数据,也可以表示一个英文字母或其他特殊字符,二个字节可以表示一个汉字。

  字:在计算机中,作为一个整体单元进行存贮和处理的一组二进制数。一台计算机,字的二进制数的位数是固定的。

  字长:一个字中包含二进制数位数的多少称为字长。字长是标志计算机精度的一项技术指标。

  存贮器编址:为了便于对计算机内的数据进行有效的管理和存贮,需要对内存单元编号,即给每个存贮单元一个地址。每个存贮单元存放一个字节的数据。 如果需要对某一个存贮单元进行存贮,必须先知道该单元的地址,然后才能 对该单元进行信息的存取。

  注意:存贮单元的地址和存贮单元中的内容是不同。

  指令:指挥计算机进行基本操作的命令。

  指令系统:一种计算机所能执行的全部指令的集合。

  程序:按一定处理步骤编排的,能完成一定处理能力的指令序列。

  计算机系统是由硬件系统和软件系统所组成的。

  一、计算机的硬件系统

  硬件系统由输入设备、输出设备、存储器、运算器和控制器组成。

  其中运算器和控制器结合在一起,称为中央处理器(CPU)

  CPU(即运算器和控制器)和存储器合称为主机。

  输入设备:常见有键盘、鼠标、扫描仪等

  输出设备:常见有显示器、打印机和绘图仪等;

  中央处理器:又称CPU,它包括运算器和控制器。是计算机的核心部分。

  我们平时所说的486、586、奔腾Ⅲ、奔腾Ⅳ指的是CPU的档次。

  运算器:可以进行算术运算和逻辑运算;

  控制器:是计算机的指挥系统,它的操作过程是取指令--分析指令,循环执行。

  存储器:具有记忆功能的物理器件,用于存储信息。分为内存和外存。

  内存:是半导体存储器,分为只读存储器(ROM)和随机存储器(RAM)。

  ROM只可读出,不能写入,断电后内容还在;

  RAM可随意写入读出,但断电后内容不存在。

  外存:磁性存储器(软盘和硬盘);光电存储器(光盘),可以作为永久性存储器。

  存储器的两个重要指标:存取速度和存储容量。内存的存取速度最快,软盘最慢。存储容量是存储的信息量,它用字节(Byte)作为基本单位,1个字节用8位二进制数表示,1KB=1024B,1MB=1024KB,1GB=1024MB。

  二、计算机的软件系统

  计算机软件系统分为系统软件和应用软件两大类。

  系统软件:为了使用和管理计算机的软件;主要操作系统软件有Windows95/98/2000/NT, DOS, UCDOS,MS-DOS,Unix,,OS/2,Linux等。其中,WINDOWS是多任务可视化图形界面,DOS是字符命令形式的单任务操作系统。

  应用软件:为了某个应用目的而编写的软件,主要有辅助教学软件,辅助设计软件、文字处理软件、工具软件以及其它的应用软件。

  三、计算机的工作原理:

  到目前为止,电子计算机的工作原理均采用冯·诺依曼的存储程序,并自动完成程序的设计思想.其工作过程如下图所示:

  需要注意的是:程序中的数据,指令都采用数字化编码方式,保存在存储器中;程序中的指令必须是属于这台机器的指令系统.

  计算机病毒是一种程序,是人为设计的具有破坏性的程序.它往往使计算机不能正常工作.计算机病毒具有破坏性,传播性,可激发性,潜伏性,隐蔽性等特点.由于计算机病毒危害极大,需要注意隔离计算机病毒的来源,经常用杀病毒软件检查计算机系统和存储器.

  计算机中有关数,编码的基本常识

  (一)1.计算机是智能化的电器设备

  计算机就其本身来说是一个电器设备,为了能够快速存储,处理,传递信息,其内部采用了大量的电子元件,在这些电子元件中,电路的通和断,电压高低,这两种状态最容易实现,也最稳定,也最容易实现对电路本身的控制.我们将计算机所能表示这样的状态,用0,1来表示,即用二进制数表示计算机内部的所有运算和操作.

  2.二进制数的运算法则

  二进制数运算非常简单,计算机很容易实现,其主要法则是:

  由于运算简单,电器元件容易实现,所以计算机内部都用二进制编码进行数据的传送,计算.

  3.十进制与二进制,八进制,十六进制数之间的相互转换

  (1)数的进制与基数.

  计数的进制不同,则它们的基数也不相同,如表1-l所示.

  不同进制的数,基数不同,其每位上所代表的值的大小也不相同,我们称之为"权"

  从以上的计算中,可以看到,进制不同,基数不同,每位上权值大小也不相同,数值大小也不相同.

  (3)十进制数转换成任意进制数

  将十进制数转换成任意进制数的基本方法是:将十进制数除以所定的进制数反向取余.

  ①将39用二进制数表示,用如下的短除法,求余数,并反向取余.如果转换成二进制还可以用右边的2的N次幂表示.

  ②将245用八进制数表示,我们可以用如下的短除法,求余数,并反向取余.

  想一想,为什么要反向取余.对于十进制小数要转换成其他进制的数,则是不断将小数部分乘以进制数取整,作为转换后的小数部分,直到为零或精确到小数点后几位.如: (0.35)10≈(0..125)10=(0.001)2

  (4)任意进制的数转换成十进制数

  将任意进制数转换成十进制数的基本方法是按权展开,见(2)数的权内容.

  美国的标准信息交换代码

  将每个字符用7位的二进制数来表示,共有128种状态

  大小字母,0…9,其它符号,控制符

  (三)汉字信息编码

  汉字输入方法大体可分为:区位码(数字码),音码,形码,音形码.

  · 区位码:优点是无重码或重码率低,缺点是难于记忆;

  · 音码:优点是大多数人都易于掌握,但同音字多,重码率高,影响输入的速度;

  · 形码:根据汉字的字型进行编码,编码的规则较多,难于记忆,必须经过训练才能较好地掌握;重码率低

  · 音形码:将音码和形码结合起来,输入汉字,减少重码率,提高汉字输入速度;

  汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准.自国家标准GB2312-80公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码.

  GB2312-80标准包括了6763个汉字,按其使用频度分为一级汉字3755个和二级汉字3008个.一级汉字按拼音排序,二级汉字按部首排序.此外,该标准还包括标点符号,数种西文字母,图形,数码等符号682个.

  区位码的区码和位码均采用从01到94的十进制,国标码采用十六进制的21H到73H(数字后加H表示其为十六进制数).区位码和国标码的换算关系是:区码和位码分别加上十进制数32.如"国"字在表中的25行90列,其区位码为2590,国标码是397AH.

  * 由于GB2312-80是80年代制定的标准,在实际应用时常常感到不够,所以,建议处理文字信息的产品采用新颁布的GB18030信息交换用汉字编码字符集,这个标准繁,简字均处同一平台,可解决两岸三地间GB码与BIG5码间的字码转换不便的问题.

  字形存储码是指供计算机输出汉字(显示或打印)用的二进制信息,也称字模.通常,采用的是数字化点阵字模.

  一般的点阵规模有16×16,24×24,64×64等,每一个点在存储器中用一个二进制位(bit)存储.例如,在16×16的点阵中,需8×32 bit 的存储空间,每8 bit为1字节,所以,需32字节的存储空间.在相同点阵中,不管其笔划繁简,每个汉字所占的字节数相等.

  为了节省存储空间,普遍采用了字形数据压缩技术.所谓的矢量汉字是指用矢量方法将汉字点阵字模进行压缩后得到的汉字字形的数字化信息.

  (四)其它信息的数字化

  一幅图像可以看作是由一个个像素点构成,图像的信息化,就是对每个像素用若干个二进制数码进行编码.图像信息化后,往往还要进行压缩.

  自然界的声音是一种连续变化的模拟信息,可以采用A/D转换器对声音信息进行数字化.

  视频信息可以看成连续变换的多幅图像构成,播放视频信息,每秒需传输和处理25幅以上的图像.视频信息数字化后的存储量相当大,所以需要进行压缩处理.

  视频文件后缀名有:avi,mpg等;

  数有正,负两种,在计算机中数的符号是用数码表示的.一般情况下,用0表示正数,用1表示负数.通常符号位放在数的最高位.

  机器数:连同符号位在一起作为一个数,称为机器数.

  真值数:一个数的数值部分称为真值数.

  (一)数的定点表示和浮点表示

  (1) 定点小数格式

  任何一个M位的小数可以表示成:

  (2) 定点整数格式

  任何一个N位带符号的整数都可表示为:

  (3) 数的浮点表示

  浮点数是指小数点在数据中的位置可以左右移动的数.一个数N要用浮点表示可以写成:N=M·RE 其中M表示浮点数的尾数,E表示浮点数的指数或称为阶码,R指的是在这个指数下的基数.浮点数通常表示成如下格式:

  M:浮点数的尾数,用定点小数表示,小数点在尾数最高位之前,是默认的.尾数用于表示浮点数的有效位,其位数N的大小反映了此浮点数的精度.

  E:浮点数的阶码,用定点整数表示.

  Ms:浮点数的符号位,也就是尾数的符号位,一般放在整个浮点数的最高位.

  (4)浮点数的规格化

  当尾数用二进制数表示时,浮点规格化数定义尾数S应满足下面关系:

  (I)对于正数,S应大于等于1/2,小于1,用二进制数表示为:

  (II)对于负数,如果尾数用原码表示,S应小于等于-1/2,大于-1,表示为:

  (III)机器零:当一个浮点数的尾数为0,不论其阶码为何值;或阶码的值遇到比它能表示的最小值还小时,不管其尾数为何值,计算机都把该浮点数看成零,即把阶码尾数全变为0,称它为机器0.

  (二)二进制数值数据的编码方法

  最常用的编码方法有原码表示法,补码表示法和反码表示法三种.

  用机器数的最高(最左)一位代表符号,其余各位给出数值的绝对值.

  [X]原=符号位+|X|(0代表正号,1代表负号)

  真值零的原码表示法,有正零和负零两种表示:

  如果X为负数,则:[X]补=(把[X]原 除符号位外,其余各位全变反(0变1,1变0),再在最末位加1 )

  同理有:如果X为负数,则:[X]原=(把[X]补 除符号位外,其余各位全变反(0变1,1变0),再在最末位加1 )

  如果X为负数,则:[X]反=(把[X]原 除符号位外,其余各位全变反(0变1,1变0))

  可见,如果真值X=0,则[X]补 有唯一的编码,[X]原 和 [X]反 都有两个不同的编码.

我要回帖

更多关于 常见的编码方式有三种 的文章

 

随机推荐