您现在所在的位置是:首页 > 业界新闻

中小企业管理信息系统的技术基础

企业管理信息系统是包括整个企业生产经营和管理活动的一个复杂系统,该系统通常包括:生产管理、财务会计、物资供应、销售管理、劳动工资和人事管理等子系统,他们分别具有管理生产、财务会计、物资供应、产品销售和工资人事等工作等职能。

信息技术是管理信息系统的基础,只有把信息技术与管理结合起来,才能真正发挥管理信息系统的作用。本章将重点介绍管理信息系统所涉及的信息技术。


第一节信息技术概述

信息技术(InformationTechnology,IT)是一个外延很广的概念,它已经渗透到各行各业,乃至人们的家庭生活和社会生活的方方面面。下面给出两个关于信息技术的定义:

(1)信息技术是使用计算机和微电子技术对信息进行加工、存储和通信的技术。

(2)凡是可以延长或扩展人的信息功能的技术,都称为信息技术。

就信息技术的主体而言,其主要内容包括传感技术、通信技术和计算机技术。这三种技术的划分是相对的,没有绝对的界限。其中,传感技术通常被认为是人的信息感受器官功能的扩展,主要包括信息识别、信息获取、信息变换以及某些信息处理技术;通信技术则是人的信息传输系统(即神经系统)功能的扩展,包括信息的检测、变换、处理、传递、存储以及控制和调节技术;计算机技术是人的信息处理器官(即大脑)功能的延伸,包括信息加工、存储、检索、分析和描述等。这三种技术相辅相成、互相结合,构成一个有机的整体。

支持管理信息系统开发及运行的信息技术包括计算机硬件技术、计算机软件技术和数据通信技术。

一、计算机硬件技术

完整的计算机系统包括两大部分,即硬件系统和软件系统。所谓硬件,是指构成计算机的物理设备,就是常说的计算机。

虽然不同类型、不同机种和不同型号的计算机在硬件配置上的差别很大,但其绝大多数都是根据冯·诺依曼计算机体系结构来设计的,即具有五大配件:运算器、控制器、存储器、输入设备和输出设备。常见的冯·诺依曼计算机系统的组成如图2--1所示。

(一)中央处理器

中央处理器(CPU)是计算机系统最主要的部件,其运算速度是决定计算机系统性能的重要指标。CPU由运算器和控制器组成,常组装在一个主板上,合称为主机。有三种总线用来连接CPU、主存储器和计算机系统的其他设备,它们分别是:数据总线为主存储器传送数据;地址总线为主存储器中一个分配的地址传送数据;控制总线传输信号以阐明是否读写或写数据到一个分配的主存储器地址或输入设备、输出设备,以及通过它们读或写数据。

运算器是计算机的运算单元,主要用于完成对数据的算术运算和逻辑运算。算术运算包括加、减、乘、除以及它们的复合运算。逻辑运算包括一般的逻辑判断和比较,如比较、位移、逻辑加、逻辑乘、逻辑反等操作。控制器是计算机的神经中枢,按照主频的节拍发出各种控制信息,控制计算机各部分自动协调地工作,完成对指令的解释和执行。它每次从存储器读取一条指令,经分析译码,产生一串操作命令发向各个部件,控制各部件动作,实现该指令的功能;然后再取下一条指令,继续分析、执行,直至程序结束,从而使整个机器能连续、有序地工作。

(二)存储器

存储器是计算机的记忆装置,它的主要功能是存放程序和数据。程序是计算机操作的依据;数据是计算机操作的对象。不管是程序还是数据,在存储器中都是用二进制的形式来表示的,统称为信息。在计算机中,位(Bit)是最小的数据单位,只能存放一个二进制的“0”或者“1”,字节(Byte,简称B)是一组长度固定为8的二进制位的集合,一般一个字节可以存放一个字符。在计算机中,存储器容量以字节为基本单位,一个字节由8个二进制位组成。存储容量的表示单位除了字节以外,还有KB、MB、GB、TB,其中,1KB一1024B,1MB一1024KB,1GB一1024MB,1TB一1024GB。

存储器一般分为主存储器(内存)和辅助存储器(外存)。

1.主存储器(内存)主存储器主要由半导体存储器组成,在计算机运行过程中用来存储数据和程序指令。计算机的主存储器直接与CPU相连,存放当前正在运行的程序和有关数据,存取速度快,但价格较贵,容量不能做得太大(相对于外存来讲)。2011年前后,电脑内存的配置越来越大,一般都在1G以上,更有2G、4G、6G内存的电脑。在其他配置相同的条件下,内存越大,机器性能就越高,处理数据也就越快。主存储器按工作方式又分为随机存取存储器(RAM)和只读存储器(ROM)。RAM中的数据可随机地读出或写入,是用来存放从外存调入的程序和有关数据以及从CPU送出的数据,人们通常所说的内存实际上指的是RAM。只读存储器ROM只占主存储器很小的一部分,在通常情况下CPU对其只取不存,它一般用来存放固定的、专用的程序或数据。
2.辅助存储器(外存)外存用来存放计算机暂时不用的程序和数据(需要时才调入内存),存取速度相对较慢,但价格比较便宜,停电也不丢失信息,容量可以做得很大。例如,现在的硬盘存储容量通常为几百GB,甚至为几个TB。
辅助存储器一般包括硬盘、软盘、光盘、移动硬盘、磁盘(带)、闪存(USBFI。ASH盘,又称优盘和闪盘)等。
对于内存和外存的区别,可以这样理解,内存就是暂时存储程序和数据的地方,例如,当我们在使用WORD处理文稿时,当你在键盘上敲入字符时,它就被存入内存中,当你选择存盘时,内存中的数据才会被存入硬盘(外存)。

(三)输入/输出设备

输入设备是外部向计算机传送信息的装置,其功能是将数据、程序及其他信息从人们熟悉的形式转换成计算机能接受的信息的形式,输入到计算机内部。常见的输入设备有键盘、鼠标、光笔、纸带输入机、模/数转换器、声音识别输入设备、图文扫描仪、条形码阅读器、触摸屏、手写体输入设备等。
输出设备的功能是将计算机内部二进制形式的信息转换成人们所需要的或其他设备能接受和识别的信息形式。常见的输出设备有打印机、显示器、绘图仪、数/模转换器、声音合成输出设备等。

有的设备兼有输入、输出两种功能,如磁盘机、磁带机等。

二、计算机软件技术

计算机的硬件只有在软件的支持下才能发挥作用,也才能扮演好企业信息技术基础建设的角色。计算机的软件是根据解决问题的方法、思想和过程而编写的程序的有序集合。一台计算机中全部程序的集合统称为这台计算机的软件系统。软件按其功能可分为系统软件和应用软件。

(一)系统软件

系统软件是用于计算机的管理、维护、控制和运行以及对运行程序进行翻译、注解、装卸等服务工作的程序的总称。系统软件主要由操作系统、语言编译系统、实用程序(常用的例行服务程序)和数据库管理系统组成。

1.操作系统

操作系统(os)是控制和管理计算机各种资源、自动调度用户作业程序、处理各种终端的软件。操作系统具备两大功能:

(1)系统资源的管理者。。操作系统的首要功能是通过CPU管理、存储管理、设备管理、文件管理及作业管理对各种资源进行合理的调度与分配,改善资源的共享和利用状况,最大限度地提高计算机在单位时间内处理工作的能力。

(2)用户与计算机之间的接口。使用未配置操作系统的计算机(“裸机”),用户要面对的是难懂的机器指令,配上OS后用户面对的是操作方便、服务周到的操作系统软件,从而明显地提高用户的工作效率。

目前常用的操作系统可分为单用户、单任务操作系统,如DOS操作系统;单用户、多任务操作系统,如WindowsXP;以作业为处理对象的批处理操作系统;能够使多个用户在各自的终端上联机使用同一台计算机的分时操作系统,如UNIX系统,这种系统中的CPU按时间片轮流为各用户服务,由于CPU速度很高,各用户都觉得自己独占了这台计算机;强调对随时发生的事件作出及时响应和处理的实时操作系统;为计算机网络配置的网络操作系统,负责网络管理、网络通信、资源共享和系统安全,如Novell公司的Net—ware、Microsoft公司的WindowsNT;用于分布式计算机系统的分布式操作系统等。

2.语言编译系统

计算机能识别的语言有很多,如汇编、Basic、Fortran、Pascal与c语言等,它们各自都规定了一套基本符号和语法规则。用这些语言编制的程序称为源程序。用“0”或者“1”的机器代码按一定的规则组成的语言,称为机器语言。用机器语言编写的程序,称为目标程序。将源程序翻译成目标程序的任务是由语言处理程序来完成的,如图2—2所示。

语言处理程序有汇编程序、编译程序、解释程序等。汇编程序也称为汇编器,其功能是把用汇编语言编写的源程序翻译成机器语言的目标程序,其翻译过程称为“汇编过程”,简称汇编。解释程序对源程序的翻译采用边解释边执行的方法,并不生成目标程序,称为解释执行,如Basic语言。编译程序则先将源程序翻译成目标程序后才能开始执行,称为编译执行,如Pascal语言、C语言等。

计算机指令是用程序设计语言编写的,而程序设计语言是人与计算机进行交流的工具。管理者应该了解哪些程序设计语言与软件工具适合组织的目标,下面介绍几种常用的程序设计语言。

(1)机器语言。机器语言是一种能够直接在计算机上执行的二进制代码指令,用二进制代码“0”和“1”的信息串表示。它能被CPU直接识别,直接执行,无须编译。用这种语言编制的程序称为机器语言程序,既难写又难懂,一般不用它编写程序。任何计算机语言最终要变换成机器语言才能被CPU执行。

(2)汇编语言。汇编语言被称为第二代语言,它用便于人们记忆的助记符作为操作指令,是一种十分接近机器语言的符号语言。汇编语言的每条指令对应一条机器语言代码,CPU不能直接识别和执行汇编语言编写的程序,必须由汇编程序汇编成机器语言才能被执行。

汇编语言执行速度快、代码紧凑、效率高,主要用于系统软件的编程,很适合于编写直接控制机器操作的低层程序,比如自动控制程序、查毒杀毒程序等。由于汇编语言与机器密切相关且编程难度较大,所以对程序人员的硬件知识有一定的要求。

(3)高级语言。高级语言采用英语词汇作为指令关键字,按照规定的语义和语法结构要求来编写程序。高级语言中每一条语句的功能相当于汇编语言的多条指令的功能。高级语言程序需要经过翻译转换成机器语言才能被CPU执行。高级语言程序容易理解、容易维护,成为人们常用的程序语言,也被称为第三代语言(3GL)。(4)第四代语言(4GL)。第四代语言是为降低程序开发难度和提高程度开发效率而设计的通用语言,包括多种软件工具,例如,某些数据库系统的查询语句和应用软件包的宏语言就具有第四代语言的特征。第四代语言从面向最终用户及信息系统专家的程度来划分,可分为以下几类:

·个人计算机软件工具:专为个人计算机设计的一般用途的应用软件包,如Mi—crosoftWord、InternetExplore等。

·查询语句:用来存取数据库或文件中数据的语言,并能支持非事先定义好的信息查询要求,如SQL。

·报表生成器:能从文件或数据中取出数据,并制作各种由信息系统例行生成表格的定制化报表。

·图形化语言:能从文件或数据库中取出数据,以图形的方式表现。一些图形化软件包也能够进行算术运算或逻辑运算,如SASGraph。

·应用程序生成器:它用预先程序化的模块产生整个应用程序,可加快应用程序的开发速度,使用者只需指定工作,应用程序生成器便能够创造出对应的程序代码,进行输入、输出、验证、更新、处理以及报表制作等工作,如MicrosoftFrontPage、PowerBuilder等。

·应用软件包:由厂商提供销售或出租的软件,免除用户特别编写内容软件的需要,如SAP/3、U8等。

·高级程序设计语言:以比Cobol和Fortran更少的指令来产生程序代码的程序设计语言,主要是为专业程序设计师提供更高的编写效率,如APL。

(5)面向对象的程序设计语言。面向对象的程序设计语言是20世纪80年代后新发展的程序设计语言,它将数据和操作合成为对象,对象可以重用,从而大大提高了编程效率,如c++。面向对象的程序设计语言孕育出另一种新的程序设计——可视化程序设计,利用可视化程序设计,设计师可以不必编写程序代码。

(6)标记语言。由于互联网的广泛应用,标记语言也开始引起人们的注意。HTML是Web的通用语言,是用来创造网页之类的超文本或超媒体文档的网页描述语言;XML是可扩展标记语言。HTML只描述文字和图形如何显示在网页文档中,文件格式的标签集是固定的;而XML则表示文档中数据的意义,侧重于数据本身,它的标签集不是固定的。

3.实用程序

实用程序(Utility)是针对操作系统的不足而编制的程序,它帮助用户迸一步管理好自己的计算机。常用的实用程序包括磁盘备份、复制一组文件、磁盘格式化、磁盘整理、内存优化、文件压缩、键盘锁定、计算机故障诊断及修复、对已被破坏的文件的修复、病毒的检测与清除等。将实用程序纳入操作系统是操作系统不断更新的一个重要原因。

4.数据库管理系统

数据库管理系统(DataBaseManagementSystems,DBMS)是20世纪60年代后期产生并发展起来的,它是计算机科学中发展最快的领域之一。数据库管理系统是一系列软件程序的集合,它以规范、一致的方式存储数据,以规范、一致的方式将数据组织成记录,并允许用规范、一致的方式存取记录。

在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据,它必须先将请求提交给DBMS,由DBMS负责从存储介质检索数据并提供给应用程序使用。因此,一个数据库管理系统就是应用程序与数据间的接口。

(二)应用软件

应用软件是用户为解决某种应用问题而编制的程序,如科学计算程序、自动控制程序、工程设计程序、数据处理程序、情报检索程序等。随着计算机的广泛应用,应用软件的种类和数量将越来越多,应用软件一般可分为通用应用软件(如文字处理软件MicrosoftWord等)和专用应用软件(如企业的财务管理系统、人事管理系统等)。

通用软件是某些具有通用信息处理功能的商品化软件,是指事先写好、有完整的程序代码,并且可以在市场中购买的一组程序。它的特点是通用性,因此可以被许多有类似应用需求的用户所使用。比较典型的通用软件有文字处理软件、表格处理软件、数值统计分析软件、财务核算软件、数据管理软件、集成包软件、电子邮件、网络浏览器与群件等。

专用软件是满足用户特定要求的应用软件。在用户对数据处理的功能需求存在很大差异性、通用软件不能满足要求时,需要专业人士采取单独开发的方法,为用户开发具有特定要求的专门应用软件,如为某公司定制的人力资源管理信息系统,如为某服装企业定制的服装连锁店管理软件,服装批发管理软件服装PDA点货系统等。

三、数据通信技术

通信技术是信息技术的另一个重要组成部分。数据通信是20世纪50年代后期随着电子计算机的广泛应用而发展起来的。数据通信系统是以计算机为中心,结合分散在远程的终端装置或其他计算机,通过通信线路彼此连接起来,进行数据的传输、交换、存储和处理的设备总称。数据通信系统模型如图2—3所示。

第二节数据管理技术

一、数据描述及层次组织
信息系统中的信息是从客观事物出发,经过人的综合归纳,抽象成计算机能够接受的信息,流经数据库,通过控制决策机构,最后用来指导客观事物。数据描述是数据处理中的一个重要环节,从事物的特性到计算机中的具体指示,信息实际上经历了几个领域:现实世界、信息世界和计算机世界。在这三个领域中对信息的描述采用不同的术语,三个领域的关系如图2—4和图2—5所示。

在不同的世界中使用的概念和术语是不同的,但它们在转换过程中都有一一对应的关系,如表2—1所示。

1.现实世界

现实世界是存在于人们头脑之外的客观世界,由客观事物及其相互联系组成。其使用的术语有:

(1)客观事物:实际存在的人和事物,如学校、各教学单位、教师、学生等;也可以是事物与事物之间的联系,如教师和学生、教学管理等。

(2)事物特征:每一个事物都具有特性,事物通过自身特性与其他事物相区别。例如,教师的特征有姓名、性别、学历、职称等。事物特征有名和值之分,具有相同特性的事物属于同一个事物类。

2.信息世界

信息世界中的信息是客观世界中实体的特性在人们头脑中的反映,用一种人为的文字、符号、标记来表示。其使用的术语有:

(1)实体:现实世界中客观存在并相互区别的事物称为实体。它可以指物,也可以指人;可以指实际的东西,也可以指概念性的东西。

(2)实体集:现实世界中的事物类,在信息世界中称为实体集,是同类实体的集合。

(3)属性:现实世界中事物的特征就是实体的属性。属性也有名和值之分,属性名用来划分实体所属的实体集,属性值则是某个实体在该属性下的具体表现。属性值的集合统称为属性的域。如对学生实体而言,姓名、学号、年龄、性别、年级、管理信息系统成绩等都是他们的属性。

(4)实体标识符:用于和同类实体相互区分的属性集合(不含多余的属性)称为实体标识符。

3.计算机世界
计算机世界又称为数据世界。由于计算机只能处理数据化的信息,因此必须对信息进行数据化处理。计算机系统的数据通过一定的逻辑层次来描述,也按一定的层次组织,从位、字节、字段、记录、文件到数据库和数据仓库。其层次结构如图2—6所示。

(1)字段:标记实体属性的命名单位称为字段(Field)或数据项,是组成数据系统的有意义的最小基本单位。例如,产品有产品名、材质、产品数量、价格等字段;学生有学号、姓名、性别、年龄、院系、专业等字段。

(2)记录:字段的有序集合称为记录(相当于前面提到的数据元素)。一般用一个记录描述一个实体。例如,一个学生记录由有序的字段集组成:20090101、张三、男、19、管理学院、工商管理。能唯一标识文件中每个记录的字段集称为文件的主键,如学生学号。

(3)文件:同一类记录的集合称为文件。文件是描述实体集的,例如,所有学生记录组成了一个学生文件。(4)数据库:按一定方式组织起来的逻辑相关的文件集合形成数据库。数据库技术的出现,把数据的组织推向了顶峰,它改进了文件组织形式的不足,形成一个综合的集成化的数据集合。所以,数据组织的层次由低到高依次为:字段一记录一文件一数据库。

如图2—5所示,概念模型是现实世界到计算机世界的一个中间层次。现实世界的事物反映到人的大脑中,人们把这些事物抽象为一种既不依赖于具体的计算机系统又不为某一数据库管理系统支持的概念模型,概念模型的表示方法有很多,最常用的是实体一联系方法,该方法用E—R模型来描述现实世界的概念模型。E—R模型提供了表示实体、属性和联系的方法:

·实体:用矩形表示,矩形框内写明实体名。

·属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。

·联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)。

一个记录描述一个实体。一个实体可以指一个事物,也可以指“事物”与“事物”之间的联系。每个实体具有的某种或若干种特性或特征称为一个属性。例如,订货号、订货日期、订货数量是订货实体中的各个属性。

现实世界中,事物是相互联系的,这种联系必然在信息世界中体现出来,即实体是相互联系的。两个不同实体间的联系有以下三种情形:

(1)一对一联系,记为1:1。例如,班级与班长之间、工厂与厂长之间、科研任务与科研组组长之间等都是1:1的联系。

(2)一对多联系,记为1:n。例如,一个学校有若干学生,而每个学生都在一个学校学习,学校与学生之间是一对多的联系。

(3)多对多联系,记为m:n。例如,商店与商品、课程与学生之间,一个学生可选多门课程,而每一门课程可有多个学生选修,课程与学生之间是多对多的联系。图2—7是一个学生管理系统中学生选课管理子系统概念模型的E—R模型图。有关E—R模型的其他相关知识将在第六章的数据库设计中进行详细讲解,请读者参考。

二、数据管理技术的发展过程

一个有效的管理信息系统能够及时准确地提供相关信息,而这些信息是存储在计算机文件中的。只有当文件被适当地安排和维护时,用户才能很容易地访问和检索他们所需要的信息。如果在图书馆查找相关资料时曾使用过索引卡片,你就会发现文件管理的重要性。同样,对于组织来说,也需要好的文件组织和管理,否则会导致信息处理混乱、费用大,而且效益也会不好。即使用了优良的硬件和软件,如果没有文件管理,一些机构的信息系统也不会起到相应的作用。

为了保证信息的及时|生、准确性、完整性和可靠性,需要用科学的方法和先进的技术来管理信息和数据。怎样把各种数据组织起来,使计算机能有效而方便地处理加工,是数据管理技术要解决的问题。随着计算机硬件技术、软件技术的发展,数据库技术的发展也由低级到高级、由简单到逐步完善。数据管理技术的发展可归纳为三个阶段:人工管理、文件系统和数据库管理系统。

(一)人工管理(20世纪50年代中期以前)

这一阶段计算机主要用于科学计算,数据量不大,一般不需要将数据长期保存,只在输入程序的同时输入数据.夕h部存储器只有磁带、卡片和纸带等;由于还没有操作系统,也没有数据管理方面的软件,程序员在设计程序时不仅要规定软件的逻辑结构,而且还要设计其物理结构,使得程序与数据相互依赖,一旦数据的存储方式稍有改变,就必须修改相应程序;只有汇编语言的数据处理方式基本是批处理。人工管理阶段的工作原理如图2—8所示。这个阶段有如下几个特点:

(1)计算机系统不提供对用户数据的管理功能。用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等。程序和数据是一个不可分割的整体,数据无独立性,脱离了程序就无任何存在的价值。

(2)数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享。即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加入这组数据。由于这组数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费了存储空间。

(3)不单独保存数据。由于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则就毫无用处,所以,所有程序的数据均不单独保存。

早期的计算机上没有完善的操作系统,数据的一切组织管理完全依靠人工完成,难以处理复杂的数据处理任务。显然,由人工在繁杂的案卷中查找和使用数据是相当费时和麻烦的事,于是很快就被先进的文件系统所代替。

(二)文件系统(20世纪50年代后期到60年代中期)

在这一阶段,计算机不仅用于科学计算,还应用于信息管理方面。随着数据量的增加,数据的存储、检索和维护成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备,软件领域也出现了操作系统和高级软件。文件管理系统对文件进行统一管理,它提供各种例行程序对文件进行查询、修改、插入、删除等操作。程序员可以集中精力研究算法,而不必过多地考虑数据存储的物理细节。文件系统的工作原理如图2—9所示。通常文件具有逻辑结构和物理结构。文件的逻辑结构描述文件中各记录之间的相互关系,或每个记录在文件中的位置。一个具有逻辑结构的文件,其每个记录在文件中都有确定的位置。文件的物理结构是为体现逻辑结构服务的,从用户的角度看,每个文件的逻辑结构呈现出一定的形式,第一个位置上是什么记录、第二个位置上是什么记录……这些只是虚拟概念,但是任何虚拟最终都要用实体来体现,怎样存储这些记录来体现文件的记录之间的位置关系呢?这就用到了物理结构。当你有了一个逻辑上的文件后,计算机为这个文件分配磁盘,并将其存人磁盘,这种分配方式,要保证从磁盘上将文件读出来后,仍具有逻辑上的一致性。这就是说,文件在外存上存储时,分配方式要保证文件在逻辑上一致。所以物理结构就是指逻辑文件在这些分配方式下所形成的文件结构。

用文件的组织方式管理数据,文件的逻辑结构与物理结构分开,使程序与数据具有一定的独立性,即数据的处理与数据的物理存储无关。但随着数据管理规模的扩大,数据量急剧增加,文件系统也显露出一些缺陷:

(1)数据冗余。文件由记录组成,记录是数据存取的基本单位。一个文件对应一个或几个程序,如果一个程序想用几个文件中的数据产生一个新的报表,则必须重新编写程序。由于各个应用程序各自建立自己的数据文件,因此各个文件之间不可避免地会出现重复项,造成数据冗余。

(2)不一致。这往往是由于数据冗余造成的。在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。例如,银行中商业贷款、业务交易、存款业务可能会收集同样客户的信息。因为客户信息在不同部门被收集和维护,所以同一个数据项在不同部门组织中有不同的意义。

(3)数据联系弱。由于不同文件中信息在不同部门之间是不能相互联系的,文件之间相互独立,缺乏联系,灵活性差。文件系统经过全面设计后可以提供日常事务的处理,但是对于特别报告或非预期的信息需求,系统则不能及时处理。文件系统阶段是数据管理技术发展中的一个重要阶段。由于有了直接存取设备,文件类型已经多样化,有了索引文件、链接文件、直接存取文件等,而且能对排序文件进行多码检索。在这一阶段中,数据结构和算法丰富了计算机科学,为数据管理技术的进一步发展打下了基础。

(三)数据库管理系统(20世纪60年代后期至今)

随着计算机在管理中的应用更加广泛,数据量急剧增大,对数据共享的要求越发迫切;大容量磁盘已经出现,联机实时处理业务增多;软件价格在系统中的比重日益上升,硬件价格大幅下降,编制和维护应用软件所需成本相对增加。在这种情况下,为了解决多用户、多应用程序共享数据的需求,使数据为尽可能多的应用程序服务,出现了数据库系统。它把所有应用程序中使用的数据汇集起来,以记录为单位存储,在数据库管理系统的监督和管理下使用。因此,数据库中的数据是集成的,每个用户享用其中的一部分,克服了文件系统的缺陷,提供了对数据更高级、更有效的管理。数据库系统的原理如图2—10所示。概括起来,数据库系统阶段的数据管理具有以下特点:

(1)面向全组织的复杂数据结构。数据库中的数据结构不仅描述了数据本身,而且描述了整个组织数据之间的联系,实现了整个组织数据的结构化。

(2)数据冗余度小,易于扩充。由于数据库从组织的整体来看待数据,数据不再是面向某一特定的应用,而是面向整个系统,减少了数据冗余和数据之间不一致的现象。在数据库系统下,可以根据不同的应用需求,选择相应的数据加以使用,使系统易于扩充。

(3)数据与程序独立。数据库系统不仅提供了数据的存储结构与逻辑结构之间的映射功能,而且提供了数据的总体逻辑结构与局部逻辑结构之间的映射功能,从而使得当数据的存储结构改变时,逻辑结构保持不变,或者当总体逻辑结构改变时,局部逻辑结构可以保持不变,从而实现了数据的物理独立性和逻辑独立性,把数据的定义和描述与应用程序完全分离开。

(4)统一的数据控制功能。数据库系统提供了数据的安全性控制(Security)和完整性控制(Integrity),允许多个用户同时使用数据库资源。数据库的上述特点,使得信息系统的研制从围绕加工数据的以程序为中心转移到围绕共享的数据库来进行,实现了数据的集中管理,提高了数据的利用率和一致性,从而能更好地为决策服务。因此,数据库技术在信息系统应用中正起着越来越重要的作用。

三、数据库技术

数据库技术应用中,经常用到的基本概念有:数据库(DB)、数据库管理系统(DBMS)、数据库系统(DBS)、数据库技术及数据模型。

(一)数据库概述

1.数据库

数据库是以一定的方式存储在计算机内有组织的、统一管理的相关数据的集合。从完整意义上讲,数据库是表、视图和链接等的集合。数据库能为各种用户共享,冗余小,数据间联系紧密而且有较高的独立性。

2.数据库系统

数据库系统是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软硬件和数据资源组成的系统,即它是采用数据库技术的计算机系统。数据库系统的组成部分包括计算机系统、数据库、数据库管理系统和有关人员。

(1)计算机系统。计算机系统是指用于数据库管理的计算机硬软件系统。数据库需要大容量的主存用以存放和运行操作系统、数据库管理系统程序、应用程序以及数据库、目录、系统缓冲区等,辅存方面则需要大容量的直接存取设备。此外,系统应具有较高的网络功能。

(2)数据库。数据库既有存放实际数据的物理数据库,也有存放数据逻辑结构的描述数据库。

(3)数据库管理系统。数据库管理系统是一组对数据库进行管理的软件,通常包括数据定义语言及其编译程序、数据操纵语言及其编译程序以及数据管理例行程序。

(4)人员。开发、管理和使用数据库系统的人员主要有:数据库管理员(DBA)、系统分析员和数据库设计人员、应用程序员和最终用户。不同的人员涉及不同的数据抽象级别,具有不同的数据视图,其各自的职责分别是:

·数据库管理员。为了保证数据库的完整性、正确性和安全性,必须有人来对数据库进行有效的控制。行使这种控制权的人叫数据库管理员,他负责建立和维护模式,提供数据的保护措施和编写数据库文件。

·系统分析员和数据库设计人员。系统分析员负责应用系统的需求分析和规范说明,要和用户及DBA相结合,确定系统的硬件软件配置,并参与数据库系统的概要设计。数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。数据库设计人员必须参加用户需求调查和系统分析,然后进行数据库设计。在很多情况下,数据库设计人员就由数据库管理员担任。

·应用程序员。负责编制和维护应用程序,如库存控制系统、工资核算系统等。

·最终用户。最终用户通过应用程序的用户接口使用数据库。常用的接口方式有浏览器、菜单、表格操作、图形显示、报表书写等,给用户提供简明直观的数据表示。

3.数据库管理系统

数据库管理系统是位于用户与操作系统之间的一层数据管理软件,它充当应用程序和物理数据文件的接口,为用户或应用程序提供访问数据库的方法,包括数据库的建立、查询、更新及各种数据控制等。例如,当应用程序需要一个数据项,DBMS会在数据库中查找这一数据项,并把它提供给应用程序。

可以用图书管理来通俗地解释数据库管理系统。图书管理员在查找一本书时,首先要通过目录检索找到那本书的分类号和书号,然后在书库里找到那一类书的书架,并在那个书架上按书号的大小次序查找,这样很快就能找到借书人所需要的那本书。如果所有的书都不按规则,胡乱堆在各个书架上,那么借书的人就很难快速找到他们想要的书。数据库里的数据像图书馆里的图书一样,也要让人能够很方便地找到才行。人们将越来越多的资料存入计算机中,并通过一些编制好的计算机程序对这些资料进行管理,这些程序后来被称为“数据库管理系统”。它们可以管理输入到计算机中的大量数据,就像图书馆的管理员。

数据库管理系统由三个部分组成:数据定义语言、数据操纵语言和数据字典。

(1)数据定义语言是程序员用于确定数据库内容和结构的规范化语言。数据定义语言在数据被转换为应用程序所需要的格式前,定义了数据库中出现的每个数据元素。

(2)数据操纵语言。数据操纵语言结合一些传统的第三代或第四代程序语言去操纵数据库中的数据。它包含一些命令,允许终端用户和程序设计专家从数据库中获取数据来满足信息需求和开发应用系统,常用的如第四代程序设计语言:结构化查询语言(SQL)。

(3)数据字典(DD)。数据字典中存放着对数据库体系结构的描述,是一种自动或人工文件。它存储数据元素的定义和数据特征,如数据元素的用法、所有权、授权和安全性。对于应用程序的操作,DBMS都要通过查阅数据字典进行。数据字典中还存放数据库运行时的统计信息,如记录个数、访问次数等。

数据库管理系统的功能包括如下几个方面:

(1)数据定义:DBMS提供数据定义语言(DataDefinitionLanguage,DDL),供用户定义数据库的三级模式结构、两级映像以及完整性约束和保密限制等约束。DDL主要用于建立、修改数据库的库结构。DDL所描述的库结构仅仅给出了数据库的框架,数据库的框架信息被存放在数据字典中。

(2)数据操作:DBMS提供数据操作语言(DataManipulationLanguage,DML),供用户实现对数据的插入、删除、更新、查询等操作。

(3)数据库的运行管理:数据库的运行管理功能是DBMS的运行控制、管理功能,包括多用户环境下的并发控制、安全性检查和存取限制控制、完整性检查和执行、运行日志的组织管理、事务的管理和自动恢复,即保证事务的原子性。这些功能保证了数据库系统的正常运行。

(4)数据组织、存储与管理:DBMS要分类组织、存储和管理各种数据,包括数据字典、用户数据、存取路径等,需确定以何种文件结构和存取方式在存储器上组织这些数据,如何实现数据之间的联系。数据组织和存储的基本目标是提高存储空间利用率,选择合适的存取方法提高存取效率。

(5)数据库的保护:数据库中的数据是信息社会的战略资源,所以数据的保护至关重要。DBMS对数据库的保护通过4个方面来实现:数据库的恢复、并发控制、完整性控制和安全性控制。

·数据库的恢复:在数据库破坏或数据不正确时,系统有能力把数据库恢复到正常状态。

·数据库的并发控制:在多个用户同时对同一个数据进行操作时,系统应能加以控制,防止数据库被破坏,杜绝提供给用户不正确的数据。

·数据库的完整性控制:系统保证数据库中的数据及语义的正确性和有效性,防止任何会对数据造成错误的操作。例如,预订同一班飞机的乘客不能超过飞机的定员数;订购货物中,库存量不能小于发货量。使用数据库管理系统提供的存取方法,设计一些完整性规则,对数据值之间的联系进行校验,可以保证数据库中数据的正确性。

·数据库的安全性控制:系统能防止未经授权的用户存取数据库中的数据,以避免数据被泄露、更改或破坏。例如,在一个公民档案数据库中,只有被授权的访问者才可以读取数据,并进行修改,其他访问者的权限一般限于浏览特定的数据项,而不是全部数据。
(6)数据库的维护:这一部分包括数据库的数据载入、转换、转储、数据库的重组与重构以及性能监控等功能,这些功能分别由各个应用程序来完成。

(7)数据通信:DBMS具有与操作系统的联机处理、分时系统及远程作业输入的相关接口,负责处理数据的传输。对网络环境下的数据库系统,还应该包括DBMS与网络中其他软件系统的通信功能以及数据库之间的互操作功能。

(二)数据模型

数据模型是对客观事物及其联系的数据化描述。在数据库系统中,对现实世界中数据的抽象、描述以及处理等都是通过数据模型来实现的。数据模型是数据库系统设计中用于提供信息表示和操作手段的形式构架,是数据库系统实现的基础。目前,在实际数据库系统中支持的数据模型主要有三种:层次模型、网状模型和关系模型。

1.层次模型

层次模型是数据库系统中最早出现的数据模型,它用树形结构表示各类实体以及实体间的联系。层次模型数据库的典型代表是IBM公司的信息管理系统(InformationManagementSystem,IMS),这是一个曾经被广泛使用的数据库管理系统。如果用图来表示,层次模型是一棵倒立的树。这种树具有如下特征:
(1)树的最高位结点只有一个,称为根;

(2)根以外的其他结点只有一个父结点与它相连,同时还可能有一个或多个子结点与它相连;

(3)没有子结点的结点称为叶,它处于树的末端。

在现实世界中,许多实体之间本身就存在着一种自然的层次关系,如家族关系、行政关系等,图2~11表示某学院行政机构的层次模型。用层次模型来表示“1:1”和“1:m”的关系是简单清晰的。但是,想要用层次模型来表示“m:n”关系就比较复杂,首先必须设法将这种关系分解为“1:m”的关系,然后用层次模型来表示。

2.网状模型

网状模型是用网络来表示实体之间联系的模型。它与树型结构相比,具有如下特征:

(1)可以有一个以上的结点无父结点;

(2)至少有一个结点有多于一个的父结点。

显然,层次模型是网状模型的特殊形式,网状模型是层次模型的一般结构。图2—12表示网状模型的一般形式。网状模型与层次模型的不同之处主要表现在:在层次模型中,从子结点到父结点的联系是唯一的;而在网状模型中,从子结点到父结点的联系不是唯一的。相对于描述“1:1”和“1:m”关系的层次模型,网状模型则能够描述“m:n”关系。网状模型的典型代表是CODASYL委员会下属的DBTG小组发表的DBTG报告。它于1968年提出,后经多次修改完善。在这个报告的指导下,很多计算机公司推出了基于网状模型的数据库管理系统。

3.关系模型

关系模型是目前使用最广泛的一种模型。一般来说,用二维表格数据的形式来表示实体与实体之间联系的模型称为关系模型。它与人们日常生活中所接触到的表格是类似的。例如,在物资销售中常用到如表2—2、表2—3、表2—4所示的登记表。从表2—4可以看出,它解决了“用户”和“物资”之间“m:n”的关系。通过这个表,可以查出哪家单位购买了何种物资,何种物资被哪些单位购买。如果要想进一步了解某物资或某单位的详细资料,可以到表2—2和表2—3中去查找。值得注意的是,在层次模型和网状模型中,文件中存放的是实体数据,各个数据之间是通过指针来连接的,而在关系模型中,文件中存放有两类数据:一是实体本身的数据,二是实体间联系的数据。

关系模型把数据看成是二维表中的元素,一个表是一个关系,表中的每一行称为一个元组,它相当于一个记录值,表中的每一列是一个属性值集,属性的取值范围称为域,属性相当于数据项或字段。关系具有如下性质:
(1)关系中的每一列属性都是不能再分的;

(2)一个关系中的各列都被指定了相异的名字;

13)各行相异,不允许重复;

14)行、列的次序均无关;

15)每个关系都有唯一一个标识各元组的主关键字,它可以是一个属性或属性的组合。

关系模型是三种数据模型中最重要的模型。20世纪80年代以来,计算机系统商推出的数据库管理系统几乎全部是支持关系模型的。关系模型是建立在数学概念的基础上的应用关系代数和关系演算等数学理论处理数据库系统的方法。应用这类方法进行数据处理,最早是从1962年CODSYL发表的“信息代数”开始的,其后,1968年大卫·蔡尔德(DavidChild)在7090机上实现了“集合论的数据结构”(Set—theoreticDataStructure),但系统而严格地提出关系模型的是美国IBM公司的科德(E。F.Codd)。他从1970年起连续发表了多篇论文,奠定了关系数据库的理论基础。从用户的观点来看,在关系模型下,数据的逻辑结构是一张二维表。每一个关系为一张二维表,相当于一个文件。实体间的联系均通过关系进行描述。

关系模型中,用户对数据的检索和操作实际上是从原二维表中得到一个子集,该子集仍是一个二维表,因而易于理解,操作直接、方便,而且由于关系模型把存取路径向用户隐藏起来,用户只需指出“做什么”,而不必关心“怎么做”,从而大大提高了数据的独立性。

由于关系模型概念简单、清晰、易懂、易用,并有严密的数学基础以及在此基础上发展起来的关系数据理论,简化了程序开发及数据库建立的工作量,因而迅速获得了广泛的应用,并在数据库系统中占据了统治地位。

(三)数据库设计

数据库是信息系统的核心部分,数据库的设计在管理信息系统的开发中占有重要的地位。数据库设计的质量将影响信息系统的运行效率及用户对数据使用的满意度。创建数据库必须履行两种设计原则:概念设计和实体设计。概念设计是按企业观点来建立数据库中的抽象模型,实体设计则表示数据库是如何实际安装在直接存储设备中的。数据库设计包含两方面的内容:一是数据模型与数据库结构的设计,二是应用程序的设计。在数据模型与数据库结构设计时,要汇总各用户的要求,尽量减少冗余。实现数据共享,设计出满足各用户的统一的数据模型。它可以分为需求分析、逻辑设计、物理设计、应用程序设计及测试、性能测试及企业确认、装配数据库等几个步骤。其中,需求分析部分是在对被设计对象进行调查研究的基础上提出的对系统的描述形式,它不依赖于任何形式的数据库管理系统。逻辑设计与物理设计部分是在需求分析的基础上,将系统描述形式转换成与选用的数据库管理系统相适应的数据模型。

数据库设计的步骤及过程将在第六章进行详细讲解。

第三节计算机网络

计算机网络是管理信息系统运行的基础。由于一个企业或组织中的信息处理都是分布式的,把分布式信息按其本来面目由分布在不同位置的计算机进行处理,并通过通信网络把分布式信息集成起来,是管理信息系统的主要运行方式,因而,计算机网络是管理信息系统的基本技术。

一、计算机网络的概念与分类

(一)计算机网络的概念及组成

计算机网络是用通信介质把分布在不同地理位置的计算机和其他网络设备连接起来,实现信息互通和资源共享的系统。计算机网络从逻辑功能上可分为两部分:通信子网和用户资源子网。前者负责数据通信,后者负责数据处理,两者之间通过网络协议进行有机结合,完成所承担的功能。计算机网络的一般组成结构形式如图2—13所示。通信子网是计算机网络的内层,它由通信结点和通信链路组成。通信结点通常是一台专用通信处理机,它的作用包括如下三个方面:

(1)作为用户资源子网的接口,负责收发本地计算机或终端用户的信息。

(2)转发其他结点或网络的信息。

(3)对网络信息流进行控制,避免出现网络拥挤现象。

通信链路是通信结点之间的通信通道,它通常是双绞线、同轴电缆、光缆等。
用户资源子网负责网络的数据处理工作,它通常包括主计算机、终端控制器、终端以及其他资源。主计算机存有大量数据处理资源和数据存储资源,供网络用户访问。终端控制器负责对多个终端实施控制,包括链路的管理和信息的装拆。终端是用户进入网络的设备,如键盘、CRT显示器、电传打字机等。

(二)计算机网络的分类

1.根据网络规模和覆盖范围进行分类,可以把网络分为局域网、城域网和广域网

(1)局域网(LocalAreaNetwork,LAN)。局域网是指用高速通信线路将某建筑区域内或单位内的计算机连接在一起的专用网络,其作用范围一般只有几公里,工作速率大于10Mbit/s,甚至可以达到1Gbit/s。

LAN可以使用各种通信介质,如传统的电话线、同轴电缆甚至无线系统来连接计算机工作站和计算机外围设备。大多数LAN使用一台带有大容量硬盘的高性能微机作为文件服务器,服务器上安装控制通信及网络资源使用的网络操作系统。LAN的小范围分布和高速传输,使它很适合于一个部门内部的数据管理。如今,LAN已经变成组织内办公室、部门及其群体提供网络通信能力的共享系统。

(2)城域网(MetropolitanAreaNetwork,MAN)。城域网出现于20世纪90年代初。城域网可以认为是一种大型的LAN,其作用范围在100km左右,能覆盖一个城市,其主干网的工作速率可达数百Mbit/s。可将政府部门、事业单位、社会服务机构以及大型企业等重要机构进行联网,实现数字、声音、图像、视频和动画的信息交换。但城域网不同于局域网,它的服务范围不同:城域网作用于整个城市,在其建设过程中更多地集中在对通信子网的建设中,是本市用户连接世界的桥梁;而局域网则是服务于某个部门,其建设通常包括资源子网和通信子网两个部分。

(3)广域网(WideAreaNetwork,WAN)。广域网又称为远程网,它的作用范围通常是几十到几千公里,其工作速率可从1.2Kbit/s到上百个Mbit/s。WAN通信网络覆盖的范围相当广,如一个省、一个国家乃至全球。这种网络可称为信息载体,是政府部门以及终端用户日常生活、活动所必不可少的工具。因此,WAN被制造业、银行、商业、运输业及政府部门用于传送和接收其雇员、顾客、供应商及其他组织、企业的信息。例如,中国教育科研网就是广域网。广域网的典型代表是Internet,它是通过TCP/IP协议把不同国家和部门机构的内部网络连接起来的庞大的计算机网络。Internet不仅把全球成千上万个组织和网络连接起来,而且还拥有极其丰富的信息资源,能提供多样化的、多领域的和多种形式的信息服务。

2.按网络的应用范围进行分类,可以把网络分为公用网和专用网

(1)公用网。公用网是由政府出资建设、由电信部门统一管理和控制的网络。网络中的传输和交换装置可以租给任何部门使用,部门的局域网就可以通过公用网络连接到广域网上,实现信息的扩展。公用网又分为公用电话网(PSTN)、公用数据网(PDN)、数字数据网(DDN)和综合业务数据网(ISDN)等类型。公用网常采用分级结构,在首都、省会、各市和县分别成立交换中心,形成树形结构。

(2)专用网。专用网由一个单位或一个部门承建,属于该单位或部门,没有被授权的单位或部门无法使用。专用网也可以租用公用网的传输线路,其建设费用往往很高。我国的金融、军队和石油等部门均建立了自己的专用网。

3.按网络传输介质进行分类,可以把网络分为有线网和无线网

有线网是通过电缆或光缆将主机连接在一起的,无线网是通过自然空间的电磁波连接在一起的。例如,在一个展览厅或交易厅里可用蜂窝式无线电话组成一个计算机网络,在200~300m的范围内传输速率在1M~2Mbit/s;在轮船或火车上可使用便携式计算机通过蜂窝式无线电话与Internet通信;另外,通过卫星和地面站也可组成无限广域网。

二、计算机网络的拓扑结构及网络介质、网络互联设备

(一)计算机网络的拓扑结构

拓扑学是几何学的一个重要分支,它将实体抽象成为与其形状、大小无关的点,将物体之间的连接线路抽象成与距离无关的线,进而研究点、线、面之间的关系。连接在网络上的计算机、大容量磁盘、高速打印机等部件,均可看作网络上的一个节点。所谓网络拓扑结构,是指网络的链路和节点在地理上所形成的几何结构。局域网的拓扑结构主要有总线型、星型和环型等,图2—14显示了计算机网络的拓扑结构。
1.总线型

在总线型拓扑结构中,所有的工作站都连接在一条总线上,通过这条总线实现通信。总线结构是目前局域网采用最多的一种拓扑结构。在总线结构中,所有网上设备都通过相应的硬件接口直接连在总线上,任何一个节点的信息都可以沿着总线向两个方向传输扩散,并且能被总线上的任何一个节点所接收,整个网络上的通信处理分布在多个节点上,减轻了网络管理控制的负担。

其优点是:结构简单,非常便于扩充,设备量少,价格相对较低,安装使用方便。

其缺点是:一旦总线的某一点出现接触不良或断开,整个网络将陷于瘫痪,故障也难以定位和监控,实际安装时要特别处理好总线的各个接头。
2.星型

星型结构布局是将所有的工作站都直接连接到一个中央节点上,当一个工作站要传输数据到另一个工作站时,都需要通过中央节点,它负责管理和控制所有的通信。中央节点执行集中式通信控制策略,相邻节点通信也要通过中央节点。星型结构是目前小型局域网中使用较为普遍的一种拓扑结构。基于交换机的网络普遍采用星型结构,以程控交换机为中央节点,其他交换机通过程控交换机进行通信。

其优点是:结构简单,系统稳定性好,增加新的工作站时成本低,一个工作站出现故障不会影响到其他工作站的正常工作,故障率低,易于管理。其缺点是:中央节点不能出故障,必须具有较高的可靠性,一旦中央节点出现故障,整个网络就会瘫痪。

3.环型

环型拓扑结构中每个节点连接形成一个闭合回路,数据可以沿环路单向传输,也可以设置两个环路实现双向通信。环型网也是局域网常用的拓扑结构之一,适合于信息处理系统和工厂自动化系统。

其优点是:信息在网络中沿固定方向流动,两个节点间有唯一的通路,大大简化了路径选择的控制,当某个节点出现故障时,可以自动旁路,可靠性高,时间固定,实时性强。

其缺点是:由于信息是串行穿过多个节点环路接口,当节点过多时影响传输效率,使网络响应时间变长。由于整个网络构成闭合环,故网络扩充起来不太方便。网络中一旦某个节点发生故障,可能导致整个网络停止工作。

(二)网络的传输介质和互联设备

1.数据通信基础数据通信是指通过数据通信系统,将数据以某种信号方式从一处安全、可靠地传输到另一处。数据通信包括数据传输和数据在传输前后的处理。

(1)数据。数据被定义为有意义的实体,有模拟数据和数字数据两种形式。模拟数据是指在某个区间产生的连续值,如声音和视频图像、温度和血压等都是连续变化的值;数字数据是指在某个区间产生的离散值,如文本信息和整数数列等。

(2)信号。信号是数据的表示形式,或称数据的电磁或电子编码。它使数据能以适当的形式在介质上传输。信号也有模拟信号和数字信号两种基本形式。模拟信号是一种连续变化的电信号,可以按照不同频率在不同介质上传输。数字信号是一种离散的脉冲序列,如计算机的输出、数字仪表的测量结果等。它用恒定的正负电压表示二进制的l和0。这种脉冲序列可以按照不同的速率在有线介质上传输。

(3)传输。数据传输是指用电信号把数据从发送端传送到接收端的过程。一般来说,模拟数据是时间的连续函数,并且占有一定的频谱范围,典型的例子是模拟电话传输系统。数字数据也可以用模拟数据来表示,以便在模拟信道上进行传输。这要使用调制解调器,把数字数据调制成与模拟信道特性相匹配的模拟信号进行传输。调制解调器的作用是通过一个载波频率把二进制的电压脉冲序列调制转换成模拟信号,使这些数据能够适合在音频电话线路上传输。在线路的另一端,再由调制解调器把模拟信号解调还原成原来的数据。数字数据也可以直接表示成数字信号进行传输。

传输信道给数据信号传输提供了通路,又会引入噪声和干扰,使信号发生畸变,可能造成数据传输的差错。通常在传输一定距离之后,模拟信号都会衰减和畸变。为了实现长距离的传输,在模拟传输系统中使用放大器来增强信号的能量,但这同时也放大了信号中的噪声,其结果会导致信号发生畸变,严重时会导致传输错误。

为了延长传输距离,数字传输系统使用中继器来克服衰减和畸变。中继器将接收到的数字信号经过整形恢复后,再将信号以新的面目发送出去,从而克服了信号的畸变和衰减。

在局域网中,主要使用数字传输技术。在广域网中,过去以模拟传输为主。随着光纤通信技术的发展,广域网中越来越多地采用数字传输技术,它在传输质量和成本上都优于模拟传输。

(4)节点。节点(Node)可以分为两类,即转接节点和访问节点。转接节点的作用是支持网络的连接J陛能,它通过所连接的链路来转接信息。这类节点有集中器、多路转接器等。访问节点除了具有连接的链路以外,还包括计算机和终端设备。它可起到信源(发信点)和信宿(收信点)的作用。访问节点也称为端点(EndPoint)。

(5)终端。终端设备是用户进行网络操作时所使用的设备,它的种类很多,但根据其不同的用途和结构,大体上可以分成简易终端、智能终端和虚拟终端三类。

(6)主机。主机(Host,是指主计算机系统)在计算机网络中负责数据处理和网络控制,同时还要执行网络协议,和其他模块中的主机连接成网后构成网络中的主要资源。在硬件方面,主机要有足够的存储容量和处理速度,具有齐全的外部设备,特别是文件的外存储设备;在软件方面要求提供支持网络的操作系统,并有丰富的语言处理软件。

2.网络传输介质

传输介质是网络中连接收发双方的物理通道,也是通信中实际传送信息的载体。网络中常用的传输介质有如下几种:

(1)双绞线。双绞线是最传统、应用最普遍的传输介质,如电话线。它由按规则螺旋结构排列的两根、四根或八根绝缘导线组成。一对线可以作为一条通信线路,各个线对螺旋排列的目的是为了使各对线之间的电磁干扰最小。局域网中所使用的双绞线分为两类:屏蔽双绞线(STP)和非屏蔽双绞线(UTP),可用于点对点连接,也可用于多点连接。双绞线用作远程中继线时,最大距离可达15km;用于传输速率为10Mbit/s的局域网时,与集线器的最大距离为100m。双绞线的线路损失大,传输速率低,并且抗干扰能力较弱,但由于其价格便宜、易于安装以实现结构化布线,传输数字信号的距离可达几百米,因此在局域网中应用很普遍。双绞线的抗干扰性取决于一束线中相邻线对的扭曲长度及适当的屏蔽。

(2)同轴电缆。同轴电缆由内外两条导线组成,内导线是单股粗铜线或多股细铜线,外导线是一根网状空心圆柱导体,内外导线之间隔有一层绝缘材料,最外层是保护性塑料外皮。同轴介质的特性参数由内、外导体及绝缘层的电参数与机械尺寸决定。同轴电缆可以在较宽的频率范围内工作,抗干扰能力强,传输距离可达几公里,在早期计算机网络中被广泛采用。

(3)光纤。光纤电缆简称为光缆,是网络传输介质中性能最好、应用前途最广泛的一种。光纤是一种直径为50~100“m的柔软、能传导光波的介质,其中使用超高纯度石英玻璃纤维制作的光纤可以得到最低的传输损耗。在折射率较高的单根光纤外面,用折射率较低的包层包裹起来,就可以构成一条光纤通道;多条光纤组成一束,就构成一条光缆。其基本工作原理是:在发送端通过发光二极管,将电脉冲信号转换成光脉冲信号,在光纤中以全反射的方式传输,在接收端通过光电二极管将光脉冲信号转换还原成电脉冲信号。

由于光波的频率范围很广,所以光纤具有很宽的频带;光波在光纤中的传输几乎无损耗,可以在6~8km的距离内在不使用中继器的情况下实现高速率的数据传输。此外,由于是非电磁传输,无辐射,因此光纤的抗干扰能力很强,保密性好,误码率低。但光纤传输系统价格较贵,一般用作网络通信的主干线。

(4)无线传输。前面所讲述的三种介质都属于有线传输,但有线传输并不是在任何时候都能实现的。例如,通信线路要通过一些高山、岛屿,或者当公司临时在一个场地做宣传而需要联网时,这样就很难施工。即使是在城市中,挖开马路敷设电缆也不是一件容易的事。当通信距离很远时,敷设电缆既昂贵又费时。而且,我们的社会正处于一个信息时代,人们无论何时何地都需要及时的信息,这就不可避免地要用到无线传输。

可以在自由空间利用电磁波发送和接收信号进行通信就是无线传输。地球上的大气层为大部分无线传输提供了物理通道,这就是常说的无线传输介质。无线传输所使用的频段很广,人们现在已经利用了好几个波段进行通信。紫外线和更高的波段目前还不能用于通信。目前使用的无线通信的方法主要包括无线电短波、微波和卫星通信。

利用无线电短波电台进行数据通信是可行的。一般来说,短波的信号频率低于100MHz,它主要靠电离层的反射来实现通信,而电离层的不稳定所产生的衰落现象和电离层反射所产生的多径效应使得短波信道的通信质量较差。因此,当必须使用短波无线电台传输数据时,一般都是低速传输,速率为一个模拟话路每秒传几十至几百个比特。只有采用复杂的调制解调技术后,才能使数据的传输速率达到每秒几千比特。微波通信在数据通信中占有重要地位。微波的频率范围为300MHz~300GHz,但主要是使用2~40GHz的频率范围。由于微波在空间主要是直线传播,且穿透电离层而进入宇宙空间,因此它不像短波那样可以经电离层反射传播到地面上很远的地方。这样,微波通信就有两种主要的方式:地面微波接力通信和卫星通信。

由于微波在空间是直线传输,而地球表面是个曲面,因此其传输距离受到限制,一般只有50km左右。但若采用100m的天线塔,则距离可增大至lOOkm。为了实现远距离通信,必须在一条无线电通信信道的两个终端之间建立若干中继站。中继站把前一站送来的信号经过放大后再送到下一站,故称为“接力”。
微波接力通信可传输电话、电报、图像、数据等信息,其主要特点是:
·微波波段频率很高,其频段范围也很宽,因此其通信信道的容量很大;

·因为工业干扰和天气干扰的主要频谱成分比微波频率低得多,对微波通信的危害比对短波通信的危害小得多,因而微波传输质量较高;
·微波接力信道能够通过有线线路难以通过或不易架设的地区(如高山、水面等),故有较大的灵活性,抗自然灾害的能力也较强,因而可靠性较高;
·相邻站之间必须直视,不能有障碍物;

·隐蔽性和保密性较差。

卫星通信是在地球站之间利用位于36000km高空的人造同步地球卫星作为中继器的一种微波接力通信。通信卫星发出的电磁波覆盖范围广,跨度可达18000km,覆盖了地球表面三分之一的面积,三个这样的通信卫星就可以覆盖地球上的全部通信区域,这样地球各地面站之间就可以任意通信。

在卫星上可以安装多个转发装置,它以一种频率范围接收地面发来的信号,以另一种频率范围向地面站发出,其数据传输率约为50Mbps。国际上常用的频段为6/4GHz,也就是分别用(3.7~4。2)GHz和(5.925~6.425)GHz作为远程通信卫星向地面发送(下行)和地面站向上发送(上行)的频段,其频宽都是500MHz。由于这个频段已非常拥挤,因此现在也使用频率更高些的14/12GHz频段。每一路卫星信道的容量约等于10万条话频线路,可以将它看成大容量的电缆,且和发送站与接收站之间的距离无关。由于通信卫星是在太空的无人值守的微波通信中继站,因而其主要特点与地面微波通信类似,但有较大的传播延迟。

此外,也可使用红外线、毫米波或光波进行通信,但它们频率太高,波长太短,不能穿透固体物体,且很大程度上受天气的影响,因而只能在室内和近距离使用。

3.网络互联设备

网络互联的目的是使一个网络上的某一主机能够与另一网络上的主机进行通信,即使一个网络上的用户能访问其他网络上的资源,实现相互通信和交换信息。下面着重介绍管理信息系统建设中经常涉及的~些网络互联设备。

(1)中继器(Repeater)。中继器是计算机网络中最简单的设备,可以使相互联接的两个局域网间进行双向通信,扩展了网络电缆的长度。它的作用是清除噪声,放大整型信号,增加网段以延长网络距离。例如,总线型拓扑结构的局域网经常用中继器延长网段。

(2)集线器(Hub)。集线器相当于一个多口的中继器。它可以将局域网中的多台设备连接起来。

(3)网桥(Bridge)。网桥用于连接不同网络拓扑结构的网段。它可以进行协议转换,隔离网段,减少网络信息堵塞,使互联起来的局域网变成单一的逻辑网络,并具有自选路径的能力。

(4)路由器(Router)。路由器是比网桥更复杂的端口设备。它用于拓扑结构较复杂的网络互联。由于路由器工作在网络层,所以原则上它只能连接相同协议的网络,或者能在网络层互操作的网络。它对异构网的互联能力较强,既可用于广域网互联,也可用于局域网互联。路由器工作在网络层,它根据路由表传送信息。

(5)网关(Gateway)。网关又称为协议转换器,是最复杂的网络互联设备,用于在不兼容的协议之间进行信息转换。和路由器一样,网关既可用于广域网互联,也可用于局域网互联。但网关一般难以安装和维护,只有在没有其他选择时(处理根本不兼容的协议)才选用。一般用一台高档微机作为网关。比较典型的是用于银行专NNNInternet之间的支付网关。

三、计算机网络环境中的信息系统模式

(一)单机结构模式

早期开发的事务处理系统一般采用单机结构模式。这种模式下,系统内的多台计算机各自运行自己的信息系统和数据,独立使用。计算机之间不能进行通信和资源共享,效率低,实时性差,系统靠磁盘备份完成不同机器之间的数据传输。但是,单机系统具有很好的安全性和易操作性。由于组织的各个部门拥有各自的单机信息处理系统,而没有联合构成一个统一的信息系统,这就形成了一个个的“信息孤岛”。组织各部门不能利用计算机来进行协调与合作,因此这种模式已经被淘汰。

(二)主机/终端模式

主机/终端模式是由一台“好机器”担任主机,下挂若干台字符终端,各终端共享主机的内存、外存、CPU、输入输出设备等。主机对各终端用户传来的数据进行分时处理,使每个终端用户感觉像拥有一台自己的大型计算机一样。这种模式的结构如图2~15所示。这种模式由于将数据集中起来进行处理,提高了信息处理的效率,易于管理控制,也能够保证数据的安全性和一致性。但程序运行和文件存取都在主机上,用户完全依赖于主机,一旦主机出现故障,就会使所有用户受到影响。所以,系统的性能主要取决于主机的性能和通信设备的速度。一般采用大型机或高档配置的计算机作为主机。这种模式当终端过多时,速度明显下降,可靠性不高,不便于用户的灵活应用,并且由于硬件选择有限、硬件投资得不到保证而面临被逐渐淘汰。但另一方面,这种模式在业务处理比较单一、需多点实时处理数据、输入输出操作简单且无须在本地保存数据、每个点的数据处理量较小的应用领域,如订票系统、银行储蓄系统、出纳系统、登记查询系统等,依然有其特殊的应用价值。组织中具有以上特点的某些部门,如柜台、查询台、仓库等可考虑部分地采用这种模式。

(三)文件服务器/工作站模式

20世纪60~80年代,网络应用主要是集中式的,采用主机/终端模式,数据处理和数据库应用全部集中在主机上,终端没有处理能力,这样,当终端用户增多时,主机负担过重,处理性能显著下降,造成“主机瓶颈”。80年代以后,文件服务器/工作站模式(w/s)的微机网络开始流行起来,这种结构把DBMS安装在文件服务器上,而数据处理和应用程序分布在工作站上,文件服务器仅提供对数据的共享访问和文件管理,没有协同处理能力。每一台工作站具有独立运算处理数据的能力,工作站间的文件传输、文件读取、消息传送等都需要通过服务器。这是典型的集中管理、分散处理的方式。图2—16是文件服务器/工作站模式的结构示意图。由于应用程序和数据存放在文件服务器上,工作站要用到文件或数据时需从服务器调用,因此大量的文件会在网上传送,使得文件的共享只能以轮流的方式来实现,多个用户问不能对相同数据做出同步更新,局域网负担过重,容易造成网络堵塞,从而限制了该模式的发展和应用。这种模式只适合于小规模的局域网,对于客户多、数据量大的情况会产生网络瓶颈。

(四)客户机/服务器模式

随着计算机微型化的进一步发展,企业开始在整个组织中分布小型机和微型机,分布式处理逐渐取代分时处理而成为主流方式。20世纪80年代末以来,客户机/月艮务器模式(Client/Server,c/s)为最流行的网络系统模式。客户机是利用微型计算机访问网络的用户,服务器是可以提供网络控制功能的任何规模的计算机。

这种模式与文件服务器/I作站模式的主要区别在于,对数据的处理分前台和后台,客户机运行应用程序,完成屏幕交互和输入输出等前台任务,服务器则运行DBMS,完成大量的数据处理及存储管理等后台任务。图2--17是客户机/服务器模式的结构示意图。在这种模式下,客户机执行本地前端应用,而将数据库的操作交由服务器负责。客户机的运行过程是:客户机将请求传送给服务器,服务器回送处理结果,客户机据此进行分析,然后送给用户。数据库服务器是配有大容量磁盘的计算机,它保存着整个网络系统的公共的数据资源及其应用程序,让用户共享。网络上的用户不仅只是共享打印机、硬盘或数据文件,而且共享数据处理。由于后台处理的数据不需要在前台之间频繁传输,从而有效解决了文件服务器/工作站模式下的“传输瓶颈”问题,以合理均衡的事务处理,保证数据的完整性和一致性。

目前,基于c/s模式构建的企业信息系统结构也表现出越来越明显的局限性,暴露出了很多“胖客户机”带来的问题:

(1)管理较为困难。因为c/s模式属分布式方法,因此管理比集中式方法复杂。由于人员素质等各方面的原因,也容易造成这种内部网的“失效”现象。如果用户的计算机知识缺乏,网管人员将会把大量时间消耗在维修客户端硬件设备和客户端软件的安装上。

(2)开发和维护复杂。由于这种c/s模式采取开放式设计,允许运用不同厂商的技术,因此开发环境比集中式要困难得多。而且每个客户机都安装了相应的应用程序,所以维护复杂。

(3)维护成本高。由于这种c/s计算机模式下的网络设备需要不断升级,企业的客户端设备为了能够运行更新的软件,也不得不随之进行升级,使得企业的网络投资年复一年地不断扩大。

(4)网络安全性较差。这种模式下的PC有着强大的本地处理能力和高度的灵活性,因此客户端操作人员在一些无意识(或恶意)的操作下,都有可能将病毒从外部带入企业网,为企业带来巨大的损失。另一方面,企业的部分资料和数据也可能由于PC的存储能力而被人恶意盗用,造成企业不必要的损失。另外,这种模式下的网络优势局限于企业内部,难以突破企业之间的组织边界,企业间的信息交流受到很大制约。

(五)浏览器/服务器模式

随着电子商务的市场范围扩展到全球各地,企业的经营管理理念将发生根本性的变化,越来越多的组织,特别是企业,都在利用互联网技术建设自己的管理信息系统。全球化、协作化、个性化决定了企业将采用全新的模式——浏览器/服务器模式(Browser/WebServer,B/S)。这种模式~般由浏览器、Web服务器、数据库服务器三个层次组成,浏览器/服务器模式的结构如图2—18所示。这种模式下,客户端(Client)利用浏览器通过Web服务器去访问数据库以获取必要的信息。而Web服务器在线接受远程或本地的HTTP查询请求,根据查询的条件到数据库服务器获取相关数据,再将结果翻译成HTML和各种页面描述语言,传送到提出查询请求的浏览器。同样,浏览器也会将更改、删除、新增数据记录的请求申请至Web服务器,由后者与数据库联系完成这些工作。

这种方式下,Web服务器既是浏览服务器,又是应用服务器,可以运行大量的应用程序,从而使客户端变得很简单。与c/s模式的应用体系结构相比,B/S模式的应用体系结构具有更简单、成本更低、能提供更多信息等诸多优势。在具体使用中,前端用户只需通过任何标准的桌面浏览器,就可根据权限访问企业关键应用,完成包括报价、订单、支付、执行、服务等在内的企业业务过程的所有环节。而且,从建设投资方面看,采用B/S模式的应用体系结构,企业还能在开展电子商务的同时有效削减IT基础设施的成本。

在B/S模式中,数据中心是企业生存和发展的最大核心因素,网络数据的重要性远远高于网络硬件产品本身,企业将从关注网络硬件组成向关注网络数据分布发展;可靠性、安全性、可管理性将在网络数据平台中占据重要的地位。如何保证信息系统和数据安全成为采用B/S模式开发信息系统需要解决的重大问题。

(六)c/s与B/S的混合模式

c/s模式主要由客户应用程序(Client)、服务器管理程序(Server)和中间件(Middle—ware)三个部件组成。客户应用程序是系统中用户与数据进行交互的部件。服务器程序负责有效地管理系统资源,如管理一个信息数据库,其主要工作是当多个客户并发地请求服务器上的相同资源时,对这些资源进行最优化管理。中间件负责联结客户应用程序与服务器管理程序,协同完成一个作业,以满足用户查询管理数据的要求。

B/S模式是一种以web技术为基础的新型的管理信息系统平台模式。把传统C/S模式中的服务器部分分解为一个数据库服务器与一个或多个应用服务器(Web服务器),从而构成一个三层的结构体系:

第一层客户机是用户与整个系统的接口。客户的应用程序精简到一个通用的浏览器软件,如NetscapeNavigator、微软公司的IE等,浏览器将HTML代码转化成图文并茂的网页,网页还具备一定的交互功能,允许用户在网页提供的申请表上输入信息并提交给后台,提出处理请求,这个后台就是第二层的Web服务器。

第二层Web服务器将启动相应的进程来响应这一请求,并动态生成一串HTML代码,其中嵌入处理的结果,返回给客户机的浏览器。如果客户机提交的请求包括数据的存取,Web服务器还需与数据库服务器协同完成这一处理工作。

第三层数据库服务器的任务类似于c/s模式,负责协调不同的Web服务器发出的请求,管理数据库。

B/s模式的优势在于以下几个方面:

首先,它简化了客户端。它无须像c/s模式那样在不同的客户机上安装不同的客户应用程序,而只需安装通用的浏览器软件。这样不但可以节省客户机的硬盘空间与内存,而且使安装过程更加简便、网络结构更加灵活。假设一个企业的决策层要开一个讨论库存问题的会议,他们只需从会议室的计算机上直接通过浏览器查询数据,然后显示给大家看就可以了。甚至与会者还可以把笔记本电脑与会议室的网络插口相连,自己来查询相关的数据。

其次,它简化了系统的开发和维护。系统的开发者无须再为不同级别的用户设计开发不同的客户应用程序了,只需把所有的功能都实现在Web服务器上,并就不同的功能为各个组别的用户设置权限就可以了。各个用户通过HTTP请求在权限范围内调用Web服务器上不同的处理程序,从而完成对数据的查询或修改。现代企业面f临着日新月异的竞争环境,对企业内部运作机制的更新与调整也变得逐渐频繁。相对于C/S,B/S的维护具有更大的灵活性。当形势变化时,它无须再为每一个现有的客户应用程序升级,而只需对Web服务器上的服务处理程序进行修订。这样不但可以提高公司的运作效率,还省去了维护和协调工作的不少麻烦。如果一家公司有上千台客户机,并且分布在不同的地点,那么便于维护将会显得更加重要。

再次,它使用户的操作变得更简单。对于c/s模式,客户应用程序有自己特定的规格,使用者需要接受专门培训。而采用B/S模式时,客户端只是一个简单易用的浏览器软件。无论是决策层还是操作层的人员都无须培训就可以直接使用。B/S模式的这种特性,还使得管理信息系统维护的限制因素更少。

最后,B/S特别适用于网上信息发布,使得传统的管理信息系统的功能有所扩展,这是C/S无法实现的,而这种新增的网上信息发布功能恰恰是现代企业所需的。这使得企业的大部分书面文件可以被电子文件取代,从而提高了企业的工作效率,使企业行政手续简化,节省人力和物力。

鉴于B/S相对于c/s的先进性,B/s逐渐成为一种流行的MIS系统平台。各软件公司纷纷推出自己的Internet方案,基于Web的财务系统、基于Web的ERP,一些企业已经领先一步开始使用它,并且收到了一定的成效。

B/s模式的新颖与流行,以及在某些方面相对于c/s的巨大改进,使B/S成为管理信息系统平台的首选,也使人忽略了B/S不成熟的一面,以及C/S所固有的一些优点,下面让我们来看看C/S相对于B/S的一些优势:

首先,交互性强是c/s固有的一个优点。在c/s中,客户端有一套完整的应用程序,在出错提示、在线帮助等方面都有强大的功能,并且可以在子程序间自由切换。B/S虽然也提供了一定的交互能力,但与c/s的一整套客户应用相比其作用太有限了。其次,c/s模式提供了更安全的存取模式。由于c/s是配对的点对点的结构模式,采用适用于局域网、安全性比较好的网络协议(如NT的NetBEUI协议),安全性可以得到较好的保证。而B/S采用点对多点、多点对多点这种开放的结构模式,并采用TCP/IP这一类运用于Internet的开放性协议,其安全性只能靠数据库服务器上管理密码的数据库来保证。现代企业需要有开放的信息环境,需要加强与外界的联系,有的还需要通过Internet发展网上营销业务,这使得大多数企业将他们的内部网与Internet相连。由于采用TCP/IP,他们必须采用一系列的安全措施,如构筑防火墙,来防止Internet的用户对企业内部信息的窃取以及外界病毒的侵入。

再次,采用c/s模式将降低网络通信量。B/S采用了逻辑上的三层结构,而在物理上的网络结构仍然是原来的以太网或环形网。这样,第一层与第二层结构之间的通信、第二层与第三层结构之间的通信都需占用同一条网络线路。而C/S只有两层结构,网络通信量只包括Client与Server之间的通信量。所以,c/s处理大量信息的能力是g/s所无法比拟的。

最后,由于c/s在逻辑结构上比B/S少一层,对于相同的任务,c/s完成的速度总比g/s快,使得c/s更利于处理大量数据。

g/s模式的先进性和c/s模式的成熟性,使人们在现代企业MIS系统平台的选择上难以取舍。究竟应该选择哪种模式呢?有没有两种平台相结合的模式呢?答案是有的。将c/s与B/S两种模式的优势结合起来,形成混合模式,也是企业信息系统的平台模式之~。对于面向大量用户的模块采用三层的B/S模式,在客户端计算机上安装运行浏览器软件,基础数据集中放在较高性能的数据库服务器上,中间建立一个Web服务器作为数据库服务器与客户机浏览器交互的连接通道。对于系统模块安全性要求高、交互性强、处理数据量大、数据查询灵活的地方则采用C/S模式。这样能充分发挥各自的优势,开发出安全可靠、灵活方便、效率高的软件系统。

在信息系统的开发过程中,系统分析员可以根据系统的特点,灵活地为不同的子功能采用不同的模式,将两种模式交叉并行使用。本章内容是介绍管理信息系统的技术基础,主要包括信息技术的相关知识、信息系统的数据管理技术,以及与信息系统相关的一些网络技术。考虑到管理信息系统应用的特点,重点讨论了信息系统的数据管理技术及网络技术的一些相关知识。

本章第一节讨论了计算机信息技术的基本知识,包括计算机硬件技术、计算机软件技术和数据通信技术的基本概念。

本章第二节讨论了信息系统的数据管理技术,内容包括数据的描述及层次、数据管理技术的发展过程、数据库技术,重点讨论了信息系统中非常重要的数据库技术。

本章第三节讨论了信息系统的网络技术,包括计算机网络的概念及分类、网络拓扑结构,对常用的网络传输介质及网络互联设备进行了简单介绍,然后重点介绍了计算机网络环境中的信息系统模式,包括主机模式、w/s模式、B/S模式、C/S模式等。

文章来源: 秘奥软件网,中小企业信息化领跑者!全国咨询热线:400-9908-527_www.misall.com

最新新闻: 上一篇: 下一篇: