西安交通大学 英文:冯-诺依曼式程序语言浅论 -- NothingHere -- 编程爱好者博客

来源:百度文库 编辑:九乡新闻网 时间:2024/04/27 23:38:55
冯-诺依曼计算机的基本特征是:程序=命令+数据

冯-诺依曼程序语言要解决的基本问题包括:

1.原始形式到内存表达的转换
2.流程控制,包括串行的顺序,循环,分支,递归和并行相应流程
3.数据结构,注重于内存形式如何在语言中表达.
4.组织程序,流程和数据结构如何体现在语言中,逻辑流程和概念由语言如何表达.

有几种基本内存表达形式被广为接受:
 
-- 整数 --
----------

可以直接以计算机字来表示,根据需要不同可表达为:
  byte(8个二进制位,范围在2的8次方)     定义为int8_t,  uint8_t
  word(16个二进制位,范围在2的16次方)   定义为int16_t, uint16_t
  dword(32个二进制位,范围在2的32次方)  定义为int32_t, uint32_t
  qword(64个二进制位,范围在2的64次方)  定义为int64_t, uint64_t

  int(n位,范围在2的n次方, 一个计算机字,计算机可以最快速处理,与地址空间有关)

每一种内存表达还可以解释为有符号数和无符号数两种,但基本上都以补码的形式编码.

-- 指针 --
----------

一般都直接使用了int(根据计算机字长)整数结构.定义为intptr_t和uintptr_t.

-- 字符 --

一般称字符的内部表达为编码.有很多种,最有影响的包括:

ANSI : ASCII BCD
UNICODE: utf-8 utf-16 utf-32等
汉字编码: GB2312, GBK, GB18000, BIG5

通常使用一个整数来表达.可能使用8到32个二进制位,一般都等长,但也有例外.


-- 字符串 --
------------

字符串的定义很多.包括C语言, Pascal, Basic等语言都定义自己的字符串表达. 

C语言
  定义为一段连续的内存空间.以基本长度(包括byte和word两种)为单位, 在
字符串最后补以'\0'以表示结束

Pascal
  内存定义与C语言一样,只是它将第一个单位解释为整数,表示字符串长度.
因此没有最后的'\0';

Basic
  内存定义和解释与Pascal语言几乎完全一样,只是它的长度总是一个int,不随
字符单位变化面变化.

以上都只能包括编码为等长的字符.

C++中std::string的定义
  定义包括对象结构部分(用表示)和成员部分.不考虑补齐等问题.
字符串分为两个部分.一是引用结构,二是数据结构

  引用结构内存图如下:
  
  int_t         - 字符串长度
  int_t         - 数据结构长度
  intptr_t      - 指向数据结构
  ...           - 其它结构
  
  数据结构是一个C语言的字符串.

-- 日期和时间 --
----------------

日期和时间通常可以表示为整数的集合.

  C-Runtime表示日期是使用tm结构:

  Win32表示日期使用SYSTEMTIME结构:

日期还可以表示从某时起的时间,例如

  Win32中FILETIME就是一个int64_t表示从unix元年到现在的毫秒数.

比较特殊的一个表达法是, 
 
 SFL中使用一个32位整数来表示日期

 0000 00 00 分别表示年,月,日
 00 00 00 00 分别表示时,分, 秒, 10毫秒

这样的一个好处是可以直接比较日期大小