information
什么是信息(Information)?信息(Information)是一个术语,或者一个单词。中文是“信息”,英文是Information。术语被用来概括地描述一些事物的共同特征。
在日常生活中,我们会交谈、写信、制作视频、发布新闻、生成数字\图表\信号\标识,等等。在这些过程中,我们使用不同的材料,比如空气、纸张、计算机、电子元件、电磁波,等等,但它们有着相似之处,似乎有一个共同的东西在这些材料上被传送。我们需要有一个术语来表述这个共同的东西,或者更准确地说,这个共同的特征。一开始,克劳德.香农称这个共同的特征为intelligence。1939年,香农写信给MIT一位同事的信中说道:“时不时地,我埋首于传送Intelligence的一般系统的一些基本特征的分析工作。”Intelligence是一个灵活而古老的术语。在16世纪,托马斯.埃利奥特爵士曾写到:“现在Intelligence作为一个文雅的单词,用来表示通过信件或者口信达成的约定或者共识。”
过了一段时间,香农放弃了Intelligence这个术语,因为无法对Intelligence(约定或者共识)作量化计算处理,没法将这个术语应用在数学方程里。
为了能够用数学方程描述说话、写信、视频传送等过程的共同特征,就必须对共同特征进行改造、简化或者提纯,或者说收缩共同特征的范围。就好比要让超载的马车前进,就卸下一些货物一样。需要如何收缩共同特征的范围呢?那些无法做数量化处理的特征,即和“语义(meaning)”有关的特征。香农说,“这些(通信系统中的)消息通常有自己的语义(meaning);也就是说,它们会根据某一通信系统的特点,与特定的物理实体或概念实体关联在一起。通信的语义(meaning)与工程问题无关。”
在科学的发展过程中,对日常生活中使用的术语进行改造、简化或者提纯,放弃吸附在术语上的一些不能做数量化处理的东西,仅仅保留能做数量化处理的东西,使之能被应用在数学方程中,是屡见不鲜的现象。比如,牛顿为一些古老但含义模糊的词(力、质量、运动、甚至时间)赋予了新的能够数量化的含义。以前,运动可以表示极其广泛的现象:植物成熟、石头落地、孩子成长,等等。但这样,它的含义就太过于丰富了。牛顿将绝大多数“运动”场景丢弃,只保留能使用牛顿运动定律的场景,即质点的机械运动,于是奠定了古典力学的基础。到了19世纪,能量(energy)一词也经历了相似的改造过程:能量原本表示活力或者强度,但物理学家将之数学化,从而赋予了其在物理学中的基础地位。
在克劳德.香农所在的贝尔实验室中,一些工程师开始使用信息(information)这个术语来表达一些技术性的概念。香农后来也采纳了这个词,来描述说话、写信、视频传送等过程的能被数量化的一些共同特征,比如与数量和测量有关的特征。
事实上,根据香农的信息理论,两个消息——一个消息包含了丰富的语义(meaning),而另一个消息纯粹是胡说八道——可以是完全等价的。毫无疑问,正是因为这样,香农说的“通信的语义方面与通信的工程方面完全不相关”才能成立。但反过来不成立,不能说通信的工程方面与语义方面不相干。
无疑,通信理论中的“信息”一词与其说是指你说了些什么,不如说是指你能够说什么。也就是说,信息是对你在选择一个消息时有多少选择自由的度量。如果人们面对一种很基本的情况,即必须在两个可供选择的消息中选择其一,那么就可以断定,与这个场景相联系的信息是一个单位信息。因此,说这个消息或者那个消息传递了一个单位信息是一种误解(尽管这么说很方便)。信息information的概念不适用于单独一个消息上(而语义meaning这个概念可以),而是适用于一种整体的情况,即单位信息表示在这种场景下一个人挑选一个消息时拥有一些选择自由——把这视作标准量或者单位量是很方便的。
在这样一个选择中,人们用来作选择的两个消息(message)可以是任意的。一个消息可能是《论语》的文本,而另一个可能是一个单词“Yes”。发射器可以这样对两个消息进行编码,即“0”是对应第一个消息(message)的信号(signal),而“1”是对应第二个消息(message)的信号(signal);也可以是一个闭合电路(有电流)是对应第一个消息(message)的信号(signal),而一个开环电路(没有电流)是对应第二个消息(message)的信号(signal)。这样,一个简单的继电器的两个位置,闭合和打开,就可以对应于两个消息(message)。
如果说得更明确一些,在最简单的情况下,信息(information)的数量由可供选择的选择的对数来度量。由于用以2为底的对数比以10为底的对数更方便,当只有两个选择时,信息与2的以2为底的对数成正比。但是这种情况是一个单位;因此这样的二选一情况被确定为单位信息量,就像上面描述的那样。单位信息量被称为一个“比特Bit”,这个词最初是John W. Tukey提出的,是“binary digit(二进制数字)”的缩合。当数字用二进制表述时,只有两个数字,即0和1;而当使用以10为基数的十进制数字系统时,则包括10个数字,即0到9。如上所述,0和1可以用来符号化地表示任何两个选择;因此“binary digit”或者“bit”与有着单位信息量的二选一情况相关联是很自然的。如果有16个候选消息供人们任意自由选择,那么既然16=2^4,因此log2(16)=4,就可以说这种情况可以用4bit信息表示。
那么,信息是实体吗?不是,信息是一些实体的共同特征。书籍、桌子、电冰箱、衣柜、门窗、床、纸箱、保险箱、镜子和手机有什么共同特征?它们都是长方形。长方形是实体吗?不是。这个世界不存在长方形。长方形是一种形状,而形状是实体的一个特征,而不是单独存在的实体。同样,这个世界不存在信息,只存在可以用信息(单位是比特)来度量的实体。赞同柏拉图“理念”理论的人也许会反对这个观点,而赞同反对“理念”理论的亚里斯多德的人也许会赞同。
现在可以再一次回答一开始提出的问题:什么是信息(Information)?信息是事物的一种属性。事物有很多种属性。有质量,有颜色,有速度,有形状,还有信息。每种事物都或多或少带有一点信息。信息就是这个事物带给我们的意外程度或者新奇程度。如果这个事物给我们带来很多意想不到的东西,它就携带了很多信息;如果这个事物带过来的东西都是我们熟知的,那么即便文字或字符数量再多,信息也等于零。
相关阅读
一、前言我国的医院信息化建设,始于上世纪80年代中末期,经过90年代的自由繁荣(ye man)发展和本世纪初的政策扶持、引导规范与市场培育
1.首先确定数据的位置 每个房间的数据都在id=live-list-contentbox的ul中 2. 实现翻页和控制程序结束 selenium中通过点击就可以
遇见任何事情,第一件要做的事情都是搜索搜索心法1、找什么?准确描述搜索目标,纠正搜索思维。比如临时要办一个读书讲座没有头绪,就
趁着学习计划空白的时间,我决定自己创建一个project练手爬虫,刚好可以实践之前学习过的scrapy 项目内容:1.抓取拉钩网下,关键字为【数
此为火车头采集器的页面 *左边建立分组,建议结构都和所需要采集的数据结构一致,不然数据多了起来,很容易混乱。 1, 创建任务 起始