


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据的科学认识论研究引言,自然辩证法论文题目:论文中的数据或文本,存在某人头脑中的事实。由朱扬勇等计算机科学家所著的(数据学〕就是探寻求索数据学的来历、基本概念和基本原理的代表作。他们以为,数据在物理上以字节〔Byte〕作为其大小的计量单位,一个字节为一个数据单位,数据物理存在与计算机系统中。数据的概念包括数据原子、数据对象、数据集、数据、元数据、数据工具,由此定义数据〔data〕:是数据原子、数据项、数据对象和数据集的统称,能够用一个数据表示一个数据原子、一个数据项、一个数据对象或者一个数据集。计算机系统中,数据是可度量的、可处理的、可观测的,并且占有空间,具有物理属性,所以数据是存在的。他们还提出数据自然界的概念,以为:人类在认识由宇宙和生命组成的真实自然界〔realnature〕的经过中,产生的成果存储在计算机系统中,在不知不觉中创造了一个由计算机中的数据构成的数据自然界〔datanature〕,数据自然界中的数据以自然方式增长而不为人类所控制,数据自然界具有未知性、多样性和复杂性的特点。这里,数据自然界的讲法特别类似于在虚拟哲学中所讲的虚拟实在论,即以为计算机中构成的数据世界不同于现实的物理世界,就是有别于物理或自然实在的虚拟实在。需要补充的是,虚拟技术诞生伊始着重与模拟现实世界的事物状态和功能属性。原理上,虚拟世界中数据构成的模型都映射了经历体验世界的状态。但随着虚拟世界的复杂化,虚拟实在的本体论就呈现出与经历体验主义框架完全不同的图景。数据本体路的经历体验主义在现今的科学技术发展历程中被广泛接受,即数据是实在世界的表征。当然,经历体验主义的本体论预设也是很受欢迎的,我们发现,大部分的数据都能够通过变换载体的方式被计算机存储和处理。1.2.2数据本体论的基础主义进路。相对于对数据经历体验主义的认识,我们可以以通过复原的方式来考虑数据的本体论基础,也就是回答数据是什么?的问题。这就是数据本体论的基础主义进路的出发点。现代哲学家弗洛里迪〔Floridi.L〕给出一种独具代表性的思路。要回答数据的基本性质什么,我们能够先回答消除或失去数据是什么意思。比方一张白纸上写满我们看不懂的语言,即便如此我们也会以为这张纸是充满数据的。如今,将华而不实的文字逐一删除直到剩下一纸空白,但还是没有完全失去数据。由于,一张白纸的显现仍然是一个数据〔datum〕,只要这张白纸与其他纸张之间存在差异不同。实际上,只要完全消除所有可能的差异,数据才能够在真正意义上被完全消除。由此,他给出单个数据〔datum〕最为基本的定义是:两个符号之间一致性〔uniformity〕的缺失,也就是讲数据能够被复原为两个符号之间的差异。在对信息进行苏格拉底式的考虑中,弗洛里迪为避免很多哲学家对于基础概念本体论的基础主义倾向,转而关注信息的关旨性〔aboutness〕和诠释学通信的本身指示〔self-referential〕循环,提倡一种认识论导向的、中心化的语义信息解释。即便我们能够泛化的议论信息的概念,但总还是需要一个提纲挈领的解释,各类含义的信息使用需要围绕一个具有理论优先性的核心概念,它对其他概念产生影响并且互相关联。正是由于这种形而上学的追问,使得弗洛里迪提出数据的概念要比信息更为基本。由此,弗洛里迪将信息的语义理解划分为1〕作为内容的语义信息的广义定义,和2〕以事实为导向的语义信息的狭义定义。语义信息的广义定义建立我们关于通信现象的认识,后者往往指示客观的或外在于心灵的语义内容。它们被一连串的代码和符号所表示,并被嵌入至不同类型的物理操作之中。比方解释字符串01100001对应于字母a.计算机编程和输入数据能够在不同的抽象层次来完成,但是指令和数据必须被转换成机器可阅读的代码。我们操作的层次将决定表示的适当概念,这需要被恰当排列的、有意义的数据,并且这些信息一定要对某人有意义。借助大量的二进制数据的字符串以及综合、连续的标准能够将这样的数据有所指称〔如ASCII码〕,那么计算机就能够向人类观察者输出有意义的信息了。在这里,固然信息是被编码和传输的,但是信息本身也将独立于它的编码或传输而存在。一般来讲,语义信息的广义定义就是数据+意义。也就是〔1〕假设被理解为一个客观语义内容的信息实例,当且仅当;〔2〕对于n1,由n个数据所组成;〔3〕数据是指在句法上恰当排列的〔well-formed〕;〔4〕合式的数据是有意义的。信息离不开数据,在最为简单的情况下,信息能够由一个数据所组成。只要存在构成数据的差异。由于信息依靠于在句法上恰当排列的数据,并且数据也依靠于各种物理上可实现的差异,所以,信息能够与其支撑物脱离开来。一张白纸对于印在上面的文字并非必要的背景条件,白纸本身与不同符号之间的差异一起,构成了数据本身。而信息则对应符号之间的语义内容。广义的信息定义赞同这样的论题:一个数据就是一个关系实体。所以,任何数据都具有相关性。在理解作为关系实体的数据,它是具有约束启示,它能够被系统作为一个恰当的问题输入而加以利用,同时这一系统又能够正确地将该问题语义化进而产生出作为输出结果的信息。换句话讲,作为内容的信息可以以描绘叙述为数据+问题。在本体论中性角度,没有数据表征就没有信息。简单的看,弗洛里迪的信息哲学坚持外延论的立场,以及信息语义学的观点。语义学观点就是用数据空间来定义信息的观点,语义信息就是符合构造的、有意义和真值的数据。从这个意义出发衍生出唯物论的观点,即脱离物质的信息是不可能存在的,由于在这里表征就是物理实现,也就是讲,没有物理实现就没有信息。在物理计算等计算机科学领域内,这样的预设是肯定的,由于必需要考虑到数据载体的物理属性和限制。在人工智能和认知科学的物理符号系统假讲背景下,也需要这一本体论预设。当然,假如是基于贝克莱式的实体、属性精神化的形而上学倾向,或者在物质和广延的宇宙具有某种精神的或非广延基质作为本体论基础哲学假设下〔如柏拉图、莱布尼兹〕,我们也不一定需要坚持每一个差异状态的出现最终都必然需要某种数据表征的物理实现,这一信息的唯物主义解释,比方单个数据的相关像就能够是单子。事实上,这一传统的实在论争论能够根据可能的解释而被重构。弗洛里迪以为,世界作为信息是数据的某种智慧表示出,自然智能〔如人和动物〕感受的是信息,由于这就是世界;而人工智能处理数据,知识数据被自然智能感受为信息。所以,他以为人工智能是信息哲学不成熟的范式。因而,信息与数据是相关的。当前,数据作为可解释但未被解释的、可区分的差异,表征了人工智能语义学的上限,但却表征了自然智能语义学的下限,后者在一般情况下只处理信息。巧妙的界面分层设计正是利用这一临界状态使得人机互动成为可能。这一规范表示清楚当下的人工智能所获得的成就被句法资源所限制,而自然智能则受限于语义资源。将信息的立场理解为一种约束或限制,我们只需要考虑任何一种非朴素的认识论。弗洛里迪以为康德的本体与现象的二分关系能够解释成数据和信息的二分关系,加之环境或客观世界的经历体验内容作为临界状态,这时未经解释的数据流便有规律的、源源不断的坍塌为信息流。也就是讲,数据本身无关乎意义,而是主体通过对数据的认识来获得语义信息,而信息则是数据的不同表象。不得不成认,弗洛里迪的数据概念解读是与常识相悖的。在本体论意义上,他以为数据的差异性是人类认识的前提,也是以信息为基础的人工智能研究不可逾越的上限。这里,我们要将其与一般的经历体验主义划清界线,后者以为数据的出现一定具备经历体验意义。所以,当下我们对于人工智能的研究,不管是基于规则系统的传统还是依靠统计学的机器学习,都是把数据作为基础操作对象。而弗洛里迪以为这些并非是数据本体,而是信息,它们是经过加工和解释的。尽管弗洛里迪很明确地指出要与本质主义与复原论划清界线,声称自个的信息本体论是非复原的。但是很明显的,他企图为信息哲学研究提供一个坚实的形而上学基础,不可避免地代入强烈的复原论色彩。所以,弗洛里迪对于对数据本体论的差异认识不可避免地落入了基础主义框架之中。由此,我将这一数据本体论归于基础主义进路。1.2.3数据本体论的建构主义进路。科学家经常肯定数据的独立性,试图将数据与语义背景、实验组织等区分开来。但是,也有人以为数据作为客观的、中立的科学概念往往是虚构出来的,由于他们预设并以为数据脱离于它本身的起源、本质和历史,并且传达出这样一种认识,即数据是这个世界之外的、无差异不同的通用货币。但是,数据从来都不可能是原始的,数据总是依靠人们的倾向和价值观念而被构建出来。数据分析看似客观公正,但其实价值选择贯穿了从构建到解读的全经过。数据一般被视为存在于那里的东西,它是关于实在的而非实在本身。确实,数据是一种抽象、一种人工物、一种工具产品,是存在的自然状态。但是,这种想法太过狭隘,要知道数据并不是贫瘠地介入分析,数据构造的可视化和信息图使得实在更为智能化。我们需要意识到,数据已经好像能源一样,作为人类、社会和政治的核心来考虑。数据战争已经开场直接影响到人类的生存与死亡。数据不仅仅仅是抽象和表征,它们是被构造的,并且它们的生产、分析和解释能够产生相应的结果。就如吉特曼和杰克森〔GitelmanandJackson〕在(原始数据是矛盾修辞〕一书中所言:假如数据以某种方式服从于我们,那么我们也同样服从于数据。数据从世界中所捕获,相应的作用于这个世界。数据不是也永远不会是中立的。相反的,我们应该这样理解数据:数据是根据使用者的需要而被框定〔framed〕、构成和认识的。弗洛里迪从认识论的角度将数据解释为事实的集合〔collection〕。信息的角度看,数据就是信息;计算的角度看,数据是能够被电子化处理和传输的二进制元素的集合;而从差异性的角度看,数据是从其他数据中清楚明晰的、能够理解的抽象元素。首先,数据提供了进一步推理或构造经历体验证据的基础。第二,数据构成了能够被存储、处理和分析的表征信息,但数据并没有必要构成事实。第三,数据构成了计算的输入和输出,但必须被处理成事实和信息〔比方,DVD包含十亿节数据而不是相应的事实和信息〕。第四,数据是有意义的,由于它们捉住并预示着变化〔比方点或字母〕,这样的变化倾向提供了可被解释的信号。如下所示,理解数据还能够从社会建构角度、物质性角度、意识形态承载角度、商品交易角度、构建公益角度等等。关键点是,数据不仅只是数据,在得到数据、分析数据和从数据中获得结论的经过中,数据的理解和使用一直在发生着变化。但是,弗洛里迪的观点并不被广泛认同。我们应该怎样考虑数据,怎样测量它们,怎样适宜的表示出数据的本质这些疑问。在反对者看来,数据并没有先于存在和它们的生成;它们并不是无中生有。数据通过测量、抽象和概括技巧而产生,这些技术与人们发明的标准相一致的形式和衡量方式〔比方度量系统〕,它们被用来实现一项任务或将数据记录下来。它们作为认识论意义上的单位,能够使认识论有效的表征出来,并且能够使关于一样现象的数据以多种方式被测量和记录。每一种方式都提供了分析和解释的差异化的数据集。数据产生的方式并不是不可改变的,它遭到下面因素的影响:协议、流程、测量尺度、种类、标准设计、协商和争论,还有某些在混乱状况下产生的数据。所以,数据怎样在本体论上定义和限定并不是一个中性的、技术性经过,而是一个规范的、政策性的和伦理经过。但是,一旦固定下来,数据的本体论就会排除可变性。固然行动者、事物和经过具有多样性,但是数据模型的收敛和稳定的经过对于抵制和改编总是开放的,并且数据的矛盾性并不是简单的符合一个系统。另外,一旦数据产生,它们就能够以各种分类方式被存储、分离和拆分。换句话讲,数据并不独立于思想体系以及生产它们的基础性工具。这样的思想体系被哲学前提和信念所灌输而构成不同的实践方式。我们不能只是看到数据的外表价值,进而在本质上将其视为中立的、客观的、先于分析的〔pre-analytic〕东西。事实上,数据遭到技术上、经济学上、伦理上、时间上、空间上和哲学上的建构。数据并非独立于思想、工具、实践、背景和知识而存在,相反地,这些被用来生产、处理和分析数据。对于数据的理解并不仅仅随着时间而进化,它随着观点的变化而变化。因而,数据并不是简单地表征了世界的实在;它们是关于世界的构造。从这个角度来讲,科学知识是被生产的,而不是纯粹的被发现.数据是不同的,这使得被用来使用它们的软件、设备、文件和知识使用得以分开。比方,假如数据被诸如传感器网络的工具而产生,解释这些数据需要对这些工具的了解,例如传感器基于什么条件下发现了什么,发现的频率是多少,以及校准的类型等等。所以,不存在先于分析的、或作为客观独立元素的数据。如吉特曼和杰克森所言:原始数据是一种矛盾修辞,数据总是已经被加工过的,不可能完全的原始,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 张家口市人民医院放疗科感染控制与安全防护知识测试题
- 沧州市人民医院浅表疑难病例B超考核
- 2025年上海市金融稳定发展研究中心公开招聘工作人员模拟试卷附答案详解(模拟题)
- 2025湖南新五丰股份有限公司公开招聘考前自测高频考点模拟试题及完整答案详解
- 2025广西崇左市壮族博物馆招聘讲解员1人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025年江西中医药大学高层次人才招聘116人模拟试卷有完整答案详解
- 2025人民医院医疗风险预警与评估报告撰写考核
- 2025内蒙古巴林左旗林业和草原局国有公益林护林员招聘66人考前自测高频考点模拟试题含答案详解
- 秦皇岛市人民医院医疗纠纷预防处理考核
- 2025年衢州常山县卫健系统医疗卫生单位招聘高层次、紧缺医疗卫生人才14人模拟试卷及1套参考答案详解
- 建筑工程项目技术总结报告模板
- 2025年吉安县公安局面向社会公开招聘留置看护男勤务辅警29人笔试备考试题及答案解析
- 【7历第一次月考】安徽省六安市霍邱县2024-2025学年部编版七年级上学期10月月考历史试卷
- 2025年西学中培训结业考试卷(有答案)
- 黑素细胞基因编辑-洞察及研究
- 男衬衫领的缝制工艺
- 拆除工程吊装方案范本(3篇)
- 税务稽查跟踪管理办法
- 2025校园师生矛盾纠纷排查化解工作机制方案
- 学校教室卫生检查标准及执行细则
- 校园基孔肯雅热防控措施课件
评论
0/150
提交评论