问:

在计算机领域未经处理的数据只是

答:
在计算机领域,未经处理的数据只是原始数据(raw data)。所谓原始数据,就是在 any 计算机过程或控制系统的第一个阶段收集的数据,它们未经过任何转换、计算或处理。原始数据的主要特征有:
1.质量参差不齐。原始数据的质量通常不高,会包含错误、异常值、重复值等。需要通过数据清洗等工作提高质量。
2.格式不统一。原始数据的格式多种多样,需要通过数据转换和标准化处理实现格式统一,便于后续处理和分析。
3.冗余度高。原始数据中常会包含大量冗余和重复信息,需要通过数据规范化等工作实现数据冗余度的降低。
4.杂乱无章。原始数据常常比较混乱无组织,需要对数据进行分类、整理和结构化处理。
5.准确度难以保证。原始数据的准确性和完整性难以得到保证,需要通过数据验证等工作确保数据准确完整。
6.不具有信息性。原始数据本身不具有太高的信息价值,需要通过数据挖掘与分析才能发掘信息与知识。
7.很难直接使用。由于格式不统一、质量不高等问题,原始数据不容易被直接利用和应用,需要进行较为繁琐的数据预处理。
综上,原始数据只是计算机处理和分析的输入和基础,需要通过一系列的数据预处理技术,如数据清洗、数据采集、数据转换和数据标准化等,将其转化为高质量的、有组织的、标准化的信息,以便进行后续的计算机处理与分析工作。