GB/T 38667-2020.Information technology-Big data-Guide for data classification.
1范围
GB/T 38667提供了大数据分类过程及其分类视角、分类维度和分类方法等方面的建议和指导。
GB/T 38667适用于指导大数据分类。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 4754-2017国民经济行业分类
GB/T 35295-2017 信息技术大数据术语
3术语和定义
GB/T 35295-2017 界定的以及下列术语和定义适用于本文件。为了便于使用,以下重复列出了GB/T 35295-2017 中的某些术语和定义。
3.1
大数据 big data
具有体量巨大、来源多样、生成极快、且多变等特征,并且难以用传统数据体系结构有效处理的包含大量数据集的数据。
注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并分别赋予了它们在大数据语境下的定义:
a) 体量volume:构 成大数据的数据集的规模.
b) 多样性variety:数据可能来自多个数据仓库.数据领域或多种数据类型。
c) 速度velocity:单 位时间的数据流量.
d )多变性variability:大数据其他 特征,即体量、速度和多样性等特征都处于多变状态。
[GB/T 35295-2017,定义 2.1.1]
3.2
数据集 data set
数据记录汇聚的数据形式。
注:它可以具有大数据的体量、速度、多样性和易变性特征。数据集的特征表征的是数据本身或静态数据,而数据的特征,当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时,表征的是动态数据。
[GB/T 35295-2017,定义2.1.46]
3.3
大数据分类 big data classification
根据大数据的属性或特征,将其按--定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序的过程。