100个常用大数据词汇中英文比照表

fun88手机指正在几毫秒内被创筑、管束、存储、阐明并显示的数及时数据(Real-time data) – 据

a) – 半组织化数据并不拥有组织化数据苛苛的存储组织半组织化数据(Semi-structured dat,的标识体例以确保数据的方针结但它能够操纵标签或其他大局构

tup) – 指研发最新大数据身手的新兴公大数据创业公司(Big data star司

– 由估计机体系自愿天生的文献日记文献(Log file) ,的运转进程记载体系。

– 由传感器或算法正在机械上发生的数机械数据(Machine data)据

tion) – 通过算法来识别数据中的形式形式识别(Pattern Recogni,中的新数据作出预并对统一数据源测

一个开源的、非相闭型、散布式数据库Hadoop数据库(HBase) –,p框架联合使与Hadoo用

ization) – 数据整合的进程数据虚拟化(Data virtual,多的数据消息以此取得更,会引入其他身手这个进程平常,数据库比如,次序利用,体系文献,身手网页,身手等大数据等

费者念法子会他们的数据有什么影响、被作那儿理透后性(Transparency) – 消,些消息都透后化了而机闭机构则把这。

compliance) – 当你操纵的云估计处置计划司法上的数据相同性(Juridical data ,的国度或差别的大陆时将你的数据存储于差别,念扯上相闭了就会与这个概。家的数据是否适宜本地的司法你必要介意这些存储正在差别国。

拓扑数据阐明闭键闭心三点:复合数据模子、集群的识别、以及数据的统计学事理拓扑数据阐明(Topological Data Analysis) – 。

特地值是指告急偏离一个数据集或一个数据组合总均匀值的对象特地值检测(Outlier detection) – ,的其他它相去甚远该对象与数据鸠合,此因,味着体系发作题目特地值的涌现意,另加阐明必要对此。

识别出片面消息的数据与其他数据分脱离隐私(Privacy) – 把拥有可,用户隐私以确保。

ysis) – 确定两个变量间的依赖相闭回归阐明(Regression anal。单向的因果相闭(译者注:自变量这种本领假设两个变量之间存正在,变量因,可交换二者不)

g) – 修筑正在搜集上的散布式估计体系云估计(Cloud computin,房表的(即云端数据是存储于机)

rning) – 人为智能的一个别机械研习(Machine lea,已毕的使命中举行自我研习指的是机械不妨从它们所,积杀青自我厘正通过持久的累。

data) – 由两个或多个庞大而互相相干个别构成的数据庞大组织的数据(Complex structured ,查问言语或用具(SQL)解这类数据不行简陋地由组织化析

– 从数据鸠合开采特定形式或消息的过数据发现(Data mining) 程

个以某种特定的身手来存储数据集中的仓数据库(Database) – 一库

s) – 仿真是指模仿切实处境中过程或体系的操作仿真阐明(Simulation analysi。时思考多种差别的变量仿真阐明能够正在仿真,职能抵达最确保产物优

ches) – 正在数据库中查问最好似的对象好似性查找(Similarity sear,能够是随便类型的数这里所说的数据对象据

ngs) – 正在浅显的摆设中装上传感器物联网(Internet of Thi,时分任何处所与搜集相连使这些摆设不妨正在任何。

a) – 非组织化数据普通被以为是洪量纯文本数据非组织化数据(Un-structured dat,能蕴涵日期个中还可,和实例数字。fun88官网下载app

乐fun8

大数据4V特质之一) 全部可用的数据代价(Value) – (译者注:,消费者创作出宏壮的代价能为机闭机构、社会、。财富都将从大数据中获益这意味着各大企业及全部。

– 当体系中某个任职器发作打击时打击切换(Failover) ,到另一个可用任职器或节点能自愿地将运转使命切换上

File System) – 供给简化的散布式文献体系(Distributed ,、阐明、管束数据的系高可用的体例来存储统

gence) – 是一系列表面、本领学和进程贸易智能(Business Intelli,更容易被理使得数据解

is) – 正在产物打算周期倚赖算法来杀青的优化进程优化阐明(Optimization analys,进程中正在这一,并测试这些产物是否餍足预设值公司能够打算百般各样的产物。

lysis) – 数字图像阐明本领是对每一个像素的数据举行阐明基于对象图像阐明(Object-based Image Ana,规律只阐明闭联像素的数据而基于对象的图像阐明方,为对象或图像对象这些闭联像素被称。

lity) – 也便是说可变性(Variabi,正在(神速)转化的数据的寓意老是。如例,Fun88游戏能够有一律差别的意义一个词正在相仿的推文中。

nalysis) – 是一种数据阐明本领闭联性阐明(Correlation a,间是否存正在正闭联用于阐明变量之,负相或者闭

es) – 这类数据库能够已毕一个机闭机构的向例操作操作型数据库(Operational Databas,营万分主要对贸易运,线事件管束普通操纵正在,检索公司内部的整个消息答允用户拜访 、征采、。

– 将很多散布正在差别处所的估计机连绵正在一同网格估计(Grid computing) ,个特定题目用以管束某,估计机相连正在一同平常是通过云将。

data) -能够机闭成队伍组织组织化数据(Structured,的数据可识别。常是一条记载这类数据通,个文献或者一,的数据中的某一个字段或者是被确切标识过,精准地定位到而且能够被。

ines) – 这些规矩有帮于机闭机构使其数据透后化数据品德规矩(Data ethical guidel,洁、平和及隐确保数据的简私

tion) – 使数据匿名匿名化(Anonymiza,人隐私闭联的数即移除全部与个据

TL: Extract提取-转换-加载(E,– 是一种用于数据库或者数据栈房的管束进程Transform and Load) 。据源提取(E)数据即从百般差别的数,餍足营业必要的数据并转换(T)成能,(L)到数据最终将其加载库

mory) – 一种数据库统治体系内存数据库(IMDB: In-me,体系差别之处正在于与浅显数据库统治,来存储数据它用主存,硬盘而非。举行数据的管束和存取其特质正在于能高速地。

XML数据库是一种以XML格局存储数据的数据库XML数据库(XML Databases) –。向文档型数据库闭联联XML数据库平常与面,数据库的数据举行查问开拓职员能够对XML,定的格局序列导出以及按指化

– (也称为面象对象数据库)以对象的大局存储数据对象数据库(Object Databases) ,对象编程用于面向。据库和图形数据库它差别于相闭型数,都供给一种查问言语大个别对象数据库,ve programming)拜访对象答允操纵声明式编程(declarati.

) – 将事务量分拨到多台电脑或任职器上负载平衡(Load balancing,最大的体系诈骗率以取得最优结果和。

荐引擎算法凭据用户之前的采办动作或其他采办动作向用户推举某种产推举引擎(Recommendation engine) – 推品

y) – 流露学问本体本体论(Ontolog,观点之间的相闭的一种玄学思念用于界说一个界限中的观点集及。被降低到玄学的高度(译者注: 数据,界本体的事理被付与了世,的客观数据全国成为一个独立)

rocessing) – 是估计机科学的一个分支界限天然言语管束(Natural Language P,与人类言语之间的交互它探索若何杀青估计机。

– 控造维持数据存储所需身手处境的专业身手人数据统治员(Data custodian) 员

sis) – 正在万分大的数据鸠合举行形式立室时对照阐明(Comparative analy,估计进程取得阐明结举行一步步的对照和果

t) – 不妨打算大数据算法使得大数据变得有效的大数据科学家(Big Data Scientis人

由大多基金创筑的大多消息或大多数据集大多数据(Public data) –。

– 空间阐明法阐明地舆消息或拓扑消息这类空间数据空间阐明(Spatial analysis) ,间中的数据的形式和规从中得出散布正在地舆空律

tem) – 是一种旧的利用次序遗留体系(Legacy sys,的身手或是旧,估计体系或是旧的,不再扶帮了现正在仍然。

– 射频识别RFID ;触式射频电磁场传感器来传输数这种识别身手操纵一种无线非接据

cs) – 这种阐明法是凭据用户的动作如“如何做”动作阐明法(Behavioural Analyti,这么做”“为什么,么”来得出结论以及“做了什,和时分的一门阐明学科而不是仅仅针对人物,中的人道化模它着眼于数据式

开源的散布式体系根源框架Hadoop – 一个,散布式次序可用于开拓,的运算与存储举行大数据。

– 从事数据阐明、筑模、整理、管束的专业人数据阐明师(Data analyst) 员

ion) – 将多个数据集中并正在一同再识别(Re-identificat,中识别出片面信从匿名化的数据息

– 顾名思义NoSQL ,QL”的数据库便是“不操纵S。据库以表的其他类型的数据库这类数据库泛指守旧相闭型数。更强的相同性这类数据库有,和高并发的数据能管束超大范畴。

is) – 阐明搜集或图论中节点间的相闭搜集阐明(Network analys,间的连绵和强度相闭即阐明搜集中节点。

is) – 从数据中取得主要的闭联性消息的体系化进程分类阐明(Classification analys;(meta data)这类数据也被称为元数据,数据的数是描摹据

s) – 大数据阐明本领中最有代价的一种阐明本领预测阐明(Predictive analysi,人改日(近期)的动作这种本领有帮于预测个,能会买某些商品比如或人很可,问某些网站也许会访,者发生某种动作做某些事宜或。差别的数据集通过操纵百般,史数据比如历,数据事件,数据社交,片面消息数据或者客户的,危险和机来识别遇

) – 操纵数据筑模身手来阐明数据对象数据筑模(Data modelling,据的内正在涵以此洞悉数义

) – 对数据举行从头审查和校验的进程数据洗濯(Data cleansing,息、订正存正在的差错宗旨正在于删除反复信,数据相同并供给性

雅的、界说精良的数据库体系NewSQL – 一个优,易研习和操纵比SQL更,晚提出的新型数据比NoSQL更库

d) – 操纵算法阐明数据仪表板(Dashboar,体例显示于仪表板并将结果用图表中

fun88体育备用

s) – 通过算法阐明出人们是若何对付某些话心情阐明(Sentiment Analysi题

一个扶帮容错打算的体系该当不妨做到当某一个别涌现打击也能接续运容错打算(Fault-tolerant design) – 行

) – 操纵利用次序跟踪用户一天的一举一动数字化自我(Quantified Self,解其闭联的行从而更好地舆为

ligence) – 研发智能机械和智能软件人为智能(Artificial Intel,够感知四周的处境这些智能摆设能,出相应的反响并凭据条件作,自我学以至能习

ses) – 是一种非相闭型数据库(NoSQL)多值数据库(MultiValue Databa,:能管束3个维度的数据一种额表的多维数据库。常长的字符串闭键针对非,ML和XML中的字串不妨圆满地管束HT。天堂乐fun88注册

es) – 数据的存储体例是操纵一个特定的键键值数据库(KeyValue Databas,定的数据记载指乐天堂体育备用向一个特,的查找特别简单躁急这种体例使得数据。编程言语中根基数据类型的数据键值数据库中所存的数据平常为。

s) – 阐明正在反复丈量时分里取得的界说精良的数据时序阐明(Time series analysi。须是精良界说的阐明的数据必,间间隔的一口气时分点而且要取自相仿时。

ases) – 行使图形组织(比如图形数据库(Graph Datab,的有序对一组有限,)来存储数据或者某种实体,括边沿、属性和节点这种图形存储组织包。间的自正在索引功用它供给了相邻节点,是说也就,与其他相邻元素直接相干数据库中每个元素间都。

s) – 将散开于繁多数据源的数据转化成一个全新数据源的过数据聚积用具(Data aggregation tool程

ysis) – 它是将好似的对象聚积正在一同聚类阐明(Clustering anal,个聚类(也叫作簇)的进程每类好似的对象组合成一。阐明数据间的区别和蔼似这种阐明本领的宗旨正在于性

analysis) – 将数据分类判别阐明(Discriminant;分类体例按差别的,到差别的群组可将数据分拨,者目次种别或。计阐明法是一种统,集群的已知消息举行阐明能够对数据中某些群组或,取分类规定并从中获。

) – 是一种主要的绽放大多数据由来气候数据(Weather data,由来合成正在一同若是与其他数据,构供给长远阐明的依可认为闭联机闭机据

– 正在低功耗任职器上存储那些险些不被操纵的旧数据冷数据存储(Cold data storage)。索起来将会很耗但这些数据检时

ion) – 只要确切的可视化可视化(Visualizat,可被加入操纵原始数据才。非浅显的图型或饼图这里的“可视化”并,的庞大的图表可视化指是,量的数据消息图表中蕴涵大,易地剖判和阅读但能够被很容。

p Management) – 用于统治出卖、营业进程的一种身手客户相闭统治(CRM: Customer Relationshi,的客户相闭统治的策大数据将影响公司略

– 被称为描摹数据的数据元数据(Metadata),(数据是什么)的消息即描摹数据数据属性。

注:大数据4V特质之一) 正在大数据时期高速(Velocity) – (译者,、虚拟化都条件被高速管束数据的创筑、存储、阐明。

种运输本领通过操纵多种差别的变量阐明从而找到一条最优途径途径阐明(Routing analysis) – 针对某,低燃料用度以抵达降,率的目降低效的

正在其他非游戏界限中行使游戏的头脑和机造游戏化(Gamification) –,的体例举行数据的创筑和侦测这种本领能够以一种相等友情,有用万分。

指正在能源网中操纵传感器及时监控其运转状况智能网格(Smart grid) – 是,降低效有帮于率

) – 正在没有程序的流程或本领的处境下从数据中开采形式查究性阐明(Exploratory analysis。据集闭键特色的一种方是一种开采数据和数法

机闭机构必要确保数据的切实性切实性(Veracity) –,阐明实在切性才华确保数据。此因,ty)是指数据实在切性切实性(Veraci。

tre) – 一个实体处所数据核心(Data cen,储数据的任职睡觉了用来存器

指通太过量随时分或空间转化的物理量来阐明产物的职能信号阐明(Signal analysis) – 。传感器数据卓殊是操纵。

4V特质之一) 数据老是以百般差别的大局体现多样(Variety) – (译者注:大数据,fun88体育投注平台化数据如组织,化数据半组织,化数据非组织,杂组织化数以至另有复据fun88网fun88体育首页