原文地址:https://medium.com/@blprnt/data-v-da0e0d24777c

作者:Edward Shepard  

翻译:腊八粥   

本文是翻译,版权归原作者所有


让我们把 data 变成动词吧。

我 data 你,你 data 我。他们 data 我们,我们 data 他们。

当你的简明牛津词典跨过屋子向我飘来时,我们还是花些时间来考虑下面的说法:

data 这个词语的角色和功能随着技术和文化对其重新定义,在过去的十多年里呈现了明显的变化。十年前,data 只是一个复数名词。具体地说,它是 datum 的复数——一条 datum、两条 data。在当时,你可以指出并嘲笑数据爱好者们,因为他们说‘data is’,而不是‘data are’。当然,那些 data 新手继续组建公司、制作软件、开发数据库、出书、以及做 TED 演讲。慢慢地,data 真的变成了某种特别的单数:它已经变成了普普通通的不可数名词。

i data you

不可数名词是被看做单数的词语,而不管其可能有多少。blood、homework、software、trash、love、happiness、advice、peace、confidence、flour、bread 和 honey——都是不可数名词,因为它们不能计数。我保证你在本文只能看到一次 big data 这个词语,它已经结束了:这个特定的流行语被准确地采用了,因为我们通过了一种无法挽回的界限,在那里 data 不再能够被计数。它已经变得如此广泛,以致于它不能再被低等的人类操作,而不得不总是使用更广泛、更复杂的算法和半结构化的数据库来计算。正如技术对这种规模上的巨大变迁做出了响应,语言也做了响应,data 这个词发现自己大众化了。

you data me

既然 data 已经忍耐了如此巨大的语法变迁,或许我们能够说服习惯用法的神灵们,彻底地转换这个词语可被接受的词类1:我们可以让那个 data 成为一个动词吗?这听起来有些怪怪的,请考虑和 data 相近的两个同义词:record 和 measure。这两个词语可做为名词(I made a record)、和动词(We measured the temperature of the room)、真正的动名词 2(They found a list of measurements and recordings)。相比之下,把 data 限制在呆滞的、不活跃的名词分类里,不觉得奇怪吗?

上面两个词语都有一种动词形态,对于 making records 或者 taking measurements,可以更容易地表达。我能够简单地说“I am recording this conversation”,而不用说“I am going to be making an record of this conversation”。如果我们把 data 动词化,就不必说美国国家安全局(National Security Agency)正在就我们的每次交互、移动和代谢功能,收集着 data。我们可以简单地说:They data us。

they data us

data 不是惰性的,然而,其被感知到的被动性,是一种非常危险的属性之一。当我们被警告,一个政府正在收集其公民的 data 时,我们或许没有留下深刻印象,尤其是因为这种收集行为貌似没有伤害、且无关紧要时。不过,data 当然不会被收集起来就扔在了一边:它将作为决策制定的基础;还作为区分、歧视和破坏的仪器。把词语 data 的活跃形态注入普通用法,能够提醒人们,收集和使用 data 的系统在影响、行动和暴力的功能方面,正在欺骗着我们。

把 data 变成动词,还可以向我们暴露,我们共同努力的显著不对等所带来的力量失衡。从语法上讲,data 动词化将为主语/宾语的组合提供很多可能:

I data you. You data me. We data you. You data us. They data me. They data us. We data them.

看到了这种充分的原因和效果,如今 data 的普通用法就显得非常狭隘了:在我们生活的 data 体验里,我们是宾语,而不是主语。Google 阅读了我们的每一封电子邮件,根据我们给朋友、同事和爱人写信的内容,不光彩地把我们放到了营销 bucket 3里。Uber 的算法把我们的深夜旅行标记为浪漫约会的记录。他们 data 我们,然后他们再次 data 我们。

甚至名义上体现着‘我 data 我自己’的、无辜的健身追踪装置,也不单单量化自己,而是量化“自己们”,除了让个人追踪他们自己的心跳,还是一种系统,它要找到居住在圣弗朗西斯科湾地区的所有 24 岁的人们,便于再次营销。这些建议都是给跑步和走路的人们提供的让人激动的玩具,对于律师而言,他们已经找到了反对人身伤害索赔的新方法

然而,对我们而言,还有很多潜在要记录的数据。去年,我们开发了 Floodwatch,它是一个基于浏览器的工具,让用户追踪他们创建的关于自己的广告情况——为个人提供追踪那些追踪者的能力。由 Ferguson 的积极分子 @samsway@Nettaaaaaaaa@deray 创办的项目 Mapping Police Violence,保留着美国发生的、被警察杀害的每个黑人的记录。这样,该项目就让我们认识到,简单的数据收集行为所产生的影响力就可以产生多么地强大,尤其是在一些有权势的人不想让我们看到数据的时候。

这些项目让我们大概了解到,如果我们放任关于 data 的想法,将其做为无辜的、被动性质的名词,就会发生什么。拥抱 data 新的动词形态,或许我们能够更好地理解其行为的潜力,相应地,把我们在 data 句子中、自己规定的宾语角色挪到前面4

在此过程中,我们或许能够设想关于 data 的理想前景,不仅他们在 data 我们,我们也将 data 他们。或许某一天,我们在一起 data。

we all data together

插图:Sukjong Hong – http://sukjonghong.com/


本文首发 OCR Journal #001,它在 The Office For Creative Research(OCR) 运营的前两年里收集了写作、形象和数据方面的东东。还有一些有限的版本拷贝可以买到。

ocr journal #001



  1. 词类(Part of speech)是一个语言学术语,是一种语言中词的语法分类,是以语法特征(包括句法功能和形态变化)为主要依据、兼顾词汇意义对词进行划分的结果。词类划分具有层次性。如汉语中,词可以分成实词和虚词,实词中又包括体词、谓词等,体词中又可以分出名词和代词等。http://zh.wikipedia.org/wiki/%E8%A9%9E%E9%A1%9E
  2. A verbal noun is a noun formed from or otherwise corresponding to a verb. Different languages have different types of verbal noun and different ways of forming and using them. http://en.wikipedia.org/wiki/Verbal_noun
  3. “Gmail can sort users not just into a few thousand demographic and interest categories, but into literally millions of distinct “buckets”. A “bucket” is just a cluster of users, however small, who share some feature in common that might interest advertisers.” 这里的“bucket”理解为一组用户,引用文字请移步本文提到的那篇文章:https://medium.com/@jeffgould/courts-docs-show-how-google-slices-users-into-millions-of-buckets-ec9c768b6ae9
  4. 把我们从宾语位置挪到前面,就成了主语。

发表/查看评论