大数据(推荐17篇)
没了对象省了流量
2024-02-05 03:32:19
其它
读后感

大数据(1)

除了动物大数据,这本书让我知道了,数据能帮助我们。更好地了解这个世界,我们用数据来衡量和对比事务。数据能解释过去发生什么还能预测未来将会发生什么而且还让我知道了。鲸有多大?猎豹能跑多快?狮吼声到底有多响亮,以及有多少种不同种类的动物。
到目前为止,人们已命名了数百万种动物。每年都会有数千种新的动物被发现。至今可能还有数百万种动物尚未被发现。这本书让我知道了。哺乳动物有5500种。两栖动物有。7450种爬行10000种……还让我知道了澳大利亚胡假装健步如飞。每秒钟能移动120倍。体长的距离。但它的眼睛处理图像的速度无法跟上步伐。所以,当这种假装告诉移动时,他其实是在忙行。
在过去五年里,地球至少经历了五次物种大灭绝。每次物种大面积都导致了当时超过半数的动物,物种灭绝。但是,这些灾难也造就了一部分赢家。那些在灾难中幸存的动物。它们的种群繁衍壮大了。
在过去的五次物种大灭绝中,人类不应该反省吗?

大数据(2)

2019年高考的最后一天,妈妈骑着电动车载着我,路上妈妈讲起她18岁高考前都没有出过县城,直到工作后才第一次坐飞机。相比之下,我们这一代幸福得太多,三四岁的时候就坐飞机四处旅游,从国内游到国外游……聊得正投入的时候,妈妈经过一个路口没看到红灯就闯了过去,直到走到路中央才发现。

妈妈暗自庆幸这个路口没有交警,我对她说:“你下次要注意,幸亏这个路口没有设置大屏幕。在草场门那个路口就有一个特别显眼的大屏幕,它连接着两个高清摄像头,摄像头对准斑马线中央,对每一个闯红灯的行人和非机动车进行抓拍,抓拍后通过人脸识别系统很快辨认出身份信息,并把图片和姓名一起显示在大屏幕上。你如果在草场门闯了红灯,那就把你闯红灯的照片和姓名一起曝光啦,那真是好丢脸啊!”妈妈听了我的话之后,一边懊悔自己没注意看红灯,一边还沾沾自喜没被逮住。可是话音还没落,我们快到下一个路口的时候被警察拦了下来,一开始觉得很莫名其妙,谁知道那个警察手里拿着手机给我们看,哎呀,这不是我们在上一个路口闯红灯的视频吗?隔了一个路口,竟然都没有逃脱,最终还是被抓住罚了50元。

事后妈妈一直在感叹现在的技术这么发达,她长这么大还是第一次因非机动车闯红灯被处罚,这个行人闯红灯识别系统解决了长期以来处罚行人闯红灯的难题。回想起过去,交警在抓闯红灯的行人时只能在现场抓,有时闯红灯的人太多了,交警来不及一个一个抓,有的人就趁机逃跑了;有时闯红灯的人看着没有证据就不承认闯了红灯。现在可高级了,南京的十字路口安装了行人违章抓拍系统,抓拍的视频传送到云端,然后进行大数据处理和分析,又传送到交警手里,整个传送处理信息的过程只需要你眨一下眼睛就可以完成,速度之快、准确率之高真是令人瞠目结舌!云端通过抓拍的视频进行大数据统计和分析,对于闯红灯次数较多的行人除了惩罚,还有可能列入诚信系统的“黑名单”哟!如果被列入诚信系统的“黑名单”你的麻烦就大了,可能高铁票都不能买了!这种大数据统计和分析,不仅给警察的工作带来便利,同时也给闯红灯的行人以警示,提醒和监督他们遵守交通秩序,确保出行更加安全!

据说大数据在每一个领域的应用都让人震惊,大数据时代给我们带来的影响真是巨大!作为祖国的青少年,我们在共享大数据时代的饕餮盛宴时,一定要以时不我待只争朝夕的精神,努力学习,遵纪守法,跟上新时代的步伐,向新中国成立70周年献礼!


大数据(3)

大数据时代:生活、工作与思维的大变革——读懂世界的转变

我们人类社会经历过几个重要的时代,农业时代、工业时代以及正在经历的信息时代,每一次时代的变革都给人类社会带来不容小觑的进步和发展。每次变革的最大不同,便是变革所推动的时代发展的速度,其中信息化时代的发展速度更是远远地超过了各个时代。我们每天都活在信息时代非凡的发展速度之下,当我们每一次浏览网页之时、每一次电话交流之时以及每一次阅读之时,都能感受到信息时代的飞速发展给我们带来的方便和快捷。

随着信息的爆炸式增长,许多具有创新思维的人便在其中找到了可挖掘的财富。在信息时代,我们每天都要面对纷繁复杂的数据,也许在未曾仔细分析之前,这堆杂乱无章的数据只不过是无用的信息。可是当我们利用一定的手段分析建模之后,它便会成为对我们极其有用的信息。为了更好地适应这个以数据为基础的信息时代,我们势必要作出恰当的改变。

《大数据时代:生活、工作与思维的大变革》(以下简称《大数据时代》)一书正好为我们提供了改变的新方向,同时它也是我们在大数据时代读懂世界的敲门砖。本书作者维克托迈尔舍恩伯格被誉为“大数据时代的预言家”,其在《大数据时代》一书中为我们详细地展示了大数据时代较之小数据时代的差异,以及在此基础上我们该有的改变。这些内容初看显得有一些不可思议,可是在仔细地阅读后确实令人获益匪浅。

维克托迈尔舍恩伯格在《大数据时代》中提出了三个重要的思维变革:

全数据模式,样本=总体

允许不精确

“是什么”,而不是“为什么”

这听上去有点摸不着头脑,可是在作者详细的解释下一切又变得合理且明确。

首先,大数据时代的数据不再那么难以获得。尤其是在互联网的大力发展之下,我们每天可能要面对成千上万的数据。而在过去,数据的获得却不是那么容易,所以人们更加倾向于使用样本来估计总体。面对这样庞大的数据时,我们完全可以将其当成一个总体来看,这样既减少了样本估计所带来的误差和错误,也为较准确地预测提供了可能。

其次,作者倡导了忽视精确这一概念。这在我们传统的概念里是不可能的,也是一种倾向于错误的选择。可是,我们换一个角度去思考,这类似于我们生态学上的大尺度问题和小尺度问题,对于大尺度问题,我们采取一种更加宽容的态度去收集我们所需要的数据,而对于小尺度问题,我们需要更加细化且小心地去收集数据,因为我们需要精准的数据来减少错误的发生。显而易见的是大数据的收集将需要这种“允许不精确”的情况发生,这不仅是为了减少我们收集的难度,也是为了获取更多的数据,这样我们所得到的数据才可更加接近真实总体。

在上述的两种思维引导下,作者为我们展示了第三个思维的转变。我们更应该追求“是什么”,而不是“为什么”,这样的说法不是很好理解,我们换种说法,我们需要做的便是运用相关关系去了解现象,让数据自己发声,而不是非得去揭示现象背后的原因。之前提到数据的预测功能,在这点上,我们往往需要通过数据来得到一个预测的结果,或许我们无法知道这个结果其中的因果关系,但是能得到这样的预测结果也是很有用处的了。另外,想要揭示一个事物的因果关系,我们得先有这样的想法然后才能收集数据来测试这个想法的可行性,而当我们拥有了更多的数据和更好的工具之后,我们可以直接从这样的数据中去发现现象,这也为揭示这个世界的规律提供了更多的前提。

最早的大数据概念是来自自然科学的生物学和天文学研究领域,这样的概念的提出,对于科研界来说是一个激动人心的创造。科学界对于事物因果关系的追求是天职,利用大数据,科学家势必去发现更多可以深入研究的有趣问题。而在商界,它也在潜移默化地引导着一场重大的变革。

将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。

“数据化”是一个有点抽象又无处不在的概念,从古至今的文字记录、图画留存到我们每一次的社交软件的使用,都可数据化。我们常常使用的网络购物软件,也许这对于我们来说仅仅只是生活便捷的软件,而对于购物公司来说,他便掌握了所有用户的全部信息,他们可以根据你的喜好为你推荐商品,甚至利用所有用户的数据来分析公司所需要推荐的热门商品。当我们周围一切都被“量化”后,数据的商业价值就变得越来越明显。

一些敏锐的商人,在嗅到大数据这块蛋糕所带来的利益后,便开始挖掘数据所带来的巨大价值。下面,我们可以更加深人地来看看大数据的价值链了。根据作者的论述可知,由于提供价值的来源不同,分别出现了三种大数据公司。这三种来源是指:数据本身、技能与思维。这三种不同的来源,创造三种不同的商业公司。拥有数据本身的公司,毫无疑问这些公司可以收集到大量的数据,比如Twitter,这一类公司虽然拥有庞大的数据源,但是他们自己本身不一定具备利用这些数据的思维;基于技能的公司,这类公司通常具有强大的数据分析工具和分析能力;基于思维的公司,这类公司往往能利用数据和思维来获取价值。三种公司的能力各有不同,但是也有一些公司可以同时拥有上述的三种能力。书中曾有一个例子:

微软曾经以1.1亿美元的价格购买了Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITASoftware公司。

如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身来挖掘。

大数据时代所给予的价值,不仅仅是商业和科研连接,这只是一部分,除此之外其价值也可与文化、社会、经济、政府决策等方面挂钩。事实上,现今的社会也确实是在大数据的引导下不断发展进步的,可是事物的两面性决定了大数据的利用必然是有一定风险的。虽然大数据的收集,给予我们个人、社会团体以及政府都会有一定的好处,但是这无疑是将每个人暴露于“第三只眼”下。当你在网络购物的时候,你所有的喜好都尽在购物平台的掌握之中;当你在浏览器搜索时,你的搜索内容也尽在浏览器开发商的监视之下;你的社交软件也总是根据你的人脉推荐朋友给你。当读到这里的时候,也许你已经想去关闭自己的朋友圈和GPS定位了。大数据的价值在不断地被挖掘,提醒我们的是大数据时代所对应的管理变革。

这也需要转变,我们不应该单纯地用“个人许可”这样的方式来简单地解决这种隐私泄露问题。在个人许可的情况下,我们仍然需要数据的使用者承担相应的责任。而数据的使用也势必需要规范,数据应该用在结果预测上而不是一些个人动机。当然,用于预测分析的程序也是需要有专门的人员来进行监管的,在这一点上,作者提出了“大数据程序员”的概念,这类似于一种监察人员,可以测评这些运用数据的预测程序的安全性。最后,对于数据的垄断也是不可取的,数据就像是燃料一般,不断地添加才可以维持一个健康鲜活的数据市场。上述的问题与相关法律的制定也是分不开的,只有不断完善法律方可制约这些风险的发生。大数据的发展并不是一时的,并且基于其飞快的发展速度,更需要我们对其将会发生的问题进行及时控制和管理。

大数据时代的到来,就像是一次全新的改革,我们身边的一切信息都可以数据化,但是我们看待问题的方式却不一定非要全部数据化。人类有着自身的情感和判断力,如果我们被数据完全引导,这便与我们探寻世界的初衷相违背了。在这样的世界变化中,我们可以去学习大数据,利用大数据,但更为重要的是我们思维的成长。正如作者说的那样:大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。


大数据(4)

当我们生活的环境日新月异,世界运行得越来越快,“复兴号”领跑世界速度,iphone7、8不断更新……;当我们无暇回望车窗外渐行渐远的树木和风景,越来越大、越来越薄的手机占据了眼前所有的视线;当我们的大数据共享,VR、AR、共享单车、共享充电宝愈发充斥在我们的每个角落……你可曾想过慢下来点生活,可曾想过再去玩玩弹玻璃珠、跳跳橡皮筋?没有!半点儿没有!

我们的生活已进入了这个全新的世界,回不去了——除非我们想这样做。共享,成了这个时代的代名词,共享成了人们热议的话题。共享的意义在于什么?并不是简简单单的可以方便我们的生活,它是在考验我们的素质。越来越多的装了个人车锁的共享单车,没了车垫的单车等各种令人尴尬的场景出现在我们的视野。单车的“诱惑”就摆在面前,在一部分人眼中就好像是免费的奖品,等找个没人的地方小心“行事”,共享单车成了“独享”单车和“报废”单车,这样的做法是最无聊,也是最没有意义的,希望不要有更多的人领取这份免费奖品。

随着共享单车、共享出租车发展,共享的概念似乎深入人心,将来是否可能存在共享国家、共世界呢?有,完全有,以当前人类的“共享速度”完全有能成为现实。但共享越多越好吗?不,共享有可能让生活变得更极端。

在上世纪末,最早的具有计算机模型的电脑“ABC”问世。当时的电脑使用麻烦、运行缓慢,只能每秒钟计算几百次,每计算一次都需要重新编程。发展到现在,电脑越来越轻,文字成了电脑页面的主元素。后来科技革命,2G、3G接踵而至,图像、视频接近我们日常生活。现在的电脑每秒上千亿次计算,这是大数据的时代,而是否想过接下来的发展是什么样子?是VR、AR和共享时代。当共享时代过度“共享”会发生什么?《三体》中三体星人的思想也算是共享,也遭到的是破壁和毁灭,毕竟这是科幻小说,三体人并不存在。可当我们换位到三体星人的角度,当我们进VR、AR世界,事态就不简单了。什么叫现实世界?有人会说那个人多的看得见摸得着的世界。可如果进虚拟世界的人多了,并在那儿建立又一个“真实”的世界。或将一个人在刚生下来就让他进入虚拟,那是否意味着现实和虚拟将逆转?你是否可以共享世界,帮他人活着呢?笛卡尔曾说:“我思故我存(在)”,这就是我们活着的意义,当我们随口一声吩咐,机器人帮你做,帮你算,那不就成了“活死人”了,在这个世界为谁而活呢?如果把你的世界共享,你就没有存在的价值了!《苏菲的世界》中苏菲和席德原先只是两个互不相识的人,可当席德的事越来越多卷入苏菲的生活中,苏菲也不由地为此抓狂。

“共享”其实并不可怕,可如果这种趋势扭转过多的话,这就失去了“共享”原本的意义了。当共享过度就会成为无思维的幻想,这才是非常可怕的。

正所谓“生于共享,死于幻想”!不要盲目地追随“共享”的形式,而是让人类的思想在共享中激荡,让创造力成为我们的最大助力,我们才能走得更远。这样的世界,才会保持近乎永恒的平衡和价值。


大数据(5)

对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的;话题,钟情于务虚的观点;新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。

首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。

作者认为大数据时代具有三个显著特点。

一、人们研究与分析某个现象时,将使用全部数据而非抽样数据;

二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。

三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。

作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。

面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。


大数据(6)

“除了上帝,任何人都必须用数据来说话。”——这是《大数据》中出现的让人印象深刻的一句话,也是全书力图传递的信息。在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。

美国是《大数据》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,Web3·0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、政府、社会带来的种种挑战和变革。

透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。

读完此书,对生活中的数据及数据处理突然有了很大的兴趣。如果有一天,处处以数据说话,那么,政治、制度、生活将更加清明,事故、将降到最低点。

作为信息技术教师,是有必要阅读此书的!有慧根的教师将能从书中挖掘出信息技术特有的文化以及能用于教学的鲜活案例。

每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据》就这样在坚持中溶入我的思想……


大数据(7)

读完《大数据》,我才意识到这并不是一本枯燥无味的'书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。

我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。

如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。

与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。


大数据(8)

对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。

首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。

作者认为大数据时代具有三个显著特点。

一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。

二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。

三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。

作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。

面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。


大数据(9)

如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。

在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:

一、更多:不是随机样本,而是全体数据。

二、更杂:不是精确性,而是混杂性。

三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。

一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?

我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。

在风险社会中信息安全问题日趋凸显。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考的答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考的答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。


大数据(10)

读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。

这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。

其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。

大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!

在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。

在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!

大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。

大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。

大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!


大数据(11)

3月11日下午两节课后,我校全体教师和受邀而来的金南学区各友好学校的领导及教师汇聚于多媒体教室,共同分享、交流《大数据时代》读后感。

老师们从:何谓大数据;立足国情对大数据进行探讨;大数据在教育教学中的主要应用等几个方面畅谈了自己的感悟。

张萌老师说:大数据体量庞大、结构复杂、是产生巨大价值的数据集合。大数据这种方法在中国的国情下需要以更加科学、合适的方式进行实践,不可生搬硬套。

董译雯老师说:在你我感叹《大数据时代》里深植于美国民众血液中的自由、民主、严谨的价值观的同时,可否想过中国教育体制下的孩子们身上还残留多少独立与自我意识?作为典型的八零后,我们这一代人身上最缺失的便是独立思考能力。但愿,我的学生哪怕是因为我所做的一点点努力而开始思考“我”这个字的含义,足矣!

张红杰老师说:很感谢校长给我们推荐了《大数据时代》这本书。在教学工作中,应该有大数据意识,创新意识。学习一些专业的教学统计法、数据分析法,从中发现一些教育现象,并采取相应的策略。让我们的教育教学工作少一些随意和盲目,多一份严谨与科学。

白媛媛老师通过文中的三个事例,结合教学实际,谈了自己教学中对数据使用的价值;结合自己的工作,谈了如何实现工作的最高境界。

交流活动尾声,身为阅读《大数据时代》的倡议者、发起者、以及忠实的读者韩校长幽默风趣的同大家分享了他读后的感悟:我们心中要装着学校,因为我们个人的命运依赖群体的命运;工作要追求精细化,不能做胡适书中的“差不多”先生;尊重数据,拥有数据意识,建立数据团队!

此次活动从寒假期间倡导读《大数据时代》一书,到开学伊始的分组沙龙,再到今日的阅读共享,现已圆满告一段落。相信此次活动定会增强我校全体教师的数据意识,掌握大数据,运用大智慧助推我校的教育教学上一个新的台阶!


大数据(12)

“除了上帝,任何人都必须用数据来说话。”——这是《大数据时代》中出现的让人印象深刻的一句话,也是全书力图传递的信息。在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。

美国是《大数据时代》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,Web3·0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、政府、社会带来的种种挑战和变革。

透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。

读完此书,对生活中的数据及数据处理突然有了很大的兴趣。如果有一天,处处以数据说话,那么,政治、制度、生活将更加清明,事故、将降到最低点。

作为信息技术教师,是有必要阅读此书的!有慧根的教师将能从书中挖掘出信息技术特有的文化以及能用于教学的鲜活案例。

每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据时代》就这样在坚持中溶入我的思想。


大数据(13)

读完《大数据时代》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。

我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。

如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。

与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。


大数据(14)

去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。

不过话又还得说回来,《大数据时代》是本好书。

当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧———巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。

看完此书,我心中的一些问题:

1、什么是大数据?

查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity这个好像是IBM的定义吧。

以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。

2、大数据适合什么样的企业?

诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。

同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?

3、大数据带来的影响

当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?

1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。

2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响的,当然是IT公司

3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。


大数据(15)

如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的。预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。

在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:

一、更多:不是随机样本,而是全体数据。

二、更杂:不是精确性,而是混杂性。

三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。

一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?

我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的`一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。

在风险社会中信息安全问题日趋凸显。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考的答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考的答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。


大数据(16)

首先,想谈一谈何为大数据,何为大数据时代。大数据是一种资源,也是一种工具。它提供一种新的思维方式去理解当今这个信息化世界。为何说是一种新的思维方式:在信息缺乏的时代或模拟时代,我们更倾向于精确性的思维方式,就像是"钉是钉,铆是铆",而在这种传统的思维方式下,我们得到问题的答案只有一个。

而在大数据时代下,我们打破了这种思维方式,换句话说,我们接受结果的不确定性。简言概括之,我认为大数据是一种预测模型。在大数据时代下,我们关注的不是因果,即为什么是这样,而更关心"是什么"这种相关关系。换句话说,在这种新思维的思考方式下,我们探究问题背后的原因也是不可行的。我们所做的是利用大数据这种工具,让数据自己说话!

其次,我想谈下如何利用大数据提升我军战斗力。当然,大数据分析并不是精准的预测,精准的预测也是不存在的。大数据只能有利于我们理解现在和预测未来的可能性。

作为军人,我所关注的是如何利用好大数据的工具提升我军战斗力,打赢这场信息化战争。毫无疑问,现在我们打的不是刀对刀,枪对枪的战争,更不是模拟时代,当代乃是数字时代,打的是信息化战争!

四次战争的大胜,美军的战争形态从机械化转向信息化,而且相应的在战场取胜的时间也越来越短,这正是大数据时代下的必然结果。而我军正在转向信息化的过程中。在此战争形态的过程中,我们需要更多的计算分析师,大数据分析师,数学家等高等技术性人才来打赢这场信息化战争。这正是大数据时代下我们不得不有的基础。我军战斗力的提升迫在眉睫!

当然大数据是一把双刃剑,利用好了取胜也是得心应手,相反,利用不好会导致不可估量的损失。

毕竟,这只是一种预测模型,得不到精准的预测结果。我们更要让数据为我们所用,不要被庞大的数据库框住我们的思维。为适应时代的发展,在这个适者生存,弱肉强食的世界,大数据时代下的残酷竞争已经给我们敲响警钟,一场悄无声息的信息化战争已经打响!


大数据(17)

随着大数据时代的到来,用大数据预测今年的高考作文题成为不少信息供应商的噱头之一,其中以百度预测最为引人关注,尤其是其押中了今年高考作文上海卷的自由主题,让不少网友喜出望外,表示妈妈再也不用担心我的高考作文了!到底大数据压题靠不靠谱呢?

高考作文押中题一直是不少考生的梦想。进入云计算时代,用大数据来预测高考作文题成为今年不少信息技术公司的主攻对象,甚至有大数据库号称押中今年高考12道作文题。

大数据库提供六命题方向

今年高考前夕,百度预测推出了高考作文预测项目,记者登录百度预测网站,就可以打开高考作文预测页面,页面上出现一个类似蜂巢般的图表,分成六大色块,每一个色块都代表今年高考作文最有可能的命题方向,每个色块均有一个主题,并配有命中百分比数据的分析,包括时间的馈赠(28.61%)、生命的多彩(15.80%)、民族的变迁(14.99%)、教育的思辨(14.58%)、心灵的坚守(14.03%)和发展的困惑(11.99%)。根据这六大方向分别配有8~9个不同的关键词,点击这些关键词就会出现3篇例文,再次点击例文,就会和百度搜索联系在一起,直接查看例文和相关素材。

根据这一预测,百度宣布这一预测项目成功押中今年全国18道高考作文题中的12道,如时间的馈赠,关键词为依旧和记忆,对应今年高考作文题中,江苏卷和广东卷的作文题目分别为什么是不朽、胶片与数码时代。而生命的多彩中,直接给出了关键词自由,几乎完全和今年上海作文题穿越沙漠的自由和不自由契合,而青春一词也在江苏卷中提到。

百度预测方面认为,这次预测充分展示了大数据的神奇之处,命中率之高令人难以想象。

挖掘8年海量数据做预测

据百度大数据专家介绍,此次预测高考作文题是百度挖掘了近八年各个省市的高考真题和模拟题,并且结合了近些年的搜索风云热点和新闻热点数据,根据当年社会思想的关注与潮流,现有数据和实时数据相结合组成百度作文预测的大数据库,并在它们与高考命题之间建立关联;而后,百度大脑将前面提到的大数据进行智能分析,通过概率主题模型算法模拟人脑思维,反向推导出作文主题及关联词汇,从而进行主题预测,提供关键词、几率以及范题和素材。

专家称,这种海量数据的分析对于一个每天需要响应几百亿次搜索的门户搜索网站来说,技术上并不算什么,主要是如何通过数据进行分析,所以表面上看,命题者的思路千变万化,毫无头绪,但是一旦放到海量数据下面进行分析,命题的个人意志一定会受到社会各种因素和信息的影响,大数据预测者就是要找到这个可能影响命题者思路的变量因素,而这中间的规律和轨迹又不是个体命题者能够体会和察觉的。

考生:上百范文等于没押题

今年参加高考的考生小利也告诉记者,实际上,所谓押题只能是把所有的希望押在几道题上,然后通过背诵文章、背诵结构和材料,确保写出高分作文,如果像大数据库这样提供了四五十个关键词,每个关键词又有3篇例文和大量素材,这样算下来就是100多道作文题,如果给你100多道作文题就不叫押题,直接叫复习而已,因为给出的可能性太多,其实可以忽略不计了,因为实际高三也会复习到大量作文题。

真正好的作文题不怕押中

陈庆雯老师坦言自己从不会让学生押题,以不变应万变才是最重要的,而且真正好的作文题并不怕人家押中。

华南师范大学文学院教授柯汉琳也表示,用大数据押题不但能让考生看到,也会让命题者看到,不排除命题者为了避免和大数据分析碰车特意另辟蹊径,而且就算是沾边押中了部分关键词,能不能得到高分仍是未知数,这些年作文题思辨性越来越强,几乎难有标准结论和答案,即便是范文可能也会因为缺乏新意而无法得到高分。

陈庆雯老师表示,押中完全一样的作文题的几率并不高,如果学生自己没有理解、分析能力,似是而非的去生搬硬套材料和范文,阅卷老师一般都能看出来,不但不会得到高分,甚至可能因为没有写出自己的真情实感而获得低分,不如扩大阅读面,储备更多的知识,这才是写好高考作文的制胜法宝。