大数据发现,厕所越干净,城市越发达,但它永远无法解释背后的原因。

< > >
作者:波波夫科技

如果下水道是城市的良心,所以厕所是一个城市的门脸。<
许多年前,人们发现了一个有趣的现象:城市的文明程度可以从厕所的卫生程度、清洁厕所和较发达的城市得到。但到目前为止,大数据还不能解释其背后的原因:城市是发达的,厕所是干净的,还是厕所是干净的,它也将促进城市的发展。<
对于这样的“鸡或蛋问题”,大数据加上传统的民意调查和小数据相结合就能找到答案。”“S1”>“强”>“01”谷歌只猜对了一次?
p类=“P4”“>”“=”。感谢维克多迈尔舍恩伯格Ma Yun孜孜不倦的说教。大数据现在已成为世界先进生产力的象征,几乎被赋予了无所不能的希望。<

在大数据时代,舍恩和Berg做的总结传统的小数据的三个特征:非随机样本,而是整个数据不精确,但;杂合;非因果关系,但相关性。<
第一个要证明大数据的强大能力的是谷歌。<
几周前,

2009在甲型H1N1流感爆发,谷歌公司的工程师发表自然论文,介绍GFT,成功地预测了甲型H1N1流感在全国蔓延,甚至具体到特定的地区和州,法官很,使公共卫生官员和计算机科学家震惊。<
但是,在接下来的几年里,谷歌一再预言失败,因此在2014著名的《科学》杂志上发表了一篇题为《谷歌流感:大数据分析陷阱》的文章。
与CDC流感发病率相关的搜索词中的很大一部分不是由流感引起的,而是由影响搜索模式和流感传播的第三个因素(季节)决定的。谷歌流感趋势的开发人员发现,特定的搜索条件随着时间的推移而改变,但这些搜索显然与病毒无关。例如,有些人可能只是搜索一个电影或文章来寻找流感。<
少数学者

在写作这篇文章,东北大学哈佛大学认为,大数据分析是很复杂的,但因为大数据的采集过程中,很难保证有像传统的小数据如此小心,将不可避免地出现不准确的情况。最重要的问题是,大数据分析侧重于相关性,从而导致因果关系的错误。<
它们建议大数据与小数据相结合,用“全数据”思维代替“大数据”思维。 p类=“P4”> >“类”=“S1”>“强”>“02”;
第六个年级的学生,清华大学给一个“大数据帮助你进一步了解苏轼”的文章,被称为大数据,大数据在这里实际上是小数据百分百,而恰恰是A型A的剂量“数据”苏东珀。<
这是“炒作大数据”的一个缩影。<
事实上,世界上并没有很多公司拥有真正的大数据。统计Trevor Hastie斯坦福大学教授有大数据的类比分析,像一堆干草,找到有意义的“针”,但困难在于很多干草也像一根针。

对大数据的困难和困难分析,这注定要达到阈值的高度。<
然而,传统民意测验所形成的小数据具有明显的优势:样本具有代表性、可操作性,并能快速收集和分析。<
30s

上个世纪,美国数学家George Gallo普通建立和调查样本5000的美国选民结构均匀,成功地预测了< 罗斯将赢得 1936 总统选举。盖洛普宣称,“我能以统计的方式证明上帝的存在”,开启了现代的商业化。<
在大数据范围内

资料全部来自网络,如果有问题可以发邮件到站长邮箱