西安交大创新港又黄了:老树根新生涯 ? 对数据比例的分析

来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 07:06:40

对数据比例的分析

读到《福布斯杂志》中文版2011年3月号28页上一篇文章“财富与体键的秘密:比例”(英文版中文网站只到2月号),其副标题足以表达了作者的核心观点:决定成功的,往往不是数字本身,而是数字与数字之间的关系。虽然标题上提到了健身,但是文章主要说的还是经济、商业和财富方面的一些例子。比如作者认为观察美国经济复苏的几个关键数字比例分别是:美元与金价比例、美联储预算与GDP比例、债务与GDP比例、持技术签证的外籍工人与总移民的比例、公共免费义务教育(K-12) 学生表现与花费投入比例、高度成功的初创公司与公司总数(population,此处中文版译者错误地译成了“人口”,在统计学术语中这是相对于样本而言的“总体”的意思)比例,以及法律诉讼成本与GDP的比例。

在讲信息分析方法时,我自己发明了一个方法群,叫数据分析。没有什么外国或中国的理论或本本为依据,完全出乎实际工作需要,我们从事情报研究的经常要和数据打交道,主要不是生产数据,而是读懂数据,解释数据。不少决策者不大相信文字叙述的观点,却十分信任数据,以为数据就代表精确、代表科学性,然而实际情况却非常复杂,用数据来骗人已经成为一个有相当杀伤力的危害,为对付这些问题国外已经出版一些书籍,我找到仅台湾翻译成中文版的就有《如何用数字唬人:用常识看穿无所不在的数字陷阱》,作者:布拉斯兰和迪尔纳,(台)大是文化,2008年9月30日;和《别让统计数字骗了你》,作者:赫夫,(台)天下文化,2005年1月31日等。

数据分析当然不仅是为了识破骗局,做情报分析更多的是要读懂数字背后的含义,根据数字做出判断,这其中掌握能够说明问题的特定的数字比例就是诀窍之一。

多年前听一位朋友说起他看过的一本美国人写的书,大意是说(冷战时期)苏联政府是会系统性地编造假统计数据的,所以读他们的数据要非常小心;而中国则不同,他们造不来假,只能干脆不发布那些难看的数据。为什么造假统计数据很难?因为经济系统有内在规律,各个数据存在复杂比例关系,你随便修改容易,但是懂行的人一分析就看得出。

后来听“四大”这些公司搞审计的人说,查帐其实也有类似的技术,并非我等外行想象的一张张翻帐单核对,那要累死人的。那些大牌审计公司的核心技能之一就是掌握一些数据关系的模型,查帐时就去套,这些关系本身不构成发现错误的依据,但是如果严重不对头,就必须要一个解释,往往就是问题的线索,查帐就有强烈针对性。

昨天看华尔街日报中文网,恰好就看到一个实际例子。该网经济评论员的“小崔说会:“两会”留给了我们什么?”提到,温总理说2011年保障房要建设1000万套,同比增长了约70%,但评论员发现我国2011年预算的全国财政住房保障支出只增长了不到10%,这就是一个非常简单数据比例问题:保障房的标准不会大起大落,所以其套数和预算大体同步增长的应该不会错,这个比例一套上去就看出问题了。当然这仅是个“问题”未必是什么“错误”,一个合理的解释是住房保障支出大头是地方政府“埋单”了,评论员后面也正是这样解读的,但是不做那样的数据比例分析,马虎看看,极有可能就忽略了数字后面隐藏的信息。

在分析实务中像那样简单的比例关系机会不多,发现有意义的数据比例,尤其是具体具体数值,难度是非常大的。所以这可以成为分析人员的核心技能。我看其中主要还是要靠经验,数据关系的存在可能找一些理论依据,但是具体数值的多少,恐怕只有经验才能告诉你。不过当前分析海量数据的“智慧工具”出现,不知道能不能改变这个现象。