崔秀宁把自己关在寝宫,拿起一支炭笔,一边思索一边写写画画。
她要设计出,大唐版的大数据统计模型。当然,这肯定不能叫大数据,只能算统计年表。
古代当然也有数据统计。但因为方法论的问题,数据真实度非常可疑,而且采样元素太单一。宏观上勉强能用,微观上完全不能用。
这个问题,她和李洛之前都忽略了。大唐成立了很多新部门,却没有统计部门。这么大个国家,没有专业的统计部门,行吗?不行。
“数据还是比官员的奏章更可靠。”崔秀宁自言自语的说了一句,像做数学题那样,开始建立模型。
在调查监测过程中,最令人信服的是采集到的数据,而不是官员的主观汇报。数据很冰冷,可数据也最能反映客观问题。很多看似没有联系的不同维度的数据组合在一起,就能看出问题的真相。
这才是真正的以小见大。
前提是,数据不能失真。
崔秀宁当李洛这个“书法家”的老婆已经多年,字比当年漂亮多了。她的笔下,首先出现“县域”两个秀丽的字。
没错,经过斟酌,她要以县域为最小地域统计单位。以古代的条件,以县域为数据采集最小地域单位已经是极限了。
接着,女人的笔下出现1182四个阿拉伯数字,这是大唐所有的县域数量。
好了,最小数据统计地域定好了。那么由谁来采集数据?
当然要多方提供,而绝不能让地方官衙单方面采集。
原则上,专业部门,对口采集专业数据。
比如,某县一年的新生儿数量,性别比例,这项数据要有司妇寺来负责提供。
田亩变化数据,要有户部负责采集。
某地粮价等,要有商部负责采集。
如此一来,不同部门采集不同数据,不但便于专业操作,也增加了数据渠道,避免全盘作假。
手机版阅读网址:wap.11ei.com