The Beginning
大数据处理流程可以概括为四步:
1、收集数据。
原始数据种类多样,格式、位置、存储、时效性等迥异。数据收集从异构数据源中收集数据并转换成相应的格式方便处理。
2、数据存储。
收集好的数据需要根据成本、格式、查询、业务逻辑等需求,存放在合适的存储中,方便进一步的分析。
3、数据变形。
原始数据需要变形与增强之后才适合分析,比如网页日志中把IP地址替换成省市、传感器数据的纠错、用户行为统计等。
4、数据分析。
通过整理好的数据分析5W,帮助企业决策。
THE END