内容发布更新时间 : 2024/11/10 5:15:48星期一 下面是文章的全部内容请认真阅读。
BY: 2016年 D系列报告 : 企业数据报告 出品机构:中国产业洞察网 www.51report.com 2015年度广东省粤电集团有限公司沙角C电厂 销售收入与资产数据报告 2015年度企业财务数据 独家拥有 融合互联网技术、大数据技术、呼叫中心技术、统计建模技术 的 倾情奉献! 中国产业洞察网 2016年 1 BY: 2016年 数据采集方法及步骤 1、 通过网络爬虫技术,获得1500万条企业的信息; 网络爬虫是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。它可以根据既定的抓取目标,有选择的访问互联网上的网页与相关的链接,从政府公开信息、媒体公开信息和社会公开信息中获取所需要的信息。实际上,多达80%的商业情报都以非结构化的自然语言文本的形式存在其中。通过网络爬虫技术,我们从公开信息中可以获得1500万条以上的企业名单及相关信息。 2、 通过大数据采集及分析技术,筛选出50万家营业额在2000万元以上的企业; 近年来互联网、云计算、物联网的迅猛发展,无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据。通过多维度的交叉分析,能够从海量的、多样的、非结构化的大数据中发现隐藏其后的关联体系,提取出有价值的、线性化的信息,从而帮助不同行业管理人员深入了解企业情况,做出更好的决策。通过预处理、分布式存储、数据挖掘等大数据采集和分析技术,我们从网络爬虫技术获取的海量信息中可以筛选、整理出50万家营业额在2000万元以上的企业,作为我们的企业数据库。 3、 通过CATI呼叫中心对50万家企业进行电话访问,得到更详细的企业信息; CATI即计算机辅助电话访问,是将现代高速发展的通讯技术及计算机信息处理技术应用于传统的电话访问所得到的产物。在进行电话访问时,须事先输入受访人的电话号码,由电脑按程序自动拨号,电话访问员在接通电话后不知道对方身份,只负责按规定访问内容进行访问对话。访问过程和内容可以实时录音,以确保调查访问内容的真实可靠。采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。中国产业洞察网在北京和上海分别设有电话访问中心,强大的CATI系统能够进行全国范围的电话访问,可以满足覆盖全国定性、定量访问的重大项目。通过CATI系统,我们从大数据处理得到的50万家企业信息更加完善,包括企业名称、企业所在地、企业联系方式、销售收入、资产总额等等。 2 BY: 2016年 4、 构建各企业网络影响力指数 随着移动网络及智能终端的普及,个人及企业已经成为庞大的互联网络中的一个节点,自媒体时代来临。能否有效地利用企业官网和微信、微博、头条等移动应用进行企业品牌宣传、产品营销和收集用户反馈,成为企业在未来赢得竞争的关键。我们通过大数据技术收集上述50万企业的官网访问情况、产品售后评价、社交媒体关注度等等,可以构建企业网路影响力评价模型,最终得出各企业网络影响力指数。该指数能够在一定程度上反映企业的真实经营状况。 5、 通过上述数据,构建企业财务评估模型,获得企业2015年度销售收入与资产总额数据。 结合CATI获得的详细的企业信息和各企业网络影响力指数,我们可以构建出企业财务评估模型。经过模型评估的数据能够如实地反映企业在2015年度的销售收入与资产总额。 6、 验证模型的准确性 为能验证我们模型的准确性,我们选取了2000家上市公司和500家新三板公司已公开的财务信息进行比对,误差率不高于1.5%。 综上所述,经过上述方法得到的数据是极其准确和全面的。该企业财务评估模型也是我国唯一一个采用综合分析技术评估企业经营业绩的模型。 本报告主要包含:企业名称、所在行业、省份、城市、2015年度销售收入、资产总额。 本报告已经广泛应用于中国券商50强、研究咨询机构、征信机构、高校科研单位等。 3