会的解答下云测数据有哪些业内领先的AI数据服务实践?

  编者按:2020年,各省(区、市)纷纷公布了关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议(以下简称“十四五”规划建议)。各地区“十四五”规划建议中均提出大力发展数字经济,加快新基建,推动数字化建设。现将各地区“十四五”规划建议中数字化建设内容进行整理归纳,供参考。

  广东:建设具有国际竞争力的数字产业集群

  加快推进数字产业化和产业数字化,推动数字经济和实体经济深度融合,建设具有国际竞争力的数字产业集群,打造全球数字经济发展新高地。推动数字化优化升级,建设“数字湾区”、数字政府、数字社会,建设国家数字经济创新发展试验区,提升公共服务、社会治理等数字化智能化水平。探索数字数据立法,建立数据资源产权、交易流通、跨境传输和安全保护等基础制度和标准规范,支持企业参与数字领域规则和标准制定。加强数字化发展的支撑保障,提升数字技术和数字基础设施水平。提升全民数字技能,实现信息服务全覆盖。推动金融数字化、智能化转型,开展数字货币试点,打造金融科技高地。

  深圳:促进数字化转型,引领数字新生活,打造具有全球影响力的数字深圳

  加快释放数字经济潜力。制定数字化发展战略规划,加快推动数字产业化、产业数字化,壮大数字经济生产力。实施“5G+8K+AI+云”新引擎战略,加快推进未来城市场景应用和融合,打造鲲鹏生态体系,建设国家数字经济创新发展试验区、国家新一代人工智能创新发展试验区。推动大数据、云计算、数字货币、区块链等数字产业加快发展,加快培育平台经济等数字化新业态,拓展数字创意、数字影音等数字文化内容。实施工业互联网发展战略,大力支持工业机器人、传感器等发展,建设更多灯塔工厂、无人工厂、智慧车间,发展普惠性“上云用数赋智”。加快金融、物流、零售、旅游等服务业数字化进程。

  建设全球领先的数字基建。系统谋划数字化、智能化城市规划建设。科学布局支撑数字化发展的基础网络体系,构建覆盖“5G+千兆光网+智慧专网+卫星网+物联网”的通信网络基础设施体系,全面布局基于IPv6的下一代互联网,建设广覆盖、大连接、低功耗窄带物联网,推动跨境通信网络建设。统筹推进数据中心、工业互联网等新型基础设施建设,加快粤港澳大湾区大数据中心建设,构建多元协同、数智融合的算力体系。深入推进“5G+千行百业”应用。加快传统基础设施数字化升级,支持城市公用设施、建筑、电网、地下管网等物联网应用和智能化改造。

  加强数字政府建设。建设同城双活数据中心和异地备份中心,统一全市内外网络和政务云体系,推动政务数据高效采集、有效互联和规范使用。持续推进“互联网+政务服务”,推广掌上政府、指尖服务、刷脸办事,强化电子证照、电子印章、电子签名、电子档案等基础平台支撑,全面提升“i深圳”系列服务品牌。

  建设“云上城市”,加快发展数字教育、远程医疗等,建设公平普惠、便捷高效的智慧化民生服务体系。依托“城市大脑”探索构建数字孪生城市,实施“数字+”行动,使数字技术全面融入社会生活。

  加快完善数据治理体系。强化数据安全保护,建立健全数字经济体制机制,建立健全区块链、人工智能等新兴领域和数字版权、数字货币方面的制度法规,完善数据所有权、使用权、收益权,加强个人信息保护。加大数据资源开放共享力度,建立健全统一的政府数据开放平台,实行公共数据开放负面清单,引导社会机构和企业依法开放自有数据,与公共数据深度对接。推动数据资源资产化管理,鼓励数据资源合规交易、高效利用,促进数据要素在产业链上下游充分流通和深度融合。积极参与数字领域国际规则和标准制定,提出更多“深圳方案”。率先探索建立数据资源产权、交易流通、跨境传输和安全保护等基础制度和标准规范,推动数据资源开发利用。

  北京:实施应用场景建设“十百千工程”

  大力发展集成电路、新能源智能汽车、医药健康、新材料等战略性新兴产业,前瞻布局量子信息、人工智能、工业互联网、卫星互联网、机器人等未来产业。加快数字货币试验区建设,稳妥推进数字货币研发应用。

  实施促进数字经济创新发展行动纲要,打造具有国际竞争力的数字产业集群,建设全球数字经济标杆城市。深入实施北京大数据行动计划,加紧布局5G、大数据平台、车联网等新型基础设施,推动传统基础设施数字化赋能改造。实施应用场景建设“十百千工程”,率先在城市副中心、“三城一区”、冬奥园区、大兴国际机场等区域建设一批数字经济示范应用场景。鼓励线上教育、在线医疗、远程办公、云上会展等新业态发展。加快企业数字化赋能,促进平台经济、共享经济健康发展。加快数字社会、数字政府建设,提升公共服务、社会治理等数字化智能化水平。健全数字领域法规与政策体系,完善数据共享规则和标准体系,培育数据交易市场,组建大数据交易所,促进数据资源高效有序流动和深度开发利用。推动政务数据分级分类、安全有序开放,保障数据安全。积极参与数字领域国际规则和标准制定。

  江苏:努力建成全国工业互联网领先地区

  全面推进数字化。扩大重大科技基础设施、战略性新兴产业、卓越产业链投资,布局5G通信网络、大数据、物联网、特高压、智能电网、人工智能等新型基础设施建设。大力发展数字经济,推动数字产业化、产业数字化,建设全国数字经济创新发展新高地,努力成为全球信息网络重要枢纽节点。制定工业互联网发展行动计划,加快发展优势制造行业的工业核心软件,建设全国顶尖的工业软件企业集聚高地,谋划建设国家布局的工业互联网数据中心、新型互联网交换中心,推进企业“上云”、标杆工厂和企业数字化转型建设,积极创建国家“5G+工业互联网”融合应用先导区,努力建成创新驱动、应用引领、生态活跃的全国工业互联网领先地区。支持国家级江苏(无锡)车联网先导区建设。探索建设金融支持科技创新改革试验区、数字货币试验区。全面建设数字社会,打造新型智慧城市和数字乡村,提升城乡公共服务、交通物流、生态环保、社会治理、安全生产等智能化水平。加快建设数字政府,全面推进政务系统数字化建设,建立政务服务清单,完善数据共享体系和协调机制,促进公共数据资源汇聚和开发开放,着力消除“信息孤岛”。保障数据安全,加强个人信息保护。积极参与数字领域国际规则和标准制定。

  浙江:深入实施数字经济“一号工程2.0版”

  深入实施数字经济五年倍增计划,大力建设国家数字经济创新发展试验区,打造数字强省、云上浙江。加快国家(杭州)新型互联网交换中心、5G、工业互联网、大数据中心建设和下一代互联网规模部署,推进新技术、算力和融合型智能化基础设施建设,推动传统基础设施升级,建设新一代信息基础设施体系,建设人工智能、第三代半导体、类脑芯片、柔性电子、前沿新材料、量子信息等未来产业先导区。加快打造数字产业化发展引领区、产业数字化转型示范区、数字经济体制机制创新先导区,争取数字人民币试点,建设数字技术创新中心,加快打造数字变革策源地。创建国家制造业创新中心等高能级平台,培育壮大数字产业,形成一批具有国际竞争力的数字产业集群。推进工业、农业、服务业数字化转型,推动工业互联网和制造大省深度融合,培育提升“1+N”工业互联网平台体系,推广新智造模式。加快国家新一代人工智能创新发展试验区建设。加快建设数字社会,拓展新基建应用场景,推进生活数字化、公共服务数字化,深化“一件事”集成改革,高质量建成“掌上办事之省”“掌上办公之省”。加强数字立法,探索数字化基础制度和标准规范,完善数据产权保护机制,深化数据开放共享,培育数据要素市场,保障数据安全,加强个人信息保护。

  加快打造全球数字贸易中心,以市场化方式推进电子世界贸易平台全球布局,办好全球数字贸易博览会,建设线上线下融合市场平台、开源开放数据平台、国际结算平台。

  上海:构建联通全球的数字化金融基础设施

  积极争取数字货币运用试点,加快推进上海金融科技中心建设,构建联通全球的数字化金融基础设施。推动集成电路、生物医药、人工智能三大先导产业规模倍增,加快发展电子信息、汽车、高端装备、先进材料、生命健康、时尚消费品六大重点产业,打造具有国际竞争力的高端产业集群。加快数字化发展,大力发展数字经济,加快数字社会、数字政府建设,全力打造具有国际竞争力的数字产业集群。全面实施智能制造行动计划,大力发展在线新经济等新业态新模式,聚焦智能工厂、工业互联网、特色电商、网络视听等重点领域,培育壮大一批本土龙头企业,打造新生代互联网企业集群。

  持续推进“一网通办”建设,完善全方位政务服务体系,成为政务服务最优、营商环境最好的“网购型”服务城市。加强“云、数、网、端、安”基础设施建设,强化系统整合和数据汇集治理,实现“一屏观天下、一网管全城”,使“一网统管”成为上海城市治理的关键支撑和重要标志。

  山东:加快建设青岛世界工业互联网之都

  加快发展数字经济。推动数字产业化,加快集成电路、光电子、高端软件等关键基础领域创新突破,打造先进计算、新型智能终端、超高清视频、信创等具有较强竞争力的数字产业集群。支持济南建设中国算谷。推动产业数字化,深化互联网、大数据、人工智能同各产业融合,推动“现代优势产业集群+人工智能”,支持企业“上云用数赋智”。突出数字服务、智慧农业等领域,加快创新生产方式、产业形态和商业模式,打造全行业全链条数字化应用场景。建设工业互联网发展示范区,提升海尔卡奥斯、浪潮云洲等工业互联网平台国际影响力,推动骨干网、城市网、园区网、企业网全面升级,打造一批工业互联网产业园区。加快建设青岛世界工业互联网之都。建设泛在连接、智能融合的“网、云、端”数字设施,加速第五代移动通信基站布局和商用步伐。优化数据中心规划布局,推进黄河大数据中心等建设,推动国际通信业务出入口局落地,打造国家量子保密通信产业基地。

  福建:打造具有较强竞争力的数字产业集群

  大力加快数字福建建设。把数字福建建设作为推动高质量发展的基础性先导性工程,持续放大数字中国建设峰会平台效应,深化国家数字经济创新发展试验区建设。加快第五代移动通信、工业互联网、大数据中心、充电桩、换电站等建设。推进数字产业化,提升物联网、大数据、云计算、卫星应用等优势产业,大力发展人工智能、区块链等未来产业,推动集成电路、工业软件、网络通信、核心元器件及关键材料等基础产业迈向中高端,打造具有较强竞争力的数字产业集群。推进产业数字化,实施工业互联网创新发展战略,深入推进智能制造工程和“上云用数赋智”行动,拓展数字技术集成应用场景,培育新技术、新产品、新业态、新模式,促进平台经济、共享经济健康发展。优化提升数字经济产业集聚区。加强数字社会建设,提升公共服务、社会治理等数字化智能化水平。加强公共数据资源共建共享,坚决打破信息孤岛,把“数据池塘”汇聚成“数据海洋”。探索数字化基础制度和标准规范,完善数据资源基础平台。保障数据安全,加强个人信息保护。提升全民数字技能,缩小城乡区域数字鸿沟,实现信息服务全覆盖。

  四川:培育壮大“芯屏端软智网”全产业链

  打造数字经济发展高地。以国家数字经济创新发展试验区建设为引领,推动数字产业化和产业数字化,促进数字经济和实体经济深度融合,加快建设网络强省、数字四川。培育壮大“芯屏端软智网”全产业链,发展大数据、物联网、区块链等新兴产业,打造具有全国竞争力的数字产业集群。推动数据资源开发利用,创建跨行业、跨领域的国家级工业互联网平台,建设国家工业互联网标识解析(成都)节点,打造深度应用场景。布局建设云计算中心,加快建设成渝地区大数据产业基地,建成并运营成都超级计算中心。加快第五代移动通信、超宽带网络、大数据中心等建设,实施传统基础设施智能化改造,构建新型基础设施体系。建立数据流通制度规范,保障数据安全,加强个人信息保护。

  湖北:打造“光芯屏端网”、大健康等万亿产业集群

  实施战略性新兴产业倍增计划,促进产业集群发展。集中力量建设集成电路、新型显示器件、下一代信息网络、生物医药等四大国家战略性新兴产业集群,打造“光芯屏端网”、大健康等具有国际竞争力的万亿产业集群。高质量建设国家存储器、国家航天产业、国家网络安全人才与创新、国家新能源和智能网联汽车等四大基地,推动人工智能、大数据、物联网、区块链等技术集成创新与产业深度融合。

  加快建设数字湖北。实施数字经济跃升工程,推进数字产业化和产业数字化,促进数字经济与实体经济深度融合,催生新产业新业态新模式。加快数字社会建设步伐,推进智慧城市和数字乡村建设,推动数字技术在公共服务、生活服务和社会治理领域的广泛应用和融合创新。推动政府数字化转型,加强数据资源开放共享,实现科学化决策、精准化治理和高效化服务。着力建设5G、工业互联网、物联网等通信网络基础设施,以及区块链、人工智能、云计算等新技术基础设施,统筹布局数据中心等算力基础设施,发挥三峡区域清洁电能、安全区位等优势,支持宜昌建设区域数据中心集群和智能计算中心,构建高速智能的信息基础设施体系。应用新一代信息技术推动传统基础设施转型升级,发展智慧交通、智慧医疗、智慧应急等便捷智慧的融合基础设施。

  河北:办好中国国际数字经济博览会

  深化数字经济和实体经济融合发展,加快数字产业化、产业数字化。深入推进“上云用数赋智”行动,构建生产服务+商业模式+金融服务的数字化生态体系。抓好数字社会、数字政府建设,提升公共服务、社会治理等数字化、智能化水平。系统布局新型基础设施,抓好第五代移动通信、工业互联网、大数据中心等建设,建立全省统一的物联网感知设施标识,推进5G网络向县(市、区)延伸。加快基础设施数字化改造,建设数据统一共享开放平台,实施数字乡村建设工程,缩小城乡数字鸿沟。完善数据安全保障体系,加强个人信息保护。办好中国国际数字经济博览会,推进雄安数字经济创新发展试验区、石家庄数字经济产业园和张家口怀来大数据产业基地建设发展。

  湖南:打造全国一流人工智能算力设施、科学基础设施

  推进新基建,推进5G规模覆盖全省,加快下一代互联网规模化部署,打造全国一流人工智能算力设施。推进集群化创新基础设施建设,加快区块链技术创新体系建设,构建以天河计算机、量子计算、同步辐射光源、P3实验室等大设施和视频文创、新兴产业创新设施为支撑的科学基础设施集群。

  推动数字化发展。充分发挥信息化驱动引领作用,推动经济社会发展数字化、网络化、智能化。大力推进数字产业化,发展壮大电子信息制造业,加快发展互联网、大数据、云计算、人工智能等产业,做强做优软件服务业,拓展新一代信息技术应用场景。大力推进产业数字化,拓展工业互联网融合创新应用,推动企业“上云用数赋智”,推进服务业数字化转型。加快数字社会和数字政府建设。扩大基础公共信息数据有序开放共享,推动数据资源开发利用。构建数字经济生态体系,推进线上线下联动、跨界业务融合。强化数字经济信息安全,构建信息安全管理体系。

  安徽:做大做强“中国声谷”

  扩容升级科技创新“攻尖”计划,聚焦人工智能、量子信息、集成电路、生物医药、先进结构材料等重点领域,加快突破一批“卡脖子”技术。支持建设量子信息创新成果策源地和产业发展集聚区,加快形成量子信息产业创新链,打造具有全球影响力的“量子中心”。

  实施“新基建+”行动,加快第五代移动通信、工业互联网、大数据中心、超算中心、城市大脑、充电桩等建设,支持城市公用设施、建筑等物联网应用和智能化改造,打造智能双千兆宽带示范城市,推进互联网国际专用通道建设。

  加快数字化发展。发展数字经济,推进数字产业化和产业数字化,打造数字科技创新先行区和数字经济产业集聚区。实施人工智能产业创新工程、“人工智能+”应用示范工程、“皖企登云”提质扩面行动,建设合肥国家新一代人工智能创新发展试验区,争创国家数字经济创新发展试验区、中国软件名园、中国软件名城,支持建设数字车间、智能工厂、创新应用试验场、场景实验室。做大做强“中国声谷”。加快江淮大数据中心、安徽(淮南)大数据交易中心建设,推进政务数据和经济数据、社会数据资源归集整合、开放共享,加强数字社会、数字政府建设,推动安康码更多场景应用,提升公共服务、社会治理等数字化、智能化水平。探索推进大数据和网络安全、数据数字交易等地方立法。

  重庆:优化完善“芯屏器核网”全产业链、“云联数算用”全要素群

  建设适应经济社会发展的信息网络基础设施,系统布局建设新型基础设施,大力发展5G、工业互联网、物联网、大数据中心等,有序推进数字设施化、设施数字化。

  推动数字经济和实体经济深度融合。推进数字产业化和产业数字化,优化完善“芯屏器核网”全产业链、“云联数算用”全要素群、“住业游乐购”全场景集,高水平打造“智造重镇”、建设“智慧名城”。深入实施智能制造,培育打造一批具有国际先进水平的智能工厂、数字化车间和工业互联网平台。大力发展人工智能、云计算、区块链、数字内容、超算等大数据产业,积极发展软件和信息服务业,加快发展线上业态、线上服务、线上管理,积极培育智能化新产品、新模式、新职业。加强数字社会、数字政府建设,开发培育智能化应用场景,挖掘数据资源的商用、民用、政用价值,拓展智慧政务、智慧交通、智慧医疗、智慧教育、智慧旅游和智慧社区等智能化应用。深化数字领域开放合作。健全数字技术、信息安全等基础制度和标准规范,全面提升数字安全水平,加强个人信息保护。提升全民数字技能。

  江西:努力建设世界级VR中心

  全面推进物联网感知设施、高速智能信息网络、一体化大数据中心体系等信息基础设施建设,统筹部署窄带物联网、千兆光纤、数据中心及运算中心等建设,加快实现重点城镇、园区平台等第五代移动通信网络全覆盖。

  实施数字经济“一号工程”。加快数字化发展,推进数字产业化和产业数字化,推动数字经济和实体经济深度融合。集聚壮大先发优势数字产业。用好世界VR产业大会平台,加快产业项目落地和示范应用,努力建设世界级VR中心。深入推进国家“03专项”试点,推动第五代移动通信技术融合应用,大力发展移动物联网产业,加快建设“智联江西”。积极培育大数据和云计算产业,形成一批有竞争力的大数据产品、解决方案和服务应用。加速布局前沿新兴数字产业。培育集成电路设计、制造、封装、应用产业链。发展新一代人工智能技术,推动智能机器人、智能网联汽车、智能安防等产业集群加快发展。实施“区块链+”工程,建设一批区块链公共服务平台和应用研发中心,积极推进区块链与优势特色产业融合发展。构建北斗终端制造、位置服务软件开发、重点场景应用等生态,打造北斗产业基地。实施“上云用数赋智”行动,加快产业数字化、网络化、智能化步伐,培育新技术、新产品、新业态、新模式。大力发展工业互联网,推进企业上云上平台,推动制造模式升级。促进平台经济、共享经济健康发展。发展在线教育、互联网医疗、线上办公等线上服务新业态,推广众包、云外包、平台分包等新模式。建设高水平直播和短视频基地,积极培育“微经济”。

  陕西:强化数字基础设施和智能化技术创新应用

  加快数字陕西建设。加强5G、物联网、人工智能、工业互联网、北斗卫星导航系统等新型基础设施建设。推进数字产业化、产业数字化,积极发展面向汽车、装备制造、金融保险、现代物流、网络视听等行业应用场景的大数据产品及服务,培育发展大数据、人工智能、区块链、5G应用等新增长点。实施数字赋能计划,加快数字农业发展,推动制造业、服务业数字化转型,推动中小企业“上云上平台”。强化数字基础设施和智能化技术创新应用,建设西安新一代人工智能创新发展试验区、西咸新区国家级大数据和云计算产业基地、全省能源大数据中心,创建国家数字经济创新发展试验区。加快智慧社会建设,率先推进教育、医疗等领域数字化,提升全民数字技能,实现信息服务全覆盖。健全数据资源产权、交易流通和安全保护规范体系,加强个人信息保护。

  广西:推动互联网、大数据、人工智能等同各产业融合

  加强信息基础设施建设,建成高水平全光网络,建设全域感知智能终端,推进南宁国家级互联网骨干直连点等重大基础设施平台建设,加快5G、大数据中心等建设。加快融合基础设施建设,推动传统基础设施和公共服务设施数字化改造,构建多层次工业互联网体系,加快推广智能轨道交通。

  加快数字广西建设。以共建数字丝绸之路为引领,依托中国—东盟信息港,实施大数据战略,加快数字产业化、产业数字化,推动数字经济和实体经济深度融合。大力发展电子信息、信息技术应用创新等产业,积极培育鲲鹏、飞腾等新计算产业集群,推进5G产业创新发展,抢占区块链发展新高地,发展壮大地理信息、遥感、北斗产业,打造一批数字经济龙头企业和数字产业集群。实施产业“上云用数赋智”工程,推动一二三次产业向数字化、网络化、智能化转型升级。加强数字社会、数字政府建设,提升公共服务、社会治理、边境管控等数字化智能化水平。保障数据安全,加强个人信息保护。提升全民数字技能,实现信息服务全覆盖。积极参与中国—东盟数字领域规则、标准制定和东盟智慧城市网络建设。

  天津:着力打造人工智能先锋城市

  做强、做实世界智能大会品牌,大力发展数字经济,实施应用场景“十百千”工程,推进互联网、大数据、人工智能、区块链等同实体经济深度融合,着力打造人工智能先锋城市。推动建设国家基础软件创新中心,大力培育国产自主可控产业链和产业生态,全力构筑全国领先的信创产业基地。加快发展工业互联网和智能制造,建成一批标杆性智能工厂和数字化车间,建设国家智能制造中心城市和典范城市。支持5G关键产品的研发和生产,引导企业开发应用解决方案,建设5G产业集聚高地,打造全国一流5G城市。

  建设新型智慧城市,做强“城市大脑”,发展5G、工业互联网、大数据中心等新基建,推动传统和新型基础设施整体优化、协同融合。加强数字社会、数字政府建设,提升公共服务、社会治理等数字化智能化水平。加强数据资源汇聚存储、交易流通、开发利用和安全保护,构建数据资源服务体系。提升全民数字技能,实现信息服务全覆盖。

  贵州:打造云计算服务产业集群,做大“流量经济”

  加快5G、数据中心等数字基建,完善人工智能等基础设施,建设全国一体化国家大数据中心体系主节点。深入实施数据中心绿色化节能技术改造。加快传统基础设施数字化改造、智能化升级。推进北斗卫星大数据基础设施和新型基础测绘体系建设。

  大力推动数字产业化。大力发展以云计算服务为核心的软件和信息技术服务业、互联网和相关服务业,打造南方最大、服务全国的云计算服务产业集群。加速培育平台经济、共享经济等新业态,在国产数据库等软件开发设计领域形成新突破。大力发展高端电子信息制造业,重点布局智能终端、锂离子电池、新型电子元件、新型显示设备、高性能服务器和计算机等领域。大力发展通信业,做大“流量经济”。大力推动数据要素汇聚和流通,建设全国一流的数据要素集聚开发基地及数据流通市场。大力支持5G、人工智能、区块链等应用推广,打造更多行业示范、重点企业和关键产品。

  大力推动产业数字化。推进工业数字化改造,大力发展工业互联网,推动企业全流程和全产业链转型升级,提升生产经营管理数字化水平。深化农业产销智慧对接,建好用好农业综合服务平台,大力发展智慧农业。推动服务业向平台型、智慧型、共享型融合升级,大力发展智慧教育、智慧医疗、智慧物流等数字化新业态。大力发展数据融合新业态,推动特色优势产业与大数据深度融合发展。

  大力推动数字化治理。完善提升“一云一网一平台”,深入实施“数字政府”建设行动。加强数字社会建设,推进基层数字化治理。推进“互联网+”、“大数据+”、“区块链+”等在民生领域普及应用,扩大数字民生服务。推进“公共数据资源开发利用试点省”、“全国一体化在线政务服务平台试点省”建设,推进公共数据资源共享、开放、开发。探索建立数据要素驱动的数字化治理创新体系。完善大数据安全体系,推进大数据国家安全靶场升级,增强数据安全保障能力。

  辽宁:加快辽宁制造向辽宁智造转变

  着力建设数字辽宁。加快数字基础设施建设,超前布局第五代移动通讯、工业互联网、大数据中心等基础设施,构建泛在感知、高速连接、高效协同、智能融合、绿色安全的新型数字基础设施体系。大力发展数字经济,推进数字产业化和产业数字化,推动数字经济和实体经济深度融合,加快建设国家机器人创新中心、沈阳人工智能创新研究院等人工智能研发与应用平台,打造完整的大数据产业链,推进区块链技术发展应用,鼓励支持龙头企业建设跨行业、跨领域的工业互联网平台,扩大工业互联网标识解析应用规模,培育具有较强影响力的数字产业集群。推进数字社会、数字政府建设,建设省域数据统一共享开放平台,推进政务数据资源归集共享,有序开放基础公共数据资源,大力发展数据服务和资源交易,促进全社会数据资源流通,加快大数据、人工智能等政用、商用、民用发展。提升公共服务、社会治理等数字化智能化水平,推行智慧政务、智慧教育、智慧医疗、智慧物流、智慧交通、智慧金融等,提升智慧城市建设水平,加快辽宁“数字蝶变”。健全信息安全保障体系,加强公共数据和个人信息保护。

  云南:推广应用数字化的新技术、新业态

  大力建设“数字云南”。全面加速经济社会数字化转型,推进资源数字化、数字产业化和产业数字化,推动数字经济与实体经济深度融合,把数字经济打造成为引领经济高质量发展的强大引擎。以工业互联网为重点,加快产业互联网建设,加快农业数字化转型,促进服务业数字化发展,深化新一代信息技术同重点产业发展和打造世界一流“三张牌”融合应用。加强数字社会、数字政府建设,建设智慧城市,拓展数字化公共服务,提升政务服务、智慧教育、远程医疗、环境保护、社会治理、执法司法、边境管控、应急救援等数字化智能化水平。加快建设大数据中心。健全数据安全管理制度与标准规范,加强数据共享和安全保护,加强个人信息保护。建立数据资源开放共享、市场化配置体系,推动政府数据、重点行业、重点领域公共信息数据有序开放共享。

  系统布局新型基础设施。实施新一轮“云上云”行动计划,推进4G网络补短板工程,加快5G、人工智能、产业互联网、物联网、数据中心、超算中心等新型基础设施建设,推进物联网接入能力建设。推进数字工厂、智慧景区、智慧媒体建设,构建“城市大脑”。实施传统基础设施“数字+”、“智能+”升级行动,推进交通、物流、能源等基础设施物联网应用、智能化改造。

  山西:先行布局发展未来产业,跨界融通培育新业态

  加强5G基站、大数据中心、基于区块链的数据平台等信息基础设施建设,打造环首都数据存储中心、国家重要数据资源灾备中心、中西部算力中心和新一代信息基础设施建设标杆省份。聚焦半导体材料关键核心技术,发展砷化镓、碳化硅等第二/三代半导体材料,前瞻谋划第四代半导体材料研发布局,积极建设国家半导体材料研发生产基地。聚焦高端碳材料,加快碳纤维、石墨烯产业化培育和市场化应用,发展高端碳基合成材料,打造晋东南、晋中、晋北碳基新材料集聚区。探索开发量子通信卫星、数字货币、6G天线等未来新产品。提升改造先进新产品,开发基于深紫外技术的系列产品。加快布局北斗卫星导航等优势领域系列产品。

  突出数字化引领、撬动、赋能作用,着力推进数字经济与实体经济、民生服务深度融合,全面建设“数字山西”。培育智能制造新业态,加快制造向智造升级。加快形成人工智能和工业互联网产业“生态圈”。培育智慧物流新业态,开展智慧物流园区建设试点,提升物流业网络化数字化智能化水平。培育智慧城市新业态,加快数据开放共享、应用场景拓展,依托阳泉市、晋城市等全国“智慧城市”试点,打造一批先行区、示范区。大力发展“互联网+”新模式,培育扶持平台经济,积极探索“旅游+”“文化+”“农业+”等新业态。健全数字规则,依法规范发展平台企业。

  黑龙江:推进大数据中心建设,打造“中国云谷”

  推动数字产业化、产业数字化,促进数字经济与实体经济深度融合。培育数字经济新产业、新业态和新模式,拓展数字技术在现代农业、智能制造、智慧城市、流通体系等领域开发应用场景,加快数字应用和开发数字产品,大力发展平台经济、共享经济、未来经济。培育数据要素市场,探索建立数据要素定价机制,构建市场化公共数据资源管理服务体系。扩大基础公共信息数据有序开放,建设政府数据统一共享开放平台,建立健全数据分类分级安全保护制度。

  以“数字龙江”为引领,加快建设新型信息基础设施,推动5G移动通信网络规模部署,实现重要区域全覆盖。大力拓展IPv6应用,建设国家骨干网、接入网,全面建成“全光网省”。充分发挥独特冷资源等优势,加快布局建设大数据中心,把哈尔滨打造成全国大数据中心重要基地。推进超级计算、分布式计算和云计算中心建设,打造“中国云谷”,创建国家大数据综合试验区。布局建设全网赋能的工业互联网集群,争创国家级工业互联网示范区。

  甘肃:开展“东数西算”工程试点

  加强信息基础设施建设,构建覆盖全省、技术先进、安全可靠的新型信息通信网络,推进工业互联网、物联网等建设。突出融合基础设施建设,统筹融合数据中心建设应用,加快5G、大数据、云计算、区块链、人工智能发展和示范应用。建设网络安全产业园区,推动网络安全产学研用。大力发展智慧交通、智慧物流,全面推广新能源汽车,配套建设相关设施。积极发展智慧教育、智慧医疗、智慧政务,全面推进新型智慧城市建设。强化创新基础设施,建设中子研究大科学装置以及其他重点实验室、产业科技创新中心。

  提高数字化发展水平。大力发展数字经济,推动数字经济和实体经济深度融合,以数字技术创新赋能产业转型升级。完善城市数字化管理平台和感知系统,深化城市治理“一网统管”。推进数字乡村发展,加快乡村信息基础设施建设,推进农业生产数字化转型。加强数字社会、数字政府建设,提升公共服务、社会治理数字化智能化水平。开展“东数西算”工程试点,推进“上云用数赋智”行动,建设国家超算中心和区域智能计算中心。加快公共数据开放共享,保障数据安全,加强个人信息保护。

  内蒙古:建设国家北方一体化大数据中心和高性能计算基地、灾备中心

  推进数字内蒙古建设,提升数字化生产力,推动经济社会各领域数字化优化升级。大力发展数字经济,推进数字产业化和产业数字化,创建国家数字经济创新发展试验区。大力发展软件与信息服务业和电子信息制造业,培育发展大数据、区块链、人工智能、云计算、物联网等新一代信息技术产业,加快数字产业园区建设。推动数字经济和实体经济深度融合,实施数字化转型伙伴行动、上云用数赋智计划,加快传统产业数字化网络化智能化改造,推进服务业数字化。加强数字社会、数字政府建设,建设新型智慧城市和数字乡村,推进公共数据开放共享、政府信息共建共用,提升公共服务、社会治理数字化智能化水平。以新基建为牵引增创基础设施新优势,加快信息、融合、创新基础设施建设,加快5G网络建设和产业应用,建设国家北方一体化大数据中心和高性能计算基地、灾备中心。

  海南:打造“智慧赋能自由港”“数字孪生第一省”

  加快建设智慧海南。加快全省5G网络广域低频覆盖。推进移动物联网、工业互联网和数据中心等新型信息基础设施建设。加快推进各地区各部门间数据共享,打破“数据孤岛”。开展国际互联网数据交互试点,建设国际海底光缆及登陆点,设立国际通信出入口局,建成国际信息通信开放试验区。构建数字孪生治理体系,加快建设社会管理信息化平台,实现全域物流、资金流、人流等全要素数字化、虚拟化、实时可视可控,打造精细智能社会治理样板区。探索发展国际化远程医疗、远程教育,创建国际旅游消费智能体验岛。推进数字产业化和产业数字化,推动数字经济和实体经济深度融合,构筑开放型数字经济创新高地。初步将海南打造成为全球自由贸易港智慧标杆。

  吉林:建设制造强省、质量强省、网络强省、数字吉林

  加快“数字吉林”建设。加快推进数字产业化,推动大数据、云计算、物联网、人工智能等新兴产业前沿技术研发应用,以长春、吉林、延边为重点建设信息技术和软件产业园区,打造数字产业集中区和数字经济示范新高地。着力推进产业数字化,运用数字技术促进汽车、石化、农业等传统产业升级,推动工业互联网在重点行业推广应用,促进数字经济与实体经济深度融合发展。加快数字政府建设,持续推动“吉林祥云”大数据平台能力升级,打响“吉事办”应用品牌,推进数据资源共享和业务集成。全面推进数字化技术在城市运行、政务服务、社会治理、金融服务、生态保护、交通运输、旅游服务等领域广泛应用,建设数字化治理体系。落实吉林省促进大数据发展应用条例,强化公共数据管理,推动公共数据有序开放,加快培育数据要素市场,积极开发利用数据资源。保障公用数据安全,加强个人信息保护。

  宁夏:推动数据存储向数据应用转变

  构建信息网络体系,加快光纤宽带提速升级、5G网络规模组网、工业互联网建设,建设西部云基地(宁夏)一体化大数据中心,加快建设国家新型互联网交换中心,推进光纤入园入企全覆盖,建成千兆城市、宽带农村。

  实施数字经济战略,把数据资源作为重要生产要素,加快经济社会数字化转型,建设数字宁夏。推进产业数字化,推动人工智能、互联网、云计算、大数据等新一代信息技术在工业、农业、服务业领域深度应用,培育一批数字化融合新业态,推进产业智能化升级、数字化赋能。推进数字产业化,实施数字经济新业态培育行动,推动数据存储向数据应用转变,打造西部地区重要的大数据产业园和灾备基地。加强数字化治理,构建对接国家、辐射全区的公共数据共享开放平台,推进政务服务、公共服务、社会治理数字化智能化发展,提升全民数字技能,实现信息服务全覆盖。保障公共数据安全,加强个人信息保护。

  青海:推进“感知青海”建设

  全面推进5G建设应用,推动实现城市、县城、重点乡镇和重点景区5G全覆盖。推广卫星互联网应用示范。高水平推进国家大数据云计算和容灾备份基地建设,打造海南青藏高原大数据云计算产业集聚区。推进“感知青海”建设,推动物联网在生态环保、智慧农牧业、城市管理、仓储物流、应急救灾等领域深度应用,建设“城市大脑”。

  加快产业数字化、数字产业化进程,推进产业生产方式和企业形态深度变革。推动新一代信息技术与制造业融合发展,开展“5G+工业互联网”集成创新应用试点示范,实施“上云用数赋智”行动,推动智能工厂、智能车间建设。支持制造业与生产性服务业互动发展,开展先进制造业和现代服务业融合发展试点。促进区块链与实体经济融合发展,推动区块链在各领域深度应用。发展数字化现代服务业,推动新一代信息技术在教育、医疗、养老、文旅、商贸等领域广泛应用。培育分享经济、新个体经济、智能零售等新业态。鼓励发展直播电商产业,申报建设数字商务产业园。推进农牧区一二三产业融合发展,开展数字农牧业示范工程,发展循环、创意、会展、定制等农牧业新业态,推进高原特色农牧业与大健康产业融合发展。

2021年,ToB行业得到了前所未有的关注和发展。

这一年,国家出台了一系列政策,推动企业进行信息化建设,其中,促进传统产业向网络化、数字化、智能化方向发展的推动,更是为ToB行业的快速发展奠定了基础。

这一年,5G、人工智能、大数据等技术的成熟,为ToB行业带来了应用优势,企业可以通过技术与行业的深度融合,成功覆盖全业务场景,为客户提供全面的转型服务。

这一年,资本开始加倍下注ToB领域。在腾讯、阿里、字节、IDG资本等的重点关注下, 2021年国内Q1~Q3 共计发生了748笔交易,总金额达亿元人民币。

可以说,在政策、技术、资本的加持下,ToB如今势头正猛且发展强劲。而其中一些实力雄厚的企业,在技术、产品、服务能力上表现更佳。

为了让大众更全面发现、了解这些中国ToB市场的实力先锋企业,「ToB行业头条」联手3W集团正式发布了《2021中国ToB行业年度榜单·实力先锋榜》

此次评选共历时2个月,由「ToB行业头条」联手3W集团、50+投资机构及行业专家,从技术、产品、服务、发展趋势、市场竞争力等多个维度对参评企业进行综合评判,最终从报名及推荐参选的400多家企业中,挑选出了30家在ToB市场具有代表性实力的先锋企业。

下面让我们来看看,这30家企业究竟是谁?

经济学家Richard H. Thaler曾提出这样一个观点:“个人观点的微小变化可以演变为所有人的群体行为模式的重大变革”。

这意味着,在商业世界中,数据的收集处理和分析预测,必将对企业起着举足轻重的作用。

因此,将数据资产转化为价值,成为企业的不懈追求。

而随着数字化转型脚步的逐渐靠近,数据赛道必将二次爆发,企业如何运用无处不在的数据进行良性发展,成为新时代下的重要命题,这为数据服务商带来了发展机遇。

例如HCR慧辰,作为一家数据分析服务提供商,凭借着“一云两数”战略,专注为商业客户、政府机构等提供数据分析、数字化营销、行业数字化解决方案等服务,目前已得到各行业头部企业的广泛认可。

作为一家领先的大数据基础设施提供商,爱数以创新的产品与技术平台为客户提供整合、治理、洞察与保护的全域数据能力,并基于数据架构建立数据即服务,帮助客户从容应对混合云、多云战略的数据自由流动。

神策数据是国内专业的大数据分析和营销科技服务提供商,为企业提供神策营销云、神策分析云、神策数据根基平台三大产品方案,并通过全渠道的数据采集与全域用户 ID 打通,帮助企业实现数字化经营。

爱点击集团iClick,中国领先的企业数字化运营和营销云平台,致力于运用大数据技术帮助行业客户获得商业成功。历经12年高速发展,如今爱点击已稳定服务全球超过4000家大中型企业客户,并被外媒誉为“中国数字化运营第一股”。

这些年,国家正不遗余力的推动人工智能的发展。从《中国制造2025》到《新一代人工智能伦理规范》,AI已成为国家创新发展的重要一环。

在国家的大力扶持下,AI在基础算法方面已成为我国的优势面。

不仅如此,由于AI可观的商业价值和巨大的发展潜力,当前人工智能已开始在各行各业大放光彩,并因此诞生了很多专精特新的小巨人。

例如,国内领先的人工智能科技公司中关村科金,其通过人工智能、大数据、生物识别等前沿科技,以AI+得助数字化营销·运营·服务为引擎,以得助系列智能产品为支撑,目前已经为400余家头部企业提供了数字化解决方案。

九章云极DataCanvas,一家自主研发的中国公司,专注自动化数据科学平台的持续开发与建设,凭借国内外领先的自动化数据科学平台,目前已为政府、金融、通信、航空、制造、地产和互联网等多行业客户提供实时敏捷的AI能力建设。

还有中国 RPA+AI 行业领导者来也科技,其致力于为客户提供变革性的智能自动化解决方案,提升组织生产力和办公效率,释放员工潜力,助力政企实现智能时代的人机协同。

Testin云测是一家以人工智能技术驱动的企业服务平台,旗下拥有Testin云测试、云测数据、云测RPA三个业务子品牌,通过为企业客户提供核心技术、产品工具和专业人才三位一体的综合服务,为企业的长久发展提供助力。

恒拓开源是国内较早以开源技术进行企业服务的高新技术公司,专注于为航空公司、通用航空、机场、管理局等航空企业及航空院校提供信息化咨询、开发实施、开源化推进、IT系统管理、业务流程外包等服务。

2021年,随着企业上云紧锣密鼓的进行,整个云服务市场迎来了蓬勃发展。

在此情形下,如何更好地延续新的商业习惯,以及更好地满足和支持更丰富的商业需求,成为云厂商们努力的目标。

也因此,当前越来越多的云服务厂商,因赋能企业发展而走到人们的眼前。

例如有赞,一家从事零售科技服务的知名公司,主要通过全渠道、全场景的 SaaS 产品,为商家提供推广获客、成交转化、客户留存、复购增长、分享裂变等全方位服务,被誉为“中国版Shopify”。

全球实时互动云服务的开创者和引领者声网Agora,目前已赋能社交直播、教育、游戏电竞、AR/VR、金融、企业协作等20余行业赛道,200多种场景,是行业内的隐形巨头,随着元宇宙的爆火,声网也再次引起行业关注。

网易智企是网易旗下一站式企业服务提供商,包含网易云信、网易易盾、网易云商三大业务板块,多年来凭借着出色的AI、大数据、通讯音视频技术,已经为超过百万家企业客户提供通信与视频云服务,助力企业加速增长。

肯耐珂萨慧算账这些深耕人财税法的玩家,在过去几年声名鹊起,在此我们不做过多赘述。

至于元年云,是元年科技旗下智慧运营和数字决策平台,凭借其前瞻、专业、 技术 、宽能力四大差异化优势,目前元年云已累计服务5万家企业,用户数达168万,覆盖金融、工程、制造业、餐饮、专业服务、教育、软件开发等行业。

容联云是一家专业的智能通讯云服务商,基于云计算和人工智能系列技术,为企业和政府组织提供全面的通讯及数字化服务,助力企业和政府组织实现生产管理、市场营销、运营服务等系统的全数字化升级改造与融合打通。

凡科,一家专注为中小企业用户提供优质互联网产品与服务的企业,旗下拥有凡科网和营站快车两大业务模块,覆盖多种中小企业经营场景,帮助用户借助互联网技术的力量,更高效地进行经营。

纷享销客EC SCRM红圈CRM这几家深耕CRM赛道的玩家,都是中国SaaS市场知名度比较高的企业了,在此我们也不做过多赘述。

至于ZOHO,作为一家国际企业,其专注于为企业及个人提供专业、丰富的云端企业管理软件,助力企业数字化转型升级。当前,ZOHO已在全球20多个国家和地区设立分支机构,并拥有10000多名员工,整体发展态势良好。

2021年,是整个ToB行业容光焕发的一年。因此,除了大数据、AI、云计算等细分赛道,一些垂直赛道上的企业同样发展强劲,表现突出。

甚至有人断言:下一个十年,属于巨头也无法阻挡的垂直SaaS。而从ToB行业强劲的发展趋势看,未来这些垂直赛道确实有可能引发新一轮的爆火。

因此,2022年,对于市场来说,垂直赛道是一个无法忽视的存在。

例如,阳光雨露IT服务,一家IT服务行业领先的第三方服务平台,服务范围包括企业IT运维、系统集成、IT及行业解决方案、IT服务咨询等,致力于用专业的服务助力企业IT基础架构建设及数字化转型,协同企业实现降本增效的重要目标。

群核科技是全球领先的云设计软件平台和SaaS服务提供商,专注云设计系统及三维内容制作的技术研发和应用,为企业级客户提供设计渲染、营销展示、生产施工、几何建模等场景的解决方案和服务,赋能产业数字化升级。

特赞Tezign专注于技术与创意的融合,围绕企业内容工作流,打造连接企业内外内容生产、内容管理、内容应用的数字化平台,助力品牌以内容驱动增长。目前已服务8000+企业,成功帮助200+ 家中大型企业搭建内容中台,升级内容战略。

小熊U租是中国领先的IT办公设备运营商,主要围绕企业IT办公设备场景,提供全品类、全生命周期的综合解决方案服务,帮助企业解决运营中存在的资产管理困难、技术服务响应缓慢、办公设备效率低下等痛点,助力企业实现轻资产化转型。

作为向中国领先的泛建材全价值链参与者提供数字化供应链解决方案领域的先行者,网筑集团致力于为中国泛建材行业的参与者提供供应链SaaS解决方案及供应链服务,赋能中国泛建材行业的数字化转型。

云学堂致力于为客户提供数字化企业学习解决方案服务,通过“软件+内容+服务“的服务模式,以软件为入口,整合内容资源,配合专业服务,为客户提供数字化企业学习全链路解决方案。

云智慧是国内领先的全栈智能业务运维解决方案服务商,致力于通过先进的产品技术,为金融、政府、运营商、能源、交通、制造等数十类行业客户,提供数字化运维体系建设及全栈运维管理解决方案。

威努特,国内工控安全领军企业,致力于为轨道交通、石油石化、市政、智能制造、冶金及军工等国家重点行业企业提供安全咨询、安全评估、方案设计、安全建设、安全运维、安全废弃、安全培训及安全应急全生命周期安全服务。

若羽臣是一家面向全球优质消费品牌的电子商务综合服务提供商,主要为客户提供店铺运营、品牌定位、数字营销、内容营销、媒介投放、供应链管理等全渠道、全链路、全场景数字化服务,近三年年复合增长显著,极具行业示范效应。

  新浪财经讯 8月29日,由中国证券投资基金业协会金融科技专业委员会联合易方达基金、华夏基金、阿里云、通联数据等举办,新浪财经独家媒体支持的“FDDC2018全球金融数据探索与发现大赛答辩会”在北京威斯汀大酒举行。本次大赛有两大赛题,分别为“A股上市公司营业收入预测”与“A股上市公司公告信息抽取”。

  在营收预测赛题答辩中,复赛排名第一名的“Alassea Lome”战队表示,公司应收预测,应当把金融业与非金融行业区分对待。比如银行股,营收等财务数据较为稳定,不能与其他行业公司一起对比。此外,例如夏季营收显著高于冬季,所以建模中要特别注意。

  另外,上市公司披露的财务数据,可能存在“耍花样”的问题,投资者看到的是粉饰后的数据,需要二次筛查进行剔除,而团队的AI模型已经具备了识别这种行为的能力。

  据了解,“Alassea Lome”战队为吴云、万珊红、洪成晨、潘航、李帅5人组成的团队,现他们全部就读于武汉大学计算机学院,软件工程专业。

  吴云:请允许我代表Alassea Lome团队进行PPT展示,我叫吴云。

  这个赛题就是用公司的历史数据去预测公司下一季的营收,我们看官方给我们哪些数据,首先是资产负债表,然后利润表,营业收入在利润表里面,然后是现金流量表。这个数据是季度一给,但是我们需要注意的是就是金融行业的报表跟非金融行业的报表非常不一样,所以我们要对它进行一些特殊的处理。我们列出来我们国家A股的上市公司银行是25家,证券是33家,保险是6家,这些我们是要经过特别处理的。我们最终用的数据就是官方给的三大财务报表,我们是用的这些数据的。官方给了宏观数据、行业数据、公司经营数据,这是月度一给,我们并没有采用。同时官方提供了公司角度的行情数据,数据级别是一季度一给,我们同样没有采用。

  我们看一下这次比赛的函数,大家看一下我标红的部分,ytig(音)除以y,y就是公司的实际营收,ytig是我们对于这个公司营收的预测值。我们官方实际上预测的是你要在比例上预测正确,而不是在数值上预测正确。后面的si是公司市值,最终的评分是单个公司的loss乘以它的权重就是最终的总得分。loss的最小权重值是3.7,最大值是14.3,我们可以得到一个结论,市值大的公司并不是那么重要,并是市值的公司预测错了,loss会变得很大,不是这个道理,所有公司几乎是同等重要的。我们先不急着看模型,我们看一下公司的营收,它这一项它的序列有平稳和非平稳,我们举了两个有代表性的公司,一个是银行,一个是房地产。大家可以看到,银行的营收非常平稳,所以这个时候无论是你用时序模型还是其他模型,你最终预测的结果都是很棒的,就是选手的结果不会差很多。问题在哪?比如房地产的公司,它的波动非常举动,甚至还有营收为负的情况,我们怎么让模型学到这个特征,这才是我们比赛中取得高分的关键。

  我们看一下对于平德序列,直接是时间序列,它的效果很好。波动剧烈的公司分成了三类,第一类就是季节性很强烈的公司,比如夏季,格力电器,夏季的营收就是为了卖空调,标明是不是夏季、秋季、冬季。同时我们加入行业数据,就是加强季节性跟反季节性的学习,反季节性指的就是比如卖羽绒服的公司夏季的营收当然差,它夏季怎么卖羽绒服呢?接下来是行业整体不景气,就是整个行业所有的公司收入都不好,一个代表就是2018年上半年我们知道证券公司的日子不太好过的,我们怎么让模型学习到这样的特征,我们加入申万1+3级行业指数,通过指数的下降,整个行业不景气表征出来,我们同时还有其他的行业特征。最后就是比较头疼的就是波动非常剧烈的特征,我们怎么去学习。三个代表性的行业,房地产、多元金融和传媒。这个就是如果这个模型最终能够成功预测的话,就是它必须是这个公司之前出现过类似的波动,如果有的话这个模型可以学到的。如果其他公司出现过类似的波动,也可以学到。如果这两种都没有,我们特征里面必须有反应这种的特征。

  我们加入行业特征之后,这是我们对于证券这个行业整体的预测,这就是它2018年二季度的实际营收。除了跟之外,我们的模型预测都是偏大。但是我们加入了行业数据之后,可以看到整个模型预测是很准的。但是有两个意外,像东北证券和山西证券地方性的证券,它在整个行业整体下行的情况下,它的营收仍然保持不错,我们在整体行业预测变好了,对于地方性的证券公司,我们可以加入表征地方性公司的特征。

  之前评委提到公司的财务造假的问题,实际上我们是在我们的模型当中予以关注的。我们来看一下,就是在官方给的三大财务报表里面包含了公司上市之前的财务数据,因为公司上市之前交易所强制它公布你上市之前的经营数据,但是这部分经营数据事务所会审核,但是因为年代很久远,这部分数据我们认为它的真实性要打折扣。同时因为公司只有年报被事务所审核,它的季报跟半年报都是不审核的,我们对这部分数据表示质疑。

  我们再来看一下营业收入同比增长率上的猫腻,我列举了一个公司三期的营收,大家可以看一下这个公司2018年3月份比2017年3月份的收入低一点,我们可不可以认为这个公司2018年6月份经营状况也是往下跌的?这个公司整体处于下行的状态。但是不是,这个公司逆势上扬。上市公司的财报有投资者非常关注的是营业收入同比增长率,一般公司粉饰这个增长率,会把营收给评估过去,大家会发现这里面有个规律,2018年6月份加2017年6月份等于2017年3月份加2018年6月份的营收的,这是公司常用的造假的伎俩。还有一家公司历史营收,三季的营收数值一模一样,这类数据我们是不考虑的。

  因为金融数据里面有非常多的噪声,下面我们开始讲一下我们是怎么清除这些噪声的。

  我们把官方提供的三大财务报表里面所有出现过的公司提取出来一共3551家,我们把其中B股、ST、*ST全部剔除掉。我们把营收数据少于4条的公司剔除掉,同时把近期停牌以及存在明显财务造假的公司剔除掉。这里我们把所有公司的数据删掉,另外一个维度,我们把一个公司一段时间的数据删掉。首先我们把2010年之前的所有数据删掉,过于久远的数据对于现在是没有影响的。同时把公司上市之前的数据全部删掉。如果公司某一阶段营业收入为负或者0,把异常时间段所有数据剔除掉。测试集上的公司某一时间ST、*ST的剔除。营业收入低于100万的时间段,剔除期间所有数据。

  下面我来讲一下我们的数据集的结构。

  首先我们把官方的三大财务报表里面的所有特征提取出来,需要注意的是资产负债表是点的概念,我们不需要做当季值处理。利润表和资产负债表要做当季值处理。绝对没影响的特征要删除掉。金融行业跟非金融行业财务报表非常不一样,我们会把金融行业跟非金融行业共有的特征提取出来放在最前面,分别加上金融行业的特征。这就是我们三大财务报表的一个基础财务数据。同时我们引入行业分类,主要引用申银万国,但是我们这里做了一个变化,我们并没有把申银万国一到三级的行业分类全部拿近期做类比特征,因为知道如果类比特征太多的话,数据的维度太高了,噪声就特别多,所以我们只是采用了一级行业的分类。这里面有一个技巧,申银万国一级分类里面没有包含保险、证券和多元金融,我们人为地把非银金融行业拆分为证券、保险和多元金融,所以申万的一级行业分类由28个变成30个,这是为了方便我们预测证券、保险、金融那三个行业的公司。

  同时我们加入指数日行情,所有指标进行特殊处理,我们认为这种指标解释性更强。同时我们还有行业估值信息,这都是为了表征行业的整体情况。

  同时我们在公司角度上加入了沪深股票日行情以及个股日资金流向。财务衍生数据实际上也是多音字数据的一种,这些数据加入的原因就是这种财务的因子可能比财务报表上提取的单一数据解释力更强,最终我们还加入了表征整体特征的宏观数据。这里值得一提的就是我们考虑过从行业的角度去训练公司,比方说我们把化工行业挑选出来,如果训练的话要加入行业独有的特征,比如银行业要加不良贷款拨付率,最终我们发现这样的训练效果没有我们在所有公司训练好,所以最终这个数据是弃用的。

  下面是我们做的比较有创造性的工作,就是我们加入了滑窗特征,我们的训练是滑窗训练。以2018年2季度营收为例,除了给公司2018年一季度的营收之外,我们还把它前四个季度的营收告诉给这个模型,告诉给模型的原因就是金融数据是一个时序性非常强的序列,我们告诉模型它的历史上的信息。然后同时我们还加入比率滑窗,就是上一季度除以再前一个季度的特征,也是给了四个季度。

  我们的训练方式是五年一滑,但是我们一共有三个验证集。比如在2018年3月份的验证集上,取它前五年的数据作为训练集。我们不仅仅是在2018年3月份做验证,我们营收的是夏季,但是2018年3月份是春季的营收,所以我们加入过去一年夏季的验证集,同时我们也引入2016年6月份。可能大家要问为什么加2016年6月份,2015年6月份加不加?我们是做了实验的,在这三个训练集上训练模型是最好的。

  我们在模型里面,我们有的模型是在三个验证集上训练然后求平均的效果,loss最低参数就是最优参数。但是我们也有模型它只在2018年3月份上做验证,我们愿意去冒险,去赌未来涨的时间跟这个一样。

  我们看一下我们各个模型它的得分,因为xgb是我们的主模型。在不同的模型选择上,它的得分在0.4到0.5之间波动。然后xg30(音)在0.45以上,stl是在0.45到0.5之间,DNN在整个数据集上由于它得分效果不好,所以最终没有用神经网络建设模型。

  得到这么多特征之后,怎么选哪些特征是重要的对我们是好的,我们创造一个我们认为比较合理的特征选择的方法,首先把训练集默认特征全开,多轮预跑后得到所有特征的重要性,机器自动挑选前一百或者前五十的特征,这样去看loss有没有降低,如果降低我们认为这些特征组合比较好的。如果等于1,一个特征的排序,这里面我们比较高兴地看到标红的几点,一个是递延所得税资产,一个是资产减值损失,这两个跑到前面了。如果你对财务报表比较熟悉,这两个特征是公司经常修改利润、隐藏利润的手段,我们很高兴模型学到了这种隐藏的特征,把上市公司的伎俩也学到了。最终在步骤3中,我们把之前提到的特征比较好的,挑选loss最低的特征个数,生成新的训练集,然后进行不推参数组的grid search,确定最优参数组。步骤3中,我们会把一些我们对金融市场的理解,比如申万一级行业分类,我们认为这个特征是一定要的,我们会默认开启排行统计财务报表里面重要特征。

  总结一下模型的训练步骤,首先在训练集的生成上,我们的数值滑窗特征不一定是四个季度,有可能是两个季度。我们的类别特征就是申万一级行业分类开不开启。时序模型无需训练,STL和Holt-Winters二者的简单平均loss在0.48左右。xgboost主模型,random forest作为辅助模型。划分三份验证集训练,还是分别仅划分一份训练集训练。特征选择上,我们多轮预跑,首先挑选最重要的特征。是否人工指定某些特征参与训练,在集成上搜索全行业的特征。模型导航上,最终我们部署了27个模型。模型融合上,真正我们之前谈到在某一个验证集上会验证的那些模型我们认为很冒险,所以我们加了个简单的信息分类进行融合。我们得到了27个模型,但是最终我们选,这是最终结果,提到哪个模型,我们最终是从行业的角度来看我们的模型。这是2018年3月份我们各个模型在不同行业上的表现,我们可以看到在化工这个行业上,它的模型4的效果是最好的,所以我们就用模型4去预测化工这个行业。机器设计上就用9,所有依此类推。

  总结一下我们的一些优势跟还没有做到的事情,我们的数据上进行了大量的数据处理,清理了噪声。我们加入了自己的数值滑窗特征还有比率滑窗特征,同时我们引入了行业的数据还有一些外部数据。训练方式上,我们用的是滑窗训练。同时我们在三个验证集上验证,增强了模型的能力。特征选择上,我们有一套可操作性强的机器自动选择特征的方法,模型选择上我们部署了多个模型,从行业的角度最终挑选模型。可扩展性,我们从这个比赛一开始我们就想把它写成一个主流的机器学习的流程框架,所以我们有了从数据预处理到最终模型保存的几乎的所有的模块,我们自定义了CV,实现了很多xgboost官方很多没有实现的功能,可扩展性极强。

  最终三点启示,假如最终还是预测财务相关数据,我们这个模型是可以直接迁移过去的没有问题。那我们还没有做的就是我们之前提到了按行业去训练,就实际上我们最终的特征个数最高也就600个特征,但实际上你要知道预测公司营收一般是各大券商的研究所他们优秀的研究员一个人盯一个行业的几家公司,他们去实地调研,他们可能对这个公司的了解、对这个行业的了解,如何把他们的知识纳入到我们的特征库里面,如果能够纳入进来,对我们的模型有质的飞跃。关于金融数据,首先是非结构化,噪声很多,我们的处理方式就是我们进行了大量的噪声处理,同时金融数据是一个时序高度相关的模型,所以我们加入了数值滑窗还有比例滑窗特征。金融数据未来的分布可能跟现在的分布不一样,我们在多个验证集上进行验证,进行模型的创新。

  主持人:感谢我们的AL战队带来的分享,导师现在可以跟选手进行互动,有没有什么想要点评的地方都可以提出来。

  薛伟:因为我们今天下午的第二道题目是信息抽取,这种信息抽取的技术对于非结构化的数据它是可以提取更多有价值的数据的,刚才你在未来的启示上有提到。你觉得具体怎么去做或者哪方面的数据,可能会对你这个题目有帮助?

  吴云:我本身是一个优矿的忠实用户,这个题目出来就是两个赛道我们都是想参加的,后来我做了一下取舍,因为时间上精力不够有限,我想把这个问题做好,所以我只参加了赛道一。这两个赛道结合到一起,赛道二提出来的结构化数据可以为赛道一服务的。首先我跟很多赛道二的选手进行了沟通,我刚刚并没有说赛道二是完全为赛道一服务,他们做的工作可以我们马上接着用。昨天跟赛道二的一些选手进行了沟通,实际上你会知道公司发布公告,很多公司他们发布的数据方式是很老的。举一些例子,比如老一辈的财务总监他们可能拍一张照片,把公司的财务报表传到网站上,大家去查数据下来。我们这个时候可以用CV的方式,把财务报表里面的表格定义出来,再把数据自定义到,同时把整个数据每个字段对应成什么样,这对于我们帮助很大的。假如交易所定义一个规范,就没有这些事情了,没有大家去查数据,可以在源头上做更高效率的事。本身对于结构化的努力是有必要的。

  薛伟:像这些财务数据或者是其他数据,其实都是市面上提供的比较多的一些已经结构化好的数据。那你觉得有哪些还没有结构化好的数据,你是可以利用起来的?

  吴云:这个比赛当中我们主要从国内量化平台下来的数据,实际上是比较干净的。比如说没有结构化好的就是在数据的本身我可以说一点,官方提供的财务数据上一个报表我们可以看到,因为上市公司会修饰之前公布的数据,2018年的公告会修饰2017年的数据,在公司的财务报表的信息里面我们会看到它有两条记录,有时候两条记录时间标志一样,选手没有办法判断,我应该选哪一条数据,除非加一个字段,这个爬虫是10点爬的还是11点爬的。这种数据如果能够结构化,节省很多事情。我没有办法给出一个标准答案哪些数据可以结构化,因为没有去想。

  刘硕凌:作为赛题一的现在比分上第一的选手,我想问你一个问题,像我们易方达有很多资深的投资人员和研究人员,我们日常的工作当中也会涉及到预测。刚刚你也提到,未来考虑把一些专家的经验融合到你的模型里面。我想问如果说我跟这些专家希望把你的能力融入到我们专家体系里面来,你觉得两种方式有什么区别吗?

  吴云:我们做这个比赛一开始,有一个朋友是农民木鱼(音)的排名很靠前的,我们咨询他的意见,他把他的库传给我,他们更新一万多指标,我们只有六百多个。他们出了一万多之外还去实地调研,他们知道这个公司这段时间之内,比如猪苗究竟怎么样,有没有疫情这种。这种数据你这边是拿不到数据的,因为我们的数据都是量化平台上公开的数据。他们的数据在研究所里面,首先是不会公开的。假如研究所愿意牵头,我们这个行业试一下机器学习,想把人力尝试替代一点,那我们就把这些比较好的研究员坐在办公室里,我们把我们认为哪个公司哪些特征是排名比如前五十、前一百、前五百的特征选出来,告诉我是什么,我们就把它写到我们的库里面,我觉得这样是可行的,我们的特征库不断健全,让我们的模型预测更准。即使这样做,有一点是研究员去公司实地考察是替代不了的,是机器干不了的。还有跟总裁、CEO对话人为的理解,也不是短期内解决的。把他们对于哪些特征重要对于行业预测,这个是没问题的。

我要回帖

更多关于 云计算的典型服务模式 的文章

 

随机推荐