"数据挖掘的算法"相关数据
更新时间:2024-11-08人工智能之数据挖掘
数据挖掘的概念与研究概况。首先从数据挖掘的定义、分类、过程与功能四个方面介绍了数据挖掘;整理并分析了数据挖掘领域顶级会议ACM SIGKDD近六年的信息。
数据挖掘的算法与实现。按照数据挖掘应用的方向,从大数据、机器学习、社会网络、自然语言与统计数据分析五个方面介绍了数据挖掘的算法。基于大数据的数据挖掘主要介绍了数据采集层、数据存储层、数据处理层和服务封装层四个层的基本架构,和部分大数据平台实例;基于机器学习的数据挖掘主要介绍了非监督学习方法与监督学习方法,重点是监督学习方法,包括训练集、验证集与测试集、决策树模式、kNN算法、神经网络、回归分析;社会网络中的大数据挖掘主要介绍了图的基本要素、图的度量算子,并从行为分析算法、社区发现算法等方面介绍了社交网络上的算法;自然语言中的数据挖掘先介绍了词的表示分析,并从语言模型与话题模型两个层面进行算法介绍;统计数据分析与前三个方面均有交叉,主要从数据描述性分析、回归分析、关联分析、聚类分析三个方面进行介绍。最后具体分析了数据挖掘领域顶级会议SIGKDD最近几年在数据挖掘基础理论、社交网络分析和图数据挖掘、大数据挖掘等几个方面的国内外的主要研究成果。
【更多详情,请下载:人工智能之数据挖掘】
挖掘机
中国挖掘机行业数据挖掘机主题数据包包含86项数据(44个数据报告、42个表格数据),数据包的大小为74.2MB。挖掘机,又称挖掘机械,又称挖土机,是用铲斗挖掘高于或低于承机面的物料,并装入运输车辆或卸至堆料场的土方机械。挖掘机挖掘的物料主要是土壤、煤、泥沙以及经过预松后的土壤和岩石。从近几年工程机械的发展来看,挖掘机的发展相对较快,挖掘机已经成为工程建设中最主要的工程机械之一。 2020年3月以来,中国挖掘机械行业驶上了高速发展的快车道。据中国工程机械工业协会行业统计数据,2020年1-8月纳入统计的25家主机制造企业,共计销售各类挖掘机械产品189535台,同比涨幅26.7%。从实际销量数据来看,根据中国工程机械工业协会数据显示,2020年4-8月挖掘机销量同比增速约60%;剔除海外销量增速后,国内本土需求同比增速甚至超过65%。 本数据包从市场角度整理了挖掘机的产量、销售量、保存量,还有相关物联网、智能制造、基建投资等,旨在帮助用户快速了解中国挖掘机产业的现状和未来发展趋势。2002-2021年发布时间:2021-10-27抖音
抖音:时间熔炉,算法黑盒,记录每个人的美好生活抖音主题数据包包含613项数据(62个数据报告、551个表格数据),数据包的大小为849MB。抖音是一款致力于拍摄发布15s/60s音乐创意短视频为主的移动社交软件,自2016年9月26日上线以来,借助今日头条的人气,短短两年时间,日播放量已经超过10亿,成为网络传播史上的一大奇迹。 2018年春节期间,抖音彻底火爆全国:相关数据显示,春节期间,抖音日活增长了近3000万,超过了西瓜视频和火山小视频,最高日活达到了6646万,成为当前最火爆的视频APP。2020年3月抖音月活跃用户数达到5.18亿,同比增长14.7%,月人均使用时长为1709分钟,同比增长72.5%。 本数据包围绕着抖音从多个维度进行深度探讨与研究。重点分析阐述抖音红人、直播带货等拥有超高热度的话题。此外,数据包也提供了关于如何通过抖音来进行行业营销的详实案例。2019-2022年发布时间:2022-04-21A股证券
中国A股证券行业数据中国A股证券行业数据主题数据包包含26项数据,数据包的大小为1.13MB。 本数据包涵盖了中国A股证券行业数据,具体包括中国A股资产情况、企业亏损信息以及政府补助信息等。另外还统计了申万行业的相关的数据,以便进深入了解。2010-2021年发布时间:2022-02-22中国上市公司
中国A股上市公司数据中国A股上市公司数据主题数据包包含61项数据,数据包的大小为2.68MB。 本数据包涵盖了中国A股上市公司的主要数据,通过统计数据分析了中国上市公司的投资收益、纳税贡献、资产负债等情况,此外还有政府补贴、股东利润、员工薪资以及各类排行榜信息,供用户从宏观对中国的上市公司做一个全方位的了解。2010-2021年发布时间:2022-02-22外卖竞品
美团与饿了么的外卖数据对比汇总(订单、商家、配送、人均交易)美团与饿了么外卖数据对比汇总(订单、商家、配送、人均交易)主题数据包包含105项数据(28个数据报告、73个表格数据、4个数据图说),数据包的大小为127MB。 外卖业务发展至今,逐渐形成了以美团外卖和饿了么外卖为核心的“两强”格局,他们分别代表着美团系和阿里系为了打造本地生活服务,而从外卖这一高频需求出发,积累流量,挖掘年轻用户、低线城市和长尾商户的价值。 从品牌角度对比了汉堡王、西贝莜面村、周黑鸭等多个品牌的订单数量;从外卖业务对比了两个平台和商家/订单数量、配送费和配送时间、用户重合情况、APP活跃用户、广告投放等数据。还单独列出了近年来美团外卖的GMV、外卖抽佣率、客单价、人均交易、用户补贴、广告投放等数据,旨在帮助用户快速了解美团外卖与饿了么的具体业务发展情况。2016-2023年发布时间:2024-06-21大数据产业
大数据产业:场景为王,大数据产业抢占数字时代先机大数据产业主题数据包包含80项数据(25个数据报告、52个表格数据和3个数据图说),数据包的大小为149MB。大数据产业,是指大数据的产业集群、产业园区,涵盖大数据技术产品研发、工业大数据、行业大数据、大数据产业主体、大数据安全保障、大数据产业服务体系等组成的大数据工业园区。 AI产业兴起,大数据技术作为AI技术的重要分支正在蓬勃发展,中国的大数据产业也正在这一波浪潮中蓬勃发展。在政策方面,大数据政策逐步完善,应用场景建设落地成为关键。在规模方面,中国大数据产业规模持续高速增长,华东,华北地区持续领跑,以数据为驱动的数字产业园成为大数据产业集聚发展的重要载体,同时专业化、复合型大数据人才培养力度也在加大。 大数据创新市场竞争主体多样,机器学习、数据采集不断取得突破,且经过多年的发展,逐渐走向产业化、规模化。上一个十年,在互联网、移动互联网蓬勃发展的时代,流量为王;而未来十年,则将进入以大数据为核心的数字智能时代,场景为王。这也是为什么大数据产业如此受关注的原因。2020-2023年发布时间:2023-07-11中国冰雪运动
中国的冰雪运动数据(人群、滑雪场经营、滑雪场数量)中国的冰雪运动数据(人群、滑雪场经营、滑雪场数量)主题数据包包含110项数据(35个数据报告、55个表格数据和20个数据图说),数据包的大小为302MB。 本数据包关注了在北京冬奥会背景下,中国冰雪运动的发展情况。主要涵盖了冰雪运动爱好者画像、中国滑雪场分布、建成和运营情况。数据和报告来自于包括中国国家审计局、北京市滑雪协会、头豹研究院、Mob研究院在内的部门和数据研究分析机构。2011-2023年发布时间:2024-01-24奥运赛事
历届奥运会赛事数据汇总(比赛数据、媒体传播、运动员数据)历届奥运会赛事数据汇总(比赛数据、媒体传播、运动员数据)主题数据包包含72项数据(7个数据报告、49个表格数据和16个数据图说),数据包的大小为67.3MB。 奥林匹克运动会最早起源于公元前776年的古希腊,而现在奥运会已经成为各个国家用运动交流文化,切磋体育技能的世界规模综合性运动会。法国人顾拜旦于19世纪末提出举办现代奥林匹克运动会的倡议。1894年成立奥委会,1896年希腊雅典举办了首届奥运会,1924年举办了首届冬奥会,1960年举办了首届残奥会,1976年举办首届冬季残奥会,2010年举办了首届青奥会,2012年举办了首届冬青奥会。 本数据包涵盖了1896-2021年间历届夏冬奥运会的奖牌情况、参赛国家、参赛运动员、奥运期间媒体传播等相关数据,旨在帮助用户快速了解奥运会比赛数据、热度和影响力。1896-2021年发布时间:2021-11-17粉丝与偶像
粉丝与偶像:看不惯的流量数据里,多少真心多少水分?粉丝与偶像主题数据包包含86项数据(27个数据报告、59个表格数据),数据包的大小为118MB。粉丝是一个有着共同的兴趣、有很高的认同感和归属感的群体,他们与偶像之间相互平等、包容和成长,但是粉丝对偶像的狂热投入,往往伴随一系列同样狂热的消费行为,即通过粉丝进行群体变现的商业模式,也称为粉丝经济。 粉丝经济的核心最初为影视歌明星,后来选秀明星成为了粉丝经济的又一核心。现在,随着社交媒体和直播平台的出现,粉丝经济迎来了新核心:网红。本数据包也探讨了网红对于粉丝经济的变现方式和流量闭环,带你了解网红是如何成为流量新IP,并成为品牌种草以及获取粉丝心智与信任的新风口。 娱乐行业发展至今,随着偶像的养成和迭代,偶像市场的规模和偏向也发生了很大的变化,那么受众审美和星粉关系又有哪些不同呢?粉丝愿意为什么样的偶像艺人买单?粉丝群像以及如何深挖粉丝价值?为解答这些问题,本数据包涵盖了粉丝经济下的用户行为观察、部分明星艺人的商业价值研究、粉丝经济的商业变现模式、追星平台的分析等等,旨在让用户对粉丝行为及其背后的商业逻辑有更深刻的理解。2013-2023年发布时间:2021-04-28年货里的中国人消费大数据
年货里的中国人消费大数据(年货品牌、休闲零食、京东年货节)年货里的中国人消费大数据(年货品牌、休闲零食、京东年货节)主题数据包包含26项数据(12个数据报告、14个表格数据),数据包的大小为64.5MB。 本数据包为年货里的中国人消费大数据,其中包括中国网民年货购买行为调查、休闲零食行业和具体品牌百草味和良品铺子的消费情况、生鲜年货消费报告和2021年京东年货节成交额、不同品类销量增长等数据。2018-2021年发布时间:2022-01-07腾讯公司经营数据
腾讯公司经营数据(财报汇总)腾讯公司经营数据(财报汇总)主题数据包包含46项数据(39个数据报告、3个表格数据和4个数据图说),数据包的大小为85.6MB。 本数据包内容为2004年-2020年腾讯公司的中期报告与年报汇总,方便需要对腾讯公司进行研究的数据包用户节省时间,一次性轻松获取全部财务报告。2004-2021年发布时间:2021-11-17中国养老机构
中国养老机构数据中国养老机构数据主题数据包包含25项数据(5个数据报告,18个表格数据和2个数据图说),数据包的大小为15.1MB。 本数据包关注到中国养老机构的相关数据,包括养老床位数量、养老机构的入住率、养老产业的市场规模以及对失能老人提供护理服务的比例。数据和报告来自中国民政部、中国社会科学院、清华大学老龄社会研究中心、艾媒咨询等国家部门和专业的数据分析机构。2006-2020年发布时间:2021-12-24肉类消费
中国肉类消费数据中国肉类消费数据主题数据包包含29项数据(22个数据报告、1个表格数据和6个数据图说),数据包的大小为52.7MB。 本数据包主要关注了中国肉类消费的情况。重点囊括了猪肉、牛肉、羊肉、鸡肉的消费数据,包括生猪存栏量、各种肉类的产量和进口量,还关注到猪肉价格对居民消费的影响。数据和报告来自中国国家统计局、北京大学国民经济研究中心等部门和机构。2010-2021年发布时间:2022-02-14云游戏
云游戏行业数据云游戏行业数据主题数据包包含52项数据(15个数据报告、37个表格数据),数据包的大小为97.7MB。 随着云计算和5G技术的快速发展,中国的云游戏市场正在持续扩大。预计未来几年,中国将成为全球最大的云游戏市场。云游戏的用户年龄段相对较广,从青少年到中老年都有涵盖,主力玩家仍然是18-35岁的年轻人。 本数据包涵盖了云游戏相关行业数据,如市场规模、用户画像和行业未来发展趋势。2016-2025年发布时间:2024-07-24京东
京东集团经营数据京东集团经营数据数据包包含40项数据(2个数据报告、34个表格数据和4个数据图说),数据包的大小为9.63MB。 本数据包主要涵盖了截至2021年京东集团的经营数据,主要包括GMV、营业收入、净利润、ARPU值、用户分布、获客成本等,同时还囊括了一篇与京东集团相关的电商分析报告。2019-2021年发布时间:2021-11-03露营
中国露营行业数据中国露营行业数据主题数据包包含115项数据(16个数据报告、95个表格数据和4个数据图说),数据包的大小为106MB。 本数据包涵盖了我国露营地热度、热门玩法、人群画像等方面的数据,全方位解析近年来露营的热点、发展态势及露营人群行为偏好等内容,并据此作出未来露营相关的消费行为洞察和预测。2020-2025年发布时间:2024-06-14快餐
中国快餐消费数据快餐主题数据包包含85项数据(4个数据报告、81个表格数据),数据包的大小为38.8MB。快餐是指由商业企业快速供应、即刻食用、价格合理以满足人们日常生活需要的大众化餐饮。具有快速、方便、标准化、环保等特点。 中国的快餐业起步较晚,以当年肯德基快餐连锁店进入北京市场为契机,揭开了中国现代快餐快速发展的序幕。近年来,在餐饮业高速发展的大好形势下,快餐业也加速发展。东部省市快餐的营业规模明显超过正餐。从2010年开始,中国快餐业的黄金时期已经到来,并以北京等大城市和发达地区为中心,逐渐向全国蔓延开来,走向一个成熟的发展阶段。 本数据包分别介绍了中式快餐和西式快餐在中国的经营模式与营销特点,更是以快餐业中的典型公司作为案例进行商业模式上的探讨与分析。随着新冠疫情的肆虐,更是唤醒了大家对于健康快餐的青睐与追捧,本数据包对于健康快餐的趋势,民众对于健康饮食的认知度与选择倾向,都有一定程度的解析。1999-2020年发布时间:2021-10-27淘宝直播
淘宝直播经营数据淘宝直播主题数据包包含37项数据(6个数据报告、27个表格数据和4个数据图说),数据包的大小为58.1MB。 本数据包呈现了2020-2021年淘宝直播的经营数据,主要包括淘宝直播成交额及增长情况,淘宝旗下头部主播分布情况和李佳琦、薇娅等主播带货数据对比,同时还囊括了六篇与直播电商行业或淘宝直播相关的研究报告。2017-2021年发布时间:2021-11-08留学市场
中国留学市场数据中国留学市场数据主题数据包包含54项数据(9个数据报告、43个表格数据和2个数据图说),数据包的大小为66.5MB。 本数据包包含了留学市场相关数据,主要涵盖了留学人群的留学意向、留学去向、留学类型等数据,还包含多份留学市场深度分析报告,报告来源包括新东方、益普索、亿欧智库。2019-2023年发布时间:2024-07-18森林资源
全球森林资源数据全球森林资源数据主题数据包包含34项数据(20个数据报告、7个表格数据和7个数据图说),数据包的大小为96.5MB。 本数据包重点关注了全球的森林资源,尤其是中国在植树造林上的突出贡献。数据和报告来自中国国家统计局、中国林业局历次国家森林资源清查数据,介绍了中国的森林面积和森林覆盖率,林业结构和各省份的森林资源数据。1990-2021年发布时间:2022-03-04