首页 网站首页 商业信息 数据 查看内容

数据缺少怎么办?四个小方法与你分享

社群营销 2022-10-19 12:21 9915人围观 数据


编辑导读:做数据类的项目有一个逃不开的题目:没稀有据怎样办?巧妇难为无米之炊,没稀有据,可以造、可以找、可以汇集。本文作者分享了四个小技能,希望对你有帮助,一路来看看吧。

数据缺少怎样办?四个小方式与你分享


做数据类的项目,处理营业题目,以及深入研讨某项数据利用的进程中,我们凡是碰到的最大的题目就是没稀有据,没稀有据,没稀有据。

出格是在数据利用方面,不可是一个没稀有据成了我们的难点,数据量少也是难点之一。这个题目一向在困扰着我,甚至由于这个题目,我还经常被带领吐槽什么也做不出来,我有苦说不出,进退维谷,想起来这段日子真的是苦不胜言,巧妇难为无米之炊啊!

因而我想了很多折衷的计划,下面是我处理这些题目标小方式,分享给你。

一、造数据,先有再优


假如说我们偶然辰会碰到某个营业刚刚搭建,还未来得及汇集较多的数据,大概是只要少少的数据,更有甚者一点数据都没有,这个方式也可以先用起来,那就是先按照营业逻辑造仿真数据实施。

第一步,拿到营业数据库的表结构。表结构是一张数据表的根本,可以了解为在一张Excel表格里表格的题目。表结构供给了营业内容的字段、数据范例、数据格式,按照表结机关出来的数据才加倍合适营业逻辑。假如营业有多张表,那末还需要拿到表的关联关系,也就是ER图。

退一万步讲,假如我们连表结构都拿不到的话,那就极力拿到建表的SQL剧本,然后按照SQL剧本自造表结构,这样做就是造出来的数据精准度又会下降一个档次。不管若何先行动起来,才晓得会碰到什么题目。

第二步,起头造数据。现在市道上存在很多造数据的工具,产物司理调和好技术小伙伴造数据需要的工具以后,便可以交给他们起头造数据了。偶然辰造出来的数据会存在误差比力大,然后再手动调剂造的数据即可。

操纵这个方式先做出合适营业需要的数据,拿着这些数据试试能否处理题目,假如说相差比力大,那就继续优化造出来的数据,直至按照经历和实验对照预估误差值削减。先有再优!

二、乞助内部团队,帮手干点小活


假如说我们造的仿真数据难以令带领佩服,那末就脱手造一些相认实在的营业数据吧。

拿我做过的一个案例举例。

我们想要做景区客流量监测的利用,我去找了很多景区客流量的图片,然后一个个打点人头像,给算法团队做数据集。可是仅靠我一小我,如果做出充足算法团队利用的数据量,那估量要累到吐血了。

熟悉内幕的小伙伴能够都晓得,类似这样的工作是有专门的数据供给公司把这部合作作外包进来,大概是经常公布一些兼职找人干,成熟的数据标注职员一天可以看跨越10 000张图片,所以倘使有50小我介入到标注中,两天便可以标注跨越百万的图片。

But,为难的是我们也没有钱去找那末多外包小伙伴来干。因而我就策动了我们团队的UI、技术、算法工程师一路完成这个工作,虽然大师不像成熟的标注员那样一天一万张图片,可是标注出来的数据集也临时充足利用了。固然,作为产物司理也不能让人家白干活,我也拿出了产物司理的利器:请大师喝奶茶!!!

三、操纵”搜商“,借力内部数据


”搜商“这个词,不晓得大师都听说没有。我第一次听到这个词的时辰,顿时感觉除了情商、智商,搜商对一个产物司理来说也很重要。现在是信息爆炸的时代,想要什么信息都能找到。

我们能搞到数据的方式还有很多,随意百度搜一下会发现有各类百般范例的数据同享网站

这里给大师三品种型的数据同享平台!

1. 免费的科研数据同享平台


1)CCF科研数据库

CCF科研数据库首要就是把天下各地其他计较机偏向研讨团队免费供给的数据收集起来,把数听说明简单翻译一下,再免费供给给中国学者。任何一个学者小我,都不太能够晓得那末多的数据来历,更不成能有精神把这些数据分门别类整理得很是标准,使得查找和下载很是快速高效。

所以CCF做了大大都人不愿或不能做的苦活累活,经过办事需要数据的用户收取会员办事费。

2)国资平台-国信优易

国信优易数占有限公司是由国家信息中心倡议的夹杂一切制公司,主如果想把国家具有的数据可以用起来,以数据资本和技术创新为驱动力,助力国家级大数据创新创业的成长。

3)数据堂

数据堂实在之前是CCF的数据供给商,后来建立成为一家专注互联网综合数据办事的公司。对它刚爱好的小伙伴可以去领会一下。

2. 政府数据开放平台


假如说CCF科研数据库汇集的是天下各地的数据,能够很大都据不合适中国市场情况,也有能够存在很多假数据。那末政府开放的数据,可信度以及可利用性就比力大了。

现阶段各地政务数字化的扶植如火如荼,沉淀了很大都据,都是宝贝疙瘩,政府也想这堆宝贝可以发挥感化。

已经建立的有各类百般的买卖所。包括:贵阳大数据买卖所、上海数据买卖中心、浙江大数据买卖中心、华中大数据买卖平台……

类似于这样的比力成熟的政府数据开放平台还有很多,以笔者打仗的项目来看,各个地方都在抓紧扶植这样的平台。假如去百度搜索的话,会有一大堆。

数据缺少怎样办?四个小方式与你分享


3. 全国可畅通数据目录平台


假如说政府开放的数据也不够用,数据范例都太偏向社会化了,需要一些贸易化的数据。也不差钱,那末有一种叫做全国可畅通数据目录平台的产物可以处理这个题目。

这样的一个平台就类似于我们买衣服一样,把数据作为一个商品售卖。企业或小我可以把自己具有的可开放的数据放到这个平台售卖,也可以在这个平台采办自己需要的数据,条件是不能违法。

这样的平台有:京东万象、数据银河、数据宝、阿里云数据市场、百度APIStore、数据淘、大陆地数据办事平台……

更多的平台,可以百度一下,故意,总会找到!

四、奇妙的数据收集


著名的红牛企业之前由于一句广告语“红牛给你一双同党”而被起诉存在欺骗行为,喝了以后并没有长出一双同党,要求补偿。终极红牛企业和消耗者告竣息争协议,赞成补偿。

协议内容是赞成向2002年1月1日到2022年10月3日时代在美国采办红牛饮料的一切人付出补偿,不需要供给发票,只需要下载申请表填写信息即可获得补偿,而补偿金额是总共1300万,每小我能获得的补偿金是总金额除以人数。这就类似于我们玩的付出宝集五福,淘宝双十一朋分20亿红包活动,不可思议每小我也分不了几多钱。

那时美国人听说这个协议以后,蜂拥而至,5天内获得400多万申请表,留下了用户的姓名、性别、银行卡号、年龄、邮箱等数据。

就这样,红牛企业仅用3美圆就奇妙的获得了海量的消耗者信息,而且绝对实在。

虽然我没有用过这个方式,可是红牛汇集数据的思绪还是很值得我们鉴戒的!

以上就是我总结的处理没稀有据题目标小方式,可以造、可以找、可以汇集,总之一句俗话:活人还能被尿憋死吗!希望对你有用!

本文由 @金豌豆 原创公布于大家都是产物司理,未经答应,制止转载

题图来自Pexels,基于 CC0 协议

高端人脉微信群

高端人脉微信群

人脉=钱脉,我们相信天下没有聚不拢的人脉,扫码进群找到你所需的人脉,对接你所需的资源。

商业合作微信

商业合作微信

本站创始人微信,13年互联网营销经验,擅长引流裂变、商业模式、私域流量,高端人脉资源丰富。

精彩点评

相关推荐

终于有人把数据、信息、知识讲明白了

终于有人把数据、信息、知识讲明白了

导读:我们把关于信息处理的理论称为信息论,它是20世纪40年代从通信实践中发展并总结

各领域公开数据集下载

各领域公开数据集下载

整理了网上的公开数据集,分类下载如下,希望节约大家的时间。1.经济金融1.1.宏观经济

有哪些可以获取数据的网站?[大数据]

有哪些可以获取数据的网站?[大数据]

做数据可视化或者数据分析的朋友可能经常会碰到的问题就是有想法没有数据。想到我有几

数据增强(Data Augmentation)

数据增强(Data Augmentation)

我们常常会遇到数据不足的情况。比如,你遇到的一个任务,目前只有小几百的数据,然而

快速找到论文数据的19个方法

快速找到论文数据的19个方法

在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职

数据迷思2:辛普森悖论下的香港死亡数字

数据迷思2:辛普森悖论下的香港死亡数字

如果有两名篮球手A和B,本来,无论是两分球还是三分球,A都要比B投得准,但是一个赛季

最通俗易懂的理解什么是数据库

最通俗易懂的理解什么是数据库

1.什么是数据库呢?每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的

数据看中国vs世界:2021世界各国/地区薪资排名

数据看中国vs世界:2021世界各国/地区薪资排名

数据源:NUMBEO自从我的“randy77:数据看中国vs世界:2020年世界各国人均GDP最新排名

数据分析,这样才算读懂数据

数据分析,这样才算读懂数据

编辑导语:数据分析是让很多职场人头疼的一个话题,一张简简单单的图片上有几条曲线,

什么是大数据?大数据能做什么?

什么是大数据?大数据能做什么?

本篇文章主要为我们介绍了大数据的概念、发展以及相关应用。“Big Data is like teena

10分钟带你了解数据库、数据仓库、数据湖、数据中台的区别与联系(一)

10分钟带你了解数据库、数据仓库、数据湖、数据中台的区别与联系

编辑导语:作为一名数据小白,在日常学习和工作中经常会接触到数据。随着用户数据与业

北上广等70城楼市最新数据出炉,近40%城市二手房降价,深圳连跌3个月

北上广等70城楼市最新数据出炉,近40%城市二手房降价,深圳连跌3

8月16日,国家统计局发布了2022年7月70个大中城市商品住宅销售价格变动情况。数据显示

29省份常住人口数据出炉:浙江增量37万领跑全国,辽宁降幅最大

29省份常住人口数据出炉:浙江增量37万领跑全国,辽宁降幅最大

本文来源:时代周报 作者:阿力米热人口是国家发展的基础性、全局性、长期性和战略性

2022年我国数据产量达到6.6ZB 位列全球第二

2022年我国数据产量达到6.6ZB 位列全球第二

中新网7月23日电 (中新财经 吴涛)23日,在第五届数字中国建设峰会期间举行的大数据分

韩国最新数据:自去年4月至今年6月,访韩游客同比减少95.4%,中国游客锐减98.6%

韩国最新数据:自去年4月至今年6月,访韩游客同比减少95.4%,中

来源:环球时报【环球时报综合报道】受疫情影响,今年上半年访韩外国游客数量持续猛减

中国数据震惊西方!不服也不行

中国数据震惊西方!不服也不行

日前,国家统计局公布了中国一季度的实际GDP增长率,结果2022年1季度中国GDP实际增长

【数据分析】基本数据分析的7个步骤

【数据分析】基本数据分析的7个步骤

原文链接:知乎专栏目录:一、为什么要做一份数据报告二、制作数据报告的流程一、为什

数据 | 经历添加剂风波的海天味业市值蒸发超400亿

数据 | 经历添加剂风波的海天味业市值蒸发超400亿

文 | 李童 孟令稀编辑 | 陈臣自9月30日首度回应“双标”争议以来,海天味业市值已下跌

数据分析整体框架

数据分析整体框架

编辑导语:无论是产品还是运营,数据分析都是其日常工作中不可忽略的一个板块,那么数

数据分析入门学习指南|零基础小白必看

数据分析入门学习指南|零基础小白必看

数据分析在如今的求职场上越来越重要。然而,让很多朋友困惑的是,我是没有编程基础的

商业洽谈 文章投递 寻求报道
电话咨询: 15924191378
关注微信