- 如何为数据集选择正确的聚类算法
应用聚类算法比选择最佳算法要容易得多。 每种类型都有其优缺点,如果您想要一个整洁的集群结构,就必须认真考虑。 数据聚类是安排正确的整个数据模型的重要步骤。为了进行分析,应根据共同点整理信息。 主要的问题是,什么样的公共参数提供最好的结果以及“最好”包含什么意思。
张晓艺 · 2019-10-10 17:58 - 选择数据湖架构的5大理由
随着大数据的重要性和接受度的提高,人们也越来越需要考虑如何组织和托管大数据。答案之一是数据湖,在数据准备和组织方面最广泛的数据体系结构系统。
张晓艺 · 2019-10-09 16:27 - 使用机器学习进行数据映射
收集数据是许多企业定位受众的一种方式。想要直接向您的潜在买家进行营销,您需要知道他们感兴趣的东西、他们需要什么、他们在哪里以及怎样才最有可能响应您的广告。
张晓艺 · 2019-09-29 16:47 - 怎样看待未来全球数据人才激增的现象
当下无论哪个行业,几乎每家公司的数据都比以往任何时候都多。几乎所有的公司要么想利用这些数据使他们的业务更具竞争力,要么想找到一种方法将其转化为新的收入。但无论如何哪种方式,这些数据丰富的公司都需要一点:更多优秀的数据科学家。
张晓艺 · 2019-09-29 16:46 - 企业需要知道的 6个AI/ML关键点
由于人工智能(AI)和机器学习(ML)的迅速发展与应用落地,世界各地的公司正在积极利用AI和ML发展业务 ,甚至投资数百亿美元。这些技术能够对业务与产生深刻的影响,所以Gartner报告预测,未来将“进入分析时代”,到2023年,人工智能和深度学习技术将成为数据科学新应用最常见的两种方法。
张晓艺 · 2019-09-27 15:04 - 预测分析:重新考虑组织中的时间和数据
时间序列是一种标准的分析方法,但是较为先进的机器学习工具引入了统计技术,来建立更精确的预测模型。时间是无法倒流的,但是使用现有的工具,您有更好的机会预测时间,或者更准确地说是可以预测时间序列样本中的事件是否会继续影响决策趋势。
张晓艺 · 2019-09-26 15:24 - 8个可靠的开源数据可视化工具
数据可视化在数据科学领域中发挥着重要的作用。在不清楚数据的情况下,要监视和调整数据以使其按照应有的方式执行并不容易。这就是数据可视化发挥作用的地方,它把收集到的数据放到一个可视的上下文中,使数据更容易找出模式、跟踪趋势等。
张晓艺 · 2019-09-25 17:31 - 对话:数据是未来最宝贵的资源
事实证明,数据带来的机会是无数的。对历史数据使用预测分析可以预测新趋势或未来事件,正确分析数据会产生宝贵的见解以设计应用程序。而且你不需要很富有或者特别精通技术就能做到这一点。
张晓艺 · 2019-09-24 16:11 - 分布式存储时代,横空出世的OceanBase
数据,被誉为新时代的石油。几乎任何一个企业的IT管理者,都会在演讲、采访或其他形式的交流分享中强调数据的重要性。获取洞察、行为预测、市场分析、业务转型升级……数据能够为企业带来巨大的商业价值。
谢涛 · 2019-09-24 09:33 - 人工智能和大数据存在什么隐患?
从数据稀缺到现在有大量的数据,近年来,可用的数据量呈指数级增长,大数据变得无处不在。这是由于数据记录设备数量的巨大增长,以及这些设备之间通过物联网连接。似乎每个人都有收集、分析大数据的力量。
张晓艺 · 2019-09-23 16:36 - 拥有CRD,Kubernetes可能要编排整个世界了!
随着周三官方发布的Kubernetes版本1.16进入普遍可用状态,大家都有这样一个疑问:企业数据中心的基础设施的容器、虚拟机、“大数据”平台以及机器学习框架 ,所有的这些最终都要由Kubernetes来编排吗?
张晓艺 · 2019-09-19 17:56 - 真实与炒作:今天的人工智能是真正的人工智能吗?
拿起一本杂志浏览科技博客,或者在行业会议上和同行聊天。你很快就会注意到,几乎所有来自技术领域的东西都或多或少涉及人工智能或机器学习。而他们讨论人工智能的方式,听起来几乎像是在宣传:人工智能可以解决所有需求!人工智能是来拯救人类的!
张晓艺 · 2019-09-17 15:55 - 加快数据科学项目的五个自动化工具
如今,自动化不仅应用于机器人领域,它还与其他领域相结合,使技术人员的工作变得更容易,其中一个领域就是数据科学。有很多公司正在为数据科学领域开发工具和产品。在本文中,我们将研究数据科学专业人员可以使用的一些自动化工具。
张晓艺 · 2019-09-17 15:54 - 为什么集成前端和后端数据至关重要?
对于许多企业而言,尽管拥有一流的架构,但他们公司的前端和后端仍然是整个企业的两个独立的部分。前端是客户交互的地方,但是,与后台的集成很少,甚至没有集成,后台是系统运行和数据存储的地方。
张晓艺 · 2019-09-16 15:30 - 如何在多云环境中管理数据?
要实现数据治理的效果,您必须将其视为一个持续的过程。 这可能很棘手,因为这意味着您必须获得管理层的支持,不仅要进行初始差距分析和政策制定,还要进行持续的评估和调整,因为您的组织会更改其技术或添加新的云环境和应用程序。
张晓艺 · 2019-09-11 16:53 - 数据分析是如何推动游戏行业发展的?
事实上,为了让数据分析发挥最大的作用,游戏公司应该不懈地朝着建立数据驱动文化的方向前进。收集、统一、可视化、清理和分析数据本身就是一项巨大的任务。不过,那些已经在向基于数据的决策迈进的企业应该保持耐心和坚定。最终他们会发现,数据分析是值得努力的方向,游戏行业有很多例子可以证明这一点。
张晓艺 · 2019-09-10 16:08 - 企业如何最大限度发挥人工智能和自动化的影响?
科技从未像现在这样与人类生活的方方面面紧密相连。我们家里的设备都是联网或声控的。智能虚拟助理可以独立预订餐厅和安排约会,还有无人驾驶汽车和无人机等等。 然而,最显着的变化是我们工作方式的彻底转变。到明年年底,全球近一半的企业预计将使用机器人自动化(RPA)工作流程,软件“机器人”与人类并肩工作,并自动完成我们的重复工作。
张晓艺 · 2019-09-09 16:53 - 分析和统计的区别是什么?
很多数据科学的失败都是由于对分析功能的误解造成的。数据科学的有效性取决于强大的分析,或许你会在错误的地方一直前进。所以更需要投资数据分析师和统计学家,以对数据进行更全面的分析,得出更有洞察力的结论。
张晓艺 · 2019-09-09 16:49 - 我们可以不再使用ETL了吗?
目前我们没有办法完全摒除ETL以及应用它的麻烦。在完全使用相同一致数据格式的系统之前,仍然需要从一个地方获取数据并为其应用做好准备,然后加载数据。但是,数据转换的新方法可以帮助避免ETL应用过程中的问题。
张晓艺 · 2019-09-06 17:55 - 人工智能给陌陌直播带来的变革与挑战
直播行业火热发展,不断壮大,产业链趋于成熟的同时也对行业提出了更高的要求。在刚刚过去的第十届中国数据库技术大会(DTCC2019)中,来自陌陌的专家就做过陌陌直播推荐算法的相关分享,而在今年的SACC大会上,陌陌将会进一步分享在AI应用过程中所遇到的各种数据、算法挑战以及宝贵经验,与参会者交流经验、扩展思路。让我们拭目以待!
张晓艺 · 2019-08-30 18:29