可按Ctrl+D收藏 蚂蚁资源网

蚂蚁资源网

数据挖掘系统包括什么(运转灵活大数据挖掘系统)

  • 全部评论(3)
  • 893811145
  • 1.工程能力(1)编程基础:需要掌握一个大的双门语言,大手指C ++或Java,小指Python或shell脚本;需要掌握基本数据库语言;意见建议:MySQL + Python + C ++;语言只是一个工具,看语法很好;推荐书籍:“C ++ Primer Plus”(2)开发平台:Linux;建议:主常见命令,掌握Linux下的源代码编译;推荐书:“Linux私人蔬菜(3)数据结构和算法分析基础:掌握常见的数据结构和操作(线性表,团队,列,字符串,树木,地图等),主常见的计算机算法(订购算法,查找算法,动态规划,“恢复等”);意见建议:多爆代码,多刷问题;推荐书籍:“战斗数据”“剑”(4)大规模数据处理平台:Hadoop(MR计算模型,Java开发)或火花(RDD计算模型,Scala开发),关键推荐后者;建议:主要使用,如果您有能量,您可以看到源代码来了解群集调度机制;推荐的书:“大数据火花企业实践”2.算法能力(1)数学基础:概率理论,数学统计,线性代数,随机过程,优化理论意见:必须理解,即使他们无法制造基础坚实,至少掌握每个学科的理论系统,涉及相应的知识通过接收信息,可以做一个障碍理解; (2)机器学习/深度学习:硕士公共机器学习模型(线性回归,逻辑回归,SVM,感知机器;决策树,随机森林,GBDT,XGBoost;是,KNN,K-Means,EM等);掌握公共机器学习理论(预防性问题,交叉验证问题,模型选择问题,模型融合问题等);掌握公共深度学习模型(CNN,RNN等建议:这里的掌握是指熟悉推导公式的能力,并知道模型的适用场景;推荐书:“统计学习方法”“机器学习” “机器学习”“UFLDL”3)自然语言处理:掌握常用方法(TF-IDF,Word2VEC,LDA); 3.商业经验(1)了解建议和计算广告相关官Owledge;推荐书籍:“推荐的系统练习”“计算广告”(2)通过参加数据挖掘竞争,普通游戏有动作,Ali Tianchi,Datacastle等,熟悉相关的业务场景。
  • 2021-06-28 11:41:22
  • 葬爱落雨
  • SPSS数据挖掘内容包括:数据挖掘工具克莱门特架构和一些克莱门特的基本设置在整个数据挖掘系统克莱门汀数据准备克莱门汀数据准备类型和解决模型和部署资源:商业智能和数据仓库爱好者,,, ...
  • 2021-06-28 11:40:13
  • wdq
  • 什么是数据挖掘,然而并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。不过尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
  • 2021-06-28 11:40:13
  • 商品推荐