数据科学已融合多门学科于一体,包括数学,概率统计,机器学习,自然语言处理,数据仓库,大数据,可视化,云计算等。
正因为多个学科的交叉和融合,给数据领域的从业者和学习者在使用和学习上带来的巨大的困难。
为了从互联网获取更多相关经验,收集整理了相关领域有一定价值的博客和站点。
涵盖的内容有,R语言,数据挖掘,机器学习等,大量的翻译和原创文章。大量关于NLP(自然语言处理)和机器学习的文章,作者开源了中文分词器HanNLP。如果要了解在中文上的数据挖掘的相关问题,可以阅读此博客。我爱自然语言处理的中文站点。同英文站点一样,文章优质,并且大多都是基于实践的内容。该站点同"52nlp"一样,不同的只是更加专注机器学习。来自CSDN的一位博主,多是关于Spark Milb的文章。博主著有《Spark MLlib机器学习》一书,博客的文章同样质量很高。来自国外的一个博客,丰富的机器学习实践经验,包括:神经网络,深度学习,线性回归等。作者董西成,著有《Hadoop技 术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》国内比较出名的大数据个人博客,围绕Hadoop生态圈和Spark的大量文章可供阅读。比较偏重于Hadoop生态圈,文章的质量很高,能够解决一些实际生产中遇到的问题。比较综合的一个站点,很多大数据领域相关的文章,但偏重于资讯。来自博客园虾皮工作室,文章围绕Hadoop,适合入门学习。早期学习Hadoop时,阅读了许多粉丝日志的文章,文章的质量很高,大都是解决一些实际问题。数据科学领域的相关技术,近两年发展迅猛。有时仅凭个人的经验很难解决一些问题。互联网上遍布各类文章和资源,在学习时应该集万家之长,注重实践,并善于总结。同上面各博客的博主一样为知识的开源做一份贡献,让知识广为传播。
满满干货的大数据技术个人博客收集
您也可以关注我们的官方微信公众号(ID:ctoutiao),给您更多好看的内容。
声明:本文由墨加科技企业号发布,依据企业号用户协议,该企业号为文章的真实性和准确性负责。创头条作为品牌传播平台,只为传播效果负责,在文章不存在违反法律规定的情况下,不继续承担甄别文章内容和观点的义务。