内容简介
数据预处理是数据分析、数据挖掘或人工智能中必不可少的环节,它通过一定的方法将存在诸多问题的低质量数据处理变成高质量数据,在一定程度上提高数据分析或数据挖掘等工作的效率。
本书以Jupyter Notebook为主要开发工具,采用理论与实例相结合的形式,全面地介绍数据预处理的相关知识。全书共8章,其中第1章介绍数据预处理的入门知识;第2~6章介绍科学计算库NumPy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数据规约的功能;第7章介绍数据清理工具OpenRefine的安装及使用;第8章结合前期的核心知识进行实战演练。除第1章外,其他章均配置了丰富的示例或案例,读者可以一边学习一边练习,巩固所学的知识,并在实践中提升实际开发能力。
本书附有配套视频、源代码、习题、教学课件等资源。为帮助初学者更好地学习本书中的内容,本书还提供了在线答疑。
本书既可作为高等院校计算机相关专业的专用教材,也可以作为相关技术爱好者的入门用书。
相关截图
最新评论
徒弟可以A师傅,学生可以A老师,为什么外包不能A正式,我觉得很正常。异性相吸这是宇宙真理
PHP天下第一(狗头叼花)
第一个不需要关注公主号直接给激活码的帖子!
客户端超时断开后,服务端如果没有设置超时机制,那也会继续等待处理,万一这期间有消息到了,那不是就接受到消息处理了,但是也没有办法返回到客户端,导致消息丢失。
企业级GO项目开发实战 Kubernetes权威指南 第六版
https://pan.baidu.com/s/1q3bnTncIACKoTZFxvx7BQw?pwd=ii7n
RabbitMQ精讲,项目驱动落地,分布式事务拔高 有吗?
Spring Cloud Alibaba 微服务架构实战 https://pan.baidu.com/s/1jF5voFRoeF0lYAzAPBWSbw?pwd=chqk