在预处理中,涉及的常用函数如下:
-
df.isnull():判别数据中是否存在NAN数据;
-
df.dropna():按要求对存在NAN的行或列进行删除;
-
类别数据处理:有序特征映射,类标是有大小、可排序;利用字典
n_values:字符串'auto'、或者整数、或者整数数组;指定每一个属性取值上界;'auto'表示自动从训练数据中推断属性值取值的上界;一个整数表示所有属性取值的上界;数组表示每个元素依次指定了一个属性的上界;
header:将行号用作列名,且是数据的开头。注意当skip_blank_lines=True时,这个参数忽略注释行和空行。所以header=0表示第一行是数据而不是文件的第一行
这篇文章主要介绍了Python单元测试框架unittest使用方法讲解,本文讲解了unittest概述、命令行接口、测试案例自动搜索、创建测试代码、构建测试套件方法等内容,需要的朋友可以参考下
测试准备前要做的工作和测试执行完后要做的工作.包括setUp()和tearDown().
可以用命令行运行测试模块,测试类以及测试方法.
unittest支持简单的test discovery. 命令行传入discovery后,框架会自动在当前目录搜索要测试的案例并执行.搜索目录必须是包或者模块.基本使用如下:
编写以test开头的方法
多个测试套件构建成更大的测试套件
可以分无条件忽略和有条件忽略,通过装饰器实现