各种数据的导入和导出、R语言数据类型和数据结

第1天
2014-10-02

1-数据准备

眼下四章讲到了ENCORE和ENCOREstudio的设置,奥迪Q3studio的主题采取方法,各类数据的导入和导出、福特Explorer语言数据类型和数据结构,即令你曾经较为熟习的左右了奇骏的那一个基本知识,你们现在就可以正式启幕大家的数量剖析职业了。
数据深入解析包涵数据的收集、管理、分析、可视化。
那豆蔻年华章敬服传授数据剖判的第二步——数据管理。数据管理是每一个数目分析师得到数码所做的第一步。因为差非常的少从不生龙活虎份数据到大家的手中时,全数的剧情皆以我们满足的,何况管理后的数码即生龙活虎对生龙活虎于从多量音信中删除噪音,让大家拿到更加多的音信。
自己推荐《Lacrosse语言实战》那本书作为新手的入门书,里面包车型大巴剧情很详细,相符新手学习。
自身对此简易多少管理的思路分为7块,分别是多少大概浏览、修正、增加、删除、排序、归总、选入观测。

IOS-时间与字符串相互转变

临时会赶过这么的标题,须求把时光和时间戳相互调换

举个例子说把当下岁月转变到 “二〇一六0716155436”那样的格式

要么是把“二零一六0716155436”转变来“2015-07-16 15:54:36”

第一来第二个:

当昨日子调换到 “二〇一五0716155436”那样的格式

///////////////////////////////

//获取当前时间

NSDate * today = [NSDate date];

NSLog(@"%@",today);

打字与印刷出来是“二零一五-07-16 07:54:36 +0000”

很想获得?将来分明是贰零壹伍-07-16 15:54:36啊

因为存在分歧期区,系统暗中同意Green尼治时间

就此将要改动时间格式了

//转换时间格式

NSDateFormatter *df = [[NSDateFormatter alloc] init];//格式化

[df setDateFormat:@"yyyy-MM-dd HH:mm:ss"];

NSString * s1 = [df stringFromDate:today];

NSLog(@" s1s1s1s%@",s1);

打字与印刷出来是“二〇一五-07-16 15:54:36”

现行反革命已经获得到当下的年月

诸如此比还不曾完呢,必要转变来八个字符串,相通“二〇一五0716052021”的时刻戳

NSDate * date = [df dateFromString:s1];

//调换时间格式

NSDateFormatter *df2 = [[NSDateFormatter alloc] init];//格式化

[df2 setDateFormat:@"yyyyMMddHHmmss"];

[df2 setLocale:[[NSLocale alloc] initWithLocaleIdentifier:@"zh_CN"]];

NSLog(@"%@",[df2 stringFromDate:date]);

打字与印刷出来是“贰零壹陆0716155436”
接下去就是第一个:

把“20140716155436”转换成“2014-07-16 15:54:36”

率先要把二零一六0716155436转变来时间格式

//转变时间格式

NSDateFormatter *df = [[NSDateFormatter alloc] init];//格式化

[df setDateFormat:@"yyyyMMddHHmmss"];

[df setLocale:[[NSLocale alloc] initWithLocaleIdentifier:@"zh_CN"] ];

NSDate *date =[[NSDate alloc]init];

date =[df dateFromString:bill_timeStr];

str = [NSString stringWithFormat:@"%@",date];

str的结果是“二〇一五-07-16 07:54:36 +0000”

那会儿就须要再转三回

//

NSDateFormatter * df2 = [[NSDateFormatter alloc] init];

[df2 setDateFormat:@"yyyy-MM-dd HH:mm:ss"];

NSString * str1 = [df2 stringFromDate:date];

str1的结果是“2016-07-16 15:54:36”

ok,马到功成

有的时候会境遇那样的难点,须要把时光和岁月戳互相转变 举例把近来光阴调换成“二〇一六0716155436”那样的式 或许是把...

图片 1 df 图片 2

1.1-函数

图片 3

1.png

图片 4

2.png

1、数据大概浏览
在得到数量在此以前率先步要做的正是概览数据
head(df,n=10)#查阅数据集的前十条记下
str(df)#翻开数据集合构
tail(df)#查阅数据集最后部分
sapply(df)#翻开数据集类型及称谓
summary(df)#查阅数据集各变量描述总括
……

那篇文章是介绍用翼虎做信用(申请卡塔尔评分卡,包蕴了常用的数量管理办法,代码快为如下一些

df

1.2-向量化运算

图片 5

3.png

图片 6

4.png

供练习数据集
name1 <- c("Bob","Mary","Jane","Kim")
name2 <- c("Bob","Mary","Kim","Jane")
weight <- c(60,65,45,55)
height <- c(170,165,140,135)
birth <- c("1990-1","1980-2","1995-5","1996-4")
accept <- c("no","ok","ok","no")
df1 <- data.frame(name1,weight,height)
df2 <- data.frame(name2,birth,accept,stringsAsFactors = F)
2、数据纠正
多少纠正首要归纳变量的重编码、重命名,数据格式的校勘,数据地方的调动,
2.1变量的重编码
1卡塔尔国将df第11中学Kim的身体高度改为165
df1$height[name1=='Kim] <- 165
2卡塔尔国将体重按定性别变化量定义,小于等50kg为thin,51到60kg为normal,大于60kg为fat
df1$weight[weight <= 50] <- 'thin'
df1$weight[weight > 50 & weight <=60] <- 'normal'
df1$weight[weight > 60] <- 'fat'
2.2变量的重命名
为了便于管理、或是更加好的代表数据特征,大家要求改变变量名称,常用函数为names()
names(df1)#翻看全数变量名
names(df1)[2] <- 'size'#把变量‘weight’改为‘size’
2.3转移数据格式、类型
1卡塔尔纠正日期格式
日子格式的默许格式为yyyy-mm-dd
Sys.Date()#翻看系统日期
today <- Sys.Date()
format(today,"%d %a %b")#出口格式为[1] "2017-06-20"那是自个儿的写作日期,将日期格式改进为%d %a %b
抵补:format()能够用于转移数据格式,满含小数、科学总括方法等等。
2卡塔 尔(英语:State of Qatar)改过更加许多据类型

  1. 多少导入

图片 7

2-数据管理

图片 8

5.png

图片 9

2.数额洗刷

df

2-1 导入

image.png

3.表征筛选

2-1-1 CSV

图片 10

6.png

eg:
from pandas import read_csv;
df = read_csv('C://Users//user//Desktop//4.1//1.csv')
df

is.datatype()函数查询数据类型,重返TRUE或FALSE。而as.datatype()函数则转移为相应的花色。
3卡塔尔缺点和失误值处理
is.na(df1$weight)#决断缺点和失误值
df1$weight <-NA#改为缺点和失误值
data=data.frame(y=c(1,2,3,NA,5,6),x1=c(6,NA,4,3,2,1),x2=c(1,3,6,9,12,NA))
attach(data)
y[is.na(y)]=mean(y,na.rm=T)
x1[is.na(x1)]=mean(x1,na.rm=T)
x2[is.na(x2)]=mean(x2,na.rm=T)
data=data.frame(y,x1,x2)#把缺点和失误值改革为平均值

4.模子练习

2-1-2 文本文件

图片 11

7.png

eg:
from pandas import read_table;
df = read_table('C://Users//user//Desktop//4.1//2.txt', names=['age', 'name'], sep=',')
df

3.数据的丰硕
数据的拉长富含加多字段(变量卡塔尔国、记录
1卡塔尔国加多变量(列卡塔尔
df2 <- transform(df1,BMI=weight/height^2)#首先种办法
df1$BMI <- df1$weight/df1$height^2#第三种艺术
2卡塔 尔(阿拉伯语:قطر‎增加记录(行卡塔 尔(英语:State of Qatar)
增添记录在GL450中较麻烦,供给新建数据框,合併原有数据框,放在归并那块细讲。

5.作用评估

本文由巴黎人官方网址发布于巴黎人- 旅游,转载请注明出处:各种数据的导入和导出、R语言数据类型和数据结

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。