-
Notifications
You must be signed in to change notification settings - Fork 7
/
053-readxl.Rmd
75 lines (49 loc) · 1.95 KB
/
053-readxl.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
## Os pacotes readxl e writexl {#readxl}
Para ler planilhas do Excel (arquivos `.xlsx` ou `.xls`), basta utilizarmos a função `read_excel()` do pacote `readxl`. Instale o pacote antes caso você ainda não o tenha instalado.
```{r, include=FALSE}
library(readxl)
```
```{r, eval=FALSE}
install.packages("readxl")
library(readxl)
imdb_xls <- read_xlsx("dados/imdb.xls")
imdb_xlsx <- read_xlsx("dados/imdb.xlsx")
```
A funçao `read_excel()` auto detecta a extensão do arquivo.
```{r eval=FALSE}
read_excel(path = "dados/imdb.xls")
read_excel(path = "dados/imdb.xlsx")
```
O pacote disponibiliza 5 exemplos de arquivos com formato `.xls` e `.xlsx`.
```{r}
readxl_example()
```
Vamos pegar o caminho até o arquivo `datasets.xlsx` usando a função `readxl_example()`.
```{r}
caminho_datasets <- readxl_example("datasets.xlsx")
caminho_datasets
```
No Excel, um arquivo pode ter várias planilhas. Esse é o caso do arquivo `datasets.xlsx`. Você pode ver quais planilhas fazem parte do arquivo utilizando a função `excel_sheets()`.
```{r}
excel_sheets(caminho_datasets)
```
Por padrão, as funções de leitura trarão apenas a primeira planilha do arquivo. Para trazer outra planilha, basta utilizarmos o argumento `sheet`.
```{r}
# Pega a primeira planilha
read_excel(caminho_datasets)
# Pega a segunda planilha
read_excel(caminho_datasets, sheet = 2)
# Pega a planilha selecionada
read_excel(caminho_datasets, sheet = 'chickwts')
```
A seguir, listamos outros argumentos úteis da função `read_excel()`:
- `col_names=` indica se a primeira linha representa o nome das colunas;
- `col_types=` para definir a classe das colunas;
- `skip=` para pular linhas no começo da planilha;
- `na=` indica quais strings devem ser interpretadas como NA.
Também podemos escrever um arquivo Excel (com extensão `.xlsx`) utilizando a função `write_xlsx()` do pacote `writexl`.
```{r, eval=FALSE}
install.packages("writexl")
library(writexl)
write_excel(mtcars, "imdb.xlsx")
```