Associated material

Module: Module 01 - Introducing R and Rstudio

Readings:

R for Data Science - Chapter 1

R for Data Science - Chapter 4

Before we start

This course is designed with two components - the module and the zoom notes. The module content provides more explanation and background so that you can work through it on your own if you wish. The zoom notes content provides the structure for the content that will be delivered in the online sessions. Both sets of content are complementary to each other.

At the top right hand corner of both the module and zoom notes pages is a “code” button. This can be used to toggle seeing/hiding the code or to download the code that that created the page as an Rmarkdown file (we cover Rmarkdown more in-depth in module/zoom notes 6).

R and RStudio

R is the language, RStudio is an interface for interacting with R.

The RStudio environment

RStudio is what is known as an integrated development environment (IDE) which provides a graphical interface (among other things) for interacting with R. The main environment of RStudio is comprised of panels.

Panels of RStudio

console
source
environment/history
file/plot/help/viewer

Global settings for reproducibility

Before we get under way we want to set up our environment to help enforce some behaviours that encourage reproducibility.

We want to disable a few default settings

Restore .RData on startup
Save workspace to .Rdata

To do this select the Tools menu -> Global options, then on the “General” tab under the “Workspace” heading:

Untick “Restore .RData on startup”
Set “Save workspace to .RData on exit” to “Never”
Click “Apply”

Projects

Projects within RStudio provide mechanism to encapsulate a project - be it particular data analysis you’re working on, an R package you’re making (Modules/Handouts 7 and 8), or even a book (Module/Handout 6).

A project is a directory on your computer that you want to put all your code, documentation, data, and associated outputs so that everything needed to recreate an analysis is “bundled together”.

We’ll create a project for the course and create a common project structure:

File -> New Project -> New Directory -> New Project
Choose where you want it to live and give it a name
“Create Project”

Now we have our new project we’ll create some directories to store various aspects of our project. We’ll create the following directories:

scripts
docs
data
outputs

You can do this either using the “New Folder” button in the Files panel or using the code below.

dir.create("scripts")
#> Warning in dir.create("scripts"): 'scripts' already exists
dir.create("data")
#> Warning in dir.create("data"): 'data' already exists
dir.create("data")
#> Warning in dir.create("data"): 'data' already exists
dir.create("outputs")
#> Warning in dir.create("outputs"): 'outputs' already exists

Scripts

Scripts in R are a way in which we can document the steps we take through our analysis and can be used to recreate what we have done. There are two main forms that scripts come in:

R Script - plain text document that contains R commands

RMarkdown - a plain text document that has text areas and code areas which is processed/compiled thought to a output format such as html or pdf which contains formatted text, code plus the results of the code embedded in the document. We’ll cover this in more depth Module/Handout 6.

R syntax

General syntax info:

R is case sensitive
spaces are ignored by R
there is no difference between single ' and double " quotes but you have to use the same type to close as you open with

Mathematical operators

addition: +

subtraction: -

multiplication: *

division: /

exponent: **

modulo/remainder: %%

# addition
1 + 2
#> [1] 3

# subtraction
3 - 6
#> [1] -3

# multiplication
4 * 2
#> [1] 8

# division
12 / 3
#> [1] 4

# exponent
2 ** 5
#> [1] 32

# modulo
5 %% 2
#> [1] 1

The # symbol is used to denote a ‘comment’ and R will ignore everything to the right of it. This lets us add comments to our code to describe the what and why of the code being run.

Data types

In R there are 3 main types of data you’ll likely use in day-to-day life, these are:

numeric
characters
boolean

The numeric type covers is your numbers both “double” (decimal), and integers (defined by a integer number followed by L e.g. 2L). These can be typed straight in as we have been doing and can have mathematical operations performed on them.

The character type is any combination of characters zero or more that is represented on the keyboard and includes letters, numbers and symbols. Characters are defined in R by enclosing them in quotation marks (either single or double, e.g. "some words"). Characters can’t have mathematical operations performed on them.

Booleans are the logical data type, they consist of TRUE and FALSE and are used for logical operations.

Within R there are other types such as complex, and raw but they are less common

Variables

Variables are named objects that we can store data in that we can reference/use later in our code.

The main rules for naming variables - Start with a letter - No symbols (except . or _)

It’s also highly recommended to use variable names that are descriptive of the contents. This will help you remember and keep track of things easier later on.

Assigment operators

<- and = are both used for assignment within R. <- is the older/more commonly used for assigning to a variable, = is the only one that you use inside a function call to assign the parameters/arguments.

In terms of priority of operators, assignment happens last, and takes the result of evaluating the right hand side and stores it into the object of named on the left hand side.

Another key thing about variables is they only contain the last thing that was assigned to them.

Functions

Functions in R let us perform operations. Functions in R are really R code stored in a variable that does stuff. In order to “do the stuff” we need call the variable with parentheses () on the end. Inside the parentheses we can pass values for the parameters/arguments which let us change the behaviour of the function.

For instance, if we want to find the square root of a number, we can use the sqrt function and provide the number we want the square root for as an argument:

sqrt(64)
#> [1] 8

To supply multiple arguments or parameters to a function we separate them by a comma. Each argument also has a name. Arguments are filled either by name, or based on the position.

# by position
round(3.142, 1)
#> [1] 3.1

# by name
round(x = 3.142, digits = 1)
#> [1] 3.1

To find out what the names of the arguments a function takes we can run the args function on the function name:

args(round)
#> function (x, digits = 0) 
#> NULL

Help

Being able to find things out for yourself is extremely important and within R there are a couple way this can be done.

help() or ?
??
google

There is usually pretty good documentation that goes along side functions and this can be accessed through the inbuilt help system using help(), ?, or ??.

help()and ? are equivalent and will find the manual page for the exact function, e.g. to find the manual page for the mean function: help("mean") or ?mean. The most useful sections of the manual pages are “Usage”, “Arguments”, and “Examples” which tell you how to run the function, what the arguments are supposed to be, and gives some ‘copy-paste’ examples to show you how it’s run.

?? on the other hand will bring up a list of all the manual pages that mention the word.

Google is also extremely useful and my most common search is “how to … in R”.

Comparatives

One final set of syntax operators to cover are the comparatives. These are used to create logical statements based on comparisons that will evaluate to be either TRUE or FALSE.

Comparators:

equality: ==
not equal to:!=
greater than / greater than or equal to: > / >=
less than / less than or equal to: < / <=

Logical operators

not: !
or: |
and: &

We’ll cover these in more depth in the Selecting and Filtering Module/Handout.

Starting with data

Vectors

Until now we’ve been operating on single items at a time. R has way of storing multiple pieces of information - the vector.

A vector is zero or more entries of the same data type.

To create a vector of more than one piece of information we can use the combine function, which because it is used so frequently in R, has been reduced to be c(). Each item is comma separated.

some_letters <- c("a", "b", "c")
some_letters
#> [1] "a" "b" "c"

some_numbers <- c(2, 4, 6)
some_numbers
#> [1] 2 4 6

We can see what the data type is of a vector using typeof

typeof(some_letters)
#> [1] "character"

typeof(some_numbers)
#> [1] "double"

Subsetting by index

The final syntax we’ll introduce this week is [] which enables us to extract items out of a vector.

Each item has a positional index (starting from 1 - other languages differ). We can use this index as an argument to [] to pull out the specified item. If we want multiple items we supply a vector of numbers for the indexes we want

some_numbers
#> [1] 2 4 6

# pull out the second item
some_numbers[2]
#> [1] 4

some_letters
#> [1] "a" "b" "c"
# pull out items 1 and 3
some_letters[c(1,3)]
#> [1] "a" "c"

In the Selecting and Filtering Data module we will cover this more and expand to 2 dimensions.

Exercises

Create and assign a vector of 5 numbers.
Find out the length of the vector.
Divide the entire vector by 2 and store the result into a variable called div_2 - what is the result of the division?
Calculate the minimum, maximum, mean, and standard deviation for the div_2 vector. Can you round the results to 2 decimal places?
Create and assign a vector of at least 4 animal names into animals.
Can you find a way to tell you the number of characters per item?
Into a new variable, extract the first and fourth animal.
Remove the third animal from your original animals vector (what does using a negative index do?).
Create a vector that has three copies of this updated animals vector.
Combine your animal and number vectors together into a new variable called “coerced”. Run typeof on this vector - how does it compare to the types of the original vector?

Example solutions

my_numbers <- c(12, 63, 3, 7, 84)

length(my_numbers)
#> [1] 5

div_2 <- my_numbers / 2
div_2
#> [1]  6.0 31.5  1.5  3.5 42.0

# minimum
round(min(div_2), digits = 2)
#> [1] 1.5
# maximum
round(max(div_2), digits = 2)
#> [1] 42
# mean
round(mean(div_2), digits = 2)
#> [1] 16.9
# standard deviation
round(sd(div_2), digits = 2)
#> [1] 18.57

animals <- c("lion", "tiger", "snake", "beetle", "turtle")
animals
#> [1] "lion"   "tiger"  "snake"  "beetle" "turtle"

nchar(animals)
#> [1] 4 5 5 6 6

two_animals <- animals[c(1,4)]
two_animals
#> [1] "lion"   "beetle"

animals <- animals[-3]
animals
#> [1] "lion"   "tiger"  "beetle" "turtle"

animals3 <- c(animals, animals, animals)
animals3
#>  [1] "lion"   "tiger"  "beetle" "turtle" "lion"   "tiger"  "beetle" "turtle"
#>  [9] "lion"   "tiger"  "beetle" "turtle"

my_numbers
#> [1] 12 63  3  7 84
typeof(my_numbers)
#> [1] "double"
animals
#> [1] "lion"   "tiger"  "beetle" "turtle"
typeof(animals)
#> [1] "character"

combined <- c(my_numbers, animals)
typeof(combined)
#> [1] "character"
combined
#> [1] "12"     "63"     "3"      "7"      "84"     "lion"   "tiger"  "beetle"
#> [9] "turtle"
# the numbers have now been coerced to be a character type so that
# all elements of the vector are the same data type

LS0tCnRpdGxlOiAiWm9vbSBOb3RlcyAwMTogSW50cm9kdWNpbmcgUiBhbmQgUlN0dWRpbyIKZGF0ZTogIlNlbWVzdGVyIDIsIDIwMjIiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIHRvY19kZXB0aDogMwogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93Ci0tLQoKYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9CmxpYnJhcnkoa25pdHIpCgprbml0cjo6b3B0c19jaHVuayRzZXQoCiAgY29tbWVudCA9ICIjPiIsCiAgZmlnLnBhdGggPSAiZmlndXJlcy8wMS8iLCAjIHVzZSBvbmx5IGZvciBzaW5nbGUgUm1kIGZpbGVzCiAgY29sbGFwc2UgPSBUUlVFLAogIGVjaG8gPSBUUlVFCikKCgpgYGAKCgoKPiAjIyMjIEFzc29jaWF0ZWQgbWF0ZXJpYWwKPiBNb2R1bGU6IFtNb2R1bGUgMDEgLSBJbnRyb2R1Y2luZyBSIGFuZCBSc3R1ZGlvXSgwMS1pbnRyby5odG1sKQo+IAo+IFJlYWRpbmdzOgo+Cj4gLSBbUiBmb3IgRGF0YSBTY2llbmNlIC0gQ2hhcHRlciAxXShodHRwczovL3I0ZHMuaGFkLmNvLm56L2ludHJvZHVjdGlvbi5odG1sKQo+IC0gW1IgZm9yIERhdGEgU2NpZW5jZSAtIENoYXB0ZXIgNF0oaHR0cHM6Ly9yNGRzLmhhZC5jby5uei93b3JrZmxvdy1iYXNpY3MuaHRtKQoKCiMjIyMgQmVmb3JlIHdlIHN0YXJ0CgpUaGlzIGNvdXJzZSBpcyBkZXNpZ25lZCB3aXRoIHR3byBjb21wb25lbnRzIC0gdGhlIG1vZHVsZSBhbmQgdGhlIHpvb20gbm90ZXMuIFRoZSBtb2R1bGUgY29udGVudCBwcm92aWRlcyBtb3JlIGV4cGxhbmF0aW9uIGFuZCBiYWNrZ3JvdW5kIHNvIHRoYXQgeW91IGNhbiB3b3JrIHRocm91Z2ggaXQgb24geW91ciBvd24gaWYgeW91IHdpc2guIFRoZSB6b29tIG5vdGVzIGNvbnRlbnQgcHJvdmlkZXMgdGhlIHN0cnVjdHVyZSBmb3IgdGhlIGNvbnRlbnQgdGhhdCB3aWxsIGJlIGRlbGl2ZXJlZCBpbiB0aGUgb25saW5lIHNlc3Npb25zLiBCb3RoIHNldHMgb2YgY29udGVudCBhcmUgY29tcGxlbWVudGFyeSB0byBlYWNoIG90aGVyLgoKQXQgdGhlIHRvcCByaWdodCBoYW5kIGNvcm5lciBvZiBib3RoIHRoZSBtb2R1bGUgYW5kIHpvb20gbm90ZXMgcGFnZXMgaXMgYSAiY29kZSIgYnV0dG9uLiBUaGlzIGNhbiBiZSB1c2VkIHRvIHRvZ2dsZSBzZWVpbmcvaGlkaW5nIHRoZSBjb2RlIG9yIHRvIGRvd25sb2FkIHRoZSBjb2RlIHRoYXQgdGhhdCBjcmVhdGVkIHRoZSBwYWdlIGFzIGFuIFJtYXJrZG93biBmaWxlICh3ZSBjb3ZlciBSbWFya2Rvd24gbW9yZSBpbi1kZXB0aCBpbiBbbW9kdWxlXSgwNi1jb21tdW5pY2F0ZS5odG1sKS9bem9vbSBub3Rlc10oem9vbV9ub3Rlc18wNi5odG1sKSA2KS4KCgoKXAoKIyBSIGFuZCBSU3R1ZGlvCgpSIGlzIHRoZSBsYW5ndWFnZSwgUlN0dWRpbyBpcyBhbiBpbnRlcmZhY2UgZm9yIGludGVyYWN0aW5nIHdpdGggUi4KClwKCiMjIFRoZSBSU3R1ZGlvIGVudmlyb25tZW50CgpSU3R1ZGlvIGlzIHdoYXQgaXMga25vd24gYXMgYW4gaW50ZWdyYXRlZCBkZXZlbG9wbWVudCBlbnZpcm9ubWVudCAoSURFKSB3aGljaCBwcm92aWRlcyBhIGdyYXBoaWNhbCBpbnRlcmZhY2UgKGFtb25nIG90aGVyIHRoaW5ncykgZm9yIGludGVyYWN0aW5nIHdpdGggUi4gVGhlIG1haW4gZW52aXJvbm1lbnQgb2YgUlN0dWRpbyBpcyBjb21wcmlzZWQgb2YgcGFuZWxzLgoKUGFuZWxzIG9mIFJTdHVkaW8KCi0gY29uc29sZQotIHNvdXJjZQotIGVudmlyb25tZW50L2hpc3RvcnkKLSBmaWxlL3Bsb3QvaGVscC92aWV3ZXIKClwKCiMjIyBHbG9iYWwgc2V0dGluZ3MgZm9yIHJlcHJvZHVjaWJpbGl0eQoKQmVmb3JlIHdlIGdldCB1bmRlciB3YXkgd2Ugd2FudCB0byBzZXQgdXAgb3VyIGVudmlyb25tZW50IHRvIGhlbHAgZW5mb3JjZSBzb21lIGJlaGF2aW91cnMgdGhhdCBlbmNvdXJhZ2UgcmVwcm9kdWNpYmlsaXR5LgoKV2Ugd2FudCB0byBkaXNhYmxlIGEgZmV3IGRlZmF1bHQgc2V0dGluZ3MKCi0gUmVzdG9yZSAuUkRhdGEgb24gc3RhcnR1cAotIFNhdmUgd29ya3NwYWNlIHRvIC5SZGF0YQoKVG8gZG8gdGhpcyBzZWxlY3QgdGhlIGBUb29sc2AgbWVudSAtPiBgR2xvYmFsIG9wdGlvbnNgLCB0aGVuIG9uIHRoZSAiR2VuZXJhbCIgdGFiIHVuZGVyIHRoZSAiV29ya3NwYWNlIiBoZWFkaW5nOgoKMS4gVW50aWNrICJSZXN0b3JlIC5SRGF0YSBvbiBzdGFydHVwIgoyLiBTZXQgIlNhdmUgd29ya3NwYWNlIHRvIC5SRGF0YSBvbiBleGl0IiB0byAiTmV2ZXIiCjMuIENsaWNrICJBcHBseSIKClwKCiMjIyBQcm9qZWN0cwoKUHJvamVjdHMgd2l0aGluIFJTdHVkaW8gcHJvdmlkZSBtZWNoYW5pc20gdG8gZW5jYXBzdWxhdGUgYSBwcm9qZWN0IC0gYmUgaXQgcGFydGljdWxhciBkYXRhIGFuYWx5c2lzIHlvdSdyZSB3b3JraW5nIG9uLCBhbiBSIHBhY2thZ2UgeW91J3JlIG1ha2luZyAoTW9kdWxlcy9IYW5kb3V0cyA3IGFuZCA4KSwgb3IgZXZlbiBhIGJvb2sgKE1vZHVsZS9IYW5kb3V0IDYpLgoKQSBwcm9qZWN0IGlzIGEgZGlyZWN0b3J5IG9uIHlvdXIgY29tcHV0ZXIgdGhhdCB5b3Ugd2FudCB0byBwdXQgYWxsIHlvdXIgY29kZSwgZG9jdW1lbnRhdGlvbiwgZGF0YSwgYW5kIGFzc29jaWF0ZWQgb3V0cHV0cyBzbyB0aGF0IGV2ZXJ5dGhpbmcgbmVlZGVkIHRvIHJlY3JlYXRlIGFuIGFuYWx5c2lzIGlzICJidW5kbGVkIHRvZ2V0aGVyIi4KCldlJ2xsIGNyZWF0ZSBhIHByb2plY3QgZm9yIHRoZSBjb3Vyc2UgYW5kIGNyZWF0ZSBhIGNvbW1vbiBwcm9qZWN0IHN0cnVjdHVyZToKCi0gRmlsZSAtPiBOZXcgUHJvamVjdCAtPiBOZXcgRGlyZWN0b3J5IC0+IE5ldyBQcm9qZWN0Ci0gQ2hvb3NlIHdoZXJlIHlvdSB3YW50IGl0IHRvIGxpdmUgYW5kIGdpdmUgaXQgYSBuYW1lCi0gIkNyZWF0ZSBQcm9qZWN0IgoKTm93IHdlIGhhdmUgb3VyIG5ldyBwcm9qZWN0IHdlJ2xsIGNyZWF0ZSBzb21lIGRpcmVjdG9yaWVzIHRvIHN0b3JlIHZhcmlvdXMgYXNwZWN0cyBvZiBvdXIgcHJvamVjdC4gV2UnbGwgY3JlYXRlIHRoZSBmb2xsb3dpbmcgZGlyZWN0b3JpZXM6CgotIHNjcmlwdHMKLSBkb2NzCi0gZGF0YQotIG91dHB1dHMKCllvdSBjYW4gZG8gdGhpcyBlaXRoZXIgdXNpbmcgdGhlICJOZXcgRm9sZGVyIiBidXR0b24gaW4gdGhlIEZpbGVzIHBhbmVsIG9yIHVzaW5nIHRoZSBjb2RlIGJlbG93LgoKYGBge3J9CmRpci5jcmVhdGUoInNjcmlwdHMiKQpkaXIuY3JlYXRlKCJkYXRhIikKZGlyLmNyZWF0ZSgiZGF0YSIpCmRpci5jcmVhdGUoIm91dHB1dHMiKQpgYGAKClwKCiMjIyBTY3JpcHRzCgpTY3JpcHRzIGluIFIgYXJlIGEgd2F5IGluIHdoaWNoIHdlIGNhbiBkb2N1bWVudCB0aGUgc3RlcHMgd2UgdGFrZSB0aHJvdWdoIG91ciBhbmFseXNpcyBhbmQgY2FuIGJlIHVzZWQgdG8gcmVjcmVhdGUgd2hhdCB3ZSBoYXZlIGRvbmUuIFRoZXJlIGFyZSB0d28gbWFpbiBmb3JtcyB0aGF0IHNjcmlwdHMgY29tZSBpbjoKClIgU2NyaXB0IC0gcGxhaW4gdGV4dCBkb2N1bWVudCB0aGF0IGNvbnRhaW5zIFIgY29tbWFuZHMKClJNYXJrZG93biAtIGEgcGxhaW4gdGV4dCBkb2N1bWVudCB0aGF0IGhhcyB0ZXh0IGFyZWFzIGFuZCBjb2RlIGFyZWFzIHdoaWNoIGlzIHByb2Nlc3NlZC9jb21waWxlZCB0aG91Z2h0IHRvIGEgb3V0cHV0IGZvcm1hdCBzdWNoIGFzIGh0bWwgb3IgcGRmIHdoaWNoIGNvbnRhaW5zIGZvcm1hdHRlZCB0ZXh0LCBjb2RlIHBsdXMgdGhlIHJlc3VsdHMgb2YgdGhlIGNvZGUgZW1iZWRkZWQgaW4gdGhlIGRvY3VtZW50LiBXZSdsbCBjb3ZlciB0aGlzIGluIG1vcmUgZGVwdGggTW9kdWxlL0hhbmRvdXQgNi4KClwKCiMjIFIgc3ludGF4CgpHZW5lcmFsIHN5bnRheCBpbmZvOgoKLSBSIGlzIGNhc2Ugc2Vuc2l0aXZlCi0gc3BhY2VzIGFyZSBpZ25vcmVkIGJ5IFIKLSB0aGVyZSBpcyBubyBkaWZmZXJlbmNlIGJldHdlZW4gc2luZ2xlIGAnYCBhbmQgZG91YmxlIGAiYCBxdW90ZXMgYnV0IHlvdSBoYXZlIHRvIHVzZSB0aGUgc2FtZSB0eXBlIHRvIGNsb3NlIGFzIHlvdSBvcGVuIHdpdGgKClwKCiMjIyBNYXRoZW1hdGljYWwgb3BlcmF0b3JzCgphZGRpdGlvbjogYCtgCgpzdWJ0cmFjdGlvbjogYC1gCgptdWx0aXBsaWNhdGlvbjogYCpgCgpkaXZpc2lvbjogYC9gCgpleHBvbmVudDogYCoqYAoKbW9kdWxvL3JlbWFpbmRlcjogYCUlYAoKYGBge3J9CiMgYWRkaXRpb24KMSArIDIKCiMgc3VidHJhY3Rpb24KMyAtIDYKCiMgbXVsdGlwbGljYXRpb24KNCAqIDIKCiMgZGl2aXNpb24KMTIgLyAzCgojIGV4cG9uZW50CjIgKiogNQoKIyBtb2R1bG8KNSAlJSAyCgpgYGAKClRoZSBgI2Agc3ltYm9sIGlzIHVzZWQgdG8gZGVub3RlIGEgJ2NvbW1lbnQnIGFuZCBSIHdpbGwgaWdub3JlIGV2ZXJ5dGhpbmcgdG8gdGhlIHJpZ2h0IG9mIGl0LiBUaGlzIGxldHMgdXMgYWRkIGNvbW1lbnRzIHRvIG91ciBjb2RlIHRvIGRlc2NyaWJlIHRoZSB3aGF0IGFuZCB3aHkgb2YgdGhlIGNvZGUgYmVpbmcgcnVuLgoKXAoKIyMjIERhdGEgdHlwZXMKCkluIFIgdGhlcmUgYXJlIDMgbWFpbiB0eXBlcyBvZiBkYXRhIHlvdSdsbCBsaWtlbHkgdXNlIGluIGRheS10by1kYXkgbGlmZSwgdGhlc2UgYXJlOgoKLSBudW1lcmljCi0gY2hhcmFjdGVycwotIGJvb2xlYW4KClRoZSBudW1lcmljIHR5cGUgY292ZXJzIGlzIHlvdXIgbnVtYmVycyBib3RoICJkb3VibGUiIChkZWNpbWFsKSwgYW5kIGludGVnZXJzIChkZWZpbmVkIGJ5IGEgaW50ZWdlciBudW1iZXIgZm9sbG93ZWQgYnkgTCBlLmcuIGAyTGApLiBUaGVzZSBjYW4gYmUgdHlwZWQgc3RyYWlnaHQgaW4gYXMgd2UgaGF2ZSBiZWVuIGRvaW5nIGFuZCBjYW4gaGF2ZSBtYXRoZW1hdGljYWwgb3BlcmF0aW9ucyBwZXJmb3JtZWQgb24gdGhlbS4KClRoZSBjaGFyYWN0ZXIgdHlwZSBpcyBhbnkgY29tYmluYXRpb24gb2YgY2hhcmFjdGVycyB6ZXJvIG9yIG1vcmUgdGhhdCBpcyByZXByZXNlbnRlZCBvbiB0aGUga2V5Ym9hcmQgYW5kIGluY2x1ZGVzIGxldHRlcnMsIG51bWJlcnMgYW5kIHN5bWJvbHMuIENoYXJhY3RlcnMgYXJlIGRlZmluZWQgaW4gUiBieSBlbmNsb3NpbmcgdGhlbSBpbiBxdW90YXRpb24gbWFya3MgKGVpdGhlciBzaW5nbGUgb3IgZG91YmxlLCBlLmcuIGAic29tZSB3b3JkcyJgKS4gQ2hhcmFjdGVycyBjYW4ndCBoYXZlIG1hdGhlbWF0aWNhbCBvcGVyYXRpb25zIHBlcmZvcm1lZCBvbiB0aGVtLgoKQm9vbGVhbnMgYXJlIHRoZSBsb2dpY2FsIGRhdGEgdHlwZSwgdGhleSBjb25zaXN0IG9mIGBUUlVFYCBhbmQgYEZBTFNFYCBhbmQgYXJlIHVzZWQgZm9yIGxvZ2ljYWwgb3BlcmF0aW9ucy4KCldpdGhpbiBSIHRoZXJlIGFyZSBvdGhlciB0eXBlcyBzdWNoIGFzIGNvbXBsZXgsIGFuZCByYXcgYnV0IHRoZXkgYXJlIGxlc3MgY29tbW9uCgpcCgojIyMgVmFyaWFibGVzCgpWYXJpYWJsZXMgYXJlIG5hbWVkIG9iamVjdHMgdGhhdCB3ZSBjYW4gc3RvcmUgZGF0YSBpbiB0aGF0IHdlIGNhbiByZWZlcmVuY2UvdXNlIGxhdGVyIGluIG91ciBjb2RlLgoKVGhlIG1haW4gcnVsZXMgZm9yIG5hbWluZyB2YXJpYWJsZXMKLSBTdGFydCB3aXRoIGEgbGV0dGVyCi0gTm8gc3ltYm9scyAoZXhjZXB0IC4gb3IgXykKCkl0J3MgYWxzbyBoaWdobHkgcmVjb21tZW5kZWQgdG8gdXNlIHZhcmlhYmxlIG5hbWVzIHRoYXQgYXJlIGRlc2NyaXB0aXZlIG9mIHRoZSBjb250ZW50cy4gVGhpcyB3aWxsIGhlbHAgeW91IHJlbWVtYmVyIGFuZCBrZWVwIHRyYWNrIG9mIHRoaW5ncyBlYXNpZXIgbGF0ZXIgb24uCgpcCgojIyMjIEFzc2lnbWVudCBvcGVyYXRvcnMKCmA8LWAgYW5kIGA9YCBhcmUgYm90aCB1c2VkIGZvciBhc3NpZ25tZW50IHdpdGhpbiBSLiBgPC1gIGlzIHRoZSBvbGRlci9tb3JlIGNvbW1vbmx5IHVzZWQgZm9yIGFzc2lnbmluZyB0byBhIHZhcmlhYmxlLCBgPWAgaXMgdGhlIG9ubHkgb25lIHRoYXQgeW91IHVzZSBpbnNpZGUgYSBmdW5jdGlvbiBjYWxsIHRvIGFzc2lnbiB0aGUgcGFyYW1ldGVycy9hcmd1bWVudHMuCgpJbiB0ZXJtcyBvZiBwcmlvcml0eSBvZiBvcGVyYXRvcnMsIGFzc2lnbm1lbnQgaGFwcGVucyAqKmxhc3QqKiwgYW5kIHRha2VzIHRoZSByZXN1bHQgb2YgZXZhbHVhdGluZyB0aGUgcmlnaHQgaGFuZCBzaWRlIGFuZCBzdG9yZXMgaXQgaW50byB0aGUgb2JqZWN0IG9mIG5hbWVkIG9uIHRoZSBsZWZ0IGhhbmQgc2lkZS4KCkFub3RoZXIga2V5IHRoaW5nIGFib3V0IHZhcmlhYmxlcyBpcyB0aGV5ICoqb25seSBjb250YWluIHRoZSBsYXN0IHRoaW5nIHRoYXQgd2FzIGFzc2lnbmVkIHRvIHRoZW0qKi4KClwKCgojIyMgRnVuY3Rpb25zCgpGdW5jdGlvbnMgaW4gUiBsZXQgdXMgcGVyZm9ybSBvcGVyYXRpb25zLiBGdW5jdGlvbnMgaW4gUiBhcmUgcmVhbGx5IFIgY29kZSBzdG9yZWQgaW4gYSB2YXJpYWJsZSB0aGF0IGRvZXMgc3R1ZmYuIEluIG9yZGVyIHRvICJkbyB0aGUgc3R1ZmYiIHdlIG5lZWQgY2FsbCB0aGUgdmFyaWFibGUgd2l0aCBwYXJlbnRoZXNlcyBgKClgIG9uIHRoZSBlbmQuIEluc2lkZSB0aGUgcGFyZW50aGVzZXMgd2UgY2FuIHBhc3MgdmFsdWVzIGZvciB0aGUgcGFyYW1ldGVycy9hcmd1bWVudHMgd2hpY2ggbGV0IHVzIGNoYW5nZSB0aGUgYmVoYXZpb3VyIG9mIHRoZSBmdW5jdGlvbi4KCkZvciBpbnN0YW5jZSwgaWYgd2Ugd2FudCB0byBmaW5kIHRoZSBzcXVhcmUgcm9vdCBvZiBhIG51bWJlciwgd2UgY2FuIHVzZSB0aGUgYHNxcnRgIGZ1bmN0aW9uIGFuZCBwcm92aWRlIHRoZSBudW1iZXIgd2Ugd2FudCB0aGUgc3F1YXJlIHJvb3QgZm9yIGFzIGFuIGFyZ3VtZW50OgoKYGBge3J9CnNxcnQoNjQpCmBgYAoKVG8gc3VwcGx5IG11bHRpcGxlIGFyZ3VtZW50cyBvciBwYXJhbWV0ZXJzIHRvIGEgZnVuY3Rpb24gd2Ugc2VwYXJhdGUgdGhlbSBieSBhIGNvbW1hLiBFYWNoIGFyZ3VtZW50IGFsc28gaGFzIGEgbmFtZS4gQXJndW1lbnRzIGFyZSBmaWxsZWQgZWl0aGVyIGJ5IG5hbWUsIG9yIGJhc2VkIG9uIHRoZSBwb3NpdGlvbi4KCmBgYHtyfQojIGJ5IHBvc2l0aW9uCnJvdW5kKDMuMTQyLCAxKQoKIyBieSBuYW1lCnJvdW5kKHggPSAzLjE0MiwgZGlnaXRzID0gMSkKYGBgCgpUbyBmaW5kIG91dCB3aGF0IHRoZSBuYW1lcyBvZiB0aGUgYXJndW1lbnRzIGEgZnVuY3Rpb24gdGFrZXMgd2UgY2FuIHJ1biB0aGUgYGFyZ3NgIGZ1bmN0aW9uIG9uIHRoZSBmdW5jdGlvbiBuYW1lOgoKYGBge3J9CmFyZ3Mocm91bmQpCmBgYAoKXAoKIyMjIEhlbHAKCkJlaW5nIGFibGUgdG8gZmluZCB0aGluZ3Mgb3V0IGZvciB5b3Vyc2VsZiBpcyBleHRyZW1lbHkgaW1wb3J0YW50IGFuZCB3aXRoaW4gUiB0aGVyZSBhcmUgYSBjb3VwbGUgd2F5IHRoaXMgY2FuIGJlIGRvbmUuCgotIGBoZWxwKClgIG9yIGA/YAotIGA/P2AKLSBnb29nbGUKCgpUaGVyZSBpcyB1c3VhbGx5IHByZXR0eSBnb29kIGRvY3VtZW50YXRpb24gdGhhdCBnb2VzIGFsb25nIHNpZGUgZnVuY3Rpb25zIGFuZCB0aGlzIGNhbiBiZSBhY2Nlc3NlZCB0aHJvdWdoIHRoZSBpbmJ1aWx0IGhlbHAgc3lzdGVtIHVzaW5nIGBoZWxwKClgLCBgP2AsIG9yIGA/P2AuCgpgaGVscCgpYGFuZCBgP2AgYXJlIGVxdWl2YWxlbnQgYW5kIHdpbGwgZmluZCB0aGUgbWFudWFsIHBhZ2UgZm9yIHRoZSBleGFjdCBmdW5jdGlvbiwgZS5nLiB0byBmaW5kIHRoZSBtYW51YWwgcGFnZSBmb3IgdGhlIGBtZWFuYCBmdW5jdGlvbjogYGhlbHAoIm1lYW4iKWAgb3IgYD9tZWFuYC4gVGhlIG1vc3QgdXNlZnVsIHNlY3Rpb25zIG9mIHRoZSBtYW51YWwgcGFnZXMgYXJlICJVc2FnZSIsICJBcmd1bWVudHMiLCBhbmQgIkV4YW1wbGVzIiB3aGljaCB0ZWxsIHlvdSBob3cgdG8gcnVuIHRoZSBmdW5jdGlvbiwgd2hhdCB0aGUgYXJndW1lbnRzIGFyZSBzdXBwb3NlZCB0byBiZSwgYW5kIGdpdmVzIHNvbWUgJ2NvcHktcGFzdGUnIGV4YW1wbGVzIHRvIHNob3cgeW91IGhvdyBpdCdzIHJ1bi4KCmA/P2Agb24gdGhlIG90aGVyIGhhbmQgd2lsbCBicmluZyB1cCBhIGxpc3Qgb2YgYWxsIHRoZSBtYW51YWwgcGFnZXMgdGhhdCBtZW50aW9uIHRoZSB3b3JkLgoKR29vZ2xlIGlzIGFsc28gZXh0cmVtZWx5IHVzZWZ1bCBhbmQgbXkgbW9zdCBjb21tb24gc2VhcmNoIGlzICJob3cgdG8gLi4uIGluIFIiLgoKXAoKIyMjIENvbXBhcmF0aXZlcwoKT25lIGZpbmFsIHNldCBvZiBzeW50YXggb3BlcmF0b3JzIHRvIGNvdmVyIGFyZSB0aGUgY29tcGFyYXRpdmVzLiBUaGVzZSBhcmUgdXNlZCB0byBjcmVhdGUgbG9naWNhbCBzdGF0ZW1lbnRzIGJhc2VkIG9uIGNvbXBhcmlzb25zIHRoYXQgd2lsbCBldmFsdWF0ZSB0byBiZSBlaXRoZXIgYFRSVUVgIG9yIGBGQUxTRWAuCgpDb21wYXJhdG9yczoKCi0gZXF1YWxpdHk6IGA9PWAKLSBub3QgZXF1YWwgdG86YCE9YAotIGdyZWF0ZXIgdGhhbiAvIGdyZWF0ZXIgdGhhbiBvciBlcXVhbCB0bzogYD5gIC8gYD49YAotIGxlc3MgdGhhbiAvIGxlc3MgdGhhbiBvciBlcXVhbCB0bzogYDxgIC8gYDw9YAoKTG9naWNhbCBvcGVyYXRvcnMKCi0gbm90OiBgIWAKLSBvcjogYHxgCi0gYW5kOiBgJmAKCldlJ2xsIGNvdmVyIHRoZXNlIGluIG1vcmUgZGVwdGggaW4gdGhlIFNlbGVjdGluZyBhbmQgRmlsdGVyaW5nIFtNb2R1bGVdKDAzLXN1YnNldC5odG1sKS9bSGFuZG91dF0oem9vbV9ub3Rlc18wMy5odG1sKS4KClwKCiMjIFN0YXJ0aW5nIHdpdGggZGF0YQoKIyMjIFZlY3RvcnMKClVudGlsIG5vdyB3ZSd2ZSBiZWVuIG9wZXJhdGluZyBvbiBzaW5nbGUgaXRlbXMgYXQgYSB0aW1lLiBSIGhhcyB3YXkgb2Ygc3RvcmluZyBtdWx0aXBsZSBwaWVjZXMgb2YgaW5mb3JtYXRpb24gLSB0aGUgX3ZlY3Rvcl8uCgpBIHZlY3RvciBpcyB6ZXJvIG9yIG1vcmUgZW50cmllcyBvZiB0aGUgKipzYW1lIGRhdGEgdHlwZSoqLgoKVG8gY3JlYXRlIGEgdmVjdG9yIG9mIG1vcmUgdGhhbiBvbmUgcGllY2Ugb2YgaW5mb3JtYXRpb24gd2UgY2FuIHVzZSB0aGUgX2NvbWJpbmVfIGZ1bmN0aW9uLCB3aGljaCBiZWNhdXNlIGl0IGlzIHVzZWQgc28gZnJlcXVlbnRseSBpbiBSLCBoYXMgYmVlbiByZWR1Y2VkIHRvIGJlIGBjKClgLiBFYWNoIGl0ZW0gaXMgY29tbWEgc2VwYXJhdGVkLgoKYGBge3J9CnNvbWVfbGV0dGVycyA8LSBjKCJhIiwgImIiLCAiYyIpCnNvbWVfbGV0dGVycwoKc29tZV9udW1iZXJzIDwtIGMoMiwgNCwgNikKc29tZV9udW1iZXJzCmBgYAoKV2UgY2FuIHNlZSB3aGF0IHRoZSBkYXRhIHR5cGUgaXMgb2YgYSB2ZWN0b3IgdXNpbmcgYHR5cGVvZmAKCmBgYHtyfQp0eXBlb2Yoc29tZV9sZXR0ZXJzKQoKdHlwZW9mKHNvbWVfbnVtYmVycykKYGBgCgpcCgojIyMjIFN1YnNldHRpbmcgYnkgaW5kZXgKClRoZSBmaW5hbCBzeW50YXggd2UnbGwgaW50cm9kdWNlIHRoaXMgd2VlayBpcyBgW11gIHdoaWNoIGVuYWJsZXMgdXMgdG8gZXh0cmFjdCBpdGVtcyBvdXQgb2YgYSB2ZWN0b3IuCgpFYWNoIGl0ZW0gaGFzIGEgcG9zaXRpb25hbCBpbmRleCAoc3RhcnRpbmcgZnJvbSAxIC0gb3RoZXIgbGFuZ3VhZ2VzIGRpZmZlcikuIFdlIGNhbiB1c2UgdGhpcyBpbmRleCBhcyBhbiBhcmd1bWVudCB0byBgW11gIHRvIHB1bGwgb3V0IHRoZSBzcGVjaWZpZWQgaXRlbS4gSWYgd2Ugd2FudCBtdWx0aXBsZSBpdGVtcyB3ZSBzdXBwbHkgYSB2ZWN0b3Igb2YgbnVtYmVycyBmb3IgdGhlIGluZGV4ZXMgd2Ugd2FudAoKYGBge3J9CnNvbWVfbnVtYmVycwoKIyBwdWxsIG91dCB0aGUgc2Vjb25kIGl0ZW0Kc29tZV9udW1iZXJzWzJdCgpzb21lX2xldHRlcnMKIyBwdWxsIG91dCBpdGVtcyAxIGFuZCAzCnNvbWVfbGV0dGVyc1tjKDEsMyldCmBgYAoKSW4gdGhlIFNlbGVjdGluZyBhbmQgRmlsdGVyaW5nIERhdGEgbW9kdWxlIHdlIHdpbGwgY292ZXIgdGhpcyBtb3JlIGFuZCBleHBhbmQgdG8gMiBkaW1lbnNpb25zLgoKXAoKIyBFeGVyY2lzZXMKCgoxLiBDcmVhdGUgYW5kIGFzc2lnbiBhIHZlY3RvciBvZiA1IG51bWJlcnMuCgoyLiBGaW5kIG91dCB0aGUgYGxlbmd0aGAgb2YgdGhlIHZlY3Rvci4KCjMuIERpdmlkZSB0aGUgZW50aXJlIHZlY3RvciBieSAyIGFuZCBzdG9yZSB0aGUgcmVzdWx0IGludG8gYSB2YXJpYWJsZSBjYWxsZWQgKmRpdl8yKiAtIHdoYXQgaXMgdGhlIHJlc3VsdCBvZiB0aGUgZGl2aXNpb24/Cgo0LiBDYWxjdWxhdGUgdGhlIG1pbmltdW0sIG1heGltdW0sIG1lYW4sIGFuZCBzdGFuZGFyZCBkZXZpYXRpb24gZm9yIHRoZSAqZGl2XzIqIHZlY3Rvci4gQ2FuIHlvdSByb3VuZCB0aGUgcmVzdWx0cyB0byAyIGRlY2ltYWwgcGxhY2VzPwoKNS4gQ3JlYXRlIGFuZCBhc3NpZ24gYSB2ZWN0b3Igb2YgYXQgbGVhc3QgNCBhbmltYWwgbmFtZXMgaW50byBfYW5pbWFsc18uCgo2LiBDYW4geW91IGZpbmQgYSB3YXkgdG8gdGVsbCB5b3UgdGhlIG51bWJlciBvZiBjaGFyYWN0ZXJzIHBlciBpdGVtPwoKNy4gSW50byBhIG5ldyB2YXJpYWJsZSwgZXh0cmFjdCB0aGUgZmlyc3QgYW5kIGZvdXJ0aCBhbmltYWwuCgo4LiBSZW1vdmUgdGhlIHRoaXJkIGFuaW1hbCBmcm9tIHlvdXIgb3JpZ2luYWwgYW5pbWFscyB2ZWN0b3IgKHdoYXQgZG9lcyB1c2luZyBhIG5lZ2F0aXZlIGluZGV4IGRvPykuCgo5LiBDcmVhdGUgYSB2ZWN0b3IgdGhhdCBoYXMgdGhyZWUgY29waWVzIG9mIHRoaXMgdXBkYXRlZCBhbmltYWxzIHZlY3Rvci4KCjEwLiBDb21iaW5lIHlvdXIgYW5pbWFsIGFuZCBudW1iZXIgdmVjdG9ycyB0b2dldGhlciBpbnRvIGEgbmV3IHZhcmlhYmxlIGNhbGxlZCAiX2NvZXJjZWRfIi4gUnVuIGB0eXBlb2ZgIG9uIHRoaXMgdmVjdG9yIC0gaG93IGRvZXMgaXQgY29tcGFyZSB0byB0aGUgdHlwZXMgb2YgdGhlIG9yaWdpbmFsIHZlY3Rvcj8KCgojIyMgRXhhbXBsZSBzb2x1dGlvbnMKCjEuCgpgYGB7ciwgem4wMV9zb2xuMSwgY2xhc3Muc291cmNlID0gImZvbGQtaGlkZSJ9Cm15X251bWJlcnMgPC0gYygxMiwgNjMsIDMsIDcsIDg0KQpgYGAKCi0tLS0KCjIuCgpgYGB7ciwgem4wMl9zb2xuMiwgY2xhc3Muc291cmNlID0gImZvbGQtaGlkZSJ9Cmxlbmd0aChteV9udW1iZXJzKQpgYGAKCi0tLS0KCjMuIAoKYGBge3Igem4wMV9zb2xuMywgY2xhc3Muc291cmNlID0gImZvbGQtaGlkZSJ9CmRpdl8yIDwtIG15X251bWJlcnMgLyAyCmRpdl8yCmBgYAoKLS0tLQoKNC4KCmBgYHtyIHpuMDFfc29sbjQsIGNsYXNzLnNvdXJjZSA9ICJmb2xkLWhpZGUifQojIG1pbmltdW0Kcm91bmQobWluKGRpdl8yKSwgZGlnaXRzID0gMikKIyBtYXhpbXVtCnJvdW5kKG1heChkaXZfMiksIGRpZ2l0cyA9IDIpCiMgbWVhbgpyb3VuZChtZWFuKGRpdl8yKSwgZGlnaXRzID0gMikKIyBzdGFuZGFyZCBkZXZpYXRpb24Kcm91bmQoc2QoZGl2XzIpLCBkaWdpdHMgPSAyKQpgYGAKCi0tLS0tCgo1LgoKYGBge3Igem4wMV9zb2xuNSwgY2xhc3Muc291cmNlID0gImZvbGQtaGlkZSJ9CmFuaW1hbHMgPC0gYygibGlvbiIsICJ0aWdlciIsICJzbmFrZSIsICJiZWV0bGUiLCAidHVydGxlIikKYW5pbWFscwpgYGAKCi0tLQoKNi4KCmBgYHtyLCB6bjAxX3NvbG42LCBjbGFzcy5zb3VyY2UgPSAiZm9sZC1oaWRlIn0KbmNoYXIoYW5pbWFscykKYGBgCgotLS0tCgo3LgoKYGBge3IsIHpuMDFfc29sbjcsIGNsYXNzLnNvdXJjZSA9ICJmb2xkLWhpZGUifQp0d29fYW5pbWFscyA8LSBhbmltYWxzW2MoMSw0KV0KdHdvX2FuaW1hbHMKYGBgCgotLS0tLQoKOC4KCmBgYHtyIHpuMDFfc29sbjgsIGNsYXNzLnNvdXJjZSA9ICJmb2xkLWhpZGUifQphbmltYWxzIDwtIGFuaW1hbHNbLTNdCmFuaW1hbHMKYGBgCgotLS0KCjkuCgpgYGB7ciwgem4wMV9zb2xuOSwgY2xhc3Muc291cmNlID0gImZvbGQtaGlkZSJ9CmFuaW1hbHMzIDwtIGMoYW5pbWFscywgYW5pbWFscywgYW5pbWFscykKYW5pbWFsczMKYGBgCgotLS0KCjEwLgoKYGBge3Igem4xMF9zb2xuMTAsIGNsYXNzLnNvdXJjZSA9ICJmb2xkLWhpZGUifQpteV9udW1iZXJzCnR5cGVvZihteV9udW1iZXJzKQphbmltYWxzCnR5cGVvZihhbmltYWxzKQoKY29tYmluZWQgPC0gYyhteV9udW1iZXJzLCBhbmltYWxzKQp0eXBlb2YoY29tYmluZWQpCmNvbWJpbmVkCiMgdGhlIG51bWJlcnMgaGF2ZSBub3cgYmVlbiBjb2VyY2VkIHRvIGJlIGEgY2hhcmFjdGVyIHR5cGUgc28gdGhhdAojIGFsbCBlbGVtZW50cyBvZiB0aGUgdmVjdG9yIGFyZSB0aGUgc2FtZSBkYXRhIHR5cGUKYGBgCgo=

Zoom Notes 01: Introducing R and RStudio

Semester 2, 2022

Associated material