El lenguaje de R

AuthorJordi Mas Elias
ProfessionProfesor de los Estudios de Derecho y Ciencia Política en la Universitat Oberta de Catalunya (UOC)
Pages15-73
Editorial UOC Capítulo I. El lenguaje de R
15
Capítulo I
El lenguaje de R
1. Introducción
Para aprender a utilizar programas de análisis de datos como
R, lo más importante que nos hace falta inicialmente es domi-
nar el lenguaje. En general, conocer un lenguaje de programa-
ción equivale a ser competente en un idioma. Si compartimos
el mismo idioma, podremos comunicarnos con el programa y
hacer que este entienda nuestras órdenes. Pasa lo mismo cuando
queremos aprender alemán: tendremos que dominar la gramática
alemana, sus palabras básicas y saber cómo se conjugan los ver-
bos. Además, tarde o temprano, tendremos que ser capaces de
defendernos oralmente y tener una buena pronunciación.
Con lenguajes de programación como R, la suerte que tenemos
es que son lenguajes escritos y no orales. Por lo tanto, esto nos
ahorra una parte importante del aprendizaje, puesto que solo ten-
dremos que aprender la parte escrita. El entorno en el que se utiliza
el lenguaje de R es también muy limitado: no tenemos que usarlo
ni en el aeropuerto ni en el supermercado, ni para presentarnos
a otras personas, tal como pasa en la mayoría de los idiomas, que
tenemos que aprender a usarlos en una gran cantidad de contextos.
Estos lenguajes solo son necesarios en situaciones muy concretas,
de modo que no tenemos que conocer muchas palabras puesto
que constantemente repetimos las mismas ideas, por ejemplo:
«filtra las columnas de una base de datos»
Editorial UOC Análisis de datos con R en estudios internacionales
16
«construye un gráfico a partir de estas variables»
«suma estos dos valores»
«di cuál es la media de los valores de esta variable»...
Si sabemos denominar los principales objetos de los que dis-
ponemos (variable, base de datos, valor...) y los principales verbos
que utilizaremos (filtrar, ordenar, crear gráfico), y tenemos los cono-
cimientos gramaticales necesarios para construir frases con sen-
tido, R nos entenderá y podremos hacer maravillas con los datos.
¿Cómo le hablamos, pues, a R? Siempre solemos decir «[R]
haz esto», «[R] haz aquello». Por lo tanto, todas las órdenes ya lle-
van implícitas el sujeto, puesto que es R quien lo hace, lo cual es
otra ventaja. Si, en la mayoría de idiomas, las frases suelen tener
sujeto y predicado, en la gramática de R no nos hará falta sujeto
porque R ya entiende quién tiene que hacer la acción. Lo que sí
nos hace falta es el predicado, razón por la que en el lenguaje de
R hay sobre todo verbos, adverbios y complementos del verbo:
1) a los verbos los denominaremos funciones,
2) a los adverbios los denominaremos argumentos,
3) a los complementos del verbo los denominaremos objetos, y
4) a la información complementaria asociada a los objetos la
denominaremos atributos.
2. La estructura de datos de R
Para el propósito del análisis de datos, deberemos conocer
principalmente cuatro elementos fundamentales de la estructura
de datos de R. A continuación, detallamos, en primer lugar, los
Editorial UOC Capítulo I. El lenguaje de R
17
objetos y los atributos y, en segundo lugar, las funciones y los
argumentos.
2.1. Objetos y atributos
Por objeto nos referimos a cualquier dato que tengamos
guardado dentro de R, mientras que por atributo entende-
mos la información complementaria asociada a estos datos.
Un objeto de R1 puede tomar la forma de un número, de una
cadena de valores o de un marco de datos, entre otras. Para crear
un objeto tenemos que usar el símbolo , donde, en primer
lugar, ponemos el nombre que tendrá el objeto, seguido de y,
finalmente, la forma del objeto. A continuación, hemos generado
varios códigos para crear objetos. Primero, hemos creado el obje-
to tres, que está formado por el número tres. En segundo lugar,
hemos pedido a R que nos guarde, con el nombre de operacion,
el resultado de (6 + 4) / 2. Lo mismo le pedimos con operacion_
nueva, donde nos multiplica por tres el objeto operacion que
hemos creado hace un momento. El cuarto código y el quinto nos
muestran objetos algo más sofisticados, que estudiaremos ensegui-
da. El objeto paises contiene un tipo de objeto llamado vector, de
longitud cinco, puesto que está formado por una cadena de cinco
1. Hay otros tipos de objetos que no veremos. Los más comunes son la lista, la
matriz (matrix) o las variables indexadas (array).

To continue reading

Request your trial

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT