TidyBlocks: Guía

Una herramienta basada en bloques para la manipulación y el análisis de datos ordenados. Por favor ve a o para una versión gratuita en línea visita [nuestro reprositoria de GitHub]().

Este trabajo está disponible gratuitamente bajo la licencia Hippocratica . Contribuciones de todo tipo son bienvenidas: Por favor ve a nuestra guia de contribuidores para empezar, y tenga en cuenta que todos los contribuyentes deben cumplir con nuestro Codigo de conducta.

DATOS

Colores

color block

Los conjuntos de datos colores tiene valores rojo-verde-azul (RGB) para once colores estándar: negro, rojo, granate, lima, verde, azul, azul marino, amarillo, fucsia, aguamarina y blanco Cada valor es un número entero en el rango 0… 255.

Columna Tipodedatos Valor
name text nombre color
red integer (0…255) valor rojo
green integer (0…255) valor verde
blue integer (0…255) valor azul

Terremotos

earthquakes block

Este bloque proporciona un subconjunto de datos del Servicio Geológico de EE. UU. sobre terremotos de 2016.

Columna Tipodedatos Valor
Time datetime Tiempo universal coordinado
Latitude number grados fraccionarios
Longitude number grados fraccionarios
Deepth_Km number (km) profundidad en kilómetros fraccionarios
Magnitude number Escala Richter

Pingüinos

penguins block
Columna Tipodedatos Valor
species text tipo de pingüino
island text donde se encontro al pingüino
bill_length_mm number (mm) longuitud del pico
bill_depth_mm number (mm) profundidad del pico
flipper_length_mm number (mm) longuitud de las aletas
body_mass_g number (g) masa corporal
sex text sexo

Sequencia

sequence block

Cre una secuencia de números del 1 al N inclusive.

  • nombre: El nombre de la columna que contiene los valores.
  • rango: El límite superior del rango.

Datos de usuario

user data block

Utilice un conjunto de datos previamente cargado.

  • desplegable: Seleccione el conjunto de datos por nombre.

TRANSFORMAR

Crear

create block

Añade nuevas columnas manteniendo las existentes keeping existing ones. Una columna puede ser reemplazada si a la nueva columna se le da el nombre de la columna existente.

  • nueva_columna: Nombre para la nueva columna.
  • primer espacio: Un Valor o el resultado de una operascion.

Descartar

drop block

Descarta una o más columnas de los datos. Este bloque no es estrictamente necesario; puede ignorar una columna si no la necesita, pero descartar columnas a menudo facilita la lectura de la pantalla. Este bloque es lo contrario de seleccionar.

  • columna, columna: Una lista separada por comas de los nombres de las columnas que se eliminarán.

Filtrar

filter block

Mantiene un subconjunto de filas que pasen alguna prueba como edad> 65 o país = "Islandia". La prueba se verifica de forma independiente para cada fila, y las pruebas se pueden combinar utilizando el y, o, and no blocks.

  • expresion: La prueba debe pasar cada fila para ser incluida en el resultado.

Agrupar por

grouping block

La mayoría de las operaciones de datos se realizan en grupos de registros que comparten valores, como personas del mismo país. Este bloque agrega una nueva columna a la tabla llamada_groupo_ que tiene un valor único para cada grupo. La agrupación se puede eliminar utilizando el bloque desagrupar.

  • columna, columna: Una lista separada por comas de los nombres de las columnas para agrupar. Cada combinación única de valores en estas columnas produce un grupo.

ave As

save as block

FIXME

Seleccionar

select block

Elija columnas de una tabla: las columnas que no tengan nombre se eliminarán.Este bloque no es estrictamente necesario, dado que las columnas innecesarias pueden simplemente ignorarse, pero descartar columnas innecesarias puede facilitar la lectura de la pantalla. Este bloque es el opuesto de descartar.

  • columna, columna: Una o más columnas a mantener.

Ordenar

sort block

Ordene las filas de una tabla según los valores de una o más columnas.

  • columna, columna: A comma-separated list of the names of the columns to sort by.
  • Descendiendo: If checked, sort in descending order (i.e., greatest value first).

Resumir

summarize block

Resuma los valores en una o más columnas. Si los datos han sido agrupado, one summary row is created for each group. The summary values are put in a new column op_col, e.g., mean_age.

  • desplegable: qué operación de resumen usar.
  • columna: que columna se va a resumir.

Desagrupar

ungroup block

Deshace el agrupamiento greado por agrupar quitando el especial _group_ column.

Unico

unique block

Descarte las filas que contienen valores redundantes. Si varias filas tienen los mismos valores en las columnas especificadas pero valores diferentes en otras columnas, una fila de ese grupo se elegirá arbitrariamente y se mantendrá.

  • columna, columna: Una o más columnas para verificar valores distintos.

GRAFICO

Barras

bar block

El bloque de barra hace que la altura de la barra sea proporcional al número de casos en cada grupo. Un gráfico de barras usa la altura para representar un valor, por lo que la base de la barra siempre debe mostrarse para producir una comparación visual válida.

  • Eje_x: Qué columna usar para el eje X.
  • Eje_y: Qué columna usar para el eje Y.

Cajas

box block

El bloque de diagrama de caja de Tukey resume una distribución de valores cuantitativos utilizando un conjunto de estadísticas de resumen. La marca del medio en el cuadro representa la mediana. Las partes inferior y superior del cuadro representan el primer y tercer cuartil respectivamente. El bigote abarca desde los datos más pequeños hasta los datos más grandes dentro del rango [Q1 - 1.5 * IQR, Q3 + 1.5 * IQR] donde Q1 y Q3 son el primer y tercer cuartiles, mientras que IQR es el rango intercuartílico (Q3-Q1). Los puntos atípicos más allá del bigote se muestran mediante marcas de puntos.

  • Eje_x: Qué columna usar para el eje X.
  • Eje_y: Qué columna usar para el eje Y.

Puntos

dot block

Muestra un grafico de puntos.

  • Eje_x: Qué columna usar para el eje X.

Histograma

histogram block

Visualice la distribución de una única variable continua dividiendo el eje X en grupos de clase y contando el número de observaciones en cada contenedor. Los histogramas muestran los recuentos con barras.

  • columna: Qué columna agrupar.
  • bins (10): El numero de grupos.

Dispersion

scatter block

Muestra un diagrama de dispersión.

  • Eje_x: Qué columna usar para el eje X.
  • Eje_y: Qué columna usar para el eje Y.
  • color: Qué columna usar para los colores (opcional).
  • Añadir linea: ¿Muestra una línea de regresión lineal?

ESTADISTICAS

T-test de una muestra

ttest_one block

Hacer un t-test de una muestra.

  • columna: La columna que contiene los valores de interes.
  • media: La media a probar.
  • significativo: El limite del valor significativo.

T-test pareado

ttest_two block

Hacer un t-test pareado.

  • columna_a: La columna que contiene uno de los conjuntos de valores.
  • columna_b: La columna que contiene el otro de los conjuntos de valores.
  • significativo: El limite del valor significativo.

OPERACION

Aritmética

arithmetic block

Este bloque implementa cálculos matemáticos en dos valores. Acepta números, nombres de columna y bloques de operación anidados.

  • espacio izquierdo: El lado izquierdo de la operación.
  • desplegable: Selecciona suma, resta, multiplicación, división, resto o exponenciación.
  • espacio derecho: El lado derecho de la operación.
negate block

Deniega un numero.

  • espacio: El valor a denegar.

Lógico

logical operation block

Este bloque implementa operaciones lógicas en dos valores. Acepta cualquier valor en el lado izquierdo y derecho y produce "verdadero" o "falso".

  • espacio izquierdo: El lado izquierdo de la operación.
  • despegable: Selecciona logico AND o logico OR.
  • espacio derecho: El lado derecho de la operación.

Tenga en cuenta que el AND lógico solo es verdadero si ambos lados son verdaderos, mientras que OR lógico es verdadero si uno o ambos lados son verdaderos: no es uno o ambos en lugar de uno o el otro.

not block

Produce verdadero si el valor es falso o falso si el valor es verdadero.

  • espacio: El valor a invertir.

Tipos

type checking block

Compruebe si un valor es de un tipo en particular.

  • espacio: El valor a comprobar.
  • despegable: Selecciona el tipo a convertir.
type conversion block

Convierta un valor de un tipo a otro.

  • espacio: El valor a convertir.
  • despegable: Selecciona el tipo a convertir.

Fechas/Tiempos

datetime block

Extrae el año, mes o día de un valor de fecha/hora.

  • espacio: La fecha/tiempo valor a convertir.
  • despegable: Selecciona el sub-valor a extraer.

Condicional

conditional block

Seleccione uno de los dos valores en función de una condición. Se puede usar cualquier valor para la condición o para los resultados si la condición es verdadera o falsa, pero los valores usados para los casos verdadero y falso deben ser del mismo tipo.

  • primer espacio: La condición a probar.
  • segundo espacio: El valor si la condición es verdadera.
  • tercer espacio: El valor si la condición es falsa.

VALOR

Columna

column block

Especifica el nombre de una sola columna en los datos.

  • columna: El nombre de la columna cuyo valor se desea.

Fecha y hora

datetime block

Especifica una fecha y hora fijas.

  • AAAA-MM-DD: El año, mes y día de 4 dígitos unidos con guiones.

Logico

logical block

Seleccione un valor lógico constante.

  • desplegable: Selecciona verdadero o falso.

Numbero

number block

Especifica un número fijo.

  • numbero: El número deseado.

Texto

text block

Especifica un texto fijo. El valor no debe citarse: Las comillas simples o dobles proporcionadas se incluirán en el texto.

  • texto: El texto deseado.

Numero de fila

row number block

Genere el número de fila, comenzando por 1.

Valor exponencial aleatorio

exponential random value block

Genere un valor aleatorio a partir de la distribución exponencial con el parámetro de tasa λ.

  • tasa: el parametro de tasa.

Variable normal aleatoria

normal random value block

Genera un valor aleatorio a partir de la distribución normal con media μ y desviación estándar &sigma ;.

  • media: el centro de la distribucion.
  • desviacion st: la dispersion de la distribucion.

Variable uniforme aleatoria

uniform random value block

Genera un valor aleatorio a partir de la distribución uniforme en el rango dado.

  • bajo: el extremo bajo del rango.
  • alto: el extremo alto del rango.

COMBINAR

Unir

join block

Une dos tablas haciendo coincidir los valores en la columna X de la tabla A con los valores de la columna Y de la tabla B. Si la tabla A contiene:

num nomb
1 p1
2 p2
3 p3

y la table B contiene:

val etiqu
1 q11
1 q12
3 q3
4 q4

y las tablas se unen por num y val, entonces la tabla final contiene filas para los emparejamientos 1 y 3:

_unir_ A_nomb B_etiqu
1 p1 q11
1 p1 q12
3 p3 q3

La nueva columna _unir_ contiene los valores que emparejaron, mientras que la otra columna aparece como tabla_columna.

  • tabla_izquierda: El nombre usado para identificar una tabla en un report en bloque.
  • columna_izquierda: La columna a unir de la tabla.
  • tabla_derecha: El nombre usado para identificar la tabla en un report en bloque.
  • columna_derecha: La columna a unir de la tabla.

Pegar

glue block

Combina las filas de dos tablas para crear una nueva tabla. Las tablas de entrada deben tener el mismo número de columnas, y esas columnas deben tener los mismos nombres. Se agrega una nueva columna para mostrar de dónde proviene cada fila. Por ejemplo, si la tabla A contiene:

num nomb
1 p1
2 p2

y la tabla B contiene:

num nomb
2 q2
3 q3

y la columna que etiqueta se llama fuente, entonces la tabla final contiene:

num nomb fuente
1 p1 A
2 p2 A
2 q2 B
3 q3 B
  • tabla_izquierda: El nombre usado para identificar una tabla en un report en bloque.
  • tabla_derecha: El nombre usado para identificar una tabla en un report en bloque.
  • etiqueta: El nombre de la columna que contiene el origen de la fila.