Você se dispersa quando em frente a tela de do computador?  Focusbar pode ajudar. 

July 15, 2017 no comments Posted in Análise de Dados

“Basta digitar o que você quer fazer, e a Focusbar lembrará gentilmente não mexer com outras coisas e voltar ao trabalho.

Se você é facilmente distraído, não há melhor maneira de mantê-lo focado, do que usar o Focusbar e nós sabemos por nós usamos.

Toda vez que você muda para outra janela, o Focusbar aparecerá – caso queira verificar sua conta do Facebook ou passar duas horas no Twitter.

É como uma pequena palmadinha no ombro, dizendo – você procrastinador bobo e bobo, eu sei o que você está fazendo. Pare e volte ao trabalho.”

Source: Focusbar.app – simply bring your tasks to a focus

Getting the Expected Space Before a Heading (Microsoft Word)

July 12, 2017 no comments Posted in Análise de Dados

by Allen Wyatt
(last updated May 9, 2016)

If you take advantage of styles in your Word documents, they can make your formatting much more consistent and easier than formatting manually. You can define styles for all sorts of elements in your documents.

One of the most common document elements to format is different heading levels. When formatting headings, it is not unusual to set them off from surrounding text by adding additional space before them. Word lets you do this in the style definition for the heading. You can specify virtually any amount of additional space before the heading that you want.

When your heading style includes additional space before the paragraph, you may be surprised when Word sometimes fails to add that expected space. For instance, when the heading appears right after a page break or a column break, Word normally doesn’t include that extra space. Instead, the heading appears right up at the top of the page or column.

Source: Getting the Expected Space Before a Heading (Microsoft Word)

Um pequeno experimento com uso de funções em Análise de Dados com R no Universo Tidy

July 6, 2017 no comments Posted in Análise de Dados, R

O tidyverse ou universo ‘arrumado’ é uma coleção de pacotes R que compartilham filosofias comuns e são projetados para trabalhar em conjunto de dados ditos “tidy” e que podem ser melhor conhecidos no site http://tidyverse.org/   . Grande parte dos pacotes foi desenvolvida pelo Hadley Wickham.

Se você é novo no tidyverse o melhor lugar para aprender a philsophy completa e como tudo se encaixa é o livro “R para de ciência dos dados” de autoria do Garrett Grolemund e do
Hadley Wickham. Este livro está disponível gratuitamente online .

A novidade que mais me interessou logo a princípio foi o  uso do tibble no lugar do data.frame. Em termos práticos de representação da informação são a mesma coisa, mas a sua manipulação é mais simples, mais direta e toda focalizada no uso de Pipes ( %>% ) e na estrutura de comandos no estilo do ‘dplyr’.  Dplyr por sua vez que merece cada vez mais uma revisão dada a enorme quantidade de funções implementadas nas versões mais recentes.

Existem N artigos interessantes sobre esse universo, mas ainda poucos na língua portuguesa. Espero que outros se animem.

Eu sou um usuário pouco sistemático, as vezes inicio de forma estruturada, mas com frequência me pego tendo que refatorar o código que cresceu demais sem os devidos cuidados. A medida que o código começa a ficar repetitivo quero usar funções e hoje resolvi testar como seria usar o ‘dplyr’ dentro de uma função recebendo os nomes das variáveis como parâmetros de uma função.

Em termos de operadores a coisa é meio “feia”, mas funciona que é uma maravilha.

Aqui um pequeno exemplo que pelas imagens já fica claro como proceder.

Primeiro o meu tibble, o equivalente a um data frame. 100 linhas, 9 colunas, ao imprimir primeira vantagem, observem o que tibble só imprime as 10 primeiras linhas por padrão e já exibe o tipo de dados de cada coluna, menos filtros do tipo [1:10,]  ou head(dataframe),  e muito menos um lapply( dataframe, class ) para investigar os tipos.

Um tibble quando lido de um arquivo externo ou convertido não faz aquela “eca” de converter strings em fator por padrão.

Então suponha que irei fazer N sumários de descrições dos dados usando o ‘dplyr’ e não quero ficar copiando e colando código e alterando nome de variáveis na mão. Usar funções é o racional nesse caso.

Aqui uma pequenina função que recebe o tibble,  dois parâmetros o nome da variável com a qual quero agregar/agrupar os meus dados que chamnei de group_by e outra variável expr, da qual pretendo contar ocorrências, média e soma dos seus valores.

Quais são os detalhes importantes?

  • a função enquo() que irá receber um parâmetro sem aspas, envolvê-lo para depois ser realizado como um nome de um atributo e não uma string. O ‘dplyr‘ entende que expr é uma variável que contem o nome de uma variável;
  • a função quo_name() que é realmente massa, pois irá permitir que concatenemos o nome da variável com outra string para ser usado no “lado direito” da atribuição;
  • operadores “!!”  e “:=” .

Pronto. Agora já podemos chamar a função para cada atributo de interesse e receber os sumários.

Adorei.

Para saber mais sobre Análise de Dados no Universo Tidy.

 

Hadley Wickham, o homem que revolucionou o R

July 6, 2017 no comments Posted in Análise de Dados, R

Uma das novidades mais impactantes no mundo R tem sido a contínua contribuição do Hadley Wickham e seus pacotes, inicialmente com o reshape e agora com um leque amplo de ferramentas que implementam o “Tidyverse”.

A lista é extensa demais 

O Hadley é uma máquina.
Interessante é que há já uma linha forte de instrutores de R e professores de Estatísitca que advogam o ensino do R via a visão e a notação do Tidyverse.
Eu uso parte do universo há algum tempo, mas de forma desleixada, e a cada dia descubro que existe um recurso que me facilitaria a vida se tivesse estudado de forma mais sistemática.

Aqui uma matéria extensa e muito boa que saiu na Priceonomics.

Priceonomics turns data into great stories. We’re a collection of writers, data scientists, engineers and analysts that are obsessed with creating and spreading quality, data-driven information. We’re based in San Francisco, CA and funded by great investors like Y Combinator, Spark Capital, SV Angel and more.

https://priceonomics.com/hadley-wickham-the-man-who-revolutionized-r/

 

Desassossego – Marcelo Martins Santiago 

July 6, 2017 no comments Posted in Análise de Dados

Na saia de chita da catirina do Maracatu Na roda de Samba, na roda de Choro É a roda de tu No olhos das outras meninas No beijo e no corpo nú Na esquina da Sorocaba com a Voluntários É a esquina de tú Porque volta e meia, Eu sinto teu cheiro em recantos da lapa? De santa, de anja Sei não, sei nada Vai lá, vai lá, vai lá morena Vai pra deixar meu coração Vai lá, vai lá, vai lá morena Vai pra deixar meu coração.

Na saia de chita da catirina do Maracatu Na roda de Samba, na roda de Choro É a roda de tu No olhos das outras meninas No beijo e no corpo nú Na esquina da Sorocaba com a Voluntários É a esquina de tú Porque volta e meia, Eu sinto teu cheiro em recantos da lapa? De santa, de anja Sei não, sei nada Vai lá, vai lá, vai lá morena Vai pra deixar meu coração Vai lá, vai lá, vai lá morena Vai pra deixar meu coração

Rdatasets is a collection of 1072 datasets

July 4, 2017 no comments Posted in Análise de Dados

What is this?

Rdatasets is a collection of 1072 datasets that were originally distributed alongside the statistical software environment R and some of its add-on packages. The goal is to make these data more broadly accessible for teaching and statistical software development.

Source: Rdatasets

The Improbability Principle: Why Coincidences, Miracles, and Rare Events Happen Every Day, David J. Hand – Amazon.com

June 27, 2017 no comments Posted in Análise de Dados

In The Improbability Principle, the renowned statistician David J. Hand argues that extraordinarily rare events are anything but. In fact, they’re commonplace. Not only that, we should all expect to experience a miracle roughly once every month.      But Hand is no believer in superstitions, prophecies, or the paranormal. His definition of “miracle” is thoroughly rational. No mystical or supernatural explanation is necessary to understand why someone is lucky enough to win the lottery twice, or is destined to be hit by lightning three times and still survive. All we need, Hand argues, is a firm grounding in a powerful set of laws: the laws of inevitability, of truly large numbers, of selection, of the probability lever, and of near enough.

Source: https://www.scientificamerican.com/store/books/the-improbability-principle/

HostGator Vs GoDaddy (June 2017) – Which is the Best Web Hosting?

June 25, 2017 no comments Posted in Análise de Dados

Confused between HostGator and GoDaddy? An in-depth HostGator vs GoDaddy comparison to help you choose the right host. Find out the winner!

Adam Williams

I’m a writer with a passion for technology. I’ve been constantly testing different web hosts and writing in-depth reviews on this site since 2008. If you have any questions or finding it difficult to choose the right host, you can contact me at support@saywebhosting.com.

Source: HostGator Vs GoDaddy (June 2017) – Which is the Best Web Hosting?