Os anos recentes foram marcados pelo surgimento de várias mídias sociais, do Orkut ao Facebook, incluindo Twitter, Youtube, Google+ e muitos outros: cada um oferece novos recursos para atrair mais usuários. Estas mídias sociais geram uma grande quantidade de dados que se processada corretamente
pode ser utilizada para identificar tendâncias, padrões e mudanças. O objetivo
deste trabalho é a descoberta de temas-chave em uma discussão de redes
sociais, caracterizada como grupos de termos relevantes restritos a um contexto, e o estudo de sua evolução ao longo do tempo. Para isso, utilizamos
procedimentos baseados em mineração de dados e processamento de texto. No início, as técnicas de processamento de texto são usadas para identificar os termos mais relevantes que aparecem nas mensagens de texto da rede social. Em seguida, esses termos são agrupados usando os algoritmos k-means e k-medoids clássicos, e também o recente algoritmo NMF (Non-negative Matrix Factorization). Finalmente, associamos os termos mais relevantes dos agrupamentos de documentos para caracterizar os principais temas das mensagens consideradas. A proposta foi avaliada na rede Twitter, usando conjuntos de dados de tweets de vários contextos iniciais. Os resultados mostram a viabilidade da proposta, a fim de identificar os tópicos relevantes desta rede social no contexto inicial fornecido.
O Computer on the Beach é um evento técnico-científico que visa reunir profissionais, pesquisadores e acadêmicos da área de Computação, a fim de discutir as tendências de pesquisa e mercado da computação em suas mais diversas áreas.