Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the astra-sites domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/statplace/public_html/site/wp-includes/functions.php on line 6114

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the jetpack domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/statplace/public_html/site/wp-includes/functions.php on line 6114

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wpforms-lite domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/statplace/public_html/site/wp-includes/functions.php on line 6114

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wordpress-seo domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/statplace/public_html/site/wp-includes/functions.php on line 6114

Notice: A função _load_textdomain_just_in_time foi chamada incorretamente. O carregamento da tradução para o domínio astra foi ativado muito cedo. Isso geralmente é um indicador de que algum código no plugin ou tema está sendo executado muito cedo. As traduções devem ser carregadas na ação init ou mais tarde. Leia como Depurar o WordPress para mais informações. (Esta mensagem foi adicionada na versão 6.7.0.) in /home/statplace/public_html/site/wp-includes/functions.php on line 6114

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893

Warning: Cannot modify header information - headers already sent by (output started at /home/statplace/public_html/site/wp-includes/functions.php:6114) in /home/statplace/public_html/site/wp-includes/rest-api/class-wp-rest-server.php on line 1893
{"id":6669,"date":"2020-06-09T13:10:22","date_gmt":"2020-06-09T16:10:22","guid":{"rendered":"https:\/\/site.statplace.com.br\/?p=6669"},"modified":"2024-10-07T16:53:15","modified_gmt":"2024-10-07T16:53:15","slug":"pln-processamento-de-linguagem-natural","status":"publish","type":"post","link":"https:\/\/site.statplace.com.br\/blog\/pln-processamento-de-linguagem-natural\/","title":{"rendered":"Um exemplo pr\u00e1tico de PLN (processamento de linguagem natural)"},"content":{"rendered":"\n

Artigo escrito com a colabora\u00e7\u00e3o de Val\u00e9ria Nic\u00e9ria da Silva.<\/p>\n\n\n\n

O processamento de linguagem natural (PLN) \u00e9 uma \u00e1rea dentro da Intelig\u00eancia Artificial que busca fazer com que os computadores entendam e simulem uma linguagem humana. \u00c9 usado no Google Translate, em sistemas de reconhecimentos e sintetiza\u00e7\u00e3o de falas, respostas autom\u00e1ticas e an\u00e1lises de sentimento. Mas como ser\u00e1 que o PLN funciona na pr\u00e1tica?<\/p>\n\n\n\n

No artigo de hoje vamos falar um pouco mais sobre esse processamento e explicar como fazer uma an\u00e1lise de sentimentos usando o R para estudar uma pequena amostra de tweets.<\/p>\n\n\n\n

Minera\u00e7\u00e3o de texto<\/strong><\/h2>\n\n\n\n

Todo o processamento de linguagem natural s\u00f3 \u00e9 poss\u00edvel por causa da minera\u00e7\u00e3o e extra\u00e7\u00e3o de significado dos conte\u00fados postados na internet, o chamado big data. Quando falamos de conte\u00fado queremos dizer de artigos \u2013 em blogs como este \u2013, not\u00edcias, coment\u00e1rios nas redes sociais e tudo o que \u00e9 colocado na internet em forma de texto.<\/p>\n\n\n\n

Esses conte\u00fados s\u00e3o considerados dados n\u00e3o estruturados. A minera\u00e7\u00e3o de texto \u00e9 importante para transform\u00e1-los em dados estruturados: organizados em tabelas e devidamente identificados para que possam ser analisados. S\u00f3 assim \u00e9 poss\u00edvel extrair informa\u00e7\u00f5es relevantes deles. Esses dados podem ser usados, por exemplo, para realizar diferentes an\u00e1lises de mercado<\/a>, produzir mat\u00e9rias jornal\u00edsticas ou pesquisas cient\u00edficas. <\/p>\n\n\n\n

Resumindo, a minera\u00e7\u00e3o de texto tem como objetivo encontrar termos relevantes e estabelecer relacionamento entre eles de acordo com a sua frequ\u00eancia para extrair informa\u00e7\u00f5es de grandes volumes de textos. <\/p>\n\n\n\n

Workflow<\/strong><\/h2>\n\n\n\n

Para realizar essa tarefa precisamos estabelecer um fluxo que deve ser seguido para orientar o nosso trabalho e evitar a coleta de dados que n\u00e3o s\u00e3o \u00fateis ou an\u00e1lises que n\u00e3o s\u00e3o compat\u00edveis com os dados dispon\u00edveis. O processo de obten\u00e7\u00e3o dessas informa\u00e7\u00f5es segue a seguinte l\u00f3gica:<\/p>\n\n\n\n

\"pln<\/figure><\/div>\n\n\n\n

Come\u00e7ar com uma pergunta:<\/strong> primeiro devemos ter um problema que queremos resolver, ou uma pergunta que desejamos responder, como \u201co que as pessoas est\u00e3o falando sobre data science?\u201d<\/p>\n\n\n\n

Obter os dados:<\/strong> com essa pergunta em mente, precisamos usar os dados para respond\u00ea-la. Para isso, utilizaremos como fonte de dados o que as pessoas est\u00e3o postando no Twitter.<\/p>\n\n\n\n

Limpar:<\/strong> depois de coletar os dados, passamos para a limpeza deles<\/a>, removendo caracteres especiais \u2013 como acentos e pontua\u00e7\u00f5es \u2013 e transformando todas as letras em min\u00fasculo. Depois disso retiramos tamb\u00e9m todas as stopwords<\/em>, que s\u00e3o palavras irrelevantes para a pergunta que queremos responder.<\/p>\n\n\n\n

Analisar:<\/strong> com tudo isso pronto, iremos realizar uma das partes mais divertidas que \u00e9 analisar os dados. Aqui podemos aplicar diversas t\u00e9cnicas e verificar se conseguimos responder a pergunta que nos motivou a analisar esses dados.<\/p>\n\n\n\n

Visualizar:<\/strong> nessa etapa, queremos ver o resultado da nossa an\u00e1lise e assim gerar diversas op\u00e7\u00f5es de gr\u00e1ficos como nuvem de palavras, gr\u00e1fico de barras, dendogramas, entre outros.<\/p>\n\n\n\n

Extrair conhecimento:<\/strong> a \u00faltima parte do processo, e o objetivo do trabalho, \u00e9 gerar conhecimento a partir das an\u00e1lises realizadas, agregando ainda mais ao nosso entendimento pr\u00e9vio sobre o assunto.<\/p>\n\n\n\n

C\u00f3digo de exemplo<\/strong><\/h2>\n\n\n\n

Para entender mais sobre o assunto criaremos um projeto b\u00e1sico de text mining. Para isso, utilizaremos a linguagem de programa\u00e7\u00e3o R<\/a> e os seguintes pacotes:<\/p>\n\n\n\n