Autoria de textos: automática versus manual

No último post conhecemos o campo de Geração de Linguagem Natural (NLG, sigla do inglês), um sub-campo de Processamento de Linguagem Natural, que tem o objetivo de gerar texto automático a partir de dados não necessariamente linguísticos.

Mas a questão que fica é: quando usar a geração automática e quando usar a autoria por humanos? O que responde essa pergunta são os objetivos do possível sistema a ser desenvolvido. Será que é realmente preciso automatizar o processo de criação de resumos, por exemplo? Isso vai depender da quantidade de texto que se produz, e o custo de cada uma das soluções deve ser levado em consideração.

A criação de textos sobre os dados coletados por uma estação meteorológica podem muito bem serem escritos por uma pessoa, mas com rapidez? Com que precisão, e a que custo? O quão expert na área essa pessoa deve ser, e quanto tempo de treinamento e experiência ela vai precisar pra produzir textos de qualidade?

O custo gasto para a construção ou implantação de um sistema de geração automática de texto também deve ser observado, e comparado com os custos de se contratar uma ou mais pessoas. Mas, além disso, existem outros fatores a serem levados em consideração ao se optar pela criação de texto de maneira automática.

No livro Building Natural Language Generation Systems (Construindo Sistemas de Geração de Linguagem Natural, tradução livre), são listadas 5 (cinco) razões pelas quais usar sistemas de geração automática de textos:

  • Consistência: Um sistema de geração automática de texto, gera textos a partir dos dados que são recebidos, de forma que o documento gerado seja bastante consistente com as informações em questão. Humanos, por sua vez, podem cometer erros por causa de descuidos, fadiga, tédio, ou até mesmo por falta de experiência na área.
  • Conformidades com padrões: É importante que os documentos escritos estejam de acordo com os padrões do domínio em questão. Por exemplo, a Associação Europeia de Indústria Aeroespaciais (ACMA, European Association of Aerospace Industries) criou um padrão de inglês simplificado (Simplified English) que serve como base para a escrita de manuais de aviação, para garantir que os termos usados em manuais de manutenção sejam minimamente universais. Se esses manuais forem feitos de forma manual, os autores podem ter dificuldades para cumprir os requisitos da ACMA, mas um sistema de geração automática pode ser simplesmente programado para obedecer os padrões.
  • Velocidade de produção de documentos: Imagine um sistema que publica forecasts sobre acontecimentos da política nacional, onde as coisas acontecem a todo instante e sempre surgem notícias novas. Um sistema de texto automático pode produzir esses forecasts em segundos, enquanto humanos podem levar vários minutos. O tempo que a produção manual de um desses textos leva, pode ser usado para a análise de vários textos produzidos automaticamente.
  • Gerar documentos em vários idiomas: Ainda pensando no sistema de forecasts, mas considerando que ele está sendo usado em um país onde se fala mais de um idioma, ou em uma região como a América Latina onde temos o Brasil, onde se fala português, e os outros países, que são de língua espanhola. Um sistema de geração de texto automático pode muito bem, se programado para isso, criar o mesmo texto para mais de um idioma. Obviamente, isso não descarta a necessidade de uma revisão humana.
  • Problemas com pessoal: Se o assunto do texto a ser produzido é muito difícil, ou é muito específico a um domínio do qual a empresa não dispõe de especialista, ou o autor não entende a fundo o assunto, a produção do texto se torna demorada. Além disso, o autor pode se cansar, fadigar, pode simplesmente enjoar daquele assunto e não escrever o texto com o cuidado necessário. Computadores, por sua vez, não se cansam, não enjoam de assuntos, e podem analisar bases de conhecimento de domínios específicos para aprender e produzir textos melhores e bem contextualizados.

Existem muitas outras razões que justificariam a adoção de um sistema de geração de texto natural, substituindo a autoria manual. Mas é necessário que as organizações interessadas verifiquem os reais benefícios comparando-os com os custos. Empresas que tem grande quantidade de produção de texto, são as principais potenciais usuárias, como empresas de atendimento por chat por exemplo, dentre outras.

Uma questão que pode desencorajar o uso de textos gerados automaticamente, é a responsabilidade que recai sobre os autores de textos. Por exemplo, se um jornalista publica uma notícia na qual um político é acusado de algo, ele pode ser processado pelo político por causa disso. Além disso, se um texto foi produzido automaticamente, quem seria o responsável por possíveis erros? O computador? Os desenvolvedores do sistema? Ou a empresa? Obviamente, dependendo da importância e do impacto que aquele texto pode ter, ele precisa ser revisado por humanos, e a culpa deve recair sobre o revisor, se ele não corrigiu os erros presentes no texto.

Enfim, os pontos positivos e negativos devem ser bem avaliados pelo interessados no sistema. De toda forma, sistemas desse tipo já são uma realidade e estão no meio de nós, seja na construção textos meteorológicos, chatbots, robôs. Abaixo deixo alguns exemplos de empresas e sistemas NLG (Natural Language Generation):


Jayr Alencar

Doutorando em Ciências da Computação no Centro de Informática da Universidade Federal do Pernambuco (CIn - UFPE); Mestre pela mesma instituição; Formado em Análise e Desenvolvimento de Sistemas; Católico; Fã de O Senhor do Anéis.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *


Deprecated: Creation of dynamic property Daisy_Blog_Google_Local::$files is deprecated in /home2/clube692/public_html/wp-content/themes/daisy-blog/inc/blocks/font-family/inc/class-fonts-google-local.php on line 77

Deprecated: Creation of dynamic property Daisy_Blog_Google_Local::$files is deprecated in /home2/clube692/public_html/wp-content/themes/daisy-blog/inc/blocks/font-family/inc/class-fonts-google-local.php on line 77