Sabemos que a análise de dados jurídicos pode ser feita a partir de uma base de dados interna, ou seja, gerada pelo próprio departamento jurídico ou escritório, ou de uma base de dados externa, como dos tribunais, por exemplo.
Quando tratamos dos dados internos, temos uma vantagem em relação ao manuseio deles, uma vez que já estão sob nosso domínio. Já com os tribunais, é necessário realizar a captura desses dados que podem ser encontrados nos autos dos processos, como data, decisão, classe, assunto, entre outros.
Para que esse trabalho seja eficiente e não consuma horas de buscas e preenchimentos manuais, utilizamos a tecnologia a nosso favor.
Através da programação, é possível criar um robô de captura de dados: uma automação que criamos pelo computador, através de uma linguagem de programação.
Para que isso funcione, ensinamos o computador a fazer, de maneira repetitiva, o caminho necessário para chegar até as informações que precisamos. Assim, no caso da captura de dados dos tribunais, ensinamos o computador a acessar o link do site do tribunal de interesse e damos comandos para que chegue ao acesso dos processos. Uma consideração importante é a limitação da velocidade do robô, de modo a não sobrecarregar os servidores do tribunal.
Uma vez que o robô é capaz de acessar os autos, identificar e armazenar as informações que definimos como importantes, é possível obter uma tabela com todos os dados relacionados e podemos iniciar uma nova etapa que antecede a análise, a limpeza e a organização da base obtida.