Ferramentas de busca para empresas

Localizar de forma rápida e precisa arquivos e documentos em qualquer empresa hoje é primordial e nem sempre ferramentas para desktop, como o finado Google Desktop Search, o Copernic desktop ou até mesmo a Busca do Windows (Sem falar nas ferramentas para Linux), resolvem.
 

Os programas para buscas no desktop ajudam até certo ponto, o grande problema deles é que, além de gerar um grande tráfego na rede quando se indexa arquivos armazenados em servidores, normalmente eles só fazer a atualização desses índices quando as estações de trabalho não estão sendo usadas, o que pode deixar suas bases de dados desatualizadas.

Para resolver esse problema existem várias opções pagas de ferramentas para indexação e busca de arquivos que rodam em servidores e até mesmo aquelas “caixinhas” que o Google vende. O grande problema dessas soluções é que são caras e sua cobrança normalmente se baseia no número documentos indexados.

Vou listar abaixo 2 softwares que encontrei essa semana que se propõem a fazer exatamente isso, com a vantagem de serem open source e não exigirem nenhum tipo de pagamento.

Open Search Server
Software desenvolvido em Java e roda tanto em Windows quanto em Linux e que tem uma instalação extremamente simples. Tendo-se o Java instalado basta descompactar e executar um arquivo e pronto, já está pronto pro uso.
A configuração não é assim tão simples mas também não provoca a queda de cabelos e possui uma documentação razoavelmente boa.
Fiz alguns testes preliminares e consegui indexar os arquivos em um servidor Samba de forma até simples. Creio que ainda precisa de uns ajustes mas parece ser uma opção bem interessante.
Constellio
Também usa o nosso amigo Java e sua instalação é tão simples quanto à do Open Search Server bastando somente um script. Pode ser intalado também no Linux ou no Windows.

É um software que roda em cima do Tomcat e tem uma interface simples mas bem feita. Sua configuração e uso em um testes semelhante ao que fiz com o OSS foi bem simples e bem sucedida e seu desempenho também foi melhor. 
Vale a pena testar.
By | 2015-06-14T16:55:15+00:00 terça-feira, 4 dezembro de 2012 18:40|Notícias|1 Comentário

Um Comentário

  1. Unknown 27 de janeiro de 2014 em 17:51- Responder

    O maior problema das ferramentas acima citadas e que não existe fonetica da lingua portuguesa, existe uma ferramenta barata e que resolve esta questão da melhor maneira, segue informações: TECNOLOGIA DE SOFTWARE TIMBRE
    O Timbre é um produto de software, integrado a plataforma Solr/Lucene, com o objetivo de tratar e localizar dados alfabéticos.
    Plataforma Solr/Lucene (Free): atuando como motor de indexação de textos provenientes de arquivos ou de tabelas de banco de dados.
    Timbre – Software de suporte a busca da informação
    É um produto de software baseado na arquitetura Java permitindo com isto que seja processado em qualquer plataforma operacional, sob o gerenciamento de qualquer banco de dados, totalmente integrado à plataforma Solr/Lucene, desenvolvido para dar suporte às buscas alfabéticas, tanto em arquivos de textos quanto em tabelas de banco de dados utilizando recursos tais como:
    Busca Fonética: A busca de palavras geralmente baseia-se apenas na ortografia, isto é, busca-se uma dada sequência de letras, como "J-o-ã-o", com alternativas simples como desconsiderar acentos, ou não diferenciar maiúsculas de minúsculas.
    Há situações onde é conveniente ir além, e não diferenciar palavras de pronúncia igual ou assemelhada. Isso é particularmente útil nas buscas alfabéticas, devido às variantes ortográficas. Por exemplo, na língua portuguesa falada e escrita no Brasil, não diferenciar "Luís" de "Luiz", "Karla" de "Carla", "Thaís" de "Taís", Feliz de Felis, Contente de Contenti, etc. Desta forma a busca fonética estabelece a precisão gráfica e fonética entre os vocábulos, permitindo que palavras graficamente incorretas, sejam recuperadas através da similaridade fonética do argumento que se está buscando.
    O Timbre utiliza a fonética para a língua portuguesa escrita e falada no Brasil, e para língua espanhola escrita e falada na América Latina.
    Dicionários: Dicionários são arquivos gerados para tratar significados idênticos ou semelhantes entre dados alfabéticos, ou seja, sinônimos, palavras afins, família de palavras, abreviaturas, ontologia (vocabulário utilizado para uma determinada área de conhecimento), apelidos, nomes genéricos, etc.
    Os dicionários são criados pelos usuários do Timbre, em um arquivo de texto, como por exemplo: Feliz = Alegre = Contente
    Se o usuário estiver buscando um texto que tenha o argumento Feliz e esteja utilizando o dicionário acima criado, e no texto não tiver o vocábulo feliz, mas contenha Alegre ou Contente, este texto será recuperado, da mesma forma as inversões, ou seja, se o usuário estiver buscando o argumento Contente no texto e este não o tenha, mas tenha Feliz ou Alegre, o texto será recuperado.
    Os dicionários são fonetizados, ou seja, se o argumento do texto ou o vocábulo pertencente ao dicionário estiverem graficamente incorretos, o argumento do texto será recuperado através da similaridade fonética do que se está buscando.
    Exemplo: Felis
    Recursos Especiais: Recursos para buscar iniciais de nomes, prefixo e sufixo dos nomes e posicionamento das células de um nome, além de dicionários.
    Exemplos:
    Inicial do Nome: (R = Regina = Ricardo etc.) | (J C M = José Carlos Martins etc.)
    Prefixo: (Mar = Mario = Marcondes = Marajá etc.)
    Sufixo: (Dor = Lidador = Apontador)
    Posicionamento: O nome contem Carlos (João Carlos Muniz, Carlos Magalhães etc.)
    Dicionários: Tatiana = Tatiane | Gisela = Gisele
    Stop Words no idioma português falado no Brasil: arquivo em formato txt contendo palavras que não interessam serem indexadas para o texto.
    Google Maps: Integração ao Google Maps para visualização de mapas através de buscas de endereços.
    Consolidação de Informações de diferentes bases de dados (Visão Unificada): Pesquisas em bases de dados diferentes, para busca de elementos (textos, expressões, nomes, apelidos, endereços) iguais ou equivalentes.

Deixar Um Comentário