Tags:
create new tag
, view all tags

Question

Is it possible to develop a plugin to read a pdf file and write a wiki file? I have clients who need to read a pdf file with legal newspaper every day and I am trying to build a legal document management system inside a wiki engine.

About wiki files, could be a native xml database the management of wiki files such as sedna, eXist or xindice?

Environment

TWiki version: TWikiRelease04x01x02
TWiki plugins: DefaultPlugin, EmptyPlugin, InterwikiPlugin
Server OS:  
Web server:  
Perl version:  
Client OS:  
Web Browser:  
Categories: Deployment

-- MarcioCarneiro - 23 Oct 2007

Answer

ALERT! If you answer a question - or someone answered one of your questions - please remember to edit the page and set the status to answered. The status selector is below the edit box.

Hi Marcio!

Altough you will need some engineering efforts, yes, it's possible (and after, you can publish your own piece of software, better if free software!). Such flux can be stated as:

PDF -> PDF filter -> Wiki format converter -> Input

Well, the PDF block is your newspaper (um Diário Oficial da União, I think),

The PDF can be parsed/manipulated via Perl, for instance (look at http://search.cpan.org/~antro/PDF-111/PDF.pm). That's your filter block.

The Wiki format converter can even be part of the lst module, embedded into the same perl (convertin keywords/tags into wiki tags).

And the insert can be made also via Perl using DBI.

-- MauricioMauad - 23 Oct 2007

Olá, Maurício.

Não programo em perl e estou procurando alguém que possa fazer o código. Não pensei em perl mas em usar os recursos já existentes e que podem fazer muito da conversão que pretendo, como xpdf, pdfkd, myPDF3 e outros programas que convertem e mexem com PDF. Bash, awk e sed com grep também seriam usados. A idéia é aproveitar estes recursos para criar um arquivo em .sh que realize tudo a partir do PDF. Sim, o alvo é o Diário Oficial e da Justiça, Federal e dos Estados, bem como outros arquivos PDF, como manuais de tecnologias de transportes.

-- MarcioCarneiro - 25 Oct 2007

Olá, Maurício.

Não programo em perl e estou procurando alguém que possa fazer o código. Não pensei em perl mas em usar os recursos já existentes e que podem fazer muito da conversão que pretendo, como xpdf, pdfkd, myPDF3 e outros programas que convertem e mexem com PDF. Bash, awk e sed com grep também seriam usados. A idéia é aproveitar estes recursos para criar um arquivo em .sh que realize tudo a partir do PDF. Sim, o alvo é o Diário Oficial e da Justiça, Federal e dos Estados, bem como outros arquivos PDF, como manuais de tecnologias de transportes.

No entanto, pretendo criar e editar arquivos wiki em TEXTO PURO, o que complica um pouco, pois são poucos os wikis que usam TEXTO para guardar os dados. Dê uma olhada em http://www.wikimatrix.org/compare/ikiwiki+MediaWiki+TikiWiki+TWiki. Creio que a melhor escolha seria o Twiki, mas o autor me disse que o arquivo de texto é proprietário, sem especificar o quanto, isto é, não sei se posso "cat wiki.file" e ler o conteúdo. MediaWiki, TikiWiki e TWiki exportam para diversos formatos. Só TWiki usa RCS para arquivar dados. Minha questão com o formato de arquivo para arquivar os dados é com a recuperação de informação por usuários de rede e da Internet ao mesmo tempo em que os dados são pesquisados pelos servidores de busca, como Google. Sendo banco de dados (o formato de arquivo de dados), os "search engines" não têm acesso ao texto completo e a pesquisa tem de ser feita na própria página do servidor do wiki. Eu gostaria de armazenar tudo em TEXTO para facilitar a pesquisa pela Internet e rede local.

-- MarcioCarneiro - 25 Oct 2007

Isn't this spanish discussion off topic? -- Please move to a new topic!

-- FranzJosefGigler - 26 Oct 2007

I moved off-topic content from StructuredWiki to here.

-- PeterThoeny - 31 Oct 2007

Change status to:
Topic revision: r1 - 2007-10-31 - PeterThoeny
 
  • Learn about TWiki  
  • Download TWiki
This site is powered by the TWiki collaboration platform Powered by Perl Hosted by OICcam.com Ideas, requests, problems regarding TWiki? Send feedback. Ask community in the support forum.
Copyright © 1999-2017 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.