Cos'è?
B.E.R.T. (Blog to Epub Ripping Tool) è uno strumento nato dall'esigenza di poter consultare il contenuto di alcuni blog in modalità off-line attraverso l'uso di un ebook reader. Essendo ePub il formato definito come standard per la pubblicazione digitale, BERT è in grado di processare l'html di cui si compongono i post dei blog, di estrarne i contenuti e di riversarli in un file ePub.
Bello! Mi piace come si fa?
Aspetta una attimo! prima devi comprendere alcuni concetti. Il punto di ingresso per BERT è un file di configurazione xml dentro al quale vengono definiti i Provider associato a ciascuno dei quali viene specificato un Processor
Provider: dicono a BERT da DOVE prelevare i post. Ve ne sono di due tipi: ListProvider tramite il quale è possibile specificare uno o più post singoli da "rippare" e FeedProvider che prendendo in ingresso un link a una sorgente RSS fornisce a BERT i link da cui rippare i contenuti
Processor: dicono a BERT il COME processare i contenuti dei singoli post di origine. I Processor rappresentano la parte "delicata" e debole di BERT perché per ogni singolo blog è necessario svilupparne uno ad hoc. Questo perché ogni blog gestisce i contenuti in modo differente. Che non si creda, per esempio, che tutti i blogs della piattaforma worpress.com siano uguali; sono simili ma se cambia il template cambia il Processor necessario a ripparli
Bello, bello, bello! Dai fammi provare!
Ok, ok, dunque:
Scaricati l'ultima versionde disponibile di BERT da qui
scompatta l'archivio in una directory a tua scelta
modifica, a seconda delle tue esigenze, il file
default.xml
contenuto nella sottodirectoryconf
apri un terminale Linux o la console di windows e raggiungi la directory di installazione
esegui
(Dove "*" sta per la versione ed eventualmente la stringa "bundled"). Così facendo viene letto il file di configurazionejava -jar bert-*.jar
default.xml
. Qualora desiderassi alimentare BERT con un file xml diverso dadefault.xml
basta specificarlo come unico parametro di chiamata es:
ojava -jar bert-*.jar c:\foo\my.xml
o ancorajava -jar bert-*.jar conf/my.xml
java -jar bert-*.jar /home/bazu/my.xml
attendi la fine e goditi il tuo epub generato che trovi sotto la cartella
out
Sì ma secondo me dovrebbe fare questo, potrebbe fare quello...
Fermati! Non è questo il posto giusto per discutere. Questo sito verrà mantenuto pochissimo, materiale fresco, discussioni, richieste, osservazioni le potrai fare nello spazio dedicato a BERT in sourceforge in particolar modo:
https://sourceforge.net/projects/blog2epub/forums per chidere aiuto o richiedere implementazioni di Processor
e https://sourceforge.net/tracker/?group_id=342486 per segnalare bachi o richiedere nuove implementazioni
Oppure scrivendo a: blog2epub AT gmail DOT com