#!/bin/bash
#####################################
# a2hocrpdf.sh
#
# (c) 2009 Maximilian Kalus
# Skript kann frei weitergegeben und
# abgeaendert werden, solange die
# Copyright-Anmerkung nicht veraendert
# wird.
#####################################


#Anzahl der Parameter
PARAM=$#

#Pruefen
if [[ $PARAM -lt 2 ]]; then
  echo "Usage: $0 out.pdf input*.png"
  echo "out.pdf ist the desired output file"
  echo "input*.png is a list of files to be converted (not necessarily png)"
  exit 1
fi

#Name der Ausgabe-Datei
OUTFILE=$1
shift

#PDF-Endung?
ATEST=$(basename $OUTFILE)
BTEST=$(basename $ATEST .pdf)
if [ $ATEST = $BTEST ]; then
  echo "File $OUTFILE is not a pdf-File."
  exit 2
fi

#Keine Dateien versehentlich ueberschreiben
if [ -e $OUTFILE ]; then
  echo "File $OUTFILE exists - not overwritten."
  exit 3
fi

LIST=

#Dateien durchgehen und konvertieren
for (( I=1; $I < $PARAM; I++ ))
do
  FILE=$1
  shift
  echo "Working on: $FILE"

  #Konvertierung
  /usr/bin/convert $FILE -compress none BMP3:$FILE.bmp
  /usr/local/bin/cuneiform -l ger -f hocr -o $FILE.html $FILE.bmp
  /usr/local/bin/hocr2pdf -i $FILE -o $FILE.pdf -s < $FILE.html

  #Eingangsliste der PDFS anlegen
  LIST="$LIST$FILE.pdf "
done

#Erstelle Gesamt-PDF
echo "Concatenating PDF as $OUTFILE"
/usr/bin/pdftk $LIST output $OUTFILE

#Aufrauemen
echo "Cleaning up"
for FILE in $LIST
do
  F=$(basename $FILE .pdf)
  rm -f $FILE $F.bmp $F.html
done

echo "Finished."
