Created attachment 122241 [details] PDF-filewith columns that is not processed corerctly pdftotext and pdftohtml fail to correctly process certain PDF pages with three columns. For the attached PDF-file the error occurs on page 5 where the rendered text is not in correct order. Rendered text (XXXX represents social security numbers in the file. The rendered text is correctly with 4 digits): S08032016-17 Alle og enhver, der har noget til gode i nedennævnte bo, indkaldes herved til at anmelde og dokumentere deres krav inden 8 uger S08032016-21 Alle og enhver, der har noget til gode i nedennævnte bo, indkaldes herved til at anmelde og dokumentere deres krav inden 8 uger S08032016-26 Alle og enhver, der har noget til gode i nedennævnte bo, indkaldes herved til at anmelde og dokumentere deres krav inden 8 uger Afdøde Cpr.nr. 190521XXXX Dødsdato 11.02.2016 Frede Jensen Hyldevej 12 9300 Sæby Afdøde Cpr.nr. 150733XXXX Dødsdato 04.01.2016 Inger Kathrine Simonsen Gl. Tingvej 40F, 1 th. 9600 Aars Afdøde Cpr.nr. 300121XXXX Dødsdato 26.01.2016 Anna Hartlev Gulkrog 16, st 7100 Vejle
Forgot to mention the the version of poppler is poppler-0.41.0 compiled on Fedora 22.
the option -raw seems to work. Sorry John
Use of freedesktop.org services, including Bugzilla, is subject to our Code of Conduct. How we collect and use information is described in our Privacy Policy.