Создание электронной книги с OCR в картинках (торрент)

Форумы - Создание книг - Создание электронной книги с OCR в картинках (торрент)
Нет ответов
DeMorte
DeMorte's picture
Оффлайн
Зарегистрирован: 26.09.2012

Первое важное для меня правило: делать только те книги, которые интересуют меня, иначе создание книги может начаться и не закончиться никогда.
После создания сканов (при сканировании разворотов серединку плотно прижимаем к сканирующей поверхности, иначе часть слов будет не видно, и придется возвращаться к исходнику), начинается их обработка. Можно "забабахать" сразу в pdf и "не париться", а правильнее сделать распознанный текст.Почему? да потому, что распознанный отформатированный текст можно спокойно конвертировать в любой удобный для человека формат (например есть электронные читалки, которые работают только со своими форматом книг, и для них их нужно "перегонять").
Из программ потребуется текстовый редактор, редактор изображений, стандартный "блокнот" и программа для распознания текста (на данный момент без альтернатив - finereader).
В данном случае используются следующие программы: текстовый редактор - Libreoffice (рекомендую Openoffice в сборке "инфраресурс", т.к. в нем меньше автоматизмов, которые только мешают в создании книги) - (freeware); редактор изображений - XnView(freeware); стандартный блокнот (суть его в том, что он стирает форматирование, которое навязывает FineReader, т.е. упрощает формирование текста); программа для распознания текста Finereader (sharaware - демо-версия на 30 дней,затем приобретение лицензии, есть и "крякнутые" версии).
- если худ. литература, там картинок обычно бывает мало (10-15 - это мало), поэтому смысл выкладывать их в раздаче отсутствует, т.е. текстовый документ и pdf; в других же, где картинок много (20-100), там создание отдельной папки с картинками очень востребован, т.е. текстовый документ и pdf+папка с картинками (поэтому и рекомендуется подписывать обработанные картинки по нумерации: см. рис.10035)
P.S. в подписях на картинках курса "Создание электронной книги с OCR" встречаются опечатки и орф.ошибки, надеюсь это не отпугнет Вас от создания электронной книги.

http://www.xnview.com/en/xnview.html - XnView(free)
http://www.i-rs.ru/download - OpenOffice от ИнфраРесурс(free)
http://www.abbyy.ru/finereader-windows/ - Finereader(share)

http://book.libertorrent.com/viewtopic.php?t=38842