DjVu — графический формат, оптимизированный для хранения отсканированных документов. А именно он совершенно подходит для сотворения электрических книжек.
Существует два обычных метода хранения отсканированной книжки:
1) Для энтузиастов — это определение (OCR) с следующей подготовкой настоящего текстового электрического документа.
2) Наименее терпеливые люди выкладывают прямо «сканы» — отсканированные рисунки, нередко собранные в pdf документ.
В первом случае требуется много трудозатратной работы, во 2-м получаются файлы размером в 10-ки и даже сотки мб.
Но существует компромиссный вариант — перевод отсканированных картинок в формат DjVu (дежа-вю). Сущность технологии DjVu заключается в автоматическом разбиении изображения на немного участков (к примеру, текст, логотип компании и растровая фото), для каждого из которых выбирается лучший для данного графического вида метод сжатия. Это позволяет отлично сжать электрический документ в отсутствие утраты его читаемости. В размер файла отсканированной книжки оказывается в границах нескольких мб, что полностью приемлемо.
Особенное значение этот формат приобретает для переноса в сеть математической и вообщем технической литературы, где богатство схем и формул делает определение и перевод в текстовый формат фактически неосуществимым. В текущее время формат DjVu становится фактическим эталоном для электрических библиотек технической и научной литературы.
Право на коммерческое внедрение технологии DjVu продано компании LizardTech.