logo_foroffice
FOROFFICE
11.14.2022 Статья

Как выбрать книжный сканер

Как выбрать книжный сканер

Книжные сканеры отличаются от любых других сканеров документов тем, что чаще всего не имеют однородной плоской поверхности. На первый взгляд даже не всегда можно понять — сканер ли это или какой-то особенный прибор, над назначение которого следует подумать. Тем не менее с момента своего появления сканеры для книг отлично зарекомендовали себя именно для этой специфической работы.

Хотя можно отсканировать книгу на планшетном сканере, прижав его к стеклянной пластине, но это может повредить корешок книги и не гарантирует точное качество сканирования книги. Мы настоятельно рекомендуем использовать книжный сканер, который сканирует открытую книгу сверху, так же, как вы обычно читаете ее.

Были разработаны различные книжные колыбели и другие опоры, каждая из которых имеет свои преимущества и недостатки. На рынке книжных сканеров доминируют несколько крупных поставщиков: DOKO, Optima, Image Access, I2S и Zeutschel, но многие небольшие компании также пытаются захватить их долю. К несчастью для клиентов, некоторые из этих компаний заявляют очень нереалистичные характеристики своих устройств и завышают ожидания, превышающие пределы, определяемые сегодняшними знаниями современной физики.

В последние пару лет некоторые поставщики установили цифровые камеры на подставки и снабдили их экраном, чтобы конкурировать с настоящими книжными сканерами. Они также называют свои системы с цифровыми камерами «книжными сканерами». Но это не так, потому что сканер фактически сканирует документ, а цифровая камера делает снимок. Это привело к некоторой путанице на рынке, и цель этой статьи состоит в том, чтобы объяснить различные методы работы и их влияние на качество изображения, обращение с книгой и ожидаемый срок службы непредвзятым образом.

Целью этого руководства является непредвзятое объяснение некоторых технических терминов и их влияния на качество, скорость и обработку сканирования книг.

Цифровые камеры

В цифровых камерах используются ПЗС-матрицы, состоящие из множества очень маленьких пикселей, покрытых шаблоном Байера, состоящим из двух зеленых, одного красного и одного синего пикселя, расположенных четверкой. Это уменьшает разрешение в два раза для зеленого канала и в четыре раза для красного и синего каналов. Их небольшой размер также увеличивает шум по сравнению с линейными датчиками. Эти ПЗС-датчики изображения не подходят для сканеров, поскольку они не сканируют, а делают снимки.

Если производитель утверждает, что предлагает «сканер» с однократной камерой, матричной камерой или чипом, скорее всего, это будет обычная цифровая камера, установленная на завышенной раме.

Существует и другой принцип работы. Некоторые производители используют монохромный датчик высокого разрешения и делают три кадра с разными фильтрами перед датчиком. Каждая экспозиция использует все пиксели, а затем они объединяются в полное изображение RGB, как это делают все другие обычные сканеры. Поскольку каждая экспозиция занимает несколько секунд, необходимо убедиться, что ни объект, ни камера сканера не двигаются, иначе три изображения не будут совпадать. В лучших моделях таких устройств используются 140-мегапиксельные чипы для получения разрешения 600 dpi на площади DINA2.

На следующей диаграмме показано, как полное изображение RGB состоит из трех экспозиций, сделанных с использованием фильтров красного, зеленого и синего цветов. Только три камеры с цветными фильтрами имеют такое же качество, как сканеры с линейными датчиками.

С помощью этой техники можно добиться хороших результатов при условии, что книга полностью плоская, что означает, что она прижата к стеклянной пластине.

Важная особенность, про которую стоит помнить всегда: цифровая камера предназначена для съемки объектов на различных расстояниях, некоторые из которых находятся в фокусе, а другие — нет. В итоге цифровая камера не способна заменить сканер, с тем же уровнем детализации и качества оцифровки документа.

Сканеры

Следующие компании используют в своих сканерах только линейные датчики: Avision, Canon, Contex, Colortrac, Cruse, Epson, Fujitsu, Graphtec, HP, Image Access, Kip, Oce, Panasonic, IBML, Inotek, Microtek, Kodak, Ricoh, Rowe, Xerox, Zeutschel. Ни один из этих поставщиков не использует технологию цифровых камер для своих сканеров, и на это есть веские причины.

Профессиональные сканеры имеют линейные датчики, которые захватывают красные, зеленые и синие линии, одну за другой, из документа, освещенного белым светом. Изображение уменьшается линзой и проецируется на линейный ПЗС-сенсор. Объект (документ) движется синхронно с экспозицией элементов ПЗС. В книжном сканере камера, система линз могут двигаться, или вращающееся зеркало сканирует объект, имитируя движение.

Красный элемент будет захватывать одну строку изображения, за которой следуют зеленый элемент и синий элемент. После того, как компьютер переместит эти строки в правильном порядке, изображение будет состоять из значений RGB в полном разрешении без каких-либо артефактов шаблона Байера.

Трехлинейные датчики преобразуют свет на его поверхности в электрические сигналы. Цветовые фильтры для красного, зеленого и синего цветов на трех последовательных рядах ПЗС-элементов обеспечивают очень широкий цветовой охват, характерный для ПЗС-сканеров. Размеры пикселей для высококачественных ПЗС-сенсоров довольно велики: 10 мкм x 10 мкм — это типичное значение, и размер имеет значение. Большие пиксели помогают уменьшить шум и другие эффекты, ухудшающие качество изображения.

Линзы сканера

Размер пикселя на оригинале при разрешении 600 dpi составляет 64×64 мкм, поэтому в случае элементов ПЗС размером 10×10 мкм необходимо использовать уменьшающую линзу 1:6,4. Это приводит к большой длине трека с большой фокусной глубиной. Почти во всех современных книжных сканерах используется камера, состоящая из объектива и линейного ПЗС-элемента, выровненного таким образом, что изменяется только расстояние между этими элементами, чтобы сохранить правильный фокус во время сканирования книги.

Качество редукционного объектива является очень важным фактором, влияющим на общее качество системы сканирования, но ограничений гораздо меньше по сравнению с высококачественными объективами цифровых камер. Причиной этого является тот факт, что используется только средняя часть объектива из-за особенностей линейного датчика.

Мало того, что объектив цифровой камеры должен быть почти в два раза больше в диаметре, он также будет демонстрировать значительные цветовые аберрации, геометрические неточности, такие как искажения в виде подушечек для булавок и потерю интенсивности во внешних углах. Сканеры также используются для приложений контроля качества далеко за пределами того, где нужно сделать только снимок, поэтому точность является ключевым фактором.

«Приятная картинка» не заменит точного сканирования.

Принципы сканирования

Книги не имеют плоской поверхности, поэтому приходится сканировать вдоль изогнутой поверхности книги, постоянно регулируя фокусное расстояние, чтобы оставаться в фокусе. Существует два способа сканирования книги, которая обычно лежит на столе для сканирования в альбомной ориентации. Один способ — сканирование сверху вниз (или наоборот), а другой — слева направо (или справа налево).

Оба метода имеют свои преимущества, но есть два отличительных отличия. Необходимое количество пикселей в ПЗС-камере больше при сканировании сверху вниз по сравнению со сканированием по более короткому краю. Коэффициент составляет примерно 1:1,4, потому что это коэффициент между более длинным краем и более коротким краем открытой книги в формате DIN. Другое отличие состоит в том, что сканеру приходится проходить меньшее расстояние при сканировании сверху вниз, а время сканирования короче.

Если сканер способен сканировать сбоку и может при этом непрерывно регулировать фокус и разрешение при перемещении по изогнутой поверхности, его можно сконструировать для сканирования плоских документов, открытых книг и даже книг, не полностью открытых в состоянии покоя в V-образной подставке. Если сканер сканирует сверху вниз, он может делать то же самое, за исключением возможности одновременного сканирования плоских и V-образных документов.

Некоторые производители используют цифровые камеры и утверждают, что это тоже книжные сканеры, что явно не соответствует действительности. Цифровая камера может сфотографировать только идеально плоский документ, а также плохо подходит для черно-белой печати с высоким разрешением. Чтобы в некоторой степени преодолеть это, эти поставщики используют очень большое фокусное расстояние, что делает их аппараты очень высокими.

Полезный срок службы

Книжные сканеры могут выполнить более 5 миллионов сканирований за весь срок службы. Имейте в виду, что маркетинговые отделы некоторых поставщиков цифровых камер более креативны, чем их инженерные отделы. Например, можно встретить книжные камеры, рекламируемые как 300 000 000 циклов экспозиции, что соответствует типичной ожидаемой продолжительности жизни в 240 лет! Многие клиенты уже сожалели о своих решениях о покупке, которые были основаны на опубликованных спецификациях, поскольку некоторые из этих значений вводят в заблуждение, если не полностью неверны.

Идеальный вариант — перед покупкой ознакомиться с образцами сканов с максимальным заявленным разрешением. Не верьте никаким цифрам в dpi или мегапикселях, пока они не будут проверены вами.

Но что такое разрешение и какое разрешение необходимо для определенного проекта оцифровки? Это одна из самых запутанных тем на рынке книжных сканеров.

Разрешение экрана

Современные TFT-экраны имеют разрешение 1600×1200 пикселей при ширине по диагонали 23 дюйма или, возможно, 1920×1080 при ширине по диагонали 24 дюйма. Обычно это дает разрешение 96 пикселей (фактически триплеты красных, зеленых и синих пикселей) на дюйм.

Предположим, что для обычного экрана используется разрешение 100 dpi, чтобы упростить следующие вычисления. Если вы отображаете отсканированное изображение, выполненное с разрешением 100 dpi, в исходном размере (1:1, отображается каждый пиксель) на обычном TFT-экране, оно будет идеально соответствовать исходному размеру.

При разрешении 200 dpi изображение на экране в два раза шире и в два раза больше оригинала. При разрешении 400 dpi он увеличивается в четыре раза. Обладая этими знаниями, вы можете легко проверить геометрическое разрешение и сравнить его с рекламируемым. Вы не поверите, но некоторые производители действительно готовы идти на обман. Иногда на рынке встречаются сканеры, работающие с разрешением 150 dpi, рекламируемое как 400 dpi.

Разрешение сканера

Больше всего сбивает с толку тот факт, что термин «разрешение» в цифровом мире больше не описывает разрешение системы, а скорее геометрическое разрешение оптических элементов, обычно элементов ПЗС. Геометрическое разрешение было проверено чуть выше. Изображение на предыдущей странице имеет такое же геометрическое разрешение 300 dpi как сверху и снизу, так и посередине. Ясно, что способность «разрешать детали» хороша в середине, но плоха выше и ниже фокальной плоскости.

Широко распространенный способ определения реального разрешения системы — использование различных тестовых таблиц разрешения. Одна из самых популярных и простых в использовании диаграмм показана справа. Она состоит из различных участков из пяти черных линий, разделенных четырьмя белыми линиями разных размеров. Например, число 2.0 означает, что на миллиметр приходится две пары линий (две черные и две белые).

Другие тестовые шаблоны используются для проверки изменений освещения, баланса серого тона, точности цветопередачи и геометрических искажений. Объективное измерение можно выполнить с помощью инструментов третьих сторон, таких как Image Engineering, а также с помощью инструментов поставщиков книжных сканеров, таких как Image Access. Известно, что ни один из поставщиков цифровых камер, которые утверждают, что производят сканеры для книг, не поддерживает автоматический контроль качества с помощью тестовой таблицы UTT или любых других диаграмм.

Чтобы определить системное разрешение сканера в dpi, вы должны отсканировать тестовый шаблон. Чтобы избежать каких-либо эффектов дискретизации, которые могут вызвать муаровые артефакты, тестовый шаблон должен быть ориентирован под углом 45°. Посмотрите на скан в исходном размере (1:1) и попробуйте сосчитать черные линии. Вспомните, например, число 4.0, при котором вы все равно обязательно увидите ровно пять строк, не больше и не меньше.

Эффективность выборки

Эффективность выборки — еще один подход к теме сравнения реального разрешения. Сканер рассчитан на 300 точек на дюйм, что означает, что мы должны увидеть 6,0 пар линий на мм. Если мы видим только 4,0 пары линий на мм (цифровые камеры показывают еще меньше), эффективность выборки составляет 4,0/6,0 = 66%. Чем выше эффективность дискретизации, тем лучше оптическая система в целом. Значение выше 80% достаточно велико, чтобы можно было утверждать, что геометрическое разрешение близко к реальному разрешению. Цифровые камеры часто ниже 60%, что в основном указывает на то, что реальное разрешение находится где-то между 50% и 70% заявленного разрешения.

Разрешение цифровой камеры

Цифровые камеры не были изобретены для замены сканеров. Их цель — сфотографировать трехмерные объекты вместе с другими объектами. Поскольку существует только одна фокальная плоскость, многие объекты на обычном снимке, сделанном цифровой камерой, в любом случае будут не в фокусе, что позволяет получить меньшую общую резкость, чем то, что можно захватить сканером. На типичном снимке интересующая область находится где-то близко к центру, что скрывает тот факт, что объектив теряет резкость, геометрическую точность и регистрацию цветов по краям изображения.

Сканер последовательно сканирует красный, зеленый и синий цвета, один за другим, и создает совершенно правильные с геометрической точки зрения пиксели RGB. Все цифровые камеры имеют шаблон Байера, который снижает эффективное разрешение вдвое для зеленого канала и до четверти для красного и синего каналов. Пиксели должны быть интерполированы в программном обеспечении, что приводит к еще большему количеству артефактов.

Слева внизу изображение с цифровой камеры, справа изображение с настоящего книжного сканера. Оба сканируются с разрешением 200 dpi только потому, что это максимальное разрешение, которое поддерживает цифровая камера. Производитель называет его книжным сканером, но если сравнить два изображения, разница становится очевидной. Левое изображение размыто и полно артефактов. Он также имеет очень высокий уровень шума, что характерно для недорогих цифровых камер с их чрезвычайно маленьким размером пикселя. Многие цифровые камеры пытаются сгладить шумы и пожертвовать еще большей детализацией, что неприемлемо для сканирования документов.


Неспособность создавать прямые черно-белые линии также затрудняет распознавание размытого текста любым программным обеспечением OCR.

Цифровая камера — это не сканер. Он предназначен для фотографирования объектов на разных расстояниях, в то время как сканер предназначен для сканирования документа на очень четком расстоянии, обеспечивая четкость и резкость картинки.

Размер документа

Обычные сканеры с полистовой подачей имеют фиксированную максимальную ширину документа и несколько неограниченную длину документа. Это связано с тем, что сканер постоянно снимает изображения построчно, пока документ движется перед линейной камерой. Это «сканирование» документа построчно, в отличие от «фотографирования». С технической точки зрения нет никакой разницы между системой, которая перемещает документ, и системой, которая перемещает камеру, хотя длина второй обычно ограничена.

Книжные сканеры имеют максимальную ширину и длину документа, и это обычно указывается в формате DIN. Поскольку они сканируют фиксированную область, читатель должен тщательно оценить реальный размер области сканирования. Маркетинговый отдел одного вендора, чей сканер сканирует всего на 20% больше, чем A3, придумал термин «почти DIN A2».

После того, как вы определили подходящее разрешение системы, вам необходимо указать максимальный размер сканируемого документа. Чем больше исходный документ, тем больше пикселей потребуется. В следующей таблице показано количество пикселей, необходимое для сканирования сканером длинного края документа и сканирования вдоль короткого края документа. Первому нужно меньше пикселей и больше времени, второму нужно больше пикселей и меньше времени.

Некоторые производители используют цифровые камеры и утверждают, что это тоже сканеры, что не соответствует действительности. Все цифровые камеры имеют одну фокальную плоскость и, следовательно, могут делать снимки с высоким разрешением только идеально плоского документа, а книга никогда не бывает идеально плоской. Отсутствие возможности регулировки фокуса во время сканирования делает абсолютно обязательным расположение камеры и объекта точно перпендикулярно друг другу.

Тем не менее, мы перечислили требования к мегапикселям для цифровых камер в следующей таблице. Пиксель определяется красным, зеленым и синим процентами, а в случае цифровой камеры пиксель имеет зеленый и красный проценты с интерполируемым синим содержимым или зеленый и синий с интерполированным красным содержимым.

200dpi А0 А1 А2 А3 А4
Сканирование слева направо 3×6700 3×4700 3×3400 3×2400 3×1700
Сканирование сверху вниз 3×9400 3×6700 3×4700 3×3400 3×2400
Цифровая камера 124 Мп 62 Мп 31 Мп 16 Мп 8 Мп

300dpi А0 А1 А2 А3 А4
Сканирование слева направо 3×10000 3×7100 3×5000 3×3600 3×2500
Сканирование сверху вниз 3×14100 3×10000 3×7100 3×5000 3×3600
Цифровая камера 279 Мп 140 Мп 70 Мп 35 Мп 18 Мп

400dpi А0 А1 А2 А3 А4
Сканирование слева направо 3×13300 3×9400 3×6700 3×4700 3×3400
Сканирование сверху вниз 3×18800 3×13300 3×9400 3×6700 3×4700
Цифровая камера 496 Мп 248 Мп 124 Мп 62 Мп 31 Мп

600dpi А0 А1 А2 А3 А4
Сканирование слева направо 3×19900 3×14100 3×10000 3×7100 3×5000
Сканирование сверху вниз 3×28100 3×19900 3×14100 3×1000 3×7100
Цифровая камера 1116 Мп 558 Мп 279 Мп 140 Мп 70 Мп

Примечание. Если поставщик показывает вдвое меньше пикселей, чем указано в приведенном выше списке, он считает все красные, зеленые и синие пиксели вместе и интерполирует недостающие два цвета на пиксель. Другими словами, 1/3 пикселей являются реальными, а 2/3 интерполированы. В приведенной выше таблице предполагается, что 2/3 информации о цвете пикселя являются реальными, и только 1/3 интерполирована, что все еще менее качественно, чем может дать сканирование. Некоторые поставщики заявляют, что могут снимать изображения DIN A2 с разрешением 400 точек на дюйм с помощью своих 30-мегапиксельных цифровых камер, но приведенная выше таблица доказывает их неправоту, поскольку для этого потребуется как минимум 124 мегапикселя. При разрешении 600 точек на дюйм самые большие цифровые камеры, доступные сегодня, стоимостью в десятки тысяч рублей, могут создавать изображения только формата A4, которые слишком малы для серьезного сканирования книг.

Все книжные сканеры имеют линейные камеры высокого разрешения, иначе они не назывались бы сканерами. Если поставщик, использующий цифровую камеру, утверждает, что приближается к типичному разрешению сканера 300 dpi и выше, проверьте приведенную выше таблицу и узнайте правду.

Скорость и экспозиция

Процесс сканирования занимает несколько тысяч изображений в секунду и поэтому очень нечувствителен к несовершенствам в движении документа, вибрациям и т. д. Камеры сканера освещают только небольшую область, которую они фактически сканируют, высококачественным, интенсивным светом, который, в свою очередь, обеспечивает высокое качество изображения с низким уровнем шума. Типичное время экспозиции находится в диапазоне от 250 мкс до 1500 мкс. С другой стороны, «неподвижные» цифровые камеры с высоким разрешением имеют время экспозиции порядка нескольких секунд, что делает их очень чувствительными ко всем видам движений камеры, книги, пользователя и даже пола комнаты, в которой цифровик установлен.

Количество света также является фактором, определяющим качество. Некоторые поставщики заявляют, что их сканеры вообще не нуждаются в свете и поэтому не излучают инфракрасный и ультрафиолетовый свет. В то время как второе утверждение очевидно верно, первое вводит в заблуждение.

Эти сканеры полностью полагаются на окружающий свет в процессе сканирования, что эквивалентно съемке фотографии на цифровую камеру без вспышки. Всем известно, что результат такой фотографии очень непредсказуем с точки зрения цветового баланса, шумов, отражений и так далее. Хорошие книжные сканеры имеют собственный хорошо контролируемый высококачественный источник света.

Уровень освещенности должен быть высоким в интересующей области и не должен освещать ничего за пределами этой области. Обеспечиваемый высокий уровень освещения сканера необходим для усиления «хорошего света» от сканера до уровня, намного превышающего окружающий свет, чтобы он перекрывал все дефекты, создаваемые окружающим светом. Источник света сканеров обычно должен быть в 10–20 раз ярче окружающего света, что снижает чувствительность к неконтролируемому уровню окружающего освещения до невидимого уровня.

В то же время все области, которые не сканируются в данный момент времени, должны подвергаться только ограниченному воздействию света, чтобы защитить книги и оператора сканера. Книжные сканеры, которые подчиняются этим правилам, имеют движущуюся световую полосу из светодиодов высокой интенсивности, которая скользит по поверхности книги во время ее сканирования. Интенсивность света контролируется во время сканирования, чтобы идеально освещать книгу даже на разных расстояниях и под разными углами. Все книжные сканеры крупных игроков рынка работают с движущейся световой полосой.

В современном книжном сканере используется движущаяся световая полоса, генерируемая высококачественными светодиодами. Устройство, которое освещает всю область сканирования сразу или не освещает вообще, скорее всего, не сканер, а слишком дорогая цифровая камера.

Биты, плотность и шум

Возможно, самым большим заблуждением в отношении технологии сканирования является глубина цвета в битах, также называемая цветовым разрешением.

Первое, что нужно помнить, это то, что битовая глубина и динамический диапазон — это не одно и то же. Они будут звучать почти одинаково, но это не так, и эта разница будет объяснена здесь. Большинство сканеров в настоящее время имеют глубину цвета не менее 30 бит, а многие имеют глубину цвета 36, 42 или 48 бит. Для хранения числовых значений, содержащих лучший динамический диапазон, требуется больше битов. Хотя эти два фактора часто связаны между собой, существует и второе требование.

Для лучшего динамического диапазона необходимы высококачественные ПЗС-матрицы с низким уровнем шума и электроника (т. е. дорогие). Тот факт, что сканер заявляет о глубине цвета 48 бит, не имеет ничего общего с его реальной оптической плотностью. Это означает только то, что используются 16-битные аналого-цифровые преобразователи. В следующей таблице показана теоретическая максимальная плотность для различной битовой глубины. Если эти значения находятся в спецификации сканера, их можно полностью игнорировать, поскольку они определяют только размер контейнера, а не его содержимое.

Общее количество бит Двоичные шаги Максимальная плотность (без шума) Максимальная плотность (1 бит шума)
30 1024 3.0 2.7
36 4096 3.6 3.3
42 16384 4.2 3.9
48 65536 4.8 4.5

Диапазоны плотности в реальном мире намного ниже, чем ожидалось. Далее перечислим диапазоны плотности для различных материалов:

  • газетная бумага — менее 1.8;
  • светоотражающая фотобумага — 2.0;
  • бумага для печати — 2.6;
  • пленка для печати — 3.2.

Суть ясна: 36-битное разрешение может содержать все числовые значения, необходимые для представления диапазона плотностей, найденного для лучших прозрачных пленок. Контейнер большего размера, 42 или 48 бит, — это пустая трата времени, особенно потому, что обработка большего количества данных замедляет работу каждой системы. Некоторые системы могут использовать разрешение более 36 бит, чтобы обеспечить программную коррекцию яркости и гаммы на более позднем этапе обработки, но это не означает, что плотность также увеличится.

Гораздо более важным, чем глубина цвета, является уровень шума системы. Современные книжные сканеры имеют линейные камеры с большими пикселями до 10*10 мкм, которые могут собирать много фотонов, прежде чем они насыщаются. Больше фотонов означает меньше шума. Если размер пикселя урезать вдвое, шум удваивается, и с этой проблемой приходится сталкиваться всем цифровым камерам высокого разрешения. Сегодня пиксели цифровой камеры составляют лишь одну десятую размера линейной камеры, и требуется много вычислений, чтобы получить из них хотя бы приличное изображение. Старая поговорка «чем больше, тем лучше» полностью применима к ПЗС-элементам.

36-битного цветового разрешения более чем достаточно для книжного сканера. Все, что выше этого, может выглядеть привлекательно в брошюре, но бесполезно. Более важными являются уровень освещенности и размер пикселя.

logo

Другие статьи

29 ноября 2022
Статья

Как устроено, какие преимущества дает и кому пригодится?

25 апреля 2022
Статья

Какой принтер лучше в 2022 году?

24 января 2022
Статья

Рейтинг моделей с подробными описаниями, преимуществами, ценами.