«

»

Сен 13

Создано устройство, способное сканировать закрытые книги

Большинство самых больших библиотек в мире уже достаточно давно занимаются переводом всех находящихся в них книг в цифровой формат. В некоторых из библиотек для этого используются полностью автоматические высокотехнологичные системы, а в некоторых применяют обычные ручные оптические сканеры. Но в любом случае, процесс оптического сканирования требует перелистывания каждой страницы сканируемой книги. Однако бывают случаи, когда какая-нибудь очень редкая книга, существующая в единственном экземпляре, находится в столь плачевном состоянии, что перелистывание может нанести ей непоправимый ущерб. В этом случае на выручку может прийти новое устройство, созданное специалистами из Массачусетского технологического института. Эта система позволяет сканировать книги, находящиеся в закрытом состоянии и она использует для этого некоторые физические, технологические уловки и сложные программные алгоритмы, выполняющие обработку получаемых данных.

Новая система использует в своих целях проникающие возможности излучения терагерцового диапазона, диапазона, лежащего между микроволновым излучение и инфракрасным светом. В принципе, для этих же целей можно использовать и другие виды проникающего излучения, к примеру рентгеновское излучение, однако, использование терагерцового излучения удобней и безопасней с нескольких точек зрения. Кроме того, использование терагерцового излучения позволяет более точно дифференцировать области чистой бумаги и области, покрытые чернилами за счет того, что различные химические вещества поглощают этот вид излучения по-разному.

Полученные при терагерцовом сканировании данные проходят через сложную математическую обработку, которая позволяет выделить изображение каждой страницы текста. Дополнительные программные алгоритмы позволяют сделать изображение каждого символа настолько четким, насколько это возможно, а алгоритмы, разработанные специалистами Технологического института Джорджии, позволяют восстановить оригинальные формы даже сильно искаженных символов.

«Существует большая разница в спектре поглощения терагерцового излучения чистой бумагой и материалом чернил» — рассказывает Бармак Хешмат (Barmak Heshmat), участник проекта New Atlas, — «Наша система самонастраивается на этот спектральный контраст, который изменяется и зависит в каждом случае от состава бумаги и используемых чернил. Это позволяет нам получить качественные изображения символов, которые достаточно хорошо распознаются традиционным способом оптического распознания».

Терагерцовый источник новой системы производит короткие вспышки излучения. Эти импульсы отражаются назад каждым из воздушных слоев, который находится между страницами книги, и отраженное излучение фиксируется камерой, имеющей максимальную чувствительность в терагерцовом диапазоне. Данные с этой камеры проходят через алгоритм, который определяет расстояние до каждой страницы книги, используя разницу по времени между моментом излучения импульса и временем регистрации отраженного сигнала.

Данные о расстоянии до страницы позволяют другому алгоритму отфильтровать шум и данные от других страниц. В результате такой фильтрации остается картина поверхности только определенной страницы, на которой обозначены области с различным химическим составом, что в свою очередь, позволяет прочесть все написанное на данной странице.

Опытный образец терагерцового сканера пока может «читать» лишь до десяти страниц в глубину. При попытке более глубокого проникновения полезные сигналы полностью скрываются в шумах и помехах, что делает процесс чтения полностью невозможным. Однако в ближайшем времени исследователи из Массачусетского технологического института собираются увеличить глубину проникновения их сканера путем увеличения разрешающей способности, скорости и точности камеры, увеличения мощности источника терагерцового излучения и модернизации некоторых участков программных алгоритмов.

Источник: dailytechinfo.org